中华预防医学杂志    2017年08期 贝叶斯统计在食品安全膳食暴露评估中的应用    PDF     文章点击量:336    
中华预防医学杂志2017年08期
中华医学会主办。
0

文章信息

李太顺 张亚非 吴永宁 刘沛
LiTaishun,ZhangYafei,WuYongning,LiuPei
贝叶斯统计在食品安全膳食暴露评估中的应用
Bayesian statistics application in the food safety assessment of dietary exposure
中华预防医学杂志, 2017,51(8)
http://dx.doi.org/10.3760/cma.j.issn.0253-9624.2017.08.021

文章历史

投稿日期: 2016-10-09
上一篇:陕西单胎孕妇膳食模式及其影响因素研究
下一篇:高通量测序技术在临床诊治遗传性肿瘤中的应用与研究进展
贝叶斯统计在食品安全膳食暴露评估中的应用
李太顺 张亚非 吴永宁 刘沛     
李太顺 210009 南京,东南大学公共卫生学院流行病与卫生统计学系
张亚非 210009 南京,东南大学公共卫生学院流行病与卫生统计学系
吴永宁 国家食品安全风险评估中心
刘沛 210009 南京,东南大学公共卫生学院流行病与卫生统计学系
摘要:
关键词 :食品安全;危险性评估;贝叶斯定理;膳食暴露
Bayesian statistics application in the food safety assessment of dietary exposure
LiTaishun,ZhangYafei,WuYongning,LiuPei     
Department of Epidemiology and Biostatistics, School of Public Health, Southeast University, Nanjing 210009, China
Corresponding author: Liu Pei, Email: liupeiseu@126.com
Abstract:
Key words :Food safety;Risk assessment;Bayes theorem;Dietary exposure
全文

暴露评估是实施食品安全风险控制的重要技术手段,其评估结果是政府制定食品安全法规、修订食品安全限量标准的科学依据[1]。国内外针对食品安全暴露评估的方法可分为频率统计和贝叶斯统计。前者的方法原理及模型构建已有较多报道[2,3],而贝叶斯统计方法引入到食品安全风险评估的时间较晚,但近几年发展迅速,并在欧美发达国家的膳食暴露风险评估中取得了一些引人注目的成果[4,5,6]。本文从传统概率风险评估方法面临的诸多限制出发,介绍贝叶斯统计将样本信息与先验信息相结合突破传统方法不足的优势之处,进而介绍贝叶斯方法在食品安全暴露评估中的应用及研究进展。

一、贝叶斯统计在食品安全膳食暴露风险评估中的应用  

(一)单种污染物贝叶斯统计膳食暴露概率评估  污染物的膳食暴露评估是将食品中污染物浓度数据和食物消费量数据相结合,运用一定的统计学方法,计算膳食暴露量。膳食暴露模型按其原理可分为以下四类:(1)基于点估计的确定性模型;(2)基于经验估计的概率评估模型;(3)基于参数估计的概率评估模型;(4)基于贝叶斯统计的概率评估模型。传统的膳食暴露评估方法依赖于样本数据,并不涉及对先验信息的利用。贝叶斯统计是将样本数据与先验信息相结合,在先验信息的基础上对样本分布进行调整,因此贝叶斯统计并不过分依赖样本信息,准确的先验信息可以弥补样本数据的不足,当出现以下情况时常规的概率评估模型往往受限:(1)样本量过小:在这种情况下,重复抽样产生的数据间差异小,特别是分布的尾端,传统的概率评估方法往往受到限制。(2)无原始数据:当仅有总结性数据如均数、标准差而无原始数据时,传统方法的评估效果往往较差。(3)数据存在层次结构:例如地区、家庭、个人、消费日构成的层次结构,传统的概率模型往往难以处理这类负责的层次数据机构。
        贝叶斯统计基本原理是综合未知参数的先验信息和样本数据获得参数的后验分布,可以表示为:p(θ∣x)∝p(θ)px∣θ)。式中p(x∣θ)代表θ给定条件下x的似然函数;p(θ)表示先验分布;p(θ∣x)则表示在样本x给定后θ的后验分布。频率统计仅用似然函数对未知参数进行统计推断,而贝叶斯统计允许使用先验信息,并结合似然函数获得未知参数的后验分布。对于贝叶斯膳食暴露评估模型的构建可分为以下三步:(1)构建似然函数,如x服从二项分布b(n,θ),即p(x=x∣θ)=θxθn-x,x=0,1,…,n;(2)指定参数先验分布,如对时间发生的概率θ没有了解,可采用区间(0,1)上的均匀分布U(0,1)作为θ的先验分布;(3)使用马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)方法来计算后验分布。贝叶斯统计的所有推断(如平均水平、离散程度、高端百分位数等)都基于后验分布,以上可借助贝叶斯计算专用软件(如OpenBUGS)来完成。尽管贝叶斯膳食暴露评估模型有很多优点,但其使用也存在一定限制,当变量个数越多,多元分布就越复杂,其运算时间就越长。因此贝叶斯膳食暴露评估模型不适用于消费食物变量过多的情况。

(二)多种污染物贝叶斯膳食暴露概率联合评估  目前的膳食暴露评估工作主要针对单种污染物进行,对于多种污染物同时暴露的联合评估报道较少。虽有研究考虑到多种污染物的联合作用,但并未考虑到污染物之间的交互作用[7]。实际生活中一种食物可能含有多种污染物残留,然而污染物之间联合作用对健康的影响仍然未知。例如多种杀虫剂往往同时暴露于食物当中,且杀虫剂间的交互作用不能排除,最后形成多种杀虫剂的暴露分布称之为共同暴露分布。
        多种污染物共同暴露的联合评估可采用贝叶斯非参数模型[8],人群对多种污染物的共同暴露计算是基于食品中污染物监测数据和人群消费量数据,贝叶斯非参数混合模型主要用来对具有共同暴露模式的人群进行聚类,该模型在多元高斯核函数基础上使用狄利克雷过程混合模型(Dirichlet Process Mixture, DPM)来进行聚类,DPM可以认为是有限混合模型的一个推广,有限混合模型(如Gaussian Mixture模型)必须首先给定类数,而DPM则不需要,它可以依据数据自行判断类数,此外模型后验分布的计算通过Gibbs抽样来完成[9]
        与传统的聚类方法以及主成分分析相比,贝叶斯非参数模型主要有以下优点:(1)不限于线性假设前提;(2)对组成混合暴露的污染物个数不受限制,适用于高维数据的处理;(3)聚类的类数是在评估过程中自动计算的,不需要事先给定。多种污染物贝叶斯膳食暴露概率联合评估方法同样基于一定假设前提:污染物浓度的未检出值在0与检出限值之间正态分布,对于某些污染物前提难以满足,如杀虫剂残留,若农作物未使用该杀虫剂,则检出值为0。因此在选择此方法时,对污染物浓度未检出值的处理就显得尤为重要。

(三)贝叶斯统计在毒物动力学模型中的应用  毒物动力学模型是指用数学方法定量研究外来化学物的吸收、分布、排泄和代谢转化随时间变化的规律与过程,为外暴露数据与内生物监测数据间的联系提供桥梁[10]。因此毒物动力学模型一直是近年来食品安全风险评估的研究热点之一,尤其是药代动力学模型(physiologically based pharmacokinetic model, PBPK)和药效动力学模型(physiologically based pharmacodynamics model, PBPD)的构建与应用研究。然而大多数传统毒理动力学模型都面临一些不足:一方面,外暴露与内暴露之间联系往往存在人间变异性,虽然研究证实在个体水平上外暴露与内暴露是匹配的,然而人群中人间变异的量化一直是传统毒理动力学模型忽略的问题[11];另一方面,由于某些特殊污染物如重金属半衰期长以及肾脏的蓄积作用,当前所测的生物监测数据往往反映过去的暴露情况,并不能很好反映当前外暴露水平。
        基于PBPK模型的贝叶斯人群模型可以解决上述问题,该模型即在PBPK模型的基础上使用贝叶斯方法和相应的函数所做的改进。具体表现在:在模型中引入尺度函数对过去外暴露水平进行连续性校正;考虑到个体间变异性PBPK模型中参数均使用贝叶斯计算方法,即不使用具体的均值而是用贝叶斯后验分布代替,此外贝叶斯方法允许对有关参数使用先验信息。
        基于PBPK的人群贝叶斯模型在人群基础上定量评估污染物毒理动力学特征人间变异性并整合到模型之中,此外对于污染物以往的暴露数据采用尺度函数进行连续性校正,最终使得模型的预测结果更加精确,为风险管理者也提供了合理的依据,模型也可以更加真实的解释外暴露与内在生物监测数据间的联系。在利用该模型进行预测分析时,前提是假设暴露条件不变的情况下,然而暴露者的生活习惯或外暴露条件可能会随时间发生变化,因此在预测分析时可能会存在潜在偏倚趋势。

(四)贝叶斯统计在构建剂量-反应关系模型中的应用  在膳食暴露风险评估中,剂量指的是污染物膳食暴露量,反应指的是摄入某种污染物后不良事件或疾病发生率。剂量-反应关系确定有助于发现污染物的毒效应性质,是安全性评价和危险性评价的重要内容。常见的毒物剂量-反应关系模型多来源于动物实验,然而人群剂量-反应关系模型一直无法构建,具体原因如下:首先,同一污染物暴露来源广,即使是同一食物,不同品牌间污染物浓度变异也较大,由此构建的模型存在较大的不确定性。
        分层贝叶斯方法将剂量-反应关系模型中的构建主要分为两个阶段。第一阶段,采用概率评估方法,应用模特卡罗模拟建立污染物的每日平均暴露量分布,作为下阶段模型的先验信息;第二阶段,根据模拟的每日平均暴露量,按暴露水平高低将人群分若干组别,对同一组别的个体假设暴露史和暴露时间相同,并且拥有共同的组别均数μ[i],而μ[i]先验分布假定服从对数正态分布并有上述先验信息,最后建立起暴露量与发生率之间的线性logistic模型:,模型中p[i]代表人群疾病发生率,μ[i]为各组别人群人日暴露量均数。对于上述模型中的参数以及各组别暴露均值μ[i]均采用分层贝叶斯MCMC方法计算。贝叶斯层次方法基础上的剂量-反应模型主要优点如下:(1)MCMC模拟技术的应用降低了暴露评估中的不确定性;(2)人群组别的日平均暴露量给定的是随机分布而不是具体常数,而动物模型中往往给定常数,因而贝叶斯层次模型更能反映污染物暴露的不确定性。同时贝叶斯层次模型也有一定缺陷,其假设同一组别暴露史和暴露时间相同,然而在实际生活中具有一定的不确定性,特别是在回顾性调查中存在回顾偏倚。因此在流行病调查阶段,要严格控制调查的质量。

二、国内外研究评述  同发达国家相比,我国的食品安全膳食风险评估研究起步较晚,但近些年发展迅速,食品安全风险评估体系逐渐完善。传统的膳食暴露评估方法研究如点评估、概率评估等已见大量研究[12,13,14,15]。关于贝叶斯统计方法在食品安全膳食暴露风险评估中应用报道较少,仅在微生物暴露定量风险评估方面见有报道[16]。中国台湾学者[17]针对台湾地区邻苯二甲酸盐事件,运用贝叶斯统计方法完成了6种高危饮料邻苯二甲酸盐暴露风险评估。国外发达国家高度重视食品安全问题,在美国、欧盟、日本等国家很早就建立了独立的食品安全风险评估机构,并各自开发了膳食暴露评估软件[18]。关于贝叶斯方法在膳食暴露安全风险评估中的应用,最早见于瓦格里根大学Paulo等[19]关于杀虫剂的膳食暴露风险评估报道,贝叶斯模型对食物消费量采用多元模型,检出限以下的污染物浓度也通过贝叶斯方法进行处理。多种污染物联合暴露评估的研究是适应某些特殊污染物暴露情况展开的研究,国外关于多种杀虫剂联合暴露风险评估研究较多,因为一类杀虫剂往往同时应用,相互间的交互作用不容忽视。Crépet等[20]以及Fallico等[21]的研究都阐述了使用贝叶斯非参数模型评估某一类杀虫剂的共同作用,最后形成的暴露分布也称之为共同暴露分布。基于PBPK的人群贝叶斯模型在毒物动力学方面的研究技术国外已有报道,Béchaux等[10]的研究中应用该模型去解释法国人群中尿镉水平,并且在此基础上建立预测模型去预测20年后法国人群的尿镉水平。关于贝叶斯在构建剂量-反应关系模型中的应用方面,我国台湾学者Wang等[22]利用贝叶斯层次模型在儿童人群中成功建立了每日三聚氰胺摄入量与儿童肾结石发生率之间的剂量-反应关系。此外,贝叶斯统计在污染物浓度极端值与缺失值处理、微生物暴露风险评估以及其他新的膳食暴露评估方法均有报道。综上所述,国外膳食暴露风险评估技术体系较为全面,贝叶斯统计方法在膳食暴露风险评估中应用研究以显示出其特有的优势,值得学习和借鉴。

三、小结  贝叶斯统计在食品安全膳食暴露风险评估中的应用,一方面打破了传统膳食暴露评估风险评估的限制,弥补了传统方法的不足;另一方面也完善了膳食暴露评估的现有体系,为今后研究工作提供了一条新思路。然而在具体方法选择上,两者各有利弊,贝叶斯统计可以利用多种来源的数据,但评估的食物种类有限,食物种类越多模型就越复杂,传统方法虽然对食物的种类和数目不予限制,但当数据结构复杂、缺失值过多以及样本量较小时则不适用。因此在特定数据条件下,应结合数据资料特征,分析目的进行综合分析,以选择合适的分析方法。

参考文献
[1]李宁,严卫星.国内外食品安全风险评估在风险管理中的应用概况[J].中国食品卫生杂志,2011,23(1):13-17.
[2]HoffmannK, BoeingH, DufourA, et al. Estimating the distribution of usual dietary intake by short-term measurements[J]. Eur J Clin Nutr, 2002,56Suppl 2:S53-62. DOI: 10.1038/sj.ejcn.1601429.
[3]GlenG, SmithL, IsaacsK, et al. A new method of longitudinal diary assembly for human exposure modeling[J]. J Expo Sci Environ Epidemiol, 2008,18(3):299-311. DOI: 10.1038/sj.jes.7500595.
[4]HaldT, VoseD, WegenerHC, et al. A Bayesian approach to quantify the contribution of animal-food sources to human salmonellosis[J]. Risk Anal, 2004,24(1):255-269. DOI: 10.1111/j.0272-4332.2004.00427.x.
[5]KennedyM, HartA. Bayesian modeling of measurement errors and pesticide concentration in dietary risk assessments[J]. Risk Anal, 2009,29(10):1427-1442. DOI: 10.1111/j.1539-6924.2009.01265.x.
[6]AmzalB, JulinB, VahterM, et al. Population toxicokinetic modeling of cadmium for health risk assessment[J]. Environ Health Perspect, 2009,117(8):1293-1301. DOI: 10.1289/ehp.0800317.
[7]BoobisAR, OssendorpBC, BanasiakU, et al. Cumulative risk assessment of pesticide residues in food[J]. Toxicol Lett, 2008,180(2):137-150. DOI: 10.1016/j.toxlet.2008.06.004.
[8]RoelofsVJ, CoolenFP, HartAD. Nonparametric predictive inference for exposure assessment[J]. Risk Anal, 2011,31(2):218-227. DOI: 10.1111/j.1539-6924.2010.01490.x.
[9]CrépetA, TressouJ, GraillotV, et al. Identification of the main pesticide residue mixtures to which the French population is exposed[J]. Environ Res, 2013,126:125-133. DOI: 10.1016/j.envres.2013.03.008.
[10]BéchauxC, BodinL, Clémen?onS, et al. PBPK and population modelling to interpret urine cadmium concentrations of the French population[J]. Toxicol Appl Pharmacol, 2014,279(3):364-372. DOI: 10.1016/j.taap.2014.06.026.
[11]AmzalB, JulinB, VahterM, et al. Population toxicokinetic modeling of cadmium for health risk assessment[J]. Environ Health Perspect, 2009,117(8):1293-1301. DOI: 10.1289/ehp.0800317.
[12]刘沛,刘元宝,王灿楠.膳食暴露评估模型及其构建方法[J].中华预防医学杂志,2007,41(6):502-504. DOI: 10.3760/j.issn:0253-9624.2007.06.019.
[13]李喜艳,张亚非,金昊,等.化学污染物慢性膳食暴露评估全概率模型构建研究[J].中国卫生统计,2015,32(2):214-216.
[14]李安,潘立刚,王纪华,等.农药残留加工因子及其在膳食暴露评估中的应用[J].食品安全质量检测学报,2014,(2):309-315.
[15]王向未,仇厚援,张志恒,等.食品中膳食暴露评估模型研究进展[J].浙江农业学报,2012,24(4):733-738. DOI: 10.3969/j.issn.1004-1524.2012.04.037.
[16]刘丽梅,高永超,王玎.食品中微生物危害的风险评估建模方法改进与应用[J].农业工程学报,2014,(6):279-286. DOI: 10.3969/j.issn.1002-6819.2014.06.034.
[17]ChenCC, WangSL, WuMT, et al. Exposure Estimation for Risk Assessment of the Phthalate Incident in Taiwan[J]. PLoS One, 2016,11(3):e0151070. DOI: 10.1371/journal.pone.0151070.
[18]王向未,仇厚援,张志恒,等.食品中膳食暴露评估模型研究进展[J].浙江农业学报,2012,24(4):733-738. DOI: 10.3969/j.issn.1004-1524.2012.04.037.
[19]PauloMJ, van der VoetH, JansenMJ, et al. Risk assessment of dietary exposure to pesticides using a Bayesian method[J]. Pest Manag Sci, 2005,61(8):759-766. DOI: 10.1002/ps.1060.
[20]CrépetA, TressouJ, GraillotV, et al. Identification of the main pesticide residue mixtures to which the French population is exposed[J]. Environ Res, 2013,126:125-133. DOI: 10.1016/j.envres.2013.03.008.
[21]FallicoB, D'UrsoMG, ChiapparaE. Exposure to pesticides residues from consumption of Italian blood oranges[J]. Food Addit Contam Part A Chem Anal Control Expo Risk Assess, 2009,26(7):1024-1032. DOI: 10.1080/02652030902839731.
[22]WangIJ, ChenCC, ChanCC, et al. A hierarchical Bayesian approach for risk assessment of melamine in infant formula based on cases of related nephrolithiasis in children[J]. Food Addit Contam Part A Chem Anal Control Expo Risk Assess, 2011,28(4):384-395. DOI: 10.1080/19440049.2010.548083.