如何用unscrambler对光谱预处理进行预处理

The resource cannot be found.
Server Error in '/' Application.
The resource cannot be found.
Description: HTTP 404. The resource you are looking for (or one of its dependencies) could have been removed, had its name changed, or is temporarily unavailable. &Please review the following URL and make sure that it is spelled correctly.
Requested URL: /Cssn_Software_Detail.aspx
Version Information:&Microsoft .NET Framework Version:4.0.30319; ASP.NET Version:4.0.对梨枣糖度质量分数进行无损检测分析,园艺学论文_学术堂
| [ 学术堂-专业的论文学习平台 ]
您当前的位置: >
对梨枣糖度质量分数进行无损检测分析
时间: 来源:学术堂 所属分类:
  0、 引言
  梨枣又名大铃枣、脆枣等,果实多数似梨形,为枣中稀有的名贵鲜食品种。其中,梨枣糖度是其鲜食时品质优劣的首要判断标准。为了提供高品质的梨枣,需要研究能同时检测果实内外部品质的快速、无损自动检测分级系统。研究表明,物质的内部成分与波谱信息密切相关,这使利用光谱信息对梨枣内部品质进行无损检测成为可能。
  相对于传统的检测方法,高光谱成像技术集中了光学、光电子学、电子学、信息处理、计算机科学等领域的先进技术,是光谱技术与图像技术的有机结合。
  近年来,高光谱技术在农产品检测的应用日益广泛,不仅可以实现农作物成分的检测,还可以实现水果的大小、损伤、糖度等的无损检测分析。小波分析算法作为一种强大的时-频局部化分析方法,解决了傅里叶分析方法无法对局部时间信号的局部频谱特性进行分析的问题。近几年,小波分析已经广泛应用于工业检测和农产品检测等各个领域,其主要应用是进行去噪和提取特征参数,以提高建模分析水平。
  小波分析虽然在光谱研究中应用很多,但是将小波分析应用于高光谱数据中并提取其逼近系数进行建模分析的应用还未见报道。为此,利用小波分析方法,针对高光谱成像仪采集的梨枣光谱信息建立模型,对梨枣糖度质量分数进行无损检测分析。
  1、 实验材料和方法
  1. 1 梨枣样本
  实验所用样本于 2013 年9 月28 日采摘于山西省太谷县东庄枣园。为了实现高光谱对梨枣糖度质量分数的无损检测,采集了 82 个正常梨枣样本(将其标记为 tg1 ~ tg82) ,用于检测其糖度含量。
  1. 2 高光谱数据采集
  高光谱图像数据通过高光谱成像系统采集得到,系统装置 如图 1 所示。其主要包括成像光谱仪V10E&QE、C - mount 成 像 镜 头 OLE&23、线 光 源Schott DCR Ⅲ、电控位移台 PSA 200&11&X、OBF570滤片、移动平台控制器 SC300A、计算机、校正白板和暗箱等一系列部件。其中,线光源 Schott DCR Ⅲ是一种功率为 150W 的直流稳压卤素光源。
  进行实验时,实验台速度设置为 1. 6mm/s,高度为 240mm,分辨率为 672&1 390,曝光时间为 500ms。本实验采集得到光谱范围是 400 ~ 1 000nm 之间共512 个波长下的图像信息。
  1. 3 高光谱图像校正
  由于系统暗电流和光源不均匀等的影响,采集梨枣样本图像后,须对高光谱图像进行黑白标定。系数调整好后,先扫描反射率为 99% 的标准白色校正板得到全白的参考图像 Ac,然后采集全黑的参考图像 Bc。
  黑白标定公式为
  式中 Ic&原始的高光谱图像;Bc&全黑的标定图像;Ac&全白的标定图像;Rc&标定后的高光谱图像。所有高光谱图像数据的采集都是基于台湾五铃光学股份有限公司提供的信息采集软件平台(Isuzuo-ptics) ,数据处理基于 ENVI4. 7 (Research System Inc. ,Boulder ,Co. ,USA) 和 Matlab R2010b 软件平台。
  1. 4 糖度数据采集
  当样本采集完高光谱后,立即采集其糖度数据。本实验梨枣糖度数据采用传统的方式获取,即将梨枣果肉挤压出汁,并采用滤纸对果汁进行过滤,对过滤后的汁液采用数字阿贝折射仪(WAY-2S) 测定其糖度质量分数。
  2、 结果与讨论
  2. 1 光谱预处理
  2. 1. 1 原始光谱图
  将 82 个梨枣感兴趣区域像素点的光谱求均值,得到 82 条光谱曲线。图 1 为 82 个梨枣样本的可见-近红外光谱图。
  2. 1. 2 全光谱 PLS 建模
  首先将 82 个太谷梨枣样本全部作为校正集,用The Unscrambler9. 8 软件进行偏最小二乘法 (PLS) 建模预测,得到的糖度质量分数(SSC) 实测值/预测值的散点分布图如图 2 所示,实测值与预测值的残差分布图如图 3 所示。
  由图 3 可知,tg42 偏离拟合线最远,其次为 tg3 和tg15,先将这 3 个样本暂时定为异常样本,对其逐个剔除并建模分析模型性能。模型性能参数如表 1 所示。
  由表 1 可知: 首先将 tg42 剔除后,模型 Rc 提高,RMSEC 降低,模型性能改善; 再依次剔除 tg3 和 tg15。
  当剔除 tg3 时,Rc 升高,RMSEC 降低,模型得到改善;当剔除 tg15 时,Rc 降低,RMSEC 降低,但是降低幅度不大。当把 3 个样本全部剔除时,Rc 降低,RMSEC 也降低。综合考虑,应该剔除 tg42 和 tg3。
  2. 1. 3 原始光谱预处理
  背景和噪声干扰是光谱分析中必须考虑的问题。
  在光谱分析中,首先要去除背景跟噪声的干扰,提高信噪比。本实验采用小波变换的分解重构法对剔除异常样本后的光谱进行预处理,在 MatLab 里用小波分解重构法对光谱进行预处理。试验表明,该预处理方法得到的数学模型比原始光谱所建数学模型效果要好。图 4 为原始光谱跟小波预处理后的光谱图。
  2. 1. 4 全波段光谱建模分析
  用 80 个正常梨枣样本的 472 个波段的光谱数据建立偏最小二乘(PLS) 模型和主成分回归(PCR) 模型,模型参数如表 2 所示。
  由表 2 可知: 用预处理后 512 个光谱波段建模时,PLS 模型校正集相关系数 Rc 比 PCR 模型的 Rc 要高,方差比 PCR 要低; 且 PLS 预测集相关系数 Rp 比 PCR模型的 Rp 要高,方差比 PCR 要低。所以,PLS 模型优于 PCR 模型。
  2. 2 近似系数建模分析
  2. 2. 1 提取近似系数
  对经过预处理后的光谱进行多尺度分解,提取近似系数。本文对梨枣可见-近红外光谱用小波函数db6 进行 6 层分解,分别提取 6 层的逼近信号 a1 ~ a6和 6 层的细节信号 d1 ~ d6,如图 5 所示。
  由图5 可知: 细节信号 d1 和 d2 的值较小,可认为是由传感器或是状态噪声的高频干扰; 细节信号 d5反应了 250 波段处的光谱吸收信息,因此第 5 层的贡献最大。在利用上述算法计算特征提取时,小波分解的尺度由于目标光谱特征宽度较大,往往在所确定尺度上特征空间数据量过少,对原始光谱的描述较为粗糙。这时,可以选择计算结果所确定尺度的上一级近似小波系数作为光谱特征提取的结果,即 a4 近似系数。最终选择用小波函数 db6 进行 4 层分解,并提取第 4 层的近似系数 a4 来代替原始光谱信息进行建模分析。
  2. 2. 2 近似系数建模分析
  对梨枣样本提取的 42 个近似系数进行建模分析,分别建立偏最小二乘回归(PLS) 模型和主成分回归(PCR) 模型,模型参数如表 3 所示。随机取前 20个样本作为预测集,后 60 个样本作为建模集,用建模集样本分别建立 PLS 校正模型和 PCR 校正模型,并分别对预测集样本进行预测,结果如图 6 所示。
  由表 2 和表 3 可知: 近似系数的 PLS 模型校正集相关系数 Rc(0. 931) 和 PCR 模型 Rc(0. 882) 分别要比全光谱 PLS 模型 Rc(0 . 875 ) 和 PCR 模 型 Rc(0. 858) 要高; PLS 模型校正集方差 RMSEC(0. 986) 、预测集方差 RMSEP(1. 159) 和 PCR 模型校正集方差RMSEC(1. 048) 、预测集方差 RMSEP (1. 322 ) 分别要比全光谱 PLS 模型校正集方差 RMSEC(0. 731) 、预测集方差 RMSEP(1. 270) 和 PCR 模型校正集方差 RM-SEC(0. 958) 、预测集方差 RMSEP(1. 361) 的差值更为接近,说明近似系数所建模型较稳定。因此,基于小波分解得到的近似系数可以代表光谱信息进行建模分析。
  由图 6 可知,近似系数 PLS 模型预测结果的相关系数为 0. 746,PCR 模型预测结果的相关系数为0. 736 3,均达到了良好的预测结果,且 PLS 模型预测结果比 PCR 模型要好。
  3、 结论
  1) 对比近似系数建模和全光谱数据建模,建模参数由 512 个减少为 42 个,主成分数也减少,且模型性能稳定。因此,基于小波分解得到的近似系数可以代表光谱信息进行建模分析。
  2) 对比近似系数建模和全光谱建模可知: 近似系数的 PLS 模型和 PCR 模型校正集相关系数分别要比全光谱 PLS 模型和 PCR 模型校正集相关系数高; PLS模型和 PCR 模型校正集方差、预测集方差分别要比全光谱 PLS 模型和 PCR 模型校正集方差、预测集方差更为接近。这说明,应用近似系数所建模型较稳定。因此,基于小波分解得到的近似系数可以代表光谱信息进行建模分析。
  参考文献:
  [1] 周竹,李小昱,高海龙,等. 马铃薯干物质含量高光谱检测中变量选择方法比较[J]. 农业机械学报,) :128-133,185.
  [2] 孙通,徐惠荣,应义斌. 近红外光谱分析技术在农产品/食品品质在线无损检测中的应用研究进展[J]. 光谱学与光谱分析,) : 122-126.
  [3] 赵聪慧,张淑娟,张海红,等. 鲜枣可溶性固形物最小二乘支持向量机动态监测研究[J]. 中国食品学报,2012(3) :210-214.
  [4] 王迅,刘书杰,贾海峰,等. 基于高光谱数据的高寒草地营养状况的研究[J]. 光谱学与光谱分析,) :.
  [5] 程国首,郭俊先,石砦,等. 基于高光谱图像技术的新疆红富士苹果重量预测[J]. 新疆农业大学学报,) :249-252.
您可能感兴趣的论文
1 园林绿化施工项目管理的意义 城市园林绿化作为改善城市生活质量、美化市容市..
0 引言 近年来,随着人们生活水平的提高,人们更加重视食品安全和食物营养问题,开..
1 园林绿化概述 园林绿化不仅能起到改善环境的作用,还能够给人们带来美的享受..
草坪景观是城市园林的重要组成部分,其生长状况以及外观质量对城市园林景观效果..
0引言 无公害蔬菜指的是处于良性生态环境内,通过相应的技术方式并以国家食品卫..
耐冬山茶(Camellia japonica)系指分布于青岛地区的山茶野生种群或栽培群体,为山..
园艺学论文标签
返回上级栏目:君,已阅读到文档的结尾了呢~~
便携式AOTF近红外光谱仪对颈复康喷雾粉样品中细菌含量检测的研究,便携式红外光谱仪,红外光谱,红外光谱仪,红外光谱分析,傅里叶红外光谱仪,红外光谱图库,红外光谱图,近红外光谱,傅里叶变换红外光谱仪
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
便携式AOTF近红外光谱仪对颈复康喷雾粉样品中细菌含量检测的研究
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口奚如春, 钟燕梅, 邓小梅, 陈晓阳, 莫宝盈, 易立飒&&&&
华南农业大学林学院 广州 510642
基金项目:国家林业公益性行业专项资金资助项目“优质丰产油茶专用肥研制”( ); 国家自然科学基金项目“油茶果实氮磷钾养分讯号、作用与调控机制”( ); 广东省自然科学基金团队项目“广东重要木本油料植物油脂积累、转化与调控的分子机理”(0002)。
通讯作者:陈晓阳
摘要:利用瑞典波通DA7200型固定光栅连续光谱近红外分析仪, 对来自不同产地的150份油茶种子样品进行含油量测定。依据其吸收光谱与化学特征分析数据, 建立2个种仁含油率模型, 并对模型的准确性进行预测评价。结果表明:用整颗油茶种仁建立的模型与常规方法测量结果之间的相关系数为0.88, 预测标准偏差为0.91, 该模型可用于测定准度要求相对不高而比较珍贵和量少的样品。而用粉碎油茶种仁建立的模型测定效果最好, 与常规方法测量结果之间的相关系数为0.98, 预测标准偏差为0.33, 因此该模型可代替常规测试方法使用。检验结果表明定标模型预测精度高、稳定性较好。近红外光谱技术可用于快速测定油茶种仁含油量, 具有很好的应用前景。
近红外光谱&&&&油茶&&&&含油量&&&&定标模型&&&&
Models for Determining Oil Contents in Camellia oleifera Seeds by Using Near Infrared Spectroscopy
Xi Ruchun, Zhong Yanmei, Deng Xiaomei, Chen Xiaoyang, Mao Baoyin, Yi Lisha &&&&
College of Forestry, South China Agricultural University Guangzhou 510642
Abstract: In this paper we aim to provide a rapid, simple and accurate method for determining camellia seed oil content, by the DA7200 near infrared apparatus (made in Sweden). One hundred and fifty seeds that were collected from different origins in Guangdong province were tested. Based on the analysis data of the absorption spectra and the chemical characteristics, two models for kernel oil content determination were established, and then the accuracy of the models was evaluated. The result shows that the model with the whole seed kernel can reached to 0.88 of the correlation coefficient between the prediction and the chemically measured values, and the standard deviation of prediction is in the range of 0.91. Thus this model with the whole seed kernel can be used to measure low quantity and precious samples with the relative low accuracy. The model with the crushed seed kernel can reached to 0.98 of the correlation coefficient between the prediction and the chemically measured values, and the standard deviation of prediction is in the range of 0.33. This model is very well and can directly replace conventional method. The test results show that prediction models have high precision and good stability. The forecast results indicated that near-infrared spectroscopy for rapidly testing the oil content of dry kernel was useful and would have a very good application prospects.
Key words:
near infrared spectrum&&&&Camellia oleifera&&&&oil content&&&&spectral calibration model&&&&
近红外光谱技术(NIRS,near infrared spectroscopy)是20世纪80年代后期迅速发展起来的一项物理测试技术,它能利用有机化学物质在近红外光谱区的光学特性,快速估测样品中一种或者多种化学成分的含量(张子仪等,1992)。因此具有使用简单方便、成本低、检测速度快(一个样品的检测只要10 s)、重复性好、不破坏样品的显著特点。由于其信息丰富,同时借助于计算机技术和化学计量学方法,可以直接分析不经任何预处理的生物样品(; 陆婉珍,2010)。
早在20世纪70年代,Norris等(1976)率先将NIRS应用于农产品测试。、、应用NIRS技术成功地分析了油菜(Brassica campestris)籽和花生(Arachis hypogaea)仁的含油量。NIRS 在我国许多领域得到了广泛应用,包括粮食、食品、石油、烟草、医药和化学工业,目前有油菜、棉花(Gossypium hirsutum)、黄豆(Glvcine max)、玉米(Zea mays)等油料作物方面的研究。提出了与近红外光谱分析法相适应的数学模型,并将模型用于整粒带壳油菜籽含油量的测定; 选用不同品种的棉籽进行常规成分的定标和校验,定标决定系数0.934,预测精度为0.978; 建立了油菜籽含油量和蛋白质含量模型,其NIRS 含油量预测值与实测值相关系数为0.95,相对误差小于3.5%; NIRS蛋白质含量预测值与凯氏定氮法的实测值相关系数为0.95,相对误差小于6.0%。用完整籽粒黄豆样品建立蛋白质和脂肪含量近红外定量分析模型,其中蛋白质、脂肪含量分析模型的相关系数分别为0.99,0.98。建立了NIRS玉米蛋白质、淀粉和含油量模型,预测值和实测值的相关系数分别为0.98,0.93和0.97,相对误差分别为2.7%,2.5%和7.0%。建立了NIRS油菜种子含油量模型,预测值与实测值的拟合性非常好,平均误差仅为0.1%。测定了油菜籽的油酸、芥酸和含油量,并建立定标模型。结果表明: 油酸、芥酸和含油量的近红外测定值与化学测定值之间相关系数分别为0.99,0.99和0.97,相对误差分别为4.2%,3.4%,1.9%。建立了玉米籽粒含油量模型,并对模型预测结果的准确性进行了评价,预测值与测定值间的相关系数为0.96,定标标准差和预测标准差分别为0.757和0.745。
油茶(Camellia oleifera)是我国主要木本油料树种之一,而有关油茶籽含油率的NIRS模型研究甚少。利用近红外漫反射光谱,通过应用多种预处理方法和回归方法,建立了30份油茶籽含油量的分析模型。但至今未建立近红外光谱油茶籽含油量的定标模型,限制了该项技术的应用推广。本文利用瑞典波通DA7200型固定光栅连续光谱近红外分析仪对广东省不同产地的油茶籽样品进行油脂分析,旨在构建油茶籽含油量的近红外光谱定标模型,以期为我国油茶油脂测定提供一种快速、简单、准确的测试方法。
1 材料与方法
1.1 供试材料
DA7200对基础建模最小的样品量要求为30份,但一个较好本地化模型应以100~200个样品为宜。因此,本研究于2011年10月下旬,收集广东省云浮、肇庆、梅州和广州等不同产地油茶种子共150份,经自然风干后将样品处理分成3个测试组:第Ⅰ组为风干种子(带种壳); 第Ⅱ组为风干种仁(去种壳); 第Ⅲ组为粉碎种仁。
1.2 测试仪器及软件
采用瑞典波通DA7200连续光谱固定光栅近红外分析仪(DA7200 Diode Array Analyzer)。数据光谱收集速率: 100次·sec-1; 波长范围: 950~1 650nm。分析软件采用随机附带扫描和建模软件。
1.3 测定方法
1) 样品化学特征值常规测定: 种仁含油率分别采用索氏法提取,每个样品测定3次,取其平均值,平行样品间的相对误差不得高于5.0%。将该测定的化学特征值与光谱特征值进行联合分析。
2) 光谱特征数据采集: 开机预热至少30 min,使用仪器内置参比,将上述3组处理好的样品依次分别放置在光谱仪样品盘上,对样品进行扫描。为降低装样不均匀产生的误差,每个样品扫描9次(每扫描3次后重新装样1次)。收集记录3组样品的光谱特征数据。
3) 光谱数据预处理: 分别采用标准化处理法(Normalization)、标准正态变量转换法(SNV)、乘积分散校正法(MSC)等与一阶导数和二阶导数相结合的方法对所采集的光谱数据进行预处理。最后根据定标模型的预测效果选出最佳数据预处理方法。
4) 含油量定标模型构建: 分别采用偏最小二乘法(PLS)、主成分分析法(PCR)对经过不同预处理的光谱数据进行回归分析,并利用Unscrambler classifier软件建模。以RC(模型校正相关系数)、RMSEC(模型校正相关系数标准偏差)、RCV(交互验证相关系数)、RMSECV(交互验证预测标准偏差)为衡量模型预测效果的主要参数。其中RC起主导作用,要求RC,RCV越高越好,RMSEC,RMSECV越低越好。当2个处理间RC数值相近时,RCV与RC越接近越好。根据马氏距离、主因素分析图及光谱残差图等分析结果剔除特异样品,当两定标模型预测效果接近时,则需根据其对验证集样品的分析结果进行最终取舍。
5) 建模效果验证与评价: 随机选取10份未知油茶含油量的待测样品,分别用常规方法(索氏法)测定和已建立模型进行验证比较,以R(相关系数)和SEP(预测标准偏差)比较2者之间的差异,对模型进行外部验证和预测精度估算。
2 结果与分析
2.1 油茶籽测试样品的近红外光谱图
茶油中有常见的C—H,O—H等含氢基团,在近红外光谱区域会有很强烈的吸收。由图 1可见,茶籽的近红外光谱图有明显的吸收峰,且不同样品的吸收峰强度不同,即含油量不同。不同的样品测试组,其光谱的吸收峰强度不同,这说明茶籽的近红外光谱图可以作为定量分析和选择适合样品类型的依据。
图 1 测试样品近红外光谱
Fig. 1 Near infrared spectrogram of samples
2.2 不同光谱数据预处理方法的结果比较
表 1是3组油茶供试样品经不同的光谱预处理方法后得到的种仁含油率模型参数。由表 1可知,在第Ⅰ组样品模型参数结果中,RC值都不高,经Normalization+一阶导数和Normalization+二阶导数处理方法,就种仁含油率来说,RC大部分在0.6~0.8之间,但因其RCV值太低,模型稳定性差。因此采用整个风干油茶种子建立的模型稳定性较差,效果也不好。这可能是油茶籽体积较大,相邻种子间存在较大空隙,影响到光谱有效吸收。建议在实际应用上不采用该样品类型进行测定。
表 1 不同光谱预处理方法获得的种仁含油率模型参数
Tab.1 The model parameters of oil content in kernel in different spectral pretreatment method
表 1 不同光谱预处理方法获得的种仁含油率模型参数
Tab.1 The model parameters of oil content in kernel in different spectral pretreatment method
预处理方法Pretreatment method模型参数/Model parameters
第Ⅰ组GroupⅠ第Ⅱ组GroupⅡ第Ⅲ组GroupⅢ
RCRMSECRCVRMSECVRCRMSECRCVRMSECVRCRMSECRCVRMSECV
乘积分散校正法MSG0.831.10.671.530.910.850.890.940.910.840.910.86
乘积分散校正法+一阶导数MSc+first derivative0.761.360.581.810.920.810.90.920.940.680.930.74
乘积分散校正法+二阶导数MSG+second derivative0.761.250.531.800.940.690.90.880.940.690.930.73
标准化处理法Normalization0.761.280.581.710.910.830.890.930.910.830.910.85
标准化处理法+一阶导数 Normalization+first derivative0.791.190.621.630.90.90.890.950.940.690.930.76
标准化处理法+二阶导数 Normalization+second derivative0.791.240.571.770.930.770.880.970.950.60.940.69
标准正态变量转换法snv0.731.450.531.930.90.90.871.010.910.850.910.85
标准正态变量转换法+一阶导数 SNv+first derivative0.71.540.52.010.930.720.910.840.950.610.940.68
标准正态变量转换法+二阶导数 SNv+second derivative0.671.590.342.270.930.740.90.890.930.740.90.89
在第Ⅱ组样品模型参数结果中,RC值和RCV值的比较高,均在0.85以上。其中MSC+二阶导数、SNV+一阶导数这2种处理方法RC值最高,分别为0.94和0.93,且RCV 值也较高,分别为0.90和0.91,考虑RC值和RCV值越接近,模型越好。因此,可选择SNV+一阶导数为第Ⅱ组光谱数据最佳处理方法。
在第Ⅲ组样品模型参数结果中,RC值和RCV值也比较高,均在0.90以上。其中Normalization+二阶导数、SNV+一阶导数这2种与处理方法RC值最高,达到0.95,同时RCV值也较高,分别为0.95和0.94,同样考虑RC值和RCV值越接近,模型越好。所以也可选择SNV+一阶导数为第Ⅲ组光谱数据最佳处理方法。
2.3 最佳回归方法处理结果的比较
上述分析结果已确定SNV+一阶导数为光谱数据最佳预预处理方法。因此采用该方法对光谱数据进行预处理,软件自动优化的最优波段为960~1 640 nm,然后分别利用偏最小二乘法(PLS)和主成份分析法(PCR)中的回归方法来建立光谱模型,并采用RC,RMSEC,RCV,RMSECV等4个指标值进行模型评价,筛选出最佳回归方法。处理分析结果见表 2。
表 2 不同回归方法的比较
Tab.2 The comparison of different regression methods
表 2 不同回归方法的比较
Tab.2 The comparison of different regression methods
数据预处理方法Data pretreatment methods回归方法Regression methods模型参数Model parameters
RCRMSECRCVRMSECV
第H组标准正态变量转换法+一阶导数偏最小二乘法 PLS0.930.720.910.84
Group H SNV + first derivative主成分分析法 PCR0.920.800.90.88
第m组标准正态变量转换法+一阶导数偏最小二乘法 PLS0.950.610.940.68
Group M SNV + first derivative主成份分析法 PCR0.950.650.940.71
从表 2可看出,采用偏最小二乘法(PLS)回归分析中的RC,RMSEC,RCV,RMSECV等4个指标都优于采用主成分分析法(PCR)的回归分析结果。各定标模型具有较高的相关系数,RC都在0.93以上,定标集交互验证标准误差RMSECV值都较小,分别为0.84和0.68。可见各模型的预测效果都较好,模型比较稳定。因此,偏最小二乘法(PLS)中的回归分析方法是油茶种子含油率近红外分析的最佳回归方法。
2.4 油茶籽含油量近红外定标模型的建立
根据光谱数据最佳处理方法和回归模型建立,采用马氏距离、主因素分析图、光谱残差图及浓度残差图等分析结果剔除特异样品,以获得相关系数最大和预测误差最小的定标模型。由图 2可看到,150份茶籽样品种仁含油率的化学测定值范围为45.6%~66.5%,各定标预测模型基本涵盖了茶籽种仁含油量的范围,含油量分布十分均匀。因此,本定标模型适用的线性范围为45.0%~70.0%。
图 2 含油量检验集散点
Fig. 2 The plot of scatter point for oil content of maize in validation set
2.5 油茶籽含油量近红外定标模型验证
随机选取10份未知样品进行平行比较试验,分别用常规方法和建立的模型测定其化学值和检验模型的精度,分析结果见表 3,4。
表 3 常规法测定值和近红外预测值比较
Tab.3 Comparison of value between conventional and the near infrared predicted
表 3 常规法测定值和近红外预测值比较
Tab.3 Comparison of value between conventional and the near infrared predicted
样品序号 Sample No.测定值(常规法) Value (Conventional) (%)预测值(第n组) Predicted value (Group n) (%)预测值(第m组) Predicted value (Group m) (%)预测值与常规测定值差异 (第n组) Differences of the value (Group n)预测值与常规法测定值差异 (第m组) Differences of the value (Group m)
160.461.3460.890.940.49
261.7960.7561.92-1.040.13
357.9256.6957.33-1.23-0.59
463.3463.1263.42-0.220.08
558.8359.6158.780.78-0.05
660.5661.3260.790.760.23
759.9560.9459.860.99-0.09
862.4762.8662.440.39-0.03
960.3361.0660.410.730.08
1059.7858.6860.39-1.10.61
表 4 常规法测定值与近红外预测值的相关系数
Tab.4 Correlation coefficient of value between conventional and the near infrared predicted
表 4 常规法测定值与近红外预测值的相关系数
Tab.4 Correlation coefficient of value between conventional and the near infrared predicted
组别Groups相关系数 Correlation coefficient (R)验证集预测标准偏差SEP
第Ⅱ组 Group Ⅱ0.880.91
第Ⅲ组 Group Ⅲ0.980.33
从表 3,4得出,利用近红外光谱技术测定茶籽含油率是可行的,其中用粉碎种仁测定效果最好,与常规化学分析测量结果之间的相关系数为R=0.98,预测标准偏差为0.33。因此基本可代替常规测试方法; 而用整颗种仁建立的定标模型与常规化学分析测量结果之间的相关系数为R=0.88,预测标准偏差为0.91,因此也代替常规测试方法,但误差稍偏大,可用于测定准度要求相对不高而比较珍贵、量少的样品。
3 结论与讨论
1) 本研究采用瑞典波通公司生产的新型固定光栅连续光谱分析仪(DA7200)具有较强的穿透力,涵盖了最具有穿透力的短波近红外区和信号较丰富的长波近红外区域的主要部分。仪器采用固定全息波长扫描和二极管阵列检测技术,确保无移动光栅的波长漂移,采集光谱数据的同时检测和并行处理所有波长信息。DA7200优化及精确的设计使其适用于快速无损分析样品物理和化学特性,进行定性和定量的检测。
2) 光谱数据利用标准正态变量转换法(SNV)可消除散射影响,并经过一阶导数处理能提高光谱数据处理精度。因此,光谱数据预处理的最佳处理方法是标准正态变量转换(SNV)+一阶导数法。通过采用偏最小二乘法(PLS)、主成分分析法(PCR)回归方法来建立模型,PLS的RC,RMSEC,RCV,RMSECV等4个评价指标都优于PCR。所以PLS应为茶籽含油率近红外分析的最佳回归方法。
3) 研究表明采用风干带壳种子(第Ⅰ组)进行测定,建立的模型与常规法测量值之间相关系数和标准偏差都不理想,与中利用整粒毛棉籽建立出含水率、含油率和出仁率的模型等研究结果存在一定的差异,可能是茶籽大小和种仁厚度不均以及种壳致密而坚硬、种壳和种仁间的空隙差异影响近红外光的穿透。因此建议不采用该样品类型进行测定; 第Ⅱ组是采用风干种子去壳后的整颗种仁进行测定,建立的模型与常规法测量值之间的相关系数为0.88,预测标准偏差为0.91,虽然预测精度稍低,但可用于测定准度要求相对不高而比较珍贵和量少的测试样品; 第Ⅲ组是采用粉碎种仁进行测定,建立的模型与常规法测量值之间的相关系数为0.98,预测标准偏差为0.33。因此可代替常规测试方法。
4) 第Ⅱ组和第Ⅲ组的近红外测定效果比较好,由此建立的定标模型也比较稳定,由于150个标样的茶籽种仁含油量范围为45.6%~66.5%,平均值为60.2%,因此本定标模型适用的线性范围为45.0%~70.0%,基本覆盖了油茶种仁含油量的范围,可用于生产检测。
5) 近红外光谱油茶含油率定标模型的建立,克服了以往常规测定含油率的方法(索氏提取法)测定时间长的缺点(2个测定样品各3次重复需耗时5 h),可为我国油茶含油量的测定提供一种新型测试方法。
6) 近红外光谱定标模型建立要求样品量越大越好,这样建立的模型比较稳定,其得出的预测值与常规法测得值的误差越小。为了进一步提高模型的稳定性,降低误差,还需继续加大样品量的收集,特别是补充含油率低和高的样品以修正定标模型。
参考文献(References)
方彦, 王汉宁. 2007. 利用近红外光谱法测定玉米籽粒含油量的研究..(1)
甘莉, 孙秀丽, 金良, 等. 2003. NIRS 定量分析油菜种子含油量、蛋白质含量数学模型的创建..(1)
高建芹, 张洁夫, 浦惠明, 等. 2007. 近红外光谱法在测定油菜籽含油量及脂肪酸组成中的应用..(1)
顾伟珠, 汪延祥. 1995. 多元线性回归法分析油菜籽含油量的近红外光谱数据..(1)
李钧, 王宁惠, 余青兰, 等. 2006. 傅立叶变换近红外光谱技术分析完整油菜籽含油量数学模型的建立..(1)
李宁, 闵顺耕, 覃方丽, 等. 2004. 近红外光谱法非破坏性测定黄豆籽粒中蛋白质、脂肪含量..(1)
陆婉珍. 2007. 现代近红外光谱分析技术. 2版. 北京: 中国石化出版社, 174-184.
王海莲, 万向元, 胡培松, 等. 2005. 稻米脂肪含量近红外光谱分析技术研究..(1)
汪旭升, 陆燕, 吴建国. 2001. 近红外光谱分析法(NIRS)测定棉籽粉中油分含量的研究..(1)
原姣姣, 王成章, 陈虹霞, 等. 2011. 近红外漫反射光谱法测定油茶籽含油量的研究..(1)
张晓芳, 俞信, 闫吉祥, 等. 2007. 近红外反射技术开放式检测棉籽中水分和油含量的研究..(1)
Greenwood C F, Allen J A, Leong A S, et al. 1999. An investigation of the stability of NIRS calibrations for the analysis of oil content in whole seed canola..(1)
Hartwig R A, Charles R. 1990. Near-infrared reflectance measurement of moisture, protein and oil content of crambe seed..(1)
Misra J B, Mathur R S, Bhatt D M. 2000. Near-infrared spectroscopy: A potential tool for non-destructive determination of oil content in groundnuts..(1)
Norrise K H, Barness R F, Moore J E, et al. 1976. Prediction forage quality by NIRS. Journal of Animal Science, 43(3) : 899-897.
Wei L M, Jiang H Y, Li J H, et al. 2005. Predicting the chemical composition of intact kernels in maize hybrids by near-infrared reflectance spectroscopy..(1)
本文献在全文中的定位:
测定值之间相关系数分别为0.99,0.99和0.97,相对误差分别为4.2%,3.4%,1.9%。建立了玉米籽粒含油量模型,并对模型预测结果的准确性进行了评价,预测
本文献在全文中的定位:
种的棉籽进行常规成分的定标和校验,定标决定系数0.934,预测精度为0.978; 建立了油菜籽含油量和蛋白质含量模型,其NIRS 含油量预测值与实测值相关
本文献在全文中的定位:
油菜种子含油量模型,预测值与实测值的拟合性非常好,平均误差仅为0.1%。测定了油菜籽的油酸、芥酸和含油量,并建立定标模型。结果表明: 油酸
本文献在全文中的定位:
黄豆(Glvcine max)、玉米(Zea mays)等油料作物方面的研究。提出了与近红外光谱分析法相适应的数学模型,并将模型用于整粒带壳油菜
本文献在全文中的定位:
和实测值的相关系数分别为0.98,0.93和0.97,相对误差分别为2.7%,2.5%和7.0%。建立了NIRS油菜种子含油量模型,预测值与实测值的拟合性非常好,平均误差
本文献在全文中的定位:
白质含量预测值与凯氏定氮法的实测值相关系数为0.95,相对误差小于6.0%。用完整籽粒黄豆样品建立蛋白质和脂肪含量近红外定量分析模型,其中蛋白
本文献在全文中的定位:
本文献在全文中的定位:
于计算机技术和化学计量学方法,可以直接分析不经任何预处理的生物样品(; 陆婉珍,2010)。
本文献在全文中的定位:
谱分析法相适应的数学模型,并将模型用于整粒带壳油菜籽含油量的测定; 选用不同品种的棉籽进行常规成分的定标和校验,定标决定系数0.934,预测
本文献在全文中的定位:
我国主要木本油料树种之一,而有关油茶籽含油率的NIRS模型研究甚少。利用近红外漫反射光谱,通过应用多种预处理方法和回归方法,建立了30份
本文献在全文中的定位:
行测定,建立的模型与常规法测量值之间相关系数和标准偏差都不理想,与中利用整粒毛棉籽建立出含水率、含油率和出仁率的模型等研究结果存在一
本文献在全文中的定位:
应用于农产品测试。、、应用NIRS技术成功地分析
本文献在全文中的定位:
早在20世纪70年代,Norris等(1976)率先将NIRS应用于农产品测试。、、
本文献在全文中的定位:
、应用NIRS技术成功地分析了油菜(Brassica campestris)籽和花生(
本文献在全文中的定位:
本文献在全文中的定位:
量分析模型,其中蛋白质、脂肪含量分析模型的相关系数分别为0.99,0.98。建立了NIRS玉米蛋白质、淀粉和含油量模型,预测值和实测值的相关系数分别

我要回帖

更多关于 近红外光谱预处理方法 的文章

 

随机推荐