化学成分-朴素贝叶斯分类算法的烟叶产地模式识别
摘要:
把总糖、还原糖、总氮、烟碱、总氯和总钾这6个成分含量作为影响烤烟烟叶产地的自变量,利用朴素贝叶斯分类算法(NBC)建立烤烟烟叶生产地的判别模型.结果表明,用朴素贝叶斯分类建立的烟叶产地识别模型建模、留一法、预报准确度分别为91.24%、89.05%和88.24%,而用支持向量机分类和K点最近邻分类建立的烟叶产地识别模型的准确率均低于朴素贝叶斯分类建立的模型.可见利用朴素贝叶斯分类算法对烟叶产地进行模式识别研究,可以很好地反映烟叶样本由于产地的不同带来的差异.因此可以将NBC算法引入到烟草行业的研究中.
With the Naive Bayesian Classifier,a pattern recognition model of the producing areas of flue cured tobacco was built.The model features were the contents of chemical components,including total sugar,reducing sugar,total nitrogen,nicotine,total chlorine and total potassium.The accuracy of the training set,LOOCV and the test set were91.24%,89.05%and88.24%,while the results of the SVM and the KNN could not get the same accuracy level as the NBC.The Naive Bayesian Classifier could be applied to pattern recognition of flue cured tobacco samples of different origins.
作者:
吴圣超 刘太昂 葛炯 沙云菲
Wu Shengchao;Liu Taiang;Ge Jiong;Sha Yunfei(Technology Center of Shanghai Tobacco Group Co.,LTD., Shanghai 200082 ,China;Shanghai Fanyang Information Technology Co., LTD., Shanghai 200444, China)
机构地区:
上海烟草集团有限责任公司技术中心 上海帆阳信息科技有限公司
出处:
《betway官方app 学报:自然科学版》 CAS 北大核心 2018年第1期77-83,共7页
基金:
国家自然科学基金(21273145)
关键词:
烟草 朴素贝叶斯分类 模式识别
tobacco naive Bayesian classifier pattern recognition
分类号:
O69 [理学—化学]