近紅外光譜分析技術(shù)研究
[導(dǎo)讀] 日前,儀器信息網(wǎng)編輯采訪了邵學(xué)廣,請(qǐng)他發(fā)表了對(duì)化學(xué)計(jì)量學(xué)和近紅外發(fā)展趨勢(shì)、以及限制近外應(yīng)用推廣難點(diǎn)等問(wèn)題的看法,zui后也談到了如今熱點(diǎn)的近紅外大數(shù)據(jù)的發(fā)展前景。
近年來(lái),我國(guó)近紅外光譜分析技術(shù)無(wú)論在基礎(chǔ)研究還是應(yīng)用方面都取得了長(zhǎng)足進(jìn)展。而且在近紅外光譜分析技術(shù)研究的龐大人群中,總是能看到中國(guó)為數(shù)不多的化學(xué)計(jì)量學(xué)人身影。其中,南開大學(xué)教授、中國(guó)近紅外光譜分會(huì)副理事長(zhǎng)邵學(xué)廣就是其中之一。
南開大學(xué)教授 邵學(xué)廣
日前,儀器信息網(wǎng)編輯采訪了邵學(xué)廣,請(qǐng)他介紹了他走進(jìn)化學(xué)計(jì)量學(xué)、走進(jìn)近紅外的歷程,并發(fā)表了他對(duì)化學(xué)計(jì)量學(xué)和近紅外發(fā)展趨勢(shì)、以及限制近外應(yīng)用推廣難點(diǎn)等問(wèn)題的看法,zui后也談到了如今熱點(diǎn)的近紅外大數(shù)據(jù)的發(fā)展前景。
走進(jìn)化學(xué)計(jì)量學(xué),扎根化學(xué)計(jì)量學(xué)
說(shuō)起來(lái),邵學(xué)廣并不是學(xué)化學(xué)計(jì)量學(xué)專業(yè)出身。在讀博士之前他學(xué)的是稀土化學(xué)應(yīng)用專業(yè),1992年博士畢業(yè)后選擇了”小波變換”為未來(lái)研究方向,從此才進(jìn)入了化學(xué)計(jì)量學(xué)領(lǐng)域。邵學(xué)廣經(jīng)常和學(xué)生們說(shuō)起這段經(jīng)歷,一開始很艱苦,*是照著書和手冊(cè)自學(xué)。曾經(jīng)有兩篇有關(guān)小波變換的文獻(xiàn),邵學(xué)廣每年都要看幾遍,據(jù)他自己說(shuō),一直到5年后他自己寫《化學(xué)信息學(xué)》一書的時(shí)候才真正讀懂了這兩篇文獻(xiàn)。
當(dāng)時(shí)邵學(xué)廣決定寫《化學(xué)信息學(xué)》*是因?yàn)橐_課卻沒(méi)現(xiàn)成的教材,沒(méi)想到這本書成為了中國(guó)*本關(guān)于化學(xué)信息學(xué)的書,目前已經(jīng)出版3版。
為什么從小波變換開始,邵學(xué)廣說(shuō)到,“關(guān)于小波變換,1986年上其他領(lǐng)域已經(jīng)有人開始使用,化學(xué)領(lǐng)域真正的*篇文章發(fā)表在1992年。而1992年我正好剛剛參加工作需要尋找并確定今后的研究方向。那么,當(dāng)時(shí)我覺(jué)得新提出來(lái)的小波變換會(huì)是一個(gè)很好的方向。”剛開始的5年多時(shí)間里其團(tuán)隊(duì)一直在做方法,并在各種光譜、色譜方面廣泛嘗試,結(jié)果證明這個(gè)方法的效果特別好,更加增強(qiáng)了邵學(xué)廣的信心,從而這項(xiàng)工作邵學(xué)廣一直堅(jiān)持到現(xiàn)在。
除了小波變換,邵學(xué)廣這些年主要研究工作包括免疫算法、化學(xué)因子分析、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等算法,還包括分子模擬等理論化學(xué)計(jì)算方法研究。
“其實(shí),我們實(shí)驗(yàn)室做的zui有特色的是免疫算法,是我們的一種算法。”免疫算法主要用于色譜重疊組分信號(hào)解析,可以把單峰解出來(lái)。原來(lái)色譜分析10-20個(gè)成分的時(shí)候,需要用時(shí)30-40分鐘。而用了免疫算法只需10多分鐘進(jìn)行分離,分離結(jié)束即直接就能夠計(jì)算出來(lái)。如,40多個(gè)組分的農(nóng)殘分析只需10多分鐘。
結(jié)緣近紅外,思考近紅外
近紅外光譜的缺點(diǎn)之一是解釋性差,峰很寬、很模糊。在計(jì)量學(xué)出現(xiàn)之前,近紅外光譜一直沒(méi)有得到很好的發(fā)展。“近紅外和化學(xué)計(jì)量學(xué)是捆綁在一起的兩種技術(shù),可以說(shuō)計(jì)量學(xué)的發(fā)展推動(dòng)了近紅外的發(fā)展;同樣也可以說(shuō)近紅外給了化學(xué)計(jì)量學(xué)一個(gè)舞臺(tái),讓它有了發(fā)揮作用的地方。”
近年來(lái),近紅外光譜發(fā)展很快,而邵學(xué)廣在近紅外領(lǐng)域也已經(jīng)做了將近20年。這期間他們嘗試了不同的建模方法,也提出了自己的方法,同時(shí)還研究了另一個(gè)非常重要的問(wèn)題,即建模樣品的確定問(wèn)題,發(fā)表了幾十篇的論文。“近紅外相關(guān)化學(xué)計(jì)量學(xué)方法的研究已經(jīng)比較充分、成熟。盡管不能說(shuō)哪種方法,但是有很多方法已經(jīng)能夠用了,想干什么事,基本上都可以做了。當(dāng)然,更‘新鮮’的方法研究也是需要的,但是沒(méi)有那么緊迫了。”
關(guān)于近紅外數(shù)據(jù)處理的發(fā)展趨勢(shì),邵學(xué)廣認(rèn)為,根據(jù)具體的行業(yè)需求進(jìn)行開發(fā),不做大而全的軟件。如,我們之前與中檢院合作開發(fā)的判別藥品一致性的軟件已經(jīng)交付,得到的反饋還不錯(cuò)。另外,基于數(shù)據(jù)庫(kù)的一些算法要實(shí)現(xiàn)標(biāo)準(zhǔn)化。邵學(xué)廣認(rèn)為,近紅外數(shù)據(jù)處理的下一步方向是高光譜,因?yàn)槿缃竦慕t外光譜成像數(shù)據(jù)處理還有不太成熟的地方。
關(guān)于近外光譜分析技術(shù)應(yīng)用與推廣的難點(diǎn),是邵學(xué)廣常常思考的問(wèn)題。首先,他提到的是“靈敏度”的局限。近紅外方法靈敏度很低,很多微量成分不好分析,這是限制近紅外光譜在科研領(lǐng)域應(yīng)用推廣的很大一個(gè)原因。怎么讓近紅外能測(cè)微量成分,邵學(xué)廣已經(jīng)研究7年多的時(shí)間了。邵學(xué)廣承擔(dān)基金委的一個(gè)重點(diǎn)項(xiàng)目就是研究這個(gè)問(wèn)題,經(jīng)過(guò)攻關(guān)2016年時(shí)檢測(cè)限已經(jīng)達(dá)到微克級(jí)別。近紅外另一個(gè)缺點(diǎn)是結(jié)構(gòu)分析能力差,在表征化合物結(jié)構(gòu)方面遠(yuǎn)遠(yuǎn)弱于質(zhì)譜或中紅外光譜。這幾年,邵學(xué)廣從做水的光譜入手,花了很大力氣力圖從復(fù)雜的水結(jié)構(gòu)中把不同結(jié)構(gòu)的水分子光譜提取出來(lái)。水中水分子結(jié)構(gòu)非常復(fù)雜,有單獨(dú)的水分子、二個(gè)水分子結(jié)合、三個(gè)水分子結(jié)合、甚至更多。“希望大學(xué)、研究所更多人員加入到這方面的研究中來(lái)。”
近紅外光譜推廣應(yīng)用更多的限制來(lái)自于儀器之間的差異、測(cè)量之間的差異。邵學(xué)廣這兩年做了很多模型轉(zhuǎn)移方面的研究工作,他認(rèn)為儀器之間的差異基本上可以校正,不是太難。因?yàn)閮x器之間差異是固定的,理論上也是可以校正的。邵學(xué)廣指出,真正難點(diǎn)在于測(cè)量之間的差異,如,樣品擺放位置、顆粒度大小等形態(tài)差異帶來(lái)的光譜變化會(huì)導(dǎo)致測(cè)量結(jié)果變化,且理論上就沒(méi)有解決方法,只能根據(jù)假設(shè)或一定的近似來(lái)修正。邵學(xué)廣基于假定光譜和操作條件之間存在著某些我們不知道的關(guān)系,從而建立相應(yīng)校正模型把這種關(guān)系預(yù)測(cè)出來(lái)。“這個(gè)校正模型使用的效果挺好,但是還缺少相應(yīng)的理論依據(jù)。”
推應(yīng)用發(fā)展,落地人才培養(yǎng)
邵學(xué)廣強(qiáng)調(diào),“化學(xué)計(jì)量學(xué)專業(yè)人才的缺乏是近紅外應(yīng)用發(fā)展的主要難點(diǎn)。”從事化學(xué)計(jì)量學(xué)相關(guān)專業(yè)研究的人員較少,而且,化學(xué)計(jì)量學(xué)不是本科階段必須學(xué)習(xí)的內(nèi)容,研究生階段開課的也不多。歐洲大學(xué)本科階段已經(jīng)在教學(xué)大綱中規(guī)定化學(xué)計(jì)量學(xué)為必學(xué)內(nèi)容,其份量已經(jīng)占到分析化學(xué)內(nèi)容的四分之一。但在中國(guó)還沒(méi)有這個(gè)要求。“這導(dǎo)致培養(yǎng)的相關(guān)人才太少,對(duì)化學(xué)計(jì)量學(xué)和近紅外的發(fā)展限制相當(dāng)大。”
很多人提到化學(xué)計(jì)量學(xué),會(huì)莫名的感覺(jué)有點(diǎn)“怕怕”。事實(shí)上,現(xiàn)在研究化學(xué)計(jì)量學(xué)的人雖然不算多,但是也很容易找到合作的人。另外,如今也有一些比較成熟的軟件,即使不懂化學(xué)計(jì)量學(xué)原理,只要會(huì)用軟件,也能解決問(wèn)題。
現(xiàn)在,邵學(xué)廣在南開大學(xué)本科階段開設(shè)了計(jì)量學(xué)相關(guān)教學(xué)內(nèi)容。而且,經(jīng)常有外面學(xué)生來(lái)邵學(xué)廣實(shí)驗(yàn)室學(xué)習(xí),或者以項(xiàng)目合作的模式聯(lián)合培養(yǎng),時(shí)間不等,邵學(xué)廣負(fù)責(zé)指導(dǎo)。再者,這幾年邵學(xué)廣的實(shí)驗(yàn)室也開發(fā)出了一些軟件。像是具有使用便利等優(yōu)點(diǎn)的小波變換算法,不但成為了邵學(xué)廣實(shí)驗(yàn)室扣背景的標(biāo)準(zhǔn)方法,而且,邵學(xué)廣表示,對(duì)于小波變換,內(nèi)行人可以靈活設(shè)置參數(shù),外行人不調(diào)整參數(shù)也能使用。所有這些都是邵學(xué)廣在為實(shí)現(xiàn)“不應(yīng)該讓不懂計(jì)量學(xué)成為計(jì)量學(xué)和近紅外應(yīng)用的障礙”所做的努力。
由此延伸,邵學(xué)廣談到了近紅外的人才培養(yǎng)問(wèn)題,并強(qiáng)調(diào)“打好地基”的重要性。近紅外研究人員不要只盯住應(yīng)用去做,一方面要針對(duì)應(yīng)用,但又不能*是應(yīng)用。特別是對(duì)年輕研究人員,要把基本理論“打”扎實(shí)了,等到去做應(yīng)用的時(shí)候,應(yīng)用方法、技術(shù)會(huì)非常穩(wěn)固和牢靠。否則,很多技術(shù)不牢靠反而會(huì)導(dǎo)致應(yīng)用失敗。而且,糟糕的是,一旦失敗,大家就會(huì)認(rèn)為這個(gè)方法不好,實(shí)際上會(huì)阻礙了這個(gè)領(lǐng)域的發(fā)展。
大數(shù)據(jù)推動(dòng)近紅外爆炸式增長(zhǎng)
如今“大數(shù)據(jù)”已經(jīng)成為一個(gè)熱詞,邵學(xué)廣也在多個(gè)場(chǎng)合說(shuō)到,近紅外的大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。“與其他大數(shù)據(jù)相比,近紅外光譜大數(shù)據(jù)有兩個(gè)特點(diǎn):數(shù)據(jù)量大、信息量大。”特別是成像光譜和高光譜,高光譜儀器的檢測(cè)器和目前儀器所用的有所差異;而且常用的模型轉(zhuǎn)移、數(shù)據(jù)處理等和原來(lái)傳統(tǒng)光譜也有一些差別,所以,必須開發(fā)一些新的據(jù)分析方法。邵學(xué)廣介紹到,“原來(lái)只是1-2000個(gè)數(shù)據(jù)點(diǎn),現(xiàn)在一個(gè)高光譜數(shù)據(jù)量上萬(wàn),可變量選擇的方法范圍很小。”
此外,一條光譜所含信息豐富,除了化學(xué)信息,還包括物理信息,如硬度、大小、位置等,需要綜合利用。在藥品的真假判別時(shí),往往是隔著包裝測(cè)試的,包裝材料的信息、藥片壓的實(shí)不實(shí)、藥片的形狀等物理信息都可以判別。“我們近紅外不管是哪種信息,只要有這方面的信息,不用刻刻意強(qiáng)調(diào)是物理還是化學(xué)信息。”
“從應(yīng)用角度看,近紅外大數(shù)據(jù)的價(jià)值,目前在于監(jiān)控。”監(jiān)控包括工業(yè)監(jiān)控,甚至應(yīng)用到“大街上”的空氣質(zhì)量等監(jiān)控。“大數(shù)據(jù)來(lái)源于實(shí)時(shí),也來(lái)源于長(zhǎng)期實(shí)時(shí)數(shù)據(jù)的積累。對(duì)大數(shù)據(jù)進(jìn)行相關(guān)分析、可視化分析,把數(shù)據(jù)和事件相關(guān)并從中總結(jié)出其規(guī)律性,比如說(shuō)大型活動(dòng)的人流等。數(shù)據(jù)更多的時(shí)候就可以根據(jù)已有數(shù)據(jù)建立模型,根據(jù)光譜信息預(yù)測(cè)后續(xù)發(fā)展。”
“目前大數(shù)據(jù)研究還處于初級(jí)階段,炒概念的多些,但各行各業(yè)都在用。”如,已有按大數(shù)據(jù)系統(tǒng)設(shè)計(jì)的藥品數(shù)據(jù)庫(kù),把全國(guó)藥監(jiān)的數(shù)據(jù)集成在一個(gè)數(shù)據(jù)庫(kù)中。在這個(gè)庫(kù)的基礎(chǔ)上建立模型,可用于市場(chǎng)調(diào)查、藥品抽檢等。“只需做一個(gè)光譜,上傳到數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)就可根據(jù)模型判別藥品的真假,并把結(jié)果反饋回移動(dòng)終端。目前該數(shù)據(jù)庫(kù)建設(shè)基本完成,相關(guān)技術(shù)均已成熟。”糧食領(lǐng)域也啟動(dòng)了類似項(xiàng)目,雖不涉及網(wǎng)絡(luò)、無(wú)線通信,但也涉及數(shù)據(jù)庫(kù)建設(shè)。可輸入收購(gòu)糧食樣品的光譜來(lái)得到樣品相關(guān)的濕度、蛋白質(zhì)含量等各項(xiàng)參數(shù)。煙草行業(yè)的原料大數(shù)據(jù)系統(tǒng)、生產(chǎn)在線監(jiān)控也已經(jīng)做好。
“類似工作在許多行業(yè)都已經(jīng)開展,但是真正投入使用的不多。”邵學(xué)廣這樣說(shuō)到,“這些大數(shù)據(jù)系統(tǒng)的實(shí)際應(yīng)用,不光是技術(shù)的問(wèn)題,在于監(jiān)管或被監(jiān)管者是否想做。”
不過(guò),邵學(xué)廣也指出,大數(shù)據(jù)的發(fā)展需要由應(yīng)用需求驅(qū)動(dòng)。像現(xiàn)在的物流、快遞行業(yè),需求太大了。而實(shí)驗(yàn)室對(duì)儀器中的大數(shù)據(jù)應(yīng)用現(xiàn)在需求不強(qiáng)烈。但我們這些做研究工作的學(xué)者可提前做好方法。就過(guò)程分析而言,下一步一旦中國(guó)產(chǎn)品質(zhì)量從產(chǎn)品檢驗(yàn)控制轉(zhuǎn)向過(guò)程控制,從政府層面推廣過(guò)程控制,到那個(gè)時(shí)候,企業(yè)自然會(huì)來(lái)找,近紅外光譜會(huì)有一個(gè)爆炸式增長(zhǎng)。