近赤外分光法による判別分析
東京農工大学 大学院連合農学研究科
教授 高柳 正夫 1.はじめに近赤外分光法は、食品の分析手法の一つとして広く用いられている1-3)。振動スペクトルの一種である近赤外吸収スペクトルには、測定対象の成分の種類、量、存在状態に関する情報が含まれている。また近赤外光は紫外・可視光や赤外分光法に用いられる中赤外光に比べて透過力が大きく、測定対象の内側にまで入り込む。そのため近赤外分光法は、食品を非破壊で全品分析するための有力な手法となりうる。 食品の分析というと、まず成分の定量分析が思い浮かぶだろう。近赤外分光法は、小麦の水分量の測定に成功したことをきっかけにして広く用いられるようになった4)。日本では、ミカンなどの果実の糖度測定から近赤外分光法の応用が広まっている1,2)。これらはいずれも測定対象の水分や糖を定量する分析である。一方、測定対象を大きくいくつかのグループに分ける判別分析も重要である。例えば、対象物を品種、品質、産地、成分(混入物)などにしたがってグループ分けすることがしばしば必要となる。この作業を簡便迅速に行うために、近赤外分光法と多変量解析が用いられる。ここでは、近赤外分光法による判別分析の実例と原理・手法を手短に紹介する。 筆者は近赤外分光法を主に繊維やプラスチックの分析に用いている。そのために、以下の説明で食品以外の実例を用いた部分があることをお許し願いたい。 2.文献に見られる判別分析の例対象物がいくつかの異なるグループに分かれている場合(あるいは分けることができる場合)に、新たに得られた対象物(サンプル)がどのグループに属するのかを判断する作業のことを判別分析という。はじめに、近赤外分光法と多変量解析を用いてどのような判別が行われているのかを見てみよう。以下は、主に研究論文に公表されている応用例であって、必ずしも実用化されているものではない。 (1) 品種の判別 牛肉、豚肉、鶏肉5)や、キャノーラ油、ごま油、オリーブ油のように、全く異なった種類の対象の判別に用いられることがある。これらは見かけや香りなどが明らかに異なるから、扱い慣れた人にとっては機器を用いた分析など必要ないかもしれない。しかし、素人が正確に判別するためや判別の自動化のためには近赤外分光法が便利である。後で紹介する漢方薬の桃仁と杏仁のように、異なる品種でありながら見かけが類似している対象の判別には積極的に用いられる。 ブランド品、例えばイベリコ豚6)のようなブランド肉やリンゴの品種7,8)の判別などの報告が見られる。正規品の確認や偽装品排除への応用が目的である。これらの判別をDNA分析により行おうとすると大がかりで時間も費用もかかってしまうが、近赤外分光法を用いることができれば簡便迅速、しかも比較的安価な検査が可能となる。しかし、どんなブランド品にでも応用できるわけではない。例えば「銘柄米の判別に用いることができないだろうか」という声を耳にするし実際研究も行われている9)が、残念ながら広く実用化されてはいない。 遺伝子組み換え作物かどうかの判別手法としての応用研究も行われている10,11)。多くの国が遺伝子組み換え作物の流通を限定的にしか許容しておらず、簡便な判別法が求められている。見た目で非遺伝子組み換え作物と区別がつかない場合に、近赤外分光法を用いて区別しようというものである。 (2) 品質の判別 小麦の含水量や果実の糖度の分析のように定量的な分析が行われることも多いが、基準を満たしているかどうかの判別のみが行われる場合もある。例えば農作物では、甘いか甘くないか(基準以上の糖度かどうか)、ある成分(栄養成分や生理活性成分)が基準値以上含まれているかどうかなどの判別が行われる。肉眼で確認できない内部欠陥(褐変や空洞)12)や初期腐敗13)などの有無を判別することもある。 上記のイベリコ豚では、育成期に何(主にどんぐり、主に配合飼料、あるいはそれらの混合)を食べさせていたかを肉のスペクトル測定により判別して詳細な品質の管理を行う試みが報告されている14)。鶏卵でも、その卵を産んだニワトリが地鶏なのかケージで育てられたニワトリなのかを卵のスペクトルから判別する試みが見られる15)。 熟成や劣化を近赤外分光法で追跡して、食する適期を判別することもある。例えば、後熟果実であるアボカド16)や、熟成が必要な牛肉17)について、食用適期の判別を行おうという報告が見られる。反対に腐敗や劣化を検出して食用には不適切となってしまったことの判別にも用いられる。 対象の履歴の判別に用いられることもある。肉や魚について、生ものなのか冷凍状態を経験しているかの判別の研究例が多く見られる18-20)。また加工食品について、適切に加工されているか、例えば内部まで十分に加熱を経験しているかどうかの確認などへの応用もある。 (3) 産地判別 産地判別にもしばしば用いられる21-23)。これは、品種判別や品質判別の一種とみなすことができるかもしれない。農水産物は、産地によって品質が大きく異なることがある。高品質のものが得られる地域が限られていてブランド化されていることもある。結果として産地により価格が異なるので、正しい産地判別が必要となる。国産品と輸入品の判別もしばしば求められる。国産品の方が安全で高品質だと考えられることが多いためである。産地判別は、微量元素の含有量のパターンを測定することにより行われるのが一般的であるが、大がかりで費用がかかる分析である。そこで、しばしば近赤外分光法の応用が試みられている。ヒジキへの応用例を後で示す。 (4) 成分分析 異物(殻や種、ゴミや虫など)、混ぜ物、添加物、残留農薬、カビ毒などの有無判別が行われる。近赤外分光法は決して高感度の分析手法ではないので、ごく微量な添加物や残留農薬の検出への適用は困難な場合が多い。しかし、応用を試みた報告は少なくない。アレルギー物質が含まれているかどうかの判別に用いられることもある。 日本ではあまり考えられないことではあるが、発展途上国では米にマイクロプラスチック、香辛料に小麦粉、食用油に廃油が混ぜられたものが市場に出回ることが日常的にあるとのことで、異物や偽装品が混ぜられていないかどうかの判別は重要な課題となっている。粉ミルクにメラミンが混入していた事件は良く知られている。そのために、乳製品に混入された異物の検出に関する研究は多い。異物判別にはしばしばハイパースペクトルカメラによる画像分析も行われる。 (5) その他 アルコール飲料への応用も多くみられる。日本酒では純米酒、吟醸酒などの規格の判別に応用可能であることが報告されている24)。ウィスキーやブランデー、中国酒やワインでは、産地判別やブランド判別の報告がみられる25,26)。 3.近赤外分光法と多変量解析による判別分析すでに述べたように、近赤外吸収スペクトルには測定対象の成分の種類、量、存在状態に関する情報が含まれている。したがって、測定対象の成分の種類、量、存在状態が異なればスペクトルも異なり、その違いにより判別を行うことができる。例えば農水産物の場合、品種、産地、生育条件などが異なれば成分の種類、量、存在状態なども異なるから、スペクトルを解析すれば品種、産地、生育条件などを判別することができる。品質が異なったり混入物がある場合でもスペクトルは変化するので、スペクトルによる品質判別や混入物の有無判別も可能である。 反対に、成分の種類、量、存在状態などが同一あるいは類似している場合には、いくら異なる対象であっても近赤外分光法による判別はできない。例えば同一製品を異なるブランド名で販売しているような場合、近赤外分光法でそのブランド名を判別することはできない。また、近赤外分光法は感度が非常に良い分析法ではないので、微量の混入物の検出を行う場合には、検出限界が検出対象の濃度よりも十分に低いかどうかに気をつけることが重要である。 赤外吸収スペクトル(中赤外領域のスペクトル)では、吸収バンドの帰属(ある吸収バンドがサンプルに含まれるどの成分のどの官能基に起因するかの対応付け)を行い、その成分の分子構造、量、存在状態に関する情報を得ることにより定量分析や判別分析が行われる。しかし近赤外吸収スペクトルでは、多くの場合観測される吸収バンドをサンプルの特定の成分の特定の官能基に帰属することが困難なので、スペクトルの解析は主にパターン認識により行われる1-3)。すなわち判別分析であれば、スペクトルの異同を調べることになる。具体的には、信頼できるサンプル(標準サンプル)を十分たくさん集めてスペクトルを測定し、多変量解析を用いてスペクトルの差異を抽出して判別モデルを作成する。その判別モデルを用いて、未知のサンプルについてスペクトルに基づいた判別を行う。 例を示そう。図1に4つの異なる材質の布の近赤外吸収スペクトルを示した。綿と羊毛とポリエステルのスペクトルは大きく異なるから、スペクトルによるこれらの判別は容易である。すなわち三者のいずれかである未知サンプルについて、スペクトルを測定して信頼できるサンプルのスペクトル(標準スペクトル)と比較すれば、目視でもその材質の判別が可能である。
図1 綿、麻、羊毛、ポリエステルの布の近赤外吸収スペクトル。 綿、羊毛、ポリエステルの判別は容易であるが、綿と麻のスペクトルの目視での判別は難しい。
今度は綿と麻のスペクトルを比べてみよう。綿も麻も同じセルロースでできた繊維なので、スペクトルは酷似していて目視で区別することは困難である。そこで多変量解析により判別を試みることになる。多変量解析を用いればスペクトルのわずかな違いを抽出し、整理して図として表すことができる27)。次に具体的な判別分析の例を紹介しよう。 (1) 桃仁と杏仁の判別28) 図2は、桃仁と杏仁(モモとアンズの核の中にある種)の写真である。いずれも漢方薬として用いられる。見かけはとてもよく似ているが、薬効が異なるので明確に区別する必要がある。目視での判別は困難なので、拡散反射法で測定した近赤外吸収スペクトルによる判別を試みた。両者のスペクトルを図3に示した。スペクトルもよく似ていて、目視での判別はなかなか難しい。このような時には、測定されたスペクトルを主成分分析して、結果をスコアプロットにまとめると判別が可能となる場合がある。詳細な説明は省くが、主成分分析を行うことによりスペクトルの差異(変化、バラツキ)を特徴づける成分(主成分)を探し出すことができる。それぞれのスペクトルにそれらの成分がどの程度含まれるかを表すスコアを求めてスコアプロットと呼ばれる図に表すことにより、スペクトルの特徴の整理を行うことができる。
図2 漢方薬に用いられる桃仁と杏仁
図3 桃仁と杏仁の近赤外吸収スペクトル。
図4 桃仁と杏仁の近赤外吸収スペクトルの主成分スコアプロット。
図4(a)に桃仁と杏仁それぞれ60個、合計120のスペクトル(800-2500 nm)に適切な前処理を施した後に主成分分析を行うことにより得られたスコアプロットの例を示す。白丸、黒丸のそれぞれがサンプル一つずつ(白丸が桃仁、黒丸が杏仁)に対応する。白丸と黒丸は異なった領域に集まってプロットされるので、このスコアプロットを見ることにより、そのサンプルが桃仁か杏仁かの判別をすることができる。図中の曲線は判別曲線で、桃仁、杏仁それぞれのプロットの分布からの距離(マハラノビス距離)が等しくなるように描いてある。判別曲線により、両者が確実に判別できることがわかる。 次に、図3のスペクトルの短波長側、両矢印を示した領域(800-1100 nm)のみを用いた判別を試みた。この領域の近赤外光は、特に透過力が大きく、また安価な分光装置の入手が可能な波長領域でもあるので、果実等の農作物の分析によく用いられる。図4(a)と同様の主成分分析を行い、スコアプロットを作成すると図4(b)のような結果が得られた。ここでは桃仁と杏仁のプロットが入り混じっていて、この図を用いて両者の判別を行うことはできない。この波長領域には目立った吸収バンドが無く、桃仁と杏仁のスペクトルの違いよりもサンプルごとのスペクトルのバラツキの方が大きい。そのために主成分分析のようにスペクトルから大きな変動成分を抽出する方法では、桃仁と杏仁のスペクトルの違いを抽出することができないのである。 主成分分析のように、それぞれのスペクトルが桃仁のものであるのか杏仁のものであるのかの区別をしないで解析を行う方法を、「教師なしの判別モデル作成法」という。一方、それぞれのスペクトルが桃仁のものであるのか杏仁のものであるのかを指定して解析を行う方法を「教師ありの判別モデル作成法」という。教師ありの作成法のほうが解析に用いる情報が増えるので、より効果的な判別モデルを作成することができる。ここでは、手軽に使うことができるので最近広く用いられるようになってきた教師あり判別モデル作成法であるPLS-DA(Partial Least Squares Discriminant Analysis)の結果を紹介しよう。PLSは定量モデルの作成に用いられる代表的な方法であるが、PLS-DAではこのPLSを判別分析に応用する。桃仁の標準スペクトルに 1、杏仁の標準スペクトルに -1という数値を対応付けて(割り当てて)スペクトルから数値を求める定量モデルをPLSにより作成する。判別対象のサンプルについて、そのモデルを用いてスペクトルから予測された数値が正であればそのサンプルは桃仁、負であれば杏仁と判定する。この方法では、PLSがスペクトルから桃仁と杏仁の区別に有効な成分を探し出して定量モデルを作成するので、スペクトルの変動を成り行きで解析する主成分分析よりもサンプルの種類を確実に判別するモデルを作成することができる。 結果の例を図5に示す。横軸は試料番号で、それぞれの試料についてスペクトルをPLS-DAで作成したモデルで処理した時に得られる数値が図示されている。図5(a)の試料の1から60がモデル作成用の桃仁サンプル、61から120がモデル作成用の杏仁サンプルの結果である。図5(b)は1から120までのサンプルを用いて作成したモデルが正しく機能しているかを確認するためのテスト用サンプルの結果で、121から140が桃仁、141から160が杏仁の結果である。モデル作成用だけではなく、テスト用のサンプルも桃仁の結果はすべて「正」、杏仁の結果はすべて「負」と正しく判別されている。このように教師ありの判別モデル作成法を用いると、判別対象のスペクトルのわずかな差異を効果的に利用した判別モデルが作成できる。
図5 桃仁と杏仁の近赤外吸収スペクトル(800-1100 nm)のPLS-DAの結果。
(2) ヒジキの産地判別29) PLS-DAの応用例をもう一つ示そう。ヒジキの産地判別の結果である。日本で販売されているヒジキには、国産のほかに韓国産と中国産のものがある。過去に輸入品が国産品と偽って販売された事例があるので、簡便な産地判別法が必要だと考えられている。 図6に解析の例を示した。国産18点と韓国産3点を用いてPLS-DAで判別モデルを作成し、国産5点、韓国産2点で作成したモデルのテストを行っている。ここで用いたサンプルについてはモデル作成用もテスト用もすべて正しく判定されている。しかし、韓国産についての信頼できるサンプル数が少ないので、まだ確実に判別可能であると結論することはできない。さらに、生産後時間がたった(概ね賞味期限が過ぎた)サンプルでは判定精度が低くなることが見出されている。実用化するためには、サンプル数を十分に増やし、生産後の経時変化も検討しながら慎重に判別モデルを作成する必要がある。
図6 国産と韓国産のヒジキの判別。近赤外吸収スペクトル(7300-7236および6044-5840 cm-1)を用いてPLS-DAで作成した判別モデルの結果。
(3) その他の判別手法 判別モデル作成法として、主成分スコアプロットとPLS-DAを紹介した。これらは計算が比較的容易な手法なので広く用いられている。しかし万能ではなく、例えば類似度が高いサンプルの判別や、判別目標以外にスペクトルを大きく変動させる要因がある場合などでは、十分な精度の判別モデルを作成することができないことも多い。また、主成分スコアプロットは多種同時判別にも応用が可能であるが、PLS-DAは二者判別にしか用いることができない。そのために、さまざまなモデル作成手法が用いられている。ここでは詳細を説明する紙面の余裕が無いので、いくつかの代表的な方法の名前のみ紹介する。 Soft independent modelling by class analogy(SIMCA)法は、主成分分析の結果に基づき教師ありで判別モデルを作成する手法として従来から用いられている。代表的な判別分析法として知られているフィッシャーの判別分析法は、スペクトルのように変量の数が非常に多いデータにはそのまま適用することが困難であるが、筆者の研究グループは、フィッシャーの判別分析法に正則化と直交分解を組み込むことによりスペクトルへの応用が可能で強力な判別モデルを作成することができるFDOD(Fisher's discriminant analysis orthogonal decomposition)法を提案した27,30)。サポートベクターマシン(support vector machine、SVM)は最近注目を集めている手法で、「マージン最大化」という考え方に基づき最も合理的と考えられる判別モデルを作成する。ニューラルネットワーク(artificial neural network、ANN)は、深層学習により高度な判別モデルを作成できる手法である。 4.おわりに近赤外分光法は、食品の非破壊分析に応用可能な手法として大いに期待されている。果実の品質検査など、すでに日常的に用いられている分野も存在する。しかし、まだ期待されているほどに広くは用いられていないように感じられる。スペクトルから有用な情報を引き出すために多変量解析を用いて判別モデルや定量モデルを作成しなくてはいけないところ31)が、現場の生産者や技術者が使うときのハードルになっているのかもしれない。大学や研究所での研究開発のレベルでは多くの成果が発表されているが、なかなか現場で広く使ってもらえるようにはなっていない。大学や研究所での研究開発が現場のニーズに合致していないのかもしれない。 食品は、安全と安心を保証するために、生産、流通、消費を通じて適切な検査による管理がいっそう求められるようになってきた。その中で、近赤外分光法でできることがいろいろとあるはずである。ニーズと研究開発がうまくかみ合って、近赤外分光法が食品分野で広く用いられて、安全と安心に貢献できるようになることを期待する。 参考文献
略歴
サナテックメールマガジンへのご意見・ご感想を〈e-magazine@mac.or.jp〉までお寄せください。 |
Copyright (C) Food Analysis Technology Center SUNATEC. All Rights Reserved. |