ハイブリッド学習
Hybrid learning
機械学習・深層学習
「機械学習」とは、大量の訓練データ(正解データ)の統計分析等に基づき、特定の課題の解法を計算機自らが獲得する手法をいいます。
「深層学習(ディープラーニング)」とは、多層の人工ニューラルネットワークを用いる機械学習を言い、有効な機械学習方式として近年注目されています。
このような方法で学習させたデータに基づき処理を行う方式を「機械学習システム」といいます。
一般に、自然言語処理に機械学習を適用する場合には、以下のような課題があることが知られています。
- 高度な自然言語処理を高精度で実現しようとすると、大量の訓練データ(正解データ)が必要となる。
- 結論を導くまでの過程を人間が理解することが難しいため、誤りが発生した場合に、それを修正することが難しい。
- 意味の通った文章を生成することは非常に難しい。
人間による知識構築
「人間による知識構築」は、ILUの大規模知識DBで管理された知識をカスタマイズすることにより、お客様固有のご要望にお応えする方式です。
「知識に基づく自然言語処理」の項でご説明した通り、この方式には以下のような特徴があります。
- 非常に複雑な処理であっても、その判断基準や考え方が何らかの方法で知識を開発している人間に伝われば、その処理を実現することができる。
その際に大量の訓練データは不要。 - 誤りが発生した場合に、どの知識がどのように誤動作したのかを人間が確認することができるため、悪影響を最小に抑えつつ、確実に問題を解決することができる。
ハイブリッド学習
ハイブリッド学習は、機械学習・深層学習により実現する機械学習システムと、知識構築により実現する知識駆動システムを組み合わせることにより、今までにない精度と機能を実現する、ILU独自の方式です。
- 機械学習システムの前段に知識駆動システムを組み込むことにより、機械学習が間違えないように入力を変換する。
- 機械学習システムの後段に知識駆動システムを組み込むことにより、機械学習が間違えた場合にそれを補正する。
- 機械学習システムと並行して知識駆動システムを稼働させ、どちらかを採用する。確実に障害を修正するために、知識駆動システムの結果を優先する場合が多い。
- 機械学習に必要となる大量の訓練データを、知識駆動システムを使って生成する。一般に、知識構築に必要となる情報の量は機械学習に比べて少なくてすむことから、正解データを「膨らませる」ことが可能となる。
- 機械学習が十分に成熟しているドメインの問題であれば、機械学習システムに任せる。
- 機械学習では実現が難しいドメインの問題であれば、知識駆動システムに任せる。