言語理解エンジン

NLU & Understanding

知識に基づく自然言語処理

ILUは、文章を計算機で処理するために「知識」を用います。文章を処理するために必要となる情報を、「知識」の形で人間が機械に教え込み、それに基づいて処理させる方式を、「知識駆動システム」と言います。
知識駆動システムは、人間が知識を記述し、知識が表している内容を理解することができるため、以下のような特徴を持ちます。

  • 非常に複雑な処理であっても、その判断基準や考え方が何らかの方法で知識を開発している人間に伝われば、その処理を実現することができる。その際に大量の訓練データは不要。
  • 誤りが発生した場合に、どの知識がどのように誤動作したのかを人間が確認することができるため、悪影響を最小に抑えつつ、確実に問題を解決することができる。

大規模知識DB

ILUでは、処理の目的に応じた膨大な知識を、独自のデータベース(DB)に格納し、長年にわたって蓄積してきました。
その内容は常時更新され、知識はいつも「新鮮な」状態に保たれています。

一般に、高い精度を持つ知識の構築は人間にしかできません。しかし、ILUでは、自社の自然言語処理を利用することで、この知識構築作業を高度に合理化しています。
人間は「人間にしかできない作業」に集中することができ、効率的な知識構築と拡張が可能となっているのです。

言語理解エンジン

大規模知識DBに蓄えられた知識を使って文章を処理するプログラムを「言語理解エンジン」と言います。ILUは、処理の目的と知識の種類に応じた、各種の言語理解エンジンを開発しています。

大規模な知識を使いこなす上で最も重要なことは、知識の種類と量が増加しても、安定的に短時間で処理できることです。このために、ILUは、独自の「多属性照合プログラム」を開発し、各種言語理解エンジンの基盤としています。
この多属性照合プログラムは、創業者の青江が開発した「ダブル配列」というアルゴリズムを採用しており、複数の属性を持つ入力列を最小の計算量で処理できます。例えば、表記、品詞、概念という三種類の属性を持つ単語列に対し、これらの属性を同時に考慮して結論を出すことが可能となります。
また、多属性照合プログラムは、複数の解が検出された場合に最適解を選択するためのアルゴリズムも備えています。

イメージ図
イメージ図