文章生成・要約
Text generation / summary

ソリューション概要
文章生成とは、与えられたデータあるいは原文に基づいて、新たな文章を生成する処理です。
長文が与えられた場合に、所定の視点からその要約を生成する処理もこれに含まれます。
多くの文章生成システムは、テンプレートの「空欄」に値を代入することで文章を作成しますが、ILUの文章生成・要約ソリューションは、非定型な文章の生成を可能としています。
-
活用場面
- 速報性の高いデータやテキスト情報を要約して記事を作成し、即時配信したい。
- 企業の報告書の内容を要約して、同業他社および同社過去データと比較したい。
- インタビューや取材情報から、重要情報を指定した文字列長に要約したい。
- コールセンターに寄せられる顧客の声をまとめて報告書にしたい。
- 書き言葉で書かれた文章を、話し言葉に変換してロボットに読み上げさせたい。
-
提供機能
- お客様の視点に立って原文中のどの部分を要約すべきかを判断し、用語や文字数などお客様の規約に沿った文章を生成します。
- 原文の一部を切り出すだけでは不自然な文になってしまう場合でも、文脈に沿った適切な変換を行うことで自然な文を生成します。
- 「売上高は120億67百万円」といった定量的な記述を、「増収」といった定性的な記述に変換することができます。
適用事例
処理概要


関連技術
-
PDF解析とセクション解析PDFファイルを入力とする場合、そこからテキストデータを抽出するとともに、抽出されたテキストの「構造」を推定します。
PDFから抽出されたテキストでは、どの行が見出しで、どこからどこまでがその見出しに含まれる段落なのか、といった文書の「構造」が失われます。
ILUのセクション解析技術は、この失われた「構造」を推定するものです。 -
常体敬体変換「だ・である調(常体)」と「です・ます調(敬体)」との間の変換が可能です。
企業の開示情報から記事を生成するような場合には敬体から常体への変換を、新聞記事を読み上げるような場合は常体から敬体への変換を行います。 -
基本辞書とユーザ定義辞書ILUは、標準的に、1300万語の単語辞書をソリューションに組み込んでご提供いたします。
これにより、単語とその品詞・概念などを正確に理解することができます。
それでも固有名詞や専門用語が不足する場合には、ユーザ定義辞書機能により、お客様ご自身で、単語を拡張して頂くことが可能です。