文章生成・要約
Text generation / summary
ソリューション概要
文章生成・要約とは、コンピュータが原文テキストや数値データを理解することにより、人手に頼っていた文章の作成やまとめ作業を自動化する処理です。
例えば、多種多彩な企業開示情報から、指定された論点と文字数で記事を生成すること、短時間では読み切れない長文テキストから、重要ポイントを報告書にまとめることが可能になり、業務効率化が実現できます。
-
活用場面
- 速報性の高いデータやテキスト情報を要約して記事を作成し、即時配信したい。
- 企業の報告書の内容を要約して、同業他社のデータと比較したい。
- インタビューや取材情報から、重要情報を指定した文字数に要約したい。
- コールセンターに寄せられる顧客の声をまとめて報告書にしたい。
- 書き言葉を、話し言葉に変換してロボットに読み上げさせたい。
-
提供機能
- 原文中の要約ポイントや文字数などはお客様の規約に合わせて文章生成できます。
- 原文の一部を切り出し、繋げるだけでは不自然な文になる場合でも、自動調整により文脈に沿った自然な文を生成できます。
- 「売上高は120億67百万円」といった定量的な記述を、「増収」といった定性的な記述に変換することができます。
- 「だ・である調」を「です・ます調」に変換したり、音声合成の読み上げ誤りを自動修正することができます。
適用事例
処理概要
関連技術
-
PDF解析とセクション解析PDFファイルからテキストデータを抽出するとともに、抽出テキストの「構造」を推定します。PDFから抽出されたテキストでは、どの行が見出しで、どこからどこまでがその見出しに含まれる段落なのか、といった文書の「構造」が失われます。
ILUのセクション解析技術は、この失われた「構造」を推定することが可能になります。 -
常体敬体変換「だ・である調(常体)」と「です・ます調(敬体)」との間の変換が可能です。
企業の開示情報から記事を生成するような場合には敬体から常体への変換を、新聞記事を読み上げるような場合は常体から敬体への変換を行います。 -
基本辞書とユーザ定義辞書ILUは、標準的に、1300万語の単語辞書をソリューションに組み込んでご提供いたします。
これにより、単語とその品詞・概念などを正確に理解することができます。
それでも固有名詞や専門用語が不足する場合には、ユーザ定義辞書機能により、お客様ご自身で、単語を拡張して頂くことが可能です。