インタビュー:株式会社QUICK 様
企業開示情報をAIで瞬時に読み解き、速報で提供
日本経済新聞社グループの一員として、世界中から集めた株式や債券、企業情報などのデータやニュースを分析・評価して幅広く提供する金融情報ベンダーQUICK。
ILUの自然言語理解技術など最新のAIを様々な金融サービスに活用しています。
その中で、膨大な企業の開示書類から効率的に必要な情報を自動抽出・解析して配信する「QUICK AI速報」のプロジェクトについて、同社の宮村裕之さん、荻野紘和さんにお伺いしました。
- ナレッジ開発本部
ナレッジコンテンツグループ 部長
宮村裕之さん - ナレッジ開発本部
ナレッジコンテンツグループ プランナー
荻野紘和さん
-- Chapter01
PDFの解析技術を求めILUのソリューションを採用
――プロジェクト以前はどのような課題がありましたか。
宮村さん(以下、敬称略) 決済短信など企業の開示情報を伝達する公的なシステムとして、東京証券取引所のTDnetと金融庁のEDINETがあります。当社では従来、それらに掲載された開示書類を閲覧しながら「誰が株式の何%を保有している」という数値を人の手によってデータベースに入力していました。
荻野 決算期を迎えた企業が多い時期は1日に200~300社の情報が開示されるので、5名の専門チームで一日中対応していました。
そのような状況下で、作業の効率化だけでなく人為的なミスを減らすことも大きな課題でした。
宮村 本当は数値を抽出するだけでなく文章の要約も行いたかったのですが、スタッフのスキルや業務知識のハードルが高くなるので手が出せませんでした。
とはいえ、TDnetとEDINETが提供する情報をAIで読み解くにはXBRL(注1)とPDFの解析技術が必要で、特にPDFを正確に解析して文章の意味を解釈する技術を持つ企業は少ないという実情もありました。
荻野 そんな中、日本経済新聞社がILUさんの文章生成・要約ソリューションを活用し、企業が開示した決算資料から文章を自動的に作成して「決算サマリー」として配信している取り組みを知り、当社でも活かせると思ったのです。アウトプットは違っても、情報をインプットしてデータを構造化するプロセスの基礎は同じですから。
(注1 : 企業の財務諸表や財務報告などを記述するための形式を定めた規格)
――ILUの第一印象はいかがでしたか。
荻野 我々もビジョンは持っていたものの、実際にどのように進めようかと手探りの状態でした。ILUさんは場数を踏んでいるだけあって、どのようにアプローチすればよいかを的確にアドバイスし、打ち合わせや企画書の内容からやるべきことを常に先回りして提案してくれたのです。
お願いしたものが最初にアウトプットとして上がってきた時は「もう人の手をかけなくても良くなるのでは」と夢が広がりました。
宮村 できることとできないことを明確に伝えてくれるので誠実な印象を受けました。ただし、ILUさんの中で「できる」の基準は非常に高いレベルにあり、我々のビジネスとも相性が良かったと思います。それで2014年から今日までずっとお付き合いさせていただいています。
荻野 AI系の会社というより、良い意味で日本企業らしい感触、職人的な気質も感じましたね。
宮村 距離的な不便さもなかったです。当初、月1回は当社まで来ていただき、週1回WEBミーティングも開いていました。最近、急遽WEBミーティングを始める企業が多いですが、そのおかげで我々はコロナ禍のもとでも普段と変わらない体制で業務を進めることができました。思わぬ副産物でしたね(笑)。
-- Chapter02
AIと人の手を融合させたハイブリッドなサービスを展開
――プロジェクトを進める中で生じた新たな課題はありましたか。
宮村 抽出する重要キーワードが想定していたものとずれてしまうレアなケースも出てきました。もちろん我々も100%解析できるとは思っていませんが、ILUさんは「どうして100%にならないのか」を説明したうえで、95%のものを限りなく100%に近づけることに挑んでくれます。そういう点にも好感を持ちましたね。
荻野 一例を挙げると、企業は「今期の営業利益は100億円になる見込み」といった「業績予想修正」を開示するのですが、AIが文脈とは反対に捉えてしまうことがありました。「ある部門は赤字だけど全体では黒字」という文章から、赤字部門の不調の要因だけを抽出してしまうといった状況です。
宮村 意図的なのか、書き手の癖なのかはわかりませんが、業績が好調と見せておいて最後に「赤字でした」という文章もあります(笑)。
そうした文書の正確な要約は、さすがにAIは不得てでしたね。
荻野 その「業績予想修正」に特化した「業績予想コメント」というコンテンツをリリースすることはすでに社内決定していたので、我々から「こういう場合はこうしてください」とILUさんに細かなカスタマイズをお願いして解消していきました。2019年にプロト版を開発し、アウトプットを社内の記者やアナリストに見てもらったところ、「自分だったらこうは書かない」「抜き出す箇所が間違っている」といった指摘が3割程度ありましたが、2020年夏のリリース以降はそうした指摘は届いていません。
宮村 現在、ボリュームが多くて人の手では対応できない速報はAIに任せ、後で記者やアナリストが書いたものを適用させるというハイブリッドなサービスを行っています。もともと人と機械それぞれの持ち味を活かすことを目指していたので、その点はうまくいっていると言えます。
-- Chapter03
「書類のスペシャリスト」としてのアシストに期待
――辞書はどれくらいの頻度でアップデートしていますか。
宮村 「QUICK AI速報」の辞書は年5~6回アップデートを続けてきました。3ヶ月程度の周期でILUさんと課題を共有し、新しい書類や既存書類の中でできていないものに対応しています。
荻野 開示情報のフォーマットもどんどん変わっていきます。令和に改元された際も、変更が必要でした。
宮村 それは大変な作業ではありませんでしたが、当たり前のことでミスをすれば信頼を損なうことになるため普段より神経を使いましたね。
――実際に新システムが稼働して、どのような効果がもたらされましたか。
宮村 省人化よりも、人が行うことを増やせたのが何よりの収穫でした。今まで開示情報から数値を抽出していた人員を、他の業務に回すことができたのです。どれほど技術が進展しても人しかできないことは残るので、そちらにシフトしたわけです。
人がやることと機械がやることをきちんと棲み分けし、サービスの幅を広げていくことが我々のビジョンです。
荻野 もちろん決算短信などから重要キーワードを抽出して要約文を速報として発信することも実現できました。
以前は、数値だけを抜き出す機械的な作業を人が行っていたわけですが、逆にシステムがより人間的になったと言えるかもしれません(笑)。
――今後どのようにシステムを刷新していく予定ですか。
荻野 TDnetとEDINETで閲覧できる開示情報に留まらず、企業が自社のホームページに掲載しているプレスリリースや統合報告書などにも対応できるようにしたいと考えています。
宮村 「QUICK AI速報」は、企業が開示したあらゆる情報を当社がワンストップで提供するという意図で行っているサービスですから、企業が独自で公表する情報までカバレッジを拡げるのが次のステップです。
荻野 ただし、決算短信であればどの企業も同じようなフォーマットで作成されていますが、写真だけのページがあるなど、構成がマチマチな文書から情報を正確に抽出する技術はハードルが高いです。
宮村 ここ1~2年、どれだけ自動化できるものを増やせるかという試みを行っています。一つは株主総会招集通知。写真や図表をふんだんに使う企業が増えており情報の抽出は難しいですが、そうした書類にも積極的に取り組んでいきます。
荻野 もう一つは株主優待です。「自社製品3000円分」は一般的な3000円の商品券と同義ではありません。
その場合、別なカラムに入力して区別するのですが、その作業はまだ人でないと対処できません。パターンを何百も集めれば機械でも区別できる可能性はありますが、それは今後の課題です。
――その中でILUにどのようなことを期待していますか。
宮村 構造化されていないデータをどのようにしてデータ化していくかという命題に、一緒にチャレンジしていただければと思います。
荻野 ILUさんには「世の中に数多ある書類をすべて解析する」くらいの気概でお手伝いいただくことになるかもしれません。
宮村 当社では映像や音声から情報を抽出するプロジェクトも別途進めていますが、ILUさんには今後も「書類のスペシャリスト」としてお手伝いいただければと思います。