インタビュー:株式会社日本経済新聞社 様

95%の高精度を誇る言語処理機能が、コンテンツの価値を高める

インタビューイメージ
インタビューイメージ

新聞を中核に、雑誌、書籍、電子メディア、映像からデジタル事業まで、幅広く事業を展開する日本経済新聞社。
この事業の中には、ILUが提供する、記事への自動タグ付けサービス『T-laei』が、基幹システムとして活躍しています。
日本経済新聞社の伊戸基毅さんと、藤原祥司さんに、ILUとの取り組みや、今後の展開について、お伺いしました。

-- Chapter01

間違わないタグ付けにより、省力化に貢献

インタビュー風景1 インタビュー風景1

―― ILUとプロジェクトに取り組むことになった、きっかけを教えてください。

伊戸さん(以下、敬称略) 弊社が提供するサービスのひとつ、『日経テレコン』の記事を検索する機能をどのように強化するか、検討している際に、お会いしたのが始まりです。『日経テレコン』は、国内外の新聞や雑誌、調査レポートまで、膨大なデータの中から、お客様が求める情報をピンポイントで提供できるサービスを目指していました。
日経の記事だけではなく、コンテンツを提供してくださる他社の記事にも会社名、人名、テーマなどの「タグ」を正確に付与するために、クリアべき課題が2つありました。

藤原 1つ目の課題は、記事へタグ付けする精度の向上です。
弊社には、30年にわたって運用しているデータベースがあり、記事に自動でタグをつける機能はありましたが、間違うこともありました。そのため、担当がチェックして、間違っていた場合は、ひとつひとつ修正する必要がありました。
しかし、間違いに基づいてタグ付けの機能を修正することはできなかったので、同じ間違いを繰り返します。ですから、タグのチェックと修正に、かなりの労力がかかっていましたね。

伊戸 言語処理の中でも、記事の内容を理解して、タグをつけることは非常に難易度が高い取り組みです。例えば、「ライオン」という単語の前後の文脈から、企業名か動物かを区別し、検索結果に反映することは困難なことでした。

―― タグ付けの精度を上げるために、ILUとどのような取り組みを行われたのでしょうか。

藤原 サービスとして提供できるレベルの精度にするため、1つのカテゴリに対して、何度もチューニングを繰り返しました。
弊社では、精度を計るために、適合率と再現率を指標とし、当時はどんなにがんばっても80%が限界だろうと言われていました。
しかし、最終的には95%を達成することができたので、ILUさんの技術と、粘り強さに感謝ですね。

伊戸 『日経テレコン』は、記事1件を閲覧するごとに、情報利用料金をいただくサービスです。ですから、検索して表示された記事が、お客様が探していたものではなかったということは許されません。
ILUさんとは、その後もチューニングにとことんこだわりました。そうした細かなチューニングに対応してもらえるのもの、ILUさんならではだと思います。

藤原 おそらくですが、他社のサービスを使っていたら、ここまで精度を上げることはできなかったと思います。
ILUさんのサービスは、それ自体が非常に高度なのはもちろん、間違えたところをすぐに直せることが、素晴らしいです。

インタビュー風景2
インタビュー風景2

-- Chapter02

先端技術を支えるのは、伝統工芸職人のような高度な技術

――貴社が提供される『日経テレコン』で抱えていた、もうひとつの課題は、何だったのでしょうか。

伊戸 記事の分類定義と、その定義を計算機で処理できるように表現することです。一般的な新聞の記事は、政治や経済、スポーツなどに分類されますが、弊社では、企業の活動で検索できるように、独自の分類を作りました。
例えば、M&Aであったり、海外進出であったりといった具合です。この分類のルール作りが、困難を極めましたね。

――具体的には、どういった点で苦労されましたか。

藤原 ルール作りをするために、ILUさんからは、「言葉を概念で捉える辞書があり、その概念のルールを使って分類を実現します」と説明を受けましたが、本当にできるのか、半信半疑でしたね。実際にやってみるまで、どの程度の精度が得られるのか分からなかったので、伊戸と二人で徳島県にあるILUさんを訪問して、辞書とルールを作っているスタッフの仕事を拝見することにしました。実際に訪問して、私たちもルールを作ってみて、非常に高度な作業であることが理解できました。

伊戸 ILUさんは、世の中の最先端技術を扱われていますが、実際に働いているスタッフの姿勢は、伝統工芸職人のイメージが近いかもしれません。ILUさんの言語データベースは、30年の蓄積があり、職人向けのツールが用意されていて、職人が仕事をしやすいように調整されているという印象でした。
仕事がしやすいから、効率的に作業が進み、概念とルール、2つが同時進行で賢くなっていく。その過程を目の当たりにして、ILUさんの高い技術力が、身に染みて分かりました。

――『日経テレコン』以外にも、ILUと共同で取り組んだサービスはありますか。

藤原 企業が開示した決算資料から文章を自動で作成し、配信する『決算サマリー』も、ILUさんの技術が生かされています。これは、決算資料の内容がポジティブなのかネガティブなのか理解して、文章を要約することにより、売上の増減収の要因分析や同業他社との比較などをグラフや一覧表で示すサービスです。

――現在、ILUと取り組んでいるプロジェクトは、どのようなものでしょうか。

藤原 企業のネガティブな情報を簡単に検索できる『日経リスク&コンプライアンス』です。企業名を検索するだけで、「行政処分」や「不正行為」といった企業の信用情報に関わる記事を、日経新聞だけでなく、地方新聞の情報からも優先して表示します。
リリースして1年以上経ち、お客様からはより細かくリスクの分類ができないか、というご要望を頂くようになりました。そこで、ILUさんとは『日経テレコン』のときのように、リスクを分類するルール作りと、記事のタグ付けをお願いしています。

-- Chapter03

高い精度を誇るILUのサービスが、事業の核に

インタビュー風景1 インタビュー風景1

――これまでを振り返って、ILUのプロジェクトの進め方はいかがでしょうか。

藤原 まずは、そのサービスを実現できるかどうか精査して、判断を伝えてくれます。なんでもできると言わないので、信頼できますね(笑)。

――ILUのサービスは、貴社にとってどのような存在といえますか。

伊戸 『日経リスク&コンプライアンス』はもちろん、弊社では様々な情報サービスを提供していますが、すべてのテキスト情報のコンテンツは、ILUさんの『T-laei』によって、タグ付けされて世に送り出されます。コンテンツにタグが付くことで検索が容易になり、コンテンツの価値が1段上がります。今となっては『T-laei』は、事業の核となり、欠かせないものです。

藤原 自然言語処理の世界はどんどん進化しているので、今ではILUさんに限らず、いろんなベンダーさんとやり取りをしています。その中でもILUさんにプロジェクトをお願いする理由は、高い精度が求められるサービスでも、ILUさんなら応えてくれるからです。

伊戸 これは余談ですが、ILUさんと一緒に取り組んで、プロジェクトがいくつも立ち上がったことで、「あんなことができるんだ」「こんなことができるんだ」という話が様々な部署に広がり、例えば弊社IT本部とILUさんとで、自動Q&Aシステムのプロジェクトに取り組んでいただき、すでにサービス提供を行っています。これは、書類の申請方法など、これまで総務や人事が回答していた社内業務の質問に自動で答えるシステムです。

――ILUに今後期待することは何でしょうか。

藤原 ILUさんが目指すところは、「言語を処理する」ことではなく「言語を理解する」こと。
言語の理解を突き詰めてもらうことで、私たちも新しい情報サービスを生み出せるのではないでしょうか。

伊戸 私たちのサービスは、「次の決断へ導く」というコンセプトの下、法人のお客様へ提供するものです。
ILUさんと力を合わせていくことで、コンテンツをそのまま提供するではなく、意思決定判断に使えるような情報に加工して、提供できるのではないかと考えています。