インタビュー:株式会社テレビ東京 様

キーワードの裏側にある意味情報を解析し、番組検索の精度を向上

インタビューイメージ
インタビューイメージ

動画配信サービスの急速な普及に伴い、近年、番組情報をネット検索するニーズは一段と高まっています。
テレビ東京では、心躍る番組と出会いたい視聴者に届けるため、そのような番組制作にアーカイブ映像を活用したい社内スタッフのために、ILUがテレビ東京向けに開発した意味情報抽出エンジン『C-laeiTX』をベースに『X-RAY!』を開発・導入し、検索システムの精度向上を実現しました。
導入による効果、今後の展望などを、同社の岩田牧子さん、齊藤直宏さんにお伺いしました。

-- Chapter01

新聞記事への自動タグ付けの精度を評価し、導入を決定

インタビュー風景1 インタビュー風景1

――『X-RAY!』の導入以前、どのような課題を抱えていましたか。

岩田さん(以下、敬称略) 当社では20年ほど前から、社内に保有する素材をキーワード検索できる『メタ房』を構築・運用し、社内のスタッフが番組情報を検索する際のメタデータ連携システムとして活用しています。
検索キーワードとなるメタデータは、今まで番組制作者が各自で入力してきました。EPG(電子番組表)が登場してからはその情報も活用していますが、それ以前は現場に頼っていたのです。
ところが、現場は番組を作ることに専心しているため、どうしても後まわしになり、電話で催促することもしばしばありました。
しかも、制作現場の心情としては、どうしても番組の宣伝的な情報を入れがちなので、「華麗な」とか「勇壮な景色」など番組固有のメタデータにならないものも多々あり、入力された情報が検索キーワードとして有効なものかどうかを識別することはできませんでした。

齊藤 そうした状況を改善しようと、2年ほど前に「今後のメタ房の在り方」について社内ヒアリングを実施しました。その際、「入力するワードに揺らぎがあって、検索時にうまくヒットしない」という声が上がりました。
たとえば、正式名称はひらがな表記なのにカタカナで入力したり、本当は間に「・」が入っているのに省かれていると、探しているコンテンツがヒットしないという現象です。

岩田 そうした「メタデータの円滑な入力」と、番組情報の実態に合った「検索精度の向上」が課題でした。

―― ILUとプロジェクトを組むことになった経緯を教えてください。

齊藤 テレビ東京ホールディングスの親会社(筆頭株主)である日本経済新聞社から、同社のサービス『日経テレコン』『日経電子版』で活用している『T-laei』の実用事例を紹介されたことがプロジェクトの発端です。
『T-laei』は『C-laei(注1)』をベースに、記事への自動タグ付けサービス向けにチューニングしたサービスで、記事へタグ付けする精度の高さを評価しました。その技術の背景にあるILUさんのテキストマイニングソリューションは、番組の検索に有効であると考え、まずは報道・経済番組の配信に関係する検索エンジンに導入することにしました。
(注1:ILUのテキストマイニングサービス『ABスクエア』のコアモジュール)

岩田 日経の『T-laei』とテレビ東京の番組テキスト情報を連携させてメタデータを抽出する『T-lac』というシステムを開発して報道・経済番組用に利用を開始したのが2018年で、それがプロジェクトの第一段階になります。
そして『C-laeiTX』をベースに、報道・経済番組以外に専用チューニングを施したうえで、番組テキスト情報からメタデータを抽出するシステム『X-RAY!』が2020年の春稼働しました。

齊藤 テスト運用中、ある機能に対する認識の違いがあり、こちらが期待していた辞書登録作業が行えない事態が起こりました。
その際は、ILUさんでプロジェクトを取りまとめている方が徳島からご足労くださり、こちらのシステム担当と喧々諤々やり合った結果、他の機能でカバーすることで事なきを得ました。その速やかできめ細かな対応には感謝しています。

-- Chapter02

入力したテキストの字面に表れないキーワードも抽出

――実際に新システムが稼働して、どのような効果がもたらされましたか。

齊藤 言語解析のレベルが非常に高く、先ほどお話したような表記の揺らぎをはじめ、略称、通称など、入力されたテキストの字面に表れない番組固有のキーワードも抽出するので、検索精度がかなり向上したことを実感しています。

岩田 現在は、東京・大阪・名古屋地区で放送されたすべての番組については、外部からメタデータの提供を受けています。それにEPGの情報を合わせて活用しているため、入力作業を制作現場に頼らない体制も構築できました。

齊藤 それらの情報がインプットされると自動的に解析され、『メタ房』のほうにメタキーワードとして登録される仕組みになっています。

岩田 他局にはメタデータを管理する専門セクションがあり、専任のオペレーターの手で入力しているケースもありますが、当社はその作業を機械に任せることで省人化も実現できています。

齊藤 人の手で入力すると、どうしても個人の感性により選ぶキーワードも揺らいでしまいます。機械ならルールに基づいた統一性が図れるので、より高い検索精度を保つことができると考えています。

岩田 検索キーワードに必要な要素としての新しい情報ソースの確立によって、入力作業の効率化と検索の精度向上が実現できたと思います。

――辞書はどのようにアップデートされていますか。

齊藤 基本的な言葉の定義はILUさんのほうで更新し、アップデートした辞書のデータが定期的に当社へ送られてきます。
ただし、テレビ特有の表現や、まもなくブレイクしそうな芸能人やミュージシャン、エンタメ系の新語など、当社でないと敏感に把握できない情報もあるため、社内の編成部のほうでも辞書のチューニングを行っています。
対象となる言葉は大量ではないので、以前に比べ社内の負荷はかなり小さいです。
現在は、1クールごと、番組の編成が変わるタイミングで新しい情報の入力を行っている状況です。

岩田 特に最近、グループ名が一般名称である芸人やミュージシャンがたくさん出てきて、正しい名前で検索をかけても、動物とか地名とか違う意味で認識するようなことが起こってしまうのでこれについては今後も課題です。
今も現場に番組情報の入力をお願いはしていますが、電話で催促するようなことはなくなりました(笑)。

-- Chapter03

映像・音声から情報を自動抽出するシステムの構築サポートも期待

インタビュー風景1 インタビュー風景1

――今後どのようにシステムを刷新していく予定でしょうか。

齊藤 次のチャレンジとしては、映像そのものからメタデータを抜き出していくことです。
実は『VideoPrism』というテスト運用中のシステムがあり、これは過去の番組から「顔認識」「テロップ認識」「音声認識」などにより検索キーワードになりそうな情報を抽出するというものです。

岩田 ニュースなど報道系の番組については抽出の精度が高いですが、バラエティ番組などはガヤガヤした音が入ってしまうため、正確な音声認識が難しく、現在そのあたりが課題です。

齊藤 番組の映像や音声を認識・解析すると言っても、結果的には抽出した情報をいったんテキスト化して、メタデータとして検索エンジンにかけるので、ILUさんのソリューションはそこでも活かされます。

岩田 『メタ房』についても新しいコンテンツ管理システムに刷新する予定で、いま構築中です。

齊藤 放送が主眼だったシステムから、より二次利用に対応したシステムに改変しようとしています。今回の検索エンジンの刷新が、そうした新たなチャレンジの原動力になったことは間違いありません。

――その中でILUにどのようなことを期待していますか。

岩田 誰も知らなかった作品名が1年後には流行語になるように、新しい言葉は突然生まれ、たちまち世の中に広がるものです。それが検索エンジンにも速やかに反映していくように、もちろん当社もきめ細かく辞書のアップデートに取り組みますが、今後も早めの対応を続けていただければと思います。

齊藤 当社にはアナログの素材がたくさん眠っており、それらを発掘するプロジェクトもすでに動いています。
今は一本一本を人の目で確認しなければならない状況ですが、『VideoPrism』のような映像・音声の解析システムと、高度な検索エンジンを連携することができれば、より良質のサービスを提供することができます。そのつなぎの部分を担うのがILUさんのソリューションにほかなりませんから、今後のサポートも大いに期待しています。

活用したソリューション