|
株式会社カタログ(本社:東京都渋谷区、代表:清水勇樹)は14日、動画から音声の自動書き起こし(テキスト変換)により、動画内の会話検索を可能にした動画共有サイト「もじもじTV」のクローズドα版を開発。1,000名限定で、αテストユーザーの募集を開始した。
もじもじTVは、ニコニコ動画やYouTubeの動画を登録、もしくは手持ちの動画や音声をアップロードすることで対象動画内の音声を自動でテキストに変換、動画内の会話を対象とした検索が行える動画共有サイト。音声のテキスト変換には、カタログで独自開発した大語彙連続音声認識技術を活用している。動画の再生にあわせて、書き起こされたテキストのカーソルが移動する表示や、動画下にテキストが流れる形式での表示が可能。

変換されたテキストは単語毎に編集可能で、編集したワードをキーワードとして、再生のスライドバーの時間軸にのせて表示できる。他のユーザーが登録/アップロードした動画を自身のみが編集できる「コピる」機能も用意している。
音声認識に利用する辞書については、ネット上から、新語、俗語、人物名など最新のワードを収集し、随時追加するほか、書き起こされた文章を登録ユーザーが編集(訂正)していくことで、変換精度も高まる仕組み。クローズドα版では、主にニュースもしくは、ナレータ入りの動画の変換に対応した辞書を用意。動画の登録は1日3件まで、動画共有サイトからの登録やファイルのアップロードは共に1動画あたり3分程度(20MB)までを目安に制限している。
現段階では、誤変換も多いこと、単語の編集時に他の変換候補も表示することから「同じ発音をしていても意味が異なる単語や、聞こえ方の違いなど、“こんなふうに認識されるんだ”と、誤認識を楽しんでもらえればと考えている」(カタログ)
同社では、もじもじTVをコンシューマ向けのサービスとして位置づけており、対応動画共有サイトの拡大や、ユーザーからのフィードバックを受けて機能拡充に努めていく方針。収益面では、別途、動画マッチング広告システムや、著作権物のモニタリングなど、企業向けに音声認識エンジンを活用したサービスの開発を進めている。もじもじTVでは、状況を見ながら段階的に募集会員を広げ、1年間でユーザー数100万人の獲得を目指している。
もじもじTV クローズドα版
http://mojimoji.tv/
株式会社カタログ
http://catalog.to/
|