動画検索、感覚検索

現在の動画検索では、幾つかの方法の組み合わせにより、サービスが提供されています。

  • 動画ファイル名
  • 動画ヘッダ中のメタデータ
  • 動画周辺のテキスト (タイトル、説明、タグ)
  • 動画字幕のテキスト
  • 音声認識 (Voice To Text) によるテキスト

これらは、動画そのものではなく、動画に付属するテキストデータを検索しているものです。特に利用者により付与されるタグによる分類は意外と正しく、どうにか実用的なレベルのサービスが実現されています。

顔認識 (認証) というセキュリティ方面から発達した技術もあり、出入室管理に用いられたり、テロ対策に用いられたり、身近なところでは携帯電話のロックに使われていたりします。また、デジタルカメラ、デジタルビデオカメラにおいても、人の顔を認識した露出補正が行われていたりします。

認識の技術から顔検索の試みも始まっています。Riya は顔検索から始まり、商品検索なども行っているサービスですが、顔検索の精度は、利用者による膨大なサンプル提供により向上したそうです。各国の様々な普通の人の顔データを集めるには、ある程度の精度でβ公開するという方法が有効だったようです。

顔検索が、YouTube ビデオを検索できるようになった場合、数億本あるビデオの中から、特定の人 (に似た人) を探し出すことは、近い将来に実現しそうです。Blog の書き込みと YouTube のビデオが同一人物として認識できるようになります。プライバシー的には議論も起こりそうですが、自身のデータをデジタル化するということは、そういうことが起こると受け入れられていくと思います。(10年でも20年でも残り続けるので、消せる仕組みは必要かもしれません。)

テキスト検索は、この10年ほどの中で、クローラー技術、インデックス化技術の発達もあり、ネット上に散らばっているテキストを、キーワードを使って集めることが可能となりました。適切なキーワードを入力することは、言葉を知らないと出来ないため、そこがキーワード型の検索の限界ですが、最近では、「感性検索」の活用が始まっています。

「感性検索」活用広がる、キーワードいらない気軽さが売り
http://www.nikkei.co.jp/news/main/20070820AT1D1602017082007.html

感性検索では、絞り込みの過程が数ターンありますが、テキスト検索のような、キーワードを変えたり、絞り込み条件を付けたりといった試行錯誤の感覚ではなく、無理なく利用者に条件を追加してもらえています。

対話型にアヴァターを用いるインタフェースでは、古くは MS Agent などがありましたが、Ms. Dewey は、アヴァターの使い方としては圧巻でした。検索というと、とかく Google 的なシンプルなものが好まれますが、こういう方法もアリですね。

森田::