読者です 読者をやめる 読者になる 読者になる

FutureInsight.info

AI、ビッグデータ、ライフサイエンス、テクノロジービッグプレイヤーの動向、これからの働き方などの「未来」に注目して考察するブログです。

いろいろ試してわかったTwitterの日本語検索の現状

昨日、チームラボに関してのエントリーを書き、改めてチームラボのプロダクトを確認していました。で、情報大航海プロジェクトでチームラボが作成したサグールテレビを見ていたのですが、どうもサグールテレビ側からYouTube側にあるflvファイルの取得が拒否されているような感じを受けます。

いつもなら、この後ニュースサイト、Googleで検索などを行ったと思うのですが、今の時代はニュースサイトよりもTwitterで原因を調べた方が早そうです。良い機会なので、Twitter検索をいろいろ試してみました。
まず、オフィシャルのTwitter Searchを試した見たのですが、以下の通りうまく日本語を検索してくれません。この様子だと、日本語は形態素解析して分割していない感じがします。検索言語に日本語が選べるのに、肝心の日本語検索がまともに動かないのはがっかりですね。

そんなわけで、次にUnofficialなTwitter検索サービスを試してみました。試したのは以下の2つです。

ただ、どちらも最新のデータは取得できていないようでした。現在の野良Twitter検索がまともに動かないことに関しては、Twitter検索作者さんの以下のエントリーが詳しいです。

これはうまくいっていたのですが3月のはじめにAPIによるアクセスに続いて通常ページもキャッシュされるようになり、ポストの取得がとびとびになってしまいました。影響はかなり出てしまい、回収率は1/10程度に落ち込んでしまいました。

そんなわけで、結局Googleで「site:twitter.com」オプションを指定して検索した結果が一番まともでした。

そして、以下ののような発言をfollowしているtksさんがおっしゃっているのを発見しました。

  1. 高須 正和
    tks サグールテレビからyoutubeの動画が見れなくなってしまって涙目
  2. 高須 正和
    tks youtubeが雑多プレーヤーからのアクセスを遮断したためサグールテレビの危機!......自業自得ですかそうですか
-- this quote was brought to you by quoteurl

なるほど、youtubeが野良プレーヤーからのアクセスをはじいていた訳ですね。過去にニコニコ動画もアクセス拒否を食らっていましたが、YouTube側にとっても野良プレイヤーからのアクセスが馬鹿にならない量だったのかもしれません。最近発表された赤字額もすごいですし。余談ですが、Twitterからpostを引用するときはQuoteURLが非常に便利です。

まぁ、そのことはおいといて、このようにtksさんの上のコメントにたどり着き、動作していない原因を知ったわけですが、この経緯を見るにTwitterの日本語検索の現状はまだあまりイケテナイと言わざるを得ないかと思います。まとめると以下のような感じです。

  • オフィシャルなTwitter Search(http://search.twitter.com/)は日本語がきちんと形態素解析されていない印象。独立して登場する単語なら検索可能(「こんにちは」など)
  • 野良Twitter検索はTwitter側のアクセス制限でまともにデータが取得できなくなっている様子
  • 現状、Googleの「site:twitter.com」オプションが一番役に立ちそう。こんなのもある: Google Custom Search - Twitter Search

Twitterはアーリーアダプタが非常に多いので、いろいろな問題が起きたときの情報源として大変有用です。このあたりの検索機能がこなれてきたら魅力的なプラットフォームになりそうなので、Twitter JPのがんばり(ものすごいプレッシャーをアメリカの開発チームに送る)に期待したいと思います。