Tweetの量・質を利用して将来予測ができるのではないかというストーリー。
元ネタと鳴っているのはHP LabsのPredicting the Future With Social Mediaというペーパー(8枚と短いしテクニカルな部分も殆どないので読んでみてもいいかもしれない)。
Using the tweets referring to movies prior to their release, can we accurately predict the box-office revenue generated by the movie in its opening weekend?
テーマは映画が公開される前のTweetの数を使って一週間目のボックスオフィス売上を予測できるかというものだ。
上のグラフがその結果だ。縦軸が実際の売上、横軸が(線形関係から)予測された売上だ。軸の縮尺が違うので45°線にはなっていないが、予測値と実測値が近いのが分かる。青い線は売上について仮想の賭けをするHollywood Stock Exchange (HSX)での取引から推定したもので、ペーパーではTwitterを使った予測がHSXを用いた予測より正確であった主張されている。Tweetの内容がネガティブかポジティブかを分析に加えるとさらに正確になるとのことだ。アウトオブサンプルでどうなるのかなども気になるが、ソーシャルメディアが持つマーケティングへの影響力の大きさは疑いようがない。
これからネット上の情報を使った予測は流行るでしょうね。Google Trendを使った売上予想のテクニカルペーパーも去年の今ごろに出ましたし。一般人にどの程度データの入手/収集が可能なのか、という点は気になるところです。
TwitterのデータはLibrary of Congressが保存しているようなのでアクセスできるようになるんでしょうか。プライバシーもあるので難しいところですね。