何かを示したり、相手を説得したりするときに、ストーリーを語る人と統計を使う人がいるけどのこの違いは何かという記事(前読んだと思ったら少し前の記事だった)。
Stories vs. Statistics – NYTimes.com
In listening to stories we tend to suspend disbelief in order to be entertained, whereas in evaluating statistics we generally have an opposite inclination to suspend belief in order not to be beguiled.
気になったのはこの一節。ストーリーを聞く場合には疑うのを止めて楽しもうとする一方で、統計を読むときには逆に信じるを止めるという。しかし、ストーリーの場合に疑わないのは”entertained”が目的ではない。
あるストーリーが説得的かどうかを決めるのはそれが内部的にコヒーレントかどうかだ。ストーリーは世界の状態を記述するものだが、ありうる状態は無数にある。例えば、「道を歩いているサラリーマンに通りすがりの女子高生が飛び蹴りをして蹴られたサラリーマンが突如バク転した」というのも、こうして記述できるという意味でありうる状態だ。
だがそんなストーリーを信じる人はいない。サラリーマンが歩いているだけで女子高生に蹴られるというのはありえなさそうだし、蹴られてバク転する人は見たことがない。しかし、不整合に気づくためにはとりあえずは正しいと仮定して聞く必要がある。パーツ毎に疑っていては整合性まで辿りつかない。
a.) Linda is a bank teller.
b.) Linda is a bank teller and is active in the feminist movement.
これは我々が確率計算が苦手というのを示す時によく使われる例だ。「リンダがバンクテラーである」という状態は「リンダがバンクテラーでかつフェミニストだ」という状態を包含しているのでどちらである確率が高いかといえば前者だ。しかし、多くの人は後者がよりありそう(likely)と答える。
しかし、これは確率計算を間違っているというよりも質問者と回答者の意図がかみ合っていないと捉えるべきだろう。「この商品は最高です」という宣伝文句と「この商品は最高で最高金賞受賞です」という宣伝文句があったとしてどちらがありえそうか。後者だろう。回答者は、aとbの確率を比較しているというよりも、aとbの発言どちらが信用できるかを判断していると言える。
ある事象に対する記述は無数にあるが、長ければ長いほどどこかで整合性を失いやすくなる。真実は確実に整合的なので、説明が長くて整合性が取れているほど説得力がますという仕組みだ。
統計で言えば、仮説をとりあえず信じてサンプル数を増やすと検定力が上がるのと同じことだろう。