ページ

2010年3月27日

統計の出し方

先日の豚を食べる会の時に、僕が数ヶ月前に「グラフを出すだけじゃ意味がない」とTwitterで愚痴っていたと言われました。よく、そんな大昔のつぶやきを覚えているものだと感心しました。で、僕はどの件だったのかよく覚えていませんが、多分、この件だと決めてちょっとだけ。

統計のデータって言うのはとても有効だけど、反面とても危険です。読み誤ると間違った方向に進んだり、他の人の話を聞いているとわざと別の結論に導こうとしているだろうとことがあったりします。でも、今回はそういう話ではなく、作る方の話です。

作る方にとっても統計データって危険です。まず、統計データを作ること自体が目的化しやすいというのがあります。統計データを見せられることがありますが、そのデータから何も仮説や結論が出ずに、単に「出しました」で終わることがあります。確かに、データとして見せられると面白いこともあるんですがね。

統計データをむやみやたらと集めたり、加工するのは意味がないです。無限の時間があれば意味があるかもしれませんが、普通の人間には無理です。まずは、データを扱う前になんらかの仮説や検証したい事象があります。これを忘れると、データを集めることが自己目的化します。

仮説ができあがったら、その仮説を検証するためにどうデータを集めるか、もしくは実験するかを決めます。そして、実際にそれを行ってデータを集めたり整形したりします。最後に、そのデータを元に仮説があっているか判断して、次のアクションを決めたりします。大学でもやってきたことで、ごく当たり前のことです。でも、この最後の仮説の検証をできないのか、しないのか、他の人にやらせようとしているのか、この部分が欠落していたりします。そのような報告を聞くと、何が言いたいのかわかりません。

論文とは違うので、結論は間違っていても構わないのです。間違い、もしくは納得できなければ指摘されるし、指摘できないようなエンジニアのマネージャはいりません。

日本人は奥ゆかしいので、自分の考えを中々みんなに披露しないだけかもしれません。



0 件のコメント: