読者です 読者をやめる 読者になる 読者になる

初めまして戻ってまいりました榛澤です ~10倍返しの統計学 その1~

統計
いつもお世話になっております。
この度エンジニアの席に戻ってまいりました麻雀部部長の榛澤と申します。

つくつくぼうしも鳴き始め、秋の到来を感じさせる時期になりましたが皆様いかがお過ごしでしょうか?
今年の夏の終わりは少し早そうですね。

さて、ぼくのことをあまり知らない方のために少しだけ自己紹介をします。
現在入社6年目であり、3年半はエンジニアの仕事をしていてそこから約2年はデータマイニングをしていました。
ちなみに趣味は麻雀、為替など数字にまつわることであり、物事に対して事実に基づいたオカルト的な理論を構築していくことが好きです。

エンジニアブログを書くのは今回で初ですが、今後数回にわたり書いていく予定ですので
どうぞ宜しくお願いします。
このエンジニアブログでは主に、データマイニングで扱う統計学の素晴らしさを小出しに
紹介していきたいと思っています。
統計学とは何か?何のために用いるのか?仕事や普段の生活に統計学を使うためにはどうすればいいのか?
数回にわたって読み終える頃にはいつの間にかこのような知識がついている、そんな記事にしていこうと思います。

では早速、そもそも統計学とは何なのか?そのような話をしていきます。
統計学と聞くと何やら難しい話に聞こえるかもしれませんが、実は普段の生活において私たちは統計的思考を行っているのです。
例えば天気予報を見て傘を持参するかを考えたり、過去に体調が悪くなる直前に食べたものが苦手になるなど、これらはすべて統計的思考に基づいているのです。
しかし無意識に行う統計的思考には誤った先入観で思い込んでしまうケースもあるのです。

ここで例を紹介します。
あるクラスの40名の生徒で誕生日が同じというペアがいる確率はどれぐらいか?誕生日が全員違うケースの方が圧倒的に多くなるだろうというのが大多数の感覚だと思います。しかし、それがまさに誤った先入観であり実際に計算してみると下記のようになります。

(誕生日が重ならない確率) = 365
P40 / 365^40 * 100 = 10.9(%)

つまり実際は9割方で誰かしらは誕生日が重なるのです。
どうでしょうか?考えるよりも遥かに高い確率ではないですか?

このように思い込みの解釈ではなく正しい統計的思考を導くためにも統計学を用います。

今回は第一回ということで挨拶がメインとなりましたが、このへんで失礼致します。
ではまた次回も宜しくお願いします。