しろもうふのひきだし

わたしのひきだしです

読書備忘録#8_確率面白すぎる知恵本

読書備忘録#8_確率 面白すぎる知恵本
博学こだわり倶楽部

【読もうと思った動機】
確率って、よくわからない。例えば、当たる確率10%だったら、10回試行すれば、当たるってこと?実際はそうではない。手術の成功確率90%って、なんだ?あと、数年前に友人から「モンティホール問題」なる問題を出されて、とても面白いと思ったので、一度易しい確率の本を読んでみたいと思ったので手に取った。NEWTONのような科学雑誌だと固すぎるので、文庫本のこの本にした。

【概要】
身近にある「確率」についての説明や、直感から相当かけ離れた実態の確率など、多岐にわたる確率について数学的な裏付けを持って説明している。大数の法則って、恐れ多い。確率に支配されているといっても過言ではないと感じさせられた。なお、面白すぎるかどうかは、個人によります。私は、とても面白かった。


■1章 確率がわかれば迷いはなくなる
・確率の研究はギャンブルから始まった
話の発端は、ギャンブル好きな貴族のメレと数学者のパスカルから始まった。メレが、パスカルにこう相談した。「友人と同じ金額ずつを出し合って、先に3勝した方がすべての掛け金をもらえるという賭けをした。ところが、時間の関係で途中でやめることになった。その時点でメレが2勝、友人が1勝している状態だった。賭け金をどう分配するか迷った結果、メレが2/3、友人が1/3としたのだが、果たしてこれでよかったのだろうか。」
さて、あなたならどうするだろうか。
ひとつの考え方として、勝負がついていないため、賭け金それぞれに返すという方法もあるが、これは王手をかけているメレは納得しないだろう。メレのように、2:1で分けるというものあるが、仮に友人が0勝だった場合に、勝負がついていないのに、メレが総取りするということになり、適切な配分とは言えない。パスカルは次のように解決した。
現在、メレが2勝1敗なので、次の勝負でメレが勝てば3勝となりすべての賭け金をもらえる。次の勝負でメレが負けた場合、二人とも2勝ずつになり、そのあとメレが勝てば3勝となりメレの勝ち、負ければ友人が3勝となり友人の勝ちとなる。二人のギャンブルの腕を同じだと仮定すると、お互いの勝率は1/2。このように考えていくと、メレが続きの4回戦で勝つ確率は1/2、4回戦で負けて5回戦で勝つ確率は1/4、4回戦で負けて5回戦で負ける確率も1/4となる。
したがって、2勝1敗だったメレが最終的に勝つ確率は1/2+1/4=3/4。Aが勝つ確率は1/4となる。そのため、この場合メレと友人の分配は3:1とするのが合理的であるというものだった。
確率論は、フェルマーなどの数学者が精力的に研究した学問だった。
大数の法則とは:試行の回数を増やせば増やすほど、統計的確率は理論値である数学的確率に近づいてくこと。
・「ここにちょっと変わったオセロの石が3つあります。ひとつは、片面が白、片面が黒という石。2つ目は両面とも白。3つ目は両面とも黒。これらの石の表と裏は、テーブルに置かれているときには区別はつきません。さて、この3つの石を袋の中に入れてよく振って、反対側の面が見えないようにひとつ取り出し、テーブルに置いたところ、白でした。それでは、この石の裏面は、黒、それとも白、どちらと答えた方が当たる確率が高いでしょうか?
答えは白。

石の色に番号を振る
白白、黒黒、白黒
12 34 56

袋から出した石が・・

↓パターン
白1 白2、白5
    ↓裏
白2 白1 黒6

・コイン投げで10回連続、表が出た。さて、次に表と裏のどちらが出る確率が高いか?
同じ。コイン投げは、直前の結果に影響されない「独立事象」のため。ギャンブラーの誤謬。確率は、不確定な事象について、0~100%の間で「起こりやすさ」の予測を立てることはできる。しかし、次に「起こる」ことを当てることはできない。
・当たりの出やすい宝くじ売り場は本当にあるか?
結論、ある。ただし、そこで買うと当たりやすい、ということではない。単に販売枚数に比例しているだけ。
・不思議な巡り合わせが立て続けに身に起こるワケ
例えば、不幸が立て続けに続いたり。それは確率論的にはただの偶然。ポアソンクランピング。ポアソンクランピングとは、たくさんの事象の一部が全くの偶然によって寄り集まっている状態のこと。そこには何の因果関係も結びつきもない。いわゆる、ランダム性のこと。例えば同量の白と黒の球を箱に入れて適当に混ぜた時に、まだらに白黒が点在するような状態。白が濃いところもあれば、均等になっている個所もある。ちなみに、この滅多に起こりえない希少な事象の発生数の確率分布は「ポアソン分布」と呼ばれている。

1章まとめ
ある事象が起こった時に、これは確率的にどの程度が見積もることで、精神衛生上、安らかになることができますね。確率的な思考ってのは、結構大切なんだと認識した。


■2章 知ってると得する 身近なおもしろ確率
・40人のクラスに、誕生日が同じ人がいる確率は約90%。23人の集団で約50%になる。57人のところで、99%を超える。一般的な直感とは異なる結果になるため、「誕生日のパラドックス」と呼ばれるほど。
・降水確率0%でも、雨が降ることはあるか?
ある。降水確率とは、過去の気象データと比較して、今後の一定の時間内に1mm以上の雨または雪がどのくらいの割合で降るかを統計的確率で表したもの。統計的な処理をされている。過去実績が0~4%であれば降水確率は0%、5~14%であれば、降水確率は10%ということになる。なので、降水確率0%というのは、100回の内4回くらいは1mm以上の雨が降ってもおかしくない、ということ。
・「二度あることは三度ある」は確率的に正しい?
割と正しいといえる。同じようなことが二度、三度と連続で起こる例を、コイン投げで考えてみる。表裏が出る確率はそれぞれ1/2。コイン投げを5回連続して投げたとき、表裏の出方のパターンは32通り。そのうち、表、裏が交互にでるのは、「表裏表裏表」「裏表裏表裏」の2通りしかない。6.25%。一方、表か裏が3回以上連続して出る組み合わせは、16通りもある。50%。二度あることは三度あるというのは、よく言ったもの。ポアソンクランピング。
・サッカーの試合で”番狂わせ”が起こる確率は?
低い確率で起こる事象で、その事象がひょっとしたら起こるかもしれない状況が頻繁にあり、それぞれの事象は互いに独立しているような場合、その事象がある一定区間(時間、場所、距離など)の中で偶然に起こる回数は、「ポアソン分布」と呼ばれる分布になるといわれている。例えば、ある交差点で1時間に起こる事故の件数や、1日に受け取る電子メール件数とか、1分間のウェサーバーへのアクセス数とか。サッカーの特典もこのひとつ。サッカーで1試合の得点の確率分布がポアソン分布になっているという前提に立って、サッカーで発生する番狂わせの確率を計算してみると・・・
前提として、AチームvsBチームとしたとき、Aチームの平均点は1点、Bチームはその2倍の2点とする。この場合、Aが勝つ確率は、なんと18.3%もあった。得点力みに2倍のさがあったとしても、5回に1回くらいは番狂わせが起きるということがこの計算からも言える。引き分けは、21.2%となる。なので、Bチームが順当に勝つ確率は、100-(18.3+21.2)=60.5%程度ということになる。
ただしこれは1点、2点という差が小さい場合で、Aが5点、Bが10点といった場合には、Bの勝率は88.0%。Aが10点、Bが20点といった場合は、Bチームの勝率は96.1%にもなる(ラグビーがこれに近い)。だから、ラグビーは番狂わせが起きにくいスポーツといわれているんだな。 要するに、サッカーは点が入りにくいからこそ、番狂わせが起こりやすいということが確率論からも言える。弱小国が強豪国に買ってしまうような番狂わせが起こりやすいから、サポーターは狂喜乱舞する。世界で愛されている理由はここにあるのかもしれない。

2章まとめ
誕生日のパラドックスや、降水確率など、身近な例がたくさんあって興味深い。直感と反する確率や、番狂わせを確率で表現できるなど、とても奥深い学問だと再認識した。ここには書かなかったけれど、相撲の巴戦は控えが不利などこれも確率で表現できる。あくまで全員が同じ実力って前提だけど。こういうのに興味がある人と話ができたら楽しいだろうな。


■3章 確率で解き明かすツキの正体とは
・福引は先に引くべき?後から引くべき?これは、学校で習った気がする。いつでも一緒。同時に引いても一緒。たしか、条件付き確率だったような・・・。
・ポーカーの役はどのくらいの確率でできるか?ここでは、単純化するために、配った際に役ができている確率を計算する。ロイヤルストレートフラッシュは、4通りしかない。52枚のトランプから5枚を取り出す組み合わせの総数は、260万。つまり、4/260万=0.00015%らしい。ストレートフラッシュは0.0014%、フォーカードは0.02%、フルハウスで0.14%、フラッシュは0.2%でストレートは0.4%。スリーカードが2.1%でツーペアが4.8%とのこと。ワンペアは、42%。ノーペアはおよそ50%。ワンペアとノーペアで92%にのぼる。乱暴に言えば、ポーカーの大部分はワンぺアができるかできないか、できたペアの数字はどうか?という、「確率的には」実に単純な勝負であるといえる。
ジャンボ宝くじ1枚300円の期待値は、47.6%(143円)。自分が特別だと思う人は買えばいいという数値だと思う。必ず誰かは当たるシステムではあるし。
・ルーレットでカジノ側が絶対に損をしない理由。1~36までの赤黒に割り振られた数字と、0と00というどちらでもない色の合計38個の数字の中から、球がどの数字に入るか当てるゲーム。期待値は、94.7%。どの賭け方でも、94.7%になるように設定されている。言い方を変えれば、平均して5.3円、客は損するし、胴元は得をする仕組みになっている。だから、カジノの企業努力はひとつ。できるだけ長く、たくさんのお客にたくさんの回数の賭けごとをしてもらうこと。だって、大数の法則にしたがうから。
ちなみに、日本の公営ギャンブル(競馬、競輪など)の期待値は、おおむね75%に設定されているらしい。スロットマシンやルーレットが約95%、バカラは約98%。
・ギャンブルで元手を増やす最高の作戦とは? 例えば、ここに100万円の軍資金があるとする。これを、「当たる確率が1/2で勝ったら掛け金が2倍」というルールの勝負をして、「増やす」方法を考える。5万とか10万とか等分してもよいし、60万円とか一気にかけてもよい。  結論、これは上記のことからもわかるように、100万円全額一発勝負。この場合は、期待値は常に100万円となるが、実際には客側が不利。大数の法則は絶対。どんな場合でも、続けないこと、回数を重ねないことが賭けの心得として非常に重要なのだ。
・ツキの正体とは。 ツキとは、事象の偏りのこと。作為なくランダムに起こる現象こそ、実は偏りが多い。大数の法則は絶対だが、それは十分に回数が多い場合に言えること。回数が少ない場合には、理論上の期待値と現実の間にかなりの隔たりが生じる。この幅を分散と呼ぶ。大数の法則が十分に成り立たないような段階では、分散という名の偏りが目立ってしまう。ツキは偏り。予測したり、引き寄せたり、コントロールできたりするものではない。ポアソンクランピングのことよね。

3章まとめ
ギャンブルには期待値があって、必ず胴元が儲かるようにできている。しかし、公営ギャンブルで期待値が75%とは・・・宝くじに至っては50%に行かない。大数の法則を知っていれば、やらないよな。夢という期待を買って、ワクワクするという時間を買っていると考える・・・のかな?ツキはポアソンクランピングのこと。大数の法則は、十分に試行回数が多くないと成り立たない。勉強になりました。


■4章 ビジネスで、実生活で・・・大活躍の確率論
ベイズ推定・・・人間の推論を織り込んで主観的に確率をとらえる考え方。人間社会は常に環境が変化していて、厳密な統計的確率にとらわれすぎると適用範囲が狭くて使い勝手がよくない。そもそも、不確実性は人が感じるもの。そうであれば、もっと人がその不確実性を予測する思考形式になじむやり方で確率を捉えた方がいいんじゃないか、というところから生まれた。特徴というかスタンスとして、データが少なくても、たとえ主観的な推測が入っても、多少いい加減な確率と言えども予測できた方がよい。精度はあとから上げていけばいいじゃないか、というものがある。事前確率を設定し、事後確率を取得する。その確からしさは繰り返すことで精度が上がっていく。
このベイズ推定は、スパム対策にも使用されている。スパム群と分かっているメールの集まりと、まともなメール群の集まりを調べて、比較する。その結果から、スパムの兆候を示す言葉と特徴のデータベースを構築し、スパムかそうでないかの「もっともらしさ」の比率をベイズ推定によって割り出す。そしてフィルターされる。(これって、ディープラーニングじゃね?)。また、主要検索エンジンのグーグルにも、ベイズ推定が使われ、高い確率で適切なデータを探し当てる検索サービスを提供している。
モンティホール問題・・・アメリカのテレビ番組から生まれた。モンティホールはその司会者の名前。その番組では、3つのドアが用意されている。このうち、1つのドアの向こうには豪華賞品が置かれていて、回答者はそれを当てたら商品がもらえる。どれが賞品のドアなのかモンティホールしかしらない。参加者はまず、「どのドアに賞品があると思いますか?」と聞かれて、3つのドアからこれだと思うものをひとつ選択する。すると、モンティホールは別のドアを開けて見せて、「あなたが選ばなかったこちらのドアには賞品はありません。」と示してこう続けます。「あなたが最初に決めたドアのままでもいいし、もう一方のドアに変えても構わない。最終的に選んだドアの向こうに賞品があれば、それはあなたのもの。さて、あなたはどちらを選びますか?」
この問題のポイントは、モンティホールが別のドアを開けて見せて、そこに賞品がないと判明した段階で確率がどう、変化したか、ということ。
答えは、最初に選んだドアから変更した方が、2倍の確率で賞品が手に入る。
説明。
仮に、Aのドアが当たりだった場合・・
A 当たり
B 外れ
C 外れ
これを、「変更した」場合、次のようになる。(「→」変更)
A 当たり → 外れ
B 外れ  → 当たり
C 外れ  → 当たり

このとき、Aを最初に選んだ場合は外れてしまう。しかし、Bを選んだ場合は、モンティホールはCを必ずオープンにするので、変更したら賞品をgetできる。Cを最初に選んでもBを選んだ時と同様。
したがって、変更した方が当たる確率は2/3となる。
直感と異なる。おもしれぇ~
ちなみに、パロンドのパラドックスというものある。期待値が1以下のA、Bというゲームがあるとする。それで、Cというゲームは、AとBの組み合わせで、なんと期待値が1以上になる場合があるらしい!マジか!

・2割の働きアリと、8割のさぼっているアリ。ゲーム理論で説明ができる。点数にもよるが、さぼった方が労せずして成果を得ることができる。このバランスがとられるまで、まじめとさぼりの比率が収束される。
・二つの封筒のパラドックス・・・あなたの目の前には小切手の入った2つの封筒があります。金額は明かされていませんが、片方の封筒には、もう一方の2倍の金額の小切手が入っています。今、あなたが一方の封筒を開けてみたところ、中には100万円の小切手がはいっていました。ここであなたは、そのままその封筒をもらってもいいし、もう一方に替えることもできます。さて、あなたは最初に選択した封筒をもらいますか?それとも新しい封筒をもらいますか?」
期待値を計算する。変更すれば、50%の確率でそれぞれ50万円、もしくは200万円になる。よって、50×1/2+200×1/2=125万円。したがって、変えるべきだ!
・・・これって、何かおかしい。だって、変更したら、期待値があがるということは、どちらかを選択する前から、封筒を交換した方がよいという結論が出ているということになる。奇妙だな?
・人はリスクを伴う決定において、なぜかバイアスがかかった意思決定をしてしまう。次の二つの質問に答えてみよう。
【質問1】
あなたはゲーム大会で優勝しました。賞金の受け取り方には、A,Bの二つの方法が用意されています。あなたはどちらを選びますか?
A:100万円が確実にもらえる
B:コインを投げて表なら200万円がもらえるが、裏が出たらなにも得られない。
【質問2】
あなたは200万円の負債をかかえています。A,Bのどちらの選択肢を選びますか?
A:無条件で負債が半分減額され、負債総額が100万円となる。
B:コインを投げたて表が出たら支払いが全額免除されるが、裏が出たら負債額は変わらない。
大半の人は質問1ではAを選び、質問2ではBを選ぶといわれている。どうやら人間には、目の前の利益があるときは、その利益が手に入らなくなるリスクを避けることを第一に考えて安全確実な道を選択し、逆に損失に対したときは、絶対に損をしたくないという感情に押されて、損失そのものを回避しようとする傾向がある。つまり、同じ金額であっても、利益と損失では損失の方がより、強く印象に残るというわけ。このような心理的傾向を考慮した意思決定論を、プロスペクト理論と呼ぶ。
・不確実性を味方にすることができる。アンケート調査で正直な回答を聞き出す方法。答えにくい質問(中学生を対象にした性体験の有無など)をする際に、コインを渡し、「コインの表が出た人と、性体験のある人は手を挙げてください」とすれば、表が出た人も手を挙げるので、素知らぬ顔で挙手すれば真実は誰にもわからない。
・どちらにするか迷ったときは、効用関数で判断する。コイン投げという確率50%ではなく、100%や90%・・・としていった場合、どこが分岐点になるか。これは人それぞれ。効用とは、ミクロ経済学の消費理論で用いられる用語で、人が財を受けることによって得る心理的満足感の度合いのこと。本来、確率は数学的事実であり、そこに主観が入り込む余地はない。しかし、ハズレが10%でも不満足な人はいるし、ハズレが25%までなら満足できる領域の人もいる。ある確率が満足か不満足かは、その人の価値判断によって変わる。つまり、確率的思考を上手に使いこなすには、それぞれの結末に至る確率を知ったうえで、その結末があなたにとって望ましいか否か、効用を考慮して最終判断することが大切といえる。

4章まとめ
ベイズ推定は、現代のIT社会にはなくてはならない理論。プロスペクト理論は投資の世界にも通ずる。モンティホールはいろんな意見が出そうでおもしろい。実世界では、効用で判断するのが望ましいってことか。


■5章 ダマされちゃいけない!統計数字のトリック
・朝食を食べる子供は成績がいいって本当?朝食を毎日食べているという子供は、食べない子供よりもテストの正答率が高い傾向があるという記事があった。たしかに、相関はあるが、因果関係があるかどうかは別。朝食を食べれば、脳が活性化し、しっかり勉強ができるという推論は成り立つが、別の調査できちんと裏付ける必要がある。相関関係=因果関係ではない。この例で行くと、他にも家族と学校での出来事について話をする、平日にテレビやビデオを見る時間は1時間未満 、という子供の正答率が高くなっている。よって、きちんとした生活習慣が身についていることが因果かもしれない。
・疑似相関にだまされるな。少年による凶悪犯罪が起こると、インターネットやゲームが健全な育成を妨げるとする糾弾キャンペーンが始まる。メディアでは、家庭で格闘ゲームをする時間が長い子供ほど、暴力行動に走りやすい傾向にあると問題視された。しかし、別の統計ではテレビゲームが存在しなかった時代よりもそれ以後の方が明らかに犯罪件数や割合は減少しており、ゲームやインターネットの進歩と少年犯罪の件数には相関がないと指摘する専門家はたくさんいる。これはまさに疑似相関といえる。
・損失を利益に見せかける数字のマジック。あなたが製品管理の責任者として、部下から以下の2通りの説明を受けた場合、どのように受け止めるでしょうか。
A「不良品発生率が10%から5%になりました」
B「不良品発生率が50%減になりました。」
リスクやネガティブワードは小さく、利益やポジティブワードは大きく表現すれば、相手の判断を自分の考えている方向に誘導することが可能となる。
業績説明でこう説明すれば、増加している印象となる。「1月実績に比べると、5月までは残念ながら売上が50%減少しました。円高による輸出部門のダメージのためです。しかし、対策を講じたことで、5月にはプラスに転じ、9月までには売上を60%増加させました。」
・標本の選び方で調査結果は大きく変わる。トルーマンの奇跡。標本に、自動車や電話持っている人、という条件付きであれば、結果が正しくないのは当たり前。標本をできるだけ増やして全数調査に近づければいいというのは、この考え方はスープの味見に大鍋半分を飲むようなもので、非合理的。均一であれば、スプーン一杯で十分味が分かる。
世論調査の誤差。標本誤差の誤差こそ、大事なキーワード。例えば、内閣支持率は±2%の誤差がある。
・ココロが統計にワナをしかける。医師ががん患者に5年生存率は60%です、というと、そのせいで本人の生存率が60%に届かなくなるケースがある。5年という短さに悲観してうつになったり、免疫力が弱くなったりすることがある。逆に、こなくそ~と頑張る患者もいる。心理的ファクターが現実の生存率をも大きく左右する。財務分析でもそう。倒産確率10%としたら、それを重く見た取引先が取引をやめるかもしれない。そうすると倒産確率はどんどんあがって、「倒産しない確率は90%」もあったのに、経営状態が悪化することもありうる。人の心理が絡むときは、統計や確率の数値は画一的にはとらえられないものに変化してしまう。
・検診にひそむ数字の落とし穴。リスクの数字がはっきりと示されていても、その数字を正しく認識できるとは限らない。問題がある。
 XX病という病気の診断方法が確立されました。
 この診断方法はとても優れていますが、完全ではありません。
 ある人がこの病気にかかっていれば、90%の確率で陽性になります
 病気にかかっていなくても、1%の確率で陽性と出ます。
 人口のほぼ1%がこの病気にかかっています。
 この検査をスミスさんが受け、陽性だった場合、スミスさんが本当に病気である確率はいくらでしょうか?
答えは50%。

5章まとめ
いちばん実生活で役立ちそうな章だった。疑似相関なんてダマされそう。すでに騙されてそう。損失の件、割合で話すってのがポイント。標本の件は、スープの味見が刺さった。人の心理が絡む統計的確率は、画一的にはとらえることはできない。


【この本を読んだ感想やまとめ】
大数の法則からは誰も逃れることができない。最後のスミスさん問題なんて、きちんと考えても答えが出なかった。確率、統計、難しい。けど、モンティホール問題に代表されるように、直感と異なる結果になる問題はとても面白い。誕生日のパラドックスとかね。実際はパラドックスではないんだけども。番狂わせの確率まで数学的に導けるなんて、面白すぎる。


【今後活かせること、具体的なアクション】
ツキはポアソンクランピングと理解
大数の法則からは逃れられない。ってことは、一番最初に一発勝負。これだ。
プロスペクト理論を知ったうえでの損切り


【気に入った文章・言葉を3つ】
・コイン投げは、直前の結果に影響されない「独立事象」のため。ギャンブラーの誤謬。確率は、不確定な事象について、0~100%の間で「起こりやすさ」の予測を立てることはできる。しかし、次に「起こる」ことを当てることはできない。
・標本をできるだけ増やして全数調査に近づければいいというのは、この考え方はスープの味見に大鍋半分を飲むようなもので、非合理的。均一であれば、スプーン一杯で十分味が分かる。


【こんな人に読んでほしい】
自分の直感と事実の差を楽しめる人
宝くじを買っている人
モンティホール問題を知らない人