筑波OCW 確率論
1-3
条件付き確率
今回はこれが計算できるようになることが目的。
赤色のさいころ
黒色のさいころ
二つ同時に降る。
合計が6になると勝ち。
勝率は?
二つふって、
赤色が4だということはわかる。
黒色が何色かわからない。
この状態でゲームに降りるかそのまま続行するか選べる。
赤4 黒は1から6のどれか。
黒2であれば勝利
確率はあがります。
起こりうる世界にどんな変化が起きているのか?
赤4と知ったら、「標本空間」が変わる。
ある家庭で二人の子供がいる。(年長 年少)
二人とも男子である確率
1人は男子 では二人とも男子である確率?
(B B) ( B G ) ( G B)
年長が男子 では二人とも男子である確率?
風邪を引いたら熱がでるか?
原因と結果
結果から原因を探る
熱が出ている→ 風邪をひいているのか? (診断の技)
準方向の推論
逆方向の推論
ベイズの定理
標本空間を分割するという計算手法
部分 部分は重なり合わない
A B Cのトーナメント
Aの優勝確率
AはB or C どちらと対戦するのか。
それぞれ、対戦の組み合わせにより勝率は変わっていく。得手不得手 拮抗 などなど。
conditional probability
条件付き確率
条件付き確率は、確率の公理3つをすべて満足することの証明。
サリエリが、パーティに出席した3人の紳士にシルクハットを差し出す。
そして「この中に名刺をいれてくれ」と依頼する。
入れてもらった名刺をシャッフル。
A B Cに順番にひかせる。(3人は目隠しをしている)
自分の名刺を引き当てる人が少なくとも1人はいるという確率
Bさん AがBをひくかどうかで状況がかわる。
Cさん A Bによって状況がかわる。
アントニオ・サリエリ(Antonio Salieri、1750年8月18日 - 1825年5月7日)はイタリアのレニャーゴ生まれの作曲家。
生前は神聖ローマ皇帝・オーストリア皇帝に仕えるカペルマイスター(宮廷楽長)としてヨーロッパ楽壇の頂点に立つ人物であり、またベートーヴェン、シューベルト、リストらを育てた名教育家でもあった。
死後はその名と作品を忘れられたが、戯曲『アマデウス』(1979年)およびその映画版(1984年)の主人公として取り上げられたため、知名度が上昇。
続いて 独立事象という話題について
定義
もう一方の事象がどうなったかという情報が入手できてもできなくても、
当方の事象の確率に変化がない。
F
が起きているかどうかの情報を10万円で売ると言われたら?
断ればいいということ。
上記のようなことを証明していく。
reliability
航空機 自動車
複数のエンジンが搭載されている(飛行機)
747 4004つのエンジンを搭載している
トリプルセブン 2つのエンジンでもっと大きい機体。
片方のエンジンに故障が起きているかどうかは、
もう片方のエンジンに故障が起きるかどうかの確率に影響を与えない。
という仮定のもとで、片側のエンジンが停止しても飛行を続ける。
成田空港からアメリカ東海岸をフライト
成田離陸直後にエンジントラブルが片方でおきると、西海岸で経由。
緊急着陸がどういう状況で必要かどうか。
一挙に全部停止することもごくまれにあります。
4つ積んでいて全停止。 火山灰(共通原因故障)が舞っている上空を飛んでいて起きた。
灰による視界不良
灰にガラス成分→熱で溶ける→エンジン止める
ブリティッシュ・エアウェイズ9便のボーイング747のジェットエンジンが、火山灰が詰まったことにより4基とも停止し、同機は滑空状態となった。ゼロに近い確率だといわれていた四発機の全エンジン停止という、未曾有の事態に乗員達は悪戦苦闘を重ね、どうにかエンジンの再始動に成功し、ジャカルタへ緊急着陸に成功。死傷者は出なかった。それまで何の対策も採られていなかった航空路における火山の噴煙に対する対策が世界的に急がれるきっかけとなった事故である。
整備がトラブルを産むケース。
間違った手順で直される。Oリング 潤滑油 のもれ。
同じ人が行った整備をうけた飛行機はすべてトラブルを起こす。
(エンジン故障の確率が独立性を失っているという事例)
自動車の高度な運転支援システムをはじめ、家の中でも機器にコンピュータが内蔵され、いわゆる“賢い機械”が身の回りの至る所に存在するようになりました。これまでは人間中心で、機械は言われた通りのことだけをするのが望ましいとされてきました。それは機械の行動に人が振り回されないようにするためです。
ですが、自動車の衝突回避機能のような場合、人が判断していては間に合わないため、機械に最終的な決定権を与えるようになっています。今後の高齢化を考えると、高齢者の運転が増えますが、視覚や聴覚の能力が弱くなった高齢者に「運転を注意してください」と言っているだけでは問題は解決しません。身体的負担が少なく自動車を運転できるように、代替できるところは機械に依存せざるを得ないでしょう。
そうなると、最終的な判断を人と機械のどちらが行使するのかという権限の問題が今後ますます顕在化してきます。
一方、賢い機械が出てきたことで、さまざまな場面で信頼がおけるようになってきました。例えば自動車の場合、運転者はある場面でブレーキをかけてくれたのであれば、この場合でもブレーキをかけてくれるだろうと思ってしまいます。正確な理解があって機械に依存するのは正しいことですが、中途半端な知識で理解してしまうと、あたかも機械に限界がないかのように感じてしまいます。これは過度の依存となります。
システムの自動化は航空機の分野で先行して進んでいますが、訓練を受けた操縦士でも人間と機械との間で意図の対立が起こり、予期しない状況が生じています。自動車や家の中の機器などでは、訓練どころか説明書も読まずに利用するユーザーが多数いるわけです。
システムが賢いほど、利用した人間は行動を変えてしまいます。こうした行動の変化が我々に悪影響を及ぼさないようにシステムをデザインすることが今後、非常に重要になるでしょう。人と機械が共存するシステムをいかにデザインするかは、世界各国で非常に重要なテーマです。日本人がどのように人と機械の協調と調和の問題を考えているのか、世界に示す良い機会です。システム概念をデザインする設計者やエンジニアの方々に本書が貢献できれば幸いです。
白いボール5個 赤いボール3個 一つの箱に入っている。
復元抽出
====後半====
ベイズの定理
疾患を具体例に。
病気1 熱がでる 発病者の9割
病気2
病気3
病気1が発病した人はかなりの確率で発熱ということになる。
なじみ深い病気かどうかを判断する指標→ 確率を用いる
事例
とある患者が来院する。
熱っぽいといっている。 病名はどれ?
病名1 で正解の確率97.5%らしい
設定をかえる
1 を0.01
3を0.90にする。
この場合でも病気1と判断するとなると。
この設定ではそもそも病気1が滅多に発症しない病気。
病気1が、治療法のない病気だと、告知を受けた患者はショック。
「確率的な情報の扱い」
病気2である確率は50%
病気3 26%
直観と確率的推論のギャップがよくわかる話題になります。
外国にいくのが大好きなコロンブス
50人中30人が当選する海外旅行キャンペーン
一足先にマゼラン君が「君は当選していたよ。」という。
マゼランは3回に2回は嘘をつく。
ベイズの定理はこういう状況で、コロンブスが当選している確率を
計算する。
標本空間の中のどれか一つが必ず起きる
それぞれのおこりやすさを決めてやる。
ある事象が起きているときはFということが観測されることがある。
いまFが引き起こされたことを引き起こしているのはEのうちのどれか?
F熱がある 観測情報
E 病名1、2、3 事前情報
観測情報を使って、事前情報をアップデートする。→ 事後情報(観測が行われた後)
全確率の公式が証明に利用されている。
大学院の入試でベイズの定理を証明せよという問題が出たことがあります。
さて、コロンブスマゼランの例題の確率を計算する。
まずは条件付き確率の定義に忠実になろう。
事実当選していて、(0.6)マゼランがほんとのことを言う。
事実はずれていて、(0.4)マゼランが嘘をいっている。
この場合、分母に、分子と同一の確率があることを確認しましょう。その先のエラーを防ぐ。
自然言語に書かれたものから数字を読み取っていく。
あとは代入するのみ。
回答 7分の4
この解き方をみても、この定理は暗記する代物ではないことを納得してほしい。
従って、中立的な視点では「大西洋航路の発見」、つまりヨーロッパとアメリカ大陸を結ぶ「航海路を発見した」というのが、その真の功績であると言える。コロンブスのアメリカ大陸到着以前はユーラシア大陸と南北アメリカ大陸の住人や国家、文明の間には相互の文化や経済、政治などに影響を与え合うほどの交流がほとんど無かったことから、「世界の一体化を促進した」とする評価もできる。そしてその評価の中には、聖書に地球が球体であると描写された記述があり、コロンブスの行動によりそれが正確であると立証されたこともあげられる。
マゼランはヨーロッパから東洋の香料諸島(モルッカ諸島)への西回りでの渡航ルート発見を目指して旅立ったポルトガル人航海者である。1519年スペイン王の信任を得てスペイン船5隻の艦隊を率いてスペイン・セビリアを出発したマゼランは南アメリカ大陸南端のマゼラン海峡を発見して太平洋に到達し、マゼランは途中1521年フィリピンで戦死したが、残された艦隊が1522年に史上初めての世界一周を達成した
大事なのは「定式化」
M個の選択肢があるクイズ
探偵ポアロは挑戦。
ある問題が、彼が正解できる(答えを知っている)ものである確率はp
1-pの時はM個数の中からランダムに選んでファイナルアンサーとする。
彼は正解して、賞金を手に入れた。
(実際の出演者が、鉛筆を転がして解答していたのをみたことがあるそうです。)
ポワロは正解すべく知識をもっていたのだろうか。
(映画で、クイズによる賞金獲得者が、「問題の事前漏洩に成功して、いかさまで正解したのではないか」
と脅されるというストーリーもあったらしい。)
もともとポワロは正解を知っていたのか? それとも、偶然当たったにすぎないのか?
P=0.2であると設定。
主催者の悪意が発動するというケース。(ポアロが苦手なジャンル)
そしてMが3 0.43
あるいはMが10 0.71
ベルギーで警察官として活躍し、署長にまで出世した後、退職していた。第一次世界大戦中、ドイツ軍の侵攻によりイギリスに亡命することを余儀なくされる。亡命者7名と共に、イギリスの富豪夫人(エミリー・イングルソープ)の援助を受けて、スタイルズ荘のそばにあるリーストウェイズ・コテージで生活をしていた。そこで、以前にベルギーで知り合っていた友人のアーサー・ヘイスティングズ中尉と再会し(1916年7月17日)、殺人事件を解決する(『スタイルズ荘の怪事件』)。その後、イギリスでヘイスティングズ大尉と同居し、探偵として活躍し、数多くの難事件を解決する。
これで確率はどう変化するのか。
機械A 20% 製造担当 欠陥 5%
機械B 30% 欠陥 5%
機械C 50% 欠陥 3%
製品の不良率
目の前にあるのは不良品
どの機械が製造したのか?
ではBからの欠陥である確率は?
Cの確率は? →余事象の考え方で計算できる。
人間の直観は、確率的には?
ほんの少しの数字の変化が、確率にどれだけ大きな変化を起こすのか?
この2点を例題で学びましょう。
===================
全人口0.5%が怖い病気にかかっている。
すぐに対応しないと命取り。
99%で、検出できる薬が開発された。
とある人が検査をうけたら「陽性」といわれた。
「入院しろ」といわれる。
本当にその病気にかかっている確率を計算しましょう。
=======================
結論 33%です。
99%の的中率の検査薬なのに・・・。
病気にかかることそれ自体が稀だから。
99%から的中率が95%に下がると確率はどう変化するのか?
0.332→0.087
世の中にはものすごく感度が高い問題がある。
情報の領域でもこういうの多いです。