はじめに
コジマです。
数学のトピックを扱っていこうかと思います。
ただ確率の分野がすごい苦手でね、友達にベイズの問題出されて
全然わからなくて悔しい思いしたんで復習しようと思ったわけです。
だから今回は説明が多少下手でもベイズの定理に触れようと思ったわけです。
定義
まさかの直筆
ノート型のホワイトボードと台形補正のアプリ入れたら数学記事めっちゃ捗る。
P(Y|X)というのは
Xの条件下でYが起こる確率のことを言います。
証明
ベイズの定理は条件付き確率の定義から簡単に求まります。
例題
病気のやつが超有名ですね。
この病気の検査方法では、病気に罹患している人が陽性と判定される確率が90%、病気に罹患していない人が陰性と判定される確率が80%です。
このとき、ある人がこの検査で陽性と判定された時、本当に病気に罹患している確率を求めよ。
※罹患:病気にかかること
(超有名な問題をちょっと数値いじった)
解く
まず、情報を整理します。
表にするとこんな感じ。
求めたいことは
「陽性と判定された人が罹患している確率」
知っていることに
「罹患している人が陽性と判定される確率」
があります。
求めたい条件付き確率(陽性=>罹患)に対し、逆の条件付き確率(罹患=>陽性)がわかっている場合、
ベイズの定理が使えます。
ベイズの定理を使用して答えを導くために必要な情報を与えていきます。
陽性の確率は陽性かつ罹患の確率と陰性かつ罹患の確率を合計すれば求まりますね。
あとは公式にはめていきましょう。
何が便利なのか?
ベイズの定理を知っていることで何が嬉しいのかというと
結果から原因を求めることができるというところ。
ぶっちゃけ慣れるまでくそほどややこしいんだけどね!
この例題で言えば「検査の結果が陽性」という結果が得られています。
さらに、病気に罹患した人が陽性になる確率と、全体で病気に罹患する確率という結果がわかっていれば
検査結果から陽性の原因となる病気に罹患する確率を求めることができるようになります。
その他の例を挙げておくと以下のようなことを求めることができます。
- 工場で作った製品の検品で正常と判定されたものの中から本当に製品が正常である確率
- 特定の商品を買った人が女性である確率
- 特定のキーワードを含むメールが迷惑メールである確率
などなど。
このように得られた事象から推定したいことを分析したりすることをベイズ推定と言ったりしますね。
さいごに
この記事書きながらわかっていった感覚ありますねw
アウトプットいいっすよー。
ベイズの定理を勉強するのに使った参考諸々は以下のものです。
youtube
ヨビノリたくみさんの動画。
【大学数学】ベイズの定理【確率統計】
書籍
技術者のための確率統計学 大学の基礎数学を本気で学ぶ
迷惑メールの例
ぜひ参考にしてください。
この記事を面白いまたは役に立ったと思ってくれた方は是非私のTwitter(@kojimanotech)を
フォローしてくれたらうれしいです!
以上、コジマでした。