ベイズ統計についての学習[1]
どうやら機械学習には、ベイズ統計とやらが非常に重要であるらしい。
ということで、とある入門書を一冊読んでみました。
それを読んで理解したことなどを書いてみます。
※使用した参考書などは後でまとめます。
ベイズ統計の特徴
ベイズ統計/確率論における重要そうな基本用語
(以下では事象A、事象B、データD、仮定HのことをそれぞれA、B、D、Hと略して記述する)
- 同時確率
- AとBが同時に起こる確率
- 条件付き確率
- Aが起こった場合にBが起こる確率
- 乗法定理
- AとBの同時確率 = Aが起こった場合にBが起こる確率 × Aが起こる確率
- AとBの同時確率 = Bが起こった場合にAが起こる確率 × Bが起こる確率
- 加法定理
- ベイズの定理
- Aが起こった場合にBが起こる確率 × Aが起こる確率 = Bが起こった場合にAが起こる確率 × Bが起こる確率
- これは乗法定理より等式であることが分かる。等式変換すると
- Aが起こった場合にBが起こる確率 = Bが起こった場合にAが起こる確率 × Bが起こる確率 / Aが起こる確率
- また、下のように読み替えることができる
- Dが得られたときにHが成立している確率 = Hの元でDが生じる確率 × Hが成立する確率 / Dが得られた確率
- Aが起こった場合にBが起こる確率 × Aが起こる確率 = Bが起こった場合にAが起こる確率 × Bが起こる確率
- 尤度(ゆうど)
- ベイズの定理の緑色の項のこと
- 事前確率/事前分布
- ベイズの定理の青色の項のこと
- 事後確率/事後分布
- ベイズの定理の赤色の項のこと
- 理由不十分の原則
- 事前確率/事前分布が分からない場合はとりあえず適当な値を入れて良い
- ベイズ更新
- 新旧データがある場合、旧データの事後確率/事後分布を新データの事前確率/事前分布として利用して良い
- 機械学習の中核となる考え方であると思われる
- 新旧データがある場合、旧データの事後確率/事後分布を新データの事前確率/事前分布として利用して良い
- 逐次合理性
- データが複数ある場合に、どの順に計算しても計算結果は変わらない
ベイズ統計の利用
まとめ
入門書なので、簡単な算数だけで計算できる例などが多く、ベイズ統計というものをある程度俯瞰することができたと思う。
しかし、比較的簡単な例ばかりな上に(入門だから当たり前なのだが)喩え話が多かったので、実のところ理解したようなそうでないような感じではある。
(だからこそ俯瞰的な甘い理解ができたとも言える)
より具体的な活用法などはまた別の参考書を読むべきなのと、自分の手を動かして計算したりプログラミングするなりしなければ結局身に付かないので、それは追々やろうと思います。