【統計学】条件付き確率とベイズの定理

こんにちは、DXCEL WAVEの運営者(@dxcelwave)です!

こんな方におすすめ

本記事と確率統計学における「条件付き確率」と「ベイズの定理」について詳しく解説しています。

また、上記の理解促進のため「事象と確率」についても概説しています。

目次

事象と確率

事象

サイコロ投げのように、同じ条件のもとで何回も繰り返すことができ、その結果が偶然によって決まる観察や結果を試行といい、試行の結果起こる事柄を事象と呼びます。ある試行Tについて、起こりうる事象全体をUで表した時、Uで表される事象を全事象、空集合で表される事象を空事象と呼びます。

Uが有限個の要素を持つ場合、全ての事象はUの部分集合になります。例えば、サイコロの目が出る事象全体Uがある時、「1, 2, 3のどれかが出る事象」や「1の目が出る事象」というように分解が可能な事象があります。前者のように、分解が可能な事象を複合事象と言い、後者のこれ以上分解できない事象を根元事象と言います。さらに、どの根元事象も同程度に起こると期待できるとき、同様に確からしいと言います。

確率

根元事象が同様に確からしいという仮説のもとで、事象Xの確率は次のように表されます。

(例)2つのサイコロの和が9になる確率

 2つのサイコロの合計が9になる場合の数:(3,6), (4,5), (5,4), (6, 3) ⇨ 4パターン

全事象:6 × 6 = 36パターン

2つのサイコロの合計が9になる確率 = 4/36 = 1/9

ベン図と和事象・積事象・余事象

A∪Bと表記する和事象は「AまたはBが起こる」という事象です。AとBが同時に起こらないとき、AとBは排反である、もしくは排反事象であると言います。

A∩Bと表記する積事象は「AとBがともに起こる」という事象を指します。

全事象Uの中でAが起こらないという事象を余事象と言います。

独立事象と同時確率

AとBの2つの事象があり、A、Bの確率的な状況が互いに無関係、すなわちお互いの結果に影響しあうことが無い場合、AとBは独立といいます。

AとBが独立であるとき、AとBは上記のような積で表すことができます。

条件付き確率とベイズの定理

条件付き確率

条件付き確率とは、事象Aが発生した場合に事象Bが発生する確率です。P(A|B)として表されます。

P(A|B)はベン図で言えば、水色部分(B)を1とした時の網目部(A∩B)の割合です。

すなわち、P(B)を1としてみた時のP(A∩B)の割合を示しています。普通の確率では全事象Uを1として計算しますが、条件付き確率P(A|B)では、Bを言わば全事象と見て確率を計算するのです。

条件付き確率を活用した事例

趣味10代20代合計
野球観戦102535
サッカー観戦20525
合計303060

年齢20〜30代を60人を対象に、スポーツ観戦の趣味について聞いたところ、上記結果が得られたとします。また、60人から無作為に1人を選んだ時のことを考えます。

選ばれた人が野球観戦が好きである確率は、35/60であることが分かります。ここで、もしも選ばれた人が10代であるという情報が事前に与えられたとしましょう。これは、10代であるという条件が付与されたことを意味しますので、表の10代の列に着目し、確率を計算すると良いことになります。従って、確率は10/30です。

選ばれた人が10代であるという条件のもと野球観戦が好きである確率、これこそが条件付き確率になります。

ベイズの定理

事象Bが起こるという条件のもとで、k種類の事象Ai(A1, A2, A3・・・Ak)が起こるとします。このとき、事象Bが起こるという条件のもとで、事象Aiが起こる条件付き確率P(Ai|B)は次のように表されます。

ここで確率の乗法定理は次のように表されます。

①に対して②を代入すると、次のような式が得られます。これがベイズの定理を指します。

ここで全事象UがA1, A2, A3に割られている場合、 P(A2|B)は次のように表されます。

このように、他事象の確率の和や積を求めることで、目的の条件付き確率を求めることが可能です。この

【参考】統計学の学習におすすめな教材

「データ分析する上で統計学の基礎を学びたい」方向けに以下の教材をおすすめします。

統計学基礎参考情報

当サイトでは統計学の学習に役立つ情報を多数配信しております。是非以下のページをご覧ください。

最後に

この記事が気に入ったら
フォローしてね!

本記事をシェア!
目次