トップ «前の日記(2009-06-18) 最新 次の日記(2009-06-22)» 編集

十日日記


2009-06-21

Link ベイズの公式例を樹形図で

一般読者向けの読み物で確率が話題になるとき、ベイズの公式の例に出会うことがある。それもたいていは病気の検査の例だ。たとえば次のようなものを考えよう。

ある検出法では、某病気に罹っている人の95%を陽性として検出する。その一方、罹っていない人の1%に対しても誤って陽性反応(偽陽性)を示す。また、この病気の罹患率は0.5%である。いま、ある人が検査で陽性反応を得たとき、この人が実際に罹患している確率を求めよ。

ベイズの公式の導出や、式を使って上の問題を解く方法については、上のリンク先にあるWikipediaの記事の「Example 1: Drug testing」を参照。例こそ薬物検査になっているが値がまったく同じなので、答も変わらない。

直感的統計学 ところで、吉田耕作『直感的統計学』(日経BP社、2006年)という本がある。著者は1975年以来24年間にわたってカリフォルニア州立大学経営学部で統計学を講義していた。同書はこの講義録を元に日本語に起こしたものだそうだ。経営学部だけあって例がビジネスに直結しているし、使われている数学も日本の高校文系レベルである。また平均やバラツキを大ざっぱに把握するコツについて事細かに触れていて、良書だと思う。

本書では、ベイズの公式が114ページから数ページにわたって触れられている。そこでの計算方法が樹形図を使うものだった。ちょっと目新しかったので紹介したい。

ベイズの公式を樹形図で

まず、原因・結果と流れる樹形図を作る。今回は、病気が原因で陽性という検査結果が出るのだから、病気(D)か否かで分岐し、さらに陽性(E)か陰性かで分岐させる。そして、それぞれの確率を書き込んでいく。そうやってまずは確率の一覧を作り、ベイズの公式に当てはめている。機械的なのが魅力だ。

もっともこれくらいの例であれば、数字にスレた人間は暗算で概算を行なう。同書では触れていないが、数字を大づかみする重要性を説いている同書の主張にも沿うので、ここで合わせて紹介する。

この問題は、陽性反応が出た人間のうち実際に罹患している割合を求めるものだ。病気の罹患率は0.5%なので、1000人いれば5人が罹患している計算になる。この人たちは全員陽性反応が出るとしよう。また、誤って陽性反応を出してしまう確率が1%あるので、995人のうち1%の9.95人に陽性反応が出る。約10人でよいだろう(下のカルノー図を参照)。

カルノー図

すると、陽性反応が出るのは5人+10人で15人、このうち実際に罹患している人は5人だから、求める確率は約5/15すなわち1/3になる。実際の確率が33.22%なので、いい線を行っていることがわかる。

Tags:
[]


プロフィール

渡辺 慎太郎(na@10days.org)

分野別表示

Admin | Client | Dev | Excel | Linux | PC | PDA | Web | iPad | web | 家電 | 文具 | | 英語 | 言語 | | 音楽

月別表示

1999|07|
2003|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|

最近の記事

雨量情報 dictionary.com Yahoo google Yahoo! 路線情報 東京アメッシュ l-mura l-aka l-momo 目次 r-mura r-aka r-daidai r-kiiro asahi.com nogulabo r-sora r-midori r-midori r-momo