スタッフブログBlog

2023.03.08

レビュー

【統計学】完全独習 ベイズ統計学入門

さて、今回は統計学の入門書からピックアップいたします。それがこちら。

「完全独習 ベイズ統計学入門」小島寛之 著、2015年、ダイヤモンド社

です。

著者の小島寛之氏は大学生時代には数学を専攻、そのまま数学研究の道に進むかと思いきや一時、塾講師となります。その後、ひょんなことから東京大学大学院経済学研究科博士課程で学び、現在は帝京大学経済学部教授としてベイジアン意志決定理論と呼ばれる分野を研究しています。

この“ベイジアン”という言葉は、18世紀のイギリス人数学者・神学者のトーマス・ベイズが由来となった“ベイズ統計学”の考え方を用いていることを説明する語です。本書はその“ベイズ統計学”の「入門書」(本書3p)となっています。

“ベイズ統計学”という言葉は日々触れている専門書群の中でよく目にする言葉ではありました。しかし、無知者の私はその内容については理解しておらず、ある時、何気なく家の者(理系)に「ベイズ統計って知ってる?」と聞いたところ、「もちろん、知ってるよ。難しいよね」との返答がありました。…理系の人でも難しいベイズ統計。でも、その山を越えた景色をちょっとでも見てみたい!

ところで、私はそれこそ「超」のつく文系人間です。ですが、「今からでも数学ができるようになりたい!」という野望から理系の、しかも「入門書」を見つけ、飛びついてしまったのでした。

そういった思いで開いた本書、第0講のタイトルが「四則計算だけで理解するベイズ統計学」となっております。これだけで文系人間のハートをわしづかみです。続いて「0-1 予備知識ゼロから実用レベルに到達できる」という見出しや、先ほどの「超入門書」という言葉が躍ります。どの辺が「超」かというと、

・予備知識ゼロからのスタート

・難しい記号や計算なしに、ベイズ統計が使えるようになる

・“お話”だけでごまかすのではなく、免許皆伝レベルを達成する

とのこと。・・・!これはもう読むしかありません。

 

その前に、このベイズ統計は普通の統計学(オーソドックスな統計学は「ネイマン・ピアソン統計学」と呼ばれる。)とは、どう違うのでしょうか?

ベイズ統計学では、データが不十分でも最初に「こういう事象が発生する確率はこれくらい」(=事前確率)という設定をします。そして、実際にその事象が観測されるたびにそのデータを更新(=事後確率)していくことができます。更新を重ねるうちに予測の精度が上がっていくのです。(第1講「情報を得ると確率が変わる」参照。)そして、本書の中で強調されているのは、そもそも事前確率設定が主観的であるという点です。その「うさん臭さ」故、かつては統計学のスタンダードから外されてしまっていました。

一方、伝統的な統計学(ネイマン・ピアソン統計学)では、ベイズ統計で行われるようなデータの更新は行われないので、最初からある一定以上量のデータを用意しなければなりません(本書第7講「ベイズ推定は少ない情報でもっともらしい結論を出す」参照)。

ベイズ統計の「更新することで精度を高める」という性質は機械学習と親和性が高く、昨今、再び注目を集めることとなりました。「マイクロソフトのビル・ゲイツ氏は「1996年に、自社が競争上優位にあるのはベイズ統計によることを新聞で宣言しました。」(本書p6より引用)。本書帯(写真)には「迷惑メールが自動的に判別されるしくみとは?」と記載されていますが、これもまたベイズ統計がキーになっています(本書第11講「迷惑フィルターの例」で解説)。また、ベイズ統計学はビッグ・データの解析にも有効で、すなわちそれはマーケティングにも欠かせないツールとなっていることを意味します。

そして、ベイズ統計は上記のように①限られた情報から分析を開始し、②データが追加されればそれに修正を加え、③さらにそこに主観的な設定も加味できる、という人間くさいデータ解析ができるため、それが意思決定に活用されているわけです。

ここまで読むと、具体的な数値の導出には数学の知識が必要になるとはいえ、理論的な部分では純粋に理系的というわけでもなく、哲学的な面もあるのだという認識が得られました。

 

さて、上記のような内容については、多少の専門用語を交えながらも具体的で単純なモデルを使って丁寧に説明されているので特段混乱することもなく読み進められ、理解できた手ごたえもありました。これはちょっと感動的です。著者の元塾講師という経歴が活きている部分だと思います。

でも、油断は禁物です。これまでの経験から言って「カンタン!」「誰でもわかる!」と銘打った入門書の多くに中盤以降から裏切られることが多かったのです。

 

しかし・・・

今回はなんとか最終講義の練習問題まで解き終えることができました!「入門」にしても、すごい。ここに、本書は本当の初歩の初歩ベイズ統計学徒の方にも挫折せず読破できる本であると、私が保証します(笑)。

ただ…最後の3講(19講から21講)あたりから、初心者に向けての解説に軸足をのせすぎたために、本来は高度な数学的知識が必要な部分の解説を割愛しているので、若干狐につままれた感は否めないかも知れません。「ここまできたのだから、もう少し理解を深めたかったなぁ~」と思う読者が多いと思いますが、そこは著者も重々承知で、巻末にもっと深く学びたい人のための参考文献がずらりと並べられています。

その参考文献の中には「数学的に相当な覚悟を要します」と書かれている難関書籍もありますが、本書を読み終わった後ならば興味津々となっているはずです。ああ、また読みたい本が増えてしまいます…。

最後までお読みいただき、ありがとうございました!

スタッフN

【ご購入はこちらから】