データには「誤差」が生じます。100回やって100回必ず同じ結果になるわけではありません。この「誤差」を科学的に扱おうとしたときに考えられる統計アプローチは3つあります。
■誤差へのアプローチ方法1
1つ目の誤差へのアプローチ方法は、実際のデータをまったく扱わず、ただ仮説やこういう事例がありましたという話だけをもとにして理論モデルを組み立てる、というやり方です。統計学が取り入れられるまで、経済学などの社会科学はしばしばこうしたアプローチをとっていました。
■誤差へのアプローチ方法2
そして2つ目の誤差へのアプローチ方法は、見かけ上「100回やって100回そうなる」という状態を示すために、うまくいった事例のみを結果として報告するやり方です。
たとえば生物の教科書で有名なメンデルが、エンドウ豆を使って遺伝の法則を調べようとした実験の報告をしたとき、彼は初期の報告では「結果を10個ずつ例示する」と言って、自説である彼の唱えた遺伝の法則にぴったりとはまるエンドウ豆のデータのみを示しました。もちろんメンデルはこの1回以外にも何度か実験を重ね、「例示」以上のデータを示すこともあったが、後にフィッシャーはそうした報告をまとめて検証し、「実際よりも明らかに誤差が少ない」と結論づけています。つまり、メンデル自身のせいなのか、彼の助手のせいなのか、自説に都合のいい「キレイな結果」だけを選んで報告しやがったのではないか、ということです。(もちろん彼の遺伝の法則自体が間違いということではありません。)
■誤差へのアプローチ方法3
3つ目の誤差へのアプローチ方法が、フィッシャーの提示した、ランダム化を用いて因果関係を確率的に表現しようとするものです。「実験で正しい真実を確認する」といった科学の方法論を利用します。
■余談:フィッシャーとは
天才的な頭脳を持ちながら偏屈で人付き合いの下手だったフィッシャーは、大学での人間関係に疲れ、20代の終わりから40代前半までの期間をイギリスの片田舎にあるロザムステッド農業試験場の統計家として過ごしました。権力争いに敗れた失意の日々ともとられかねないこの期間に、彼はたった1人で歴史を動かす大発見をいくつもしていたのだから、人生何があるかわからないものですね。
「誤差」への3つのアプローチ方法を紹介しました。アプローチ方法3をきちんと理解して誤差に対する正しい統計アプローチを行いましょう。