STAP細胞論文についての数学的考察

※この投稿では、数式のためにMathJaXを使用しています。そのため、古いブラウザでは読めないかもしれません。

STAP細胞は世紀の大発見か、ねつ造か、はたまた実験ミスか。盛大に真贋論争が巻き起こっていますが、正面切ってそれに参加するのはちょっと気が引けます。

「過去に書いた論文で恣意的なデータの採用、強引な論理展開、他論文からの表現拝借などを手がけていない人だけが、理研に石を投げなさい」

とか言われるかと思うと、もう黙るしかないです。

ただ、検証ネタの中で、数学的に面白そうなものを見つけました。Natureに投稿されたARTICLEの方のSTAP論文で、Figure 2.cについて、独立な2つの実験なのに結果が酷似しているというものです。こんなことは確率的にあり得ないというのですが、本当でしょうか。

fig2.c

この図には、白丸の大きさが微妙に違うなどの疑惑もあり、あとから結果を修正したのではないかなどとも言われています。しかし今回それは置いておき、この類似がどの程度の確率で起こりうるかだけを、パズル的に考えてみたいと思います。

私は生物学には疎く、そもそもSTAP細胞にどのような意義があるのかを良く理解していません。この問題を取り上げた理由も、論文を糾弾または擁護するのが目的ではなく、数学的に面白そうだからです。

さて、Figure 2.cで白と黒の個数を数えると、左右の画像とも白9個黒101個です。しかし左の画像の白2個が右では黒2個に、また黒2個が白2個に変化していて、計4個分の相違があります。この相違数を、画像間の相違度と定義しましょう。相違度が4個以下である確率を求めれば、この現象の珍しさを判定できるはずです。

統計学的には、多分標本相関係数などを使って近似的に求めるのが筋だと思いますが、あえてCPUパワーを使って、富豪プログラミング的に解いてみたいと思います。

まず、相違度が$i(i=0\sim 110)$になる確率を求めます。同じ相違度$i$でも、白$i$個が黒に変わったのか、逆に黒$i$個が白に変わったのか、あるいはその中間か、いろいろな場合があります。そこで、白→黒の変化を$j$個、黒→白の変化を$i-j$個としましょう。そのような条件を満たす場合の数は、「白9個から$j$個を選ぶ場合の数×黒101個から$i-j$個を選ぶ場合の数」で、
\[\binom{9}{j}\binom{101}{i-j}\]
通りとなります。この時右の画像は、白$9-j+(i-j)=i-2j+9$個、黒$101+j-(i-j)=-i+2j+101$個となっているはずです。従って、それぞれの場合が発生する確率は、各セルで白が発生する確率を$p$とすると、
\[p^{i-2j+9}(1-p)^{-i+2j+101}\]
です。この両式を掛け合わせてすべての$j(j=0\sim i)$について足し合わせれば、相違度が$i$になる確率を求められます。
\[\sum _{j=0}^i \binom{9}{j} \binom{101}{i-j}
p^{i-2 j+9} (1-p)^{-i+2 j+101}\]
欲しいのは相違度が4以下になる確率ですから、
\[\sum _{i=0}^4 \sum _{j=0}^i \binom{9}{j} \binom{101}{i-j}p^{i-2 j+9} (1-p)^{-i+2 j+101}\hspace{2cm}(*) \]
を計算すれば良いですね。

ところで、白が発生する確率$p$はどう考えたら良いでしょうか。画像の白丸出現率(9/110)を採用しても良いのですが、それは真の値ではなく実験の一結果に過ぎません。そこで、ベイズ推定を使ってみましょう。図左の結果(白9個黒101個)が得られたとき、$p$の真の値をベイズ推定の確率変数で表すと、その確率密度関数は次式のようなベータ分布となります。
\[\frac{(9+101+1)! p^9 (1-p)^{101}}{9! 101!}\]

f02
ただし、事前確率分布は一様分布としています。

これで準備が整いました。この式に式(*)をかけて、$p=0\sim 1$まで積分すれば良いわけです。
\[
\int^1_0 \frac{(9+101+1)! p^9 (1-p)^{101}}{9! 101!} \sum_{i=0}^4 \sum_{j=0}^i\binom{9}{j}\binom{101}{i-j} p^{i-2 j+9} (1-p)^{-i+2 j+101} dp \\
=0.0000000950841…
\]
結果が出ました。だいたい1億分の9.5ぐらいの確率なので、偶然似たパターンになったというのは、考えられそうにないです。まあ、計算する前からわかっていたことですが。

相違度の確率関数をプロットすると次のようになります。

f01

この図の4以下というのはやはり起きそうにないですね。ちなみに平均は17.21程度になりました。これは、$2\cdot 110p(1-p)$を確率密度関数に従って$p$で積分した値と一致するはずです。

ただ、機器の物理的不具合というか「クセ」が原因で、相関性が高い結果が得られた可能性はないのかな、とは思います。私はこの図が何を意味しているのかすら分かっていないので、そういった考察を展開できないのが残念です。

以上の計算は、手作業ではとても無理なのでMathematicaで行いました。Mathematicaは正規に買うと数十万円、ホームユーズでも数万円しますが、小型基板コンピュータのRaspberryPi版は無料で公開されています。演算速度さえ我慢すれば、数千円程度で環境を揃えられます。そんな解説本もいつか書きたいとは思っているのですが……。