本編(中学数学、高校数学)のカテゴリーの方で確率統計の話題を書きましたのを機に、そういえば一時期このような議論がなされていたなと思い出しました。私は医者ではないのであまり断定的なことは言えませんが、確率論的には全員検査はナンセンスだと思えます。それをベイズの定理をから見ていきたいと思います。
偽陽性問題が大きいから
偽陽性の確率は実に 93.5%
検査は万能ではありません。新型コロナウィルスを検査するPCR検査で偽陽性が出てしまうのは、病気と判別されない程度のわずかなコロナウィルスしか含まれていない場合でも、検査ではウィルスを増殖して検出するために反応してしまい、陽性と判定してしまうからです1。偽陽性が出てももう一回検査をすればよいのでは、という意見もあったようですが、確かにこの理由なら、何回検査しても偽陽性は出続けてしまい、意味は無いですね2。
さて、それでは実際にどの程度の偽陽性が出てしまうのでしょうか。少し問題風にして記載します。
日本国内における人口10万人あたりの感染者数が100人(0.1%)と推定されるとする。感度(実際に病気にかかっている人が陽性と判定される確率)が 70%、特異度(病気にかかっていない人が陰性と判定される確率)が 99% のとき、国民全員に検査を施したとすると偽陽性の確率はいくらか?
実際の計算は後に示すベイズの定理により求めますが、ここでは結果だけを示して議論を進めます。結果は、
偽陽性の確率は 93.5%
です。陽性と判定された人が100人いたとして、実際に陽性なのは6-7人程度で残りは全て偽陽性です。このような検査をしたとしてもほとんど意味は無いと考えられます。
そこで実際には体温が高い人を中心に検査するようなことをしました。これは事前確率(上記の問題で 0.1% の部分)を上げることになり、偽陽性の確率を下げることができます。実際、例えば事前確率を 50% として再計算をすると、偽陽性の確率は 1.4% にまで減ります。
なので、全員検査ではなく、疑わしい人を検査する、というのが正しい方法ということになります。
特異度が 99% もあるのに偽陽性が 93.5% も出るギャップが信じられない人へ
特異度が 99% ということはその補集合が 1% ということで、これは病気でない人を陽性と判定する間違いは 1% しかないということです。にもかかわらず偽陽性が 93.5% も出てしまうということにはギャップがあるように感じます。
本質を理解するためには極端な例を考えるとよい場合が多くあります。今回の例では推定感染者の割合が 0.1% ですが、ここを極端に 0% としてみます。そうすると、陽性者は 0 人なのですが、にもかかわらずある一定の割合(具体的には 1%)で陽性と判定してしまいます。そうすると偽陽性は 100% ということになります。偽陽性は、陽性と判定された人のうちで実際には病気ではない人の割合であり、この極端な例では陽性者は出てしまうもののその全員が病気ではないためです。
つまり推定感染者の割合によって偽陽性の割合が変化します。具体的には推定感染者の割合が少なくなればなるほど偽陽性が出やすく 100% に近づいていく、ということが分かります。
もちろん、このような極端な例では特異度の数字も変わってくるとは思いますが、ここは純粋に計算論としてこのギャップを理解することが目的なので、この数字のままで考えます。
ベイズの定理により計算する
ベイズの定理とは
ベイズの定理(2)は実は難しくなく、条件付確率の式(1)を少し変形しただけです。
P(X∩Y)=P(Y|X)P(X)=P(X|Y)P(Y)
これを変形し、
P(Y|X)=P(X|Y)P(Y)P(X)
このとき、
- P(Y) を事前確率
- P(Y|X) を事後確率
といいます。この意味は、もともと Y が起きる確率は事前確率 P(Y) だったが、X が起きたという情報を得たのでその下において Y が起きる事後確率は P(Y|X) である、ということです。
コロナ検査の偽陽性を計算する
さて、上記の問題を計算で求めてみます。再掲します。
日本国内における人口10万人あたりの感染者数が100人(0.1%)と推定されるとする。感度(実際に病気にかかっている人が陽性と判定される確率)が 70%、特異度(病気にかかっていない人が陰性と判定される確率)が 99% のとき、国民全員に検査を施したとすると偽陽性の確率はいくらか?
問題文から、
- 病気にかかる確率:P(病)=0.001 (10万人に100人:0.1%)
- 感度:P(陽|病)=0.7
- 特異度:P(¯陽|¯病)=0.99
なので、陽性的中率(陽性と判定されて実際に病気をしている確率)は、
P(病|陽)=P(陽|病)P(病)P(陽)=P(陽|病)P(病)P(陽|病)P(病)+P(陽|¯病)P(¯病)=0.7×0.0010.7×0.001+(1−0.99)×(1−0.001)=0.0654
よって、偽陽性は
1−0.0655=0.9345
となり、実に 93.5% もの人が偽陽性判定されてしまいます。
まとめ
検査は万能ではない、ということはおそらく全ての人が納得することだとは思いますが、だとしても、全員検査は多少は意味があるのではないか、と思いがちです。しかし実際に計算をしてみるとそのようなことは全く無いことが分かります。直感的にとらえるとするならば、非常に数の少ないものを見つけ出すことは難しいことである、ということです。
コメント