updated at 2021-5-31

統計が解るとコロナ騒動の正体が見える

新型コロナウイルス感染症については厚生労働省や首相官邸のウェブサイトなどの公的な情報をご確認ください。

ネットで検索すると、↑というような一文が自動で表示されますが、COVID-19(以下コロナウイルス)に関しては、あらゆる種類の情報が氾濫しています。

2020年から2021年にかけて世界中で大騒ぎとなった新型コロナウイルス感染症は本当にパンデミックであったのか?
厚生労働省を中心とした公式データから得られる情報を分析しコロナウイルス騒動の実態を探って見ます。

    項目
  1. 新型コロナウイルス感染者の基準
  2. 偽陽性と偽陰性
  3. インフルエンザはどこへ行った?
  4. 何が感染者を決めているのか?
  5. ファクトチェックと陰謀論
  6. ワクチンの安全性
  7. 情報と認知
  8. まとめ
  9. 分析に使えるデータ一覧

新型コロナウイルス感染者とは?

コロナウイルス感染者の検査には様々な方法があります。

感染者確認のプロセスと対応の一例

日本でのコロナウイルス感染者は増えているのか?

以下は厚生労働省のページで公開されている過去1年間のコロナウイルス陽性者の数を元にグラフ化したものです。
縦軸が感染者数、横軸が時間軸になっています。

一見すると、感染が急拡大したかのように見えますが、増えたのは検査数です。

検査の拡大によって拾い切れていなかった感染者が把握できるようになったと解釈することも出来ますが、 濃い色で示されている初期段階から継続して検査を実施している施設から上がってくる数値の変化に注目してください。

感染拡大=市中における陽性者の数が増えた と定義するのであれば、それらから計上される陽性者の数が一定数を保っている理由はなんなのでしょうか?

下記のリストは過去1年間の間に日本で認可されたコロナウィルス感染キットです。
https://www.mhlw.go.jp/stf/newpage_11331.html

誤って陽性と判断する偽陽性が検出される検査キットが多く、歪なグラフを説明する根拠のひとつとして考えられます。

偽陽性と偽陰性

真陽性(TP)と真陰性(TN)を正解とすると、
偽陰性(FN)は、感染者を感染していないと間違った率(別名:第二種過誤、β過誤)
偽陽性(FP)は、未感染者を感染者と間違った率になります。(別名:第一種過誤、α過誤)

メールサーバーやUTMのフィルタリングの設定でも使用している概念なのでシステムエンジニアにとっても馴染のあるワードです。 (例:迷惑メールを見過ごし通してしまうことがFN、通常のメールを誤って迷惑メールと判定し破棄することがFP)

ウイルス増殖サイクル

検査方法によって増殖したウイルスが採取できるタイミングが異なります。
ウイルスが居る時期でないと検出されない為、検査タイミングを起因とした偽陰性(FN)が有ります。

コロナウィルス検査の精度

日本疫学会のホームページにはPCRテストの精度について下記のような記載があります。

今回のコロナウイルス感染症については、実際に感染していることの把握が難しいことから、 実際の感染者に対してPCR検査がどれほど正しく診断できているかについての正確性の計算がまだできていません。 いくつかの研究では、PCR検査は新型コロナウイルス感染症を完全には診断できていないのではないかと報告するものもあります。

https://jeaweb.jp/index.html

この「検査精度が低い」ことに対して安易に雑な提案をする人も目立ちました。
朝のワイドショーに出ているT川氏もPCR検査を増やす根拠として、「検査数を増やせば精度は上がる」と発言していましたが、 検査数を増やすことで誤差が中心極限定理に基づいて平均化され縮まるのは偶発誤差の場合です。

検査方法自体に除去できない系統誤差が存在する場合は、差は縮まらず、偽陰性(FN)、偽陽性(FP)、 のどちらかに誤差が累積していくことになります。

まして、陽性と判定された感染者を入院させるなどの措置をとっている場合は安易な検査数の増加が医療崩壊に繋がります。

インフルエンザはどこへ行った?

「コロナと同時に流行ったら大変なことになるぞ」と去年(2020年)の秋頃に言われてましたが、その後の報道は無いような気がします。 毎年大流行していた季節性インフルエンザはいったいどこへ行ったのでしょうか?

参考:厚生労働省 インフルエンザ(総合ページ)
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/kenkou/kekkaku-kansenshou/infulenza/index.html

なんと、感染者の数は例年の0.1%以下

コロナウイルスと従来のインフルエンザウイルスは単純比較できません。
比較できない理由は、コロナの方が重症化するからでも感染力が強いからでも無いです。
インフルエンザは症状が出ていない人にまで検査を実施し、探し出すようなことをしていません。

インフルエンザ感染者の分母は、なんらかの自覚症状が有り、病院等を受診した患者数ですが、 毎日、夕方になると速報で流されていた「コロナウイルス感染者数」とは、症状が出ていない人も含めた本日の検査の陽性者数です。

何が感染者を決めているのか?

コロナは無症状者でも他人に感染するから検査は必要なんだ!

と言われていますが、ウイルスが人から人へ感染する為には、一定量以上のウイルスが必要です。
PCR検査は感染防止の観点で適した感染者特定方法なのでしょうか?

PCRとは?

PCRはポリメラーゼ連鎖反応の略でウイルスの遺伝子を増幅して検出する方法です。
増幅するので、1サイクル回すとウイルス量は2倍になります。
PCR検査は、回すサイクル回数(以下、CT値)によって陽性となる確率が変わります。

要するにCT値の基準を高く設定するとウイルス量が少なくても陽性と判断され、小さく設定すると陰性と判断されます。
CT値を45まで上げると、コロナに感染しているか否かと関係なくPCRテストを受けた人の97%が陽性と判定されます。

国立感染症研究所の新型コロナの検査マニュアルによると日本のCT値は40です。

台湾は35なので、日本で陽性と判定された人でも台湾で検査をすると陰性になったりします。

CT値が高く設定されたPCRテストでは、感染するのに足りないコロナウイルス遺伝子の断片が見つかったとしても陽性と判断されます。
広範囲に検査を実施し、陽性者を一律で隔離するのは、非科学的すぎる対応です。

PCRテストを開発したキャリー・マリス博士はコロナウイルス騒動が始まる前年の2019年8月に死亡していますが、 生前、PCRテストが感染症の診断には適さない旨の警告を再三に渡って発しています。
何故、PCRテストが採用されたのか不明です。

今年の4月にオーストリアのウイーンで同地域の保健局を訴えた行政裁判でPCR検査がコロナの診断には適せず科学的根拠が無いとの判決が出ています。

ポルトガルやオランダでも同様の判決が出ており、 日本でも訴訟に向けて準備している団体が有ります。
感染者の定義が揺らぐと外出制限や休業要請の法的根拠が無くなる為、今後の動向に注目です。

ファクトチェックと陰謀論

このキャリー・マリス博士の警告について、 講演会で発言している記録が残っているのにも関わらず、何故か、多くのメディアが否定しています。

ロイター
Fact check: Inventor of method used to test for COVID-19 didn’t say it can’t be used in virus detection
https://www.reuters.com/article/uk-factcheck-pcr-idUSKBN24420X

AFP
【図解】新型コロナウイルス感染症とワクチンに関する誤った主張
https://www.afpbb.com/articles/-/3345442

工学博士の武田邦彦先生がネット番組で紹介した同氏の発言も否定されています。
ファクトチェック・イニシアティブ(FIJ)
「PCR開発者がウイルスの特定にふさわしくないと言っている」
https://fij.info/archives/7796

いずれのファクトチェックも精細を欠きます。
否定するのであれば、反証として提示するものはキャリー・マリス博士がPCR検査を推奨していた事実です。

他にも、コロナウイルス関連はMSM(主流大手メディア)が報道する内容と異なる情報に対して、 ファクトチェックと称し、デマだの陰謀論だののレッテルを貼ってくるパターンが多いです。
否定する根拠がよく解らないのが共通した特徴で論破というより、↓みたいな印象。

「COVID-19研究所起源説」のように散々デマ扱いし検閲してきた情報もその後の展開であっさりと覆すので、実にいい加減です。

Facebook「COVID-19が人工物または製造物であるという主張を今後は削除しない。」と発表 2021.5.26

ワクチンの安全性

日本で大規模接種が始まった今の段階でワクチンに関して誤った見解を書くとまずそうなのでテーマだけ投げかけておきます。
各自で調べるなり考えるなりしてください。

課題1

「有効性95%」

ファイザーのワクチンは有効性95%という臨床結果が強調されていますが、これは経過観察期間内にワクチンを打った人が感染しなかった率でしかないです。 公開されているファイザー臨床試験結果か元にブラセボ(偽薬)を打たれた群がコロナウイルスに感染しなかった率と比較してみましょう。

ファイザーは嘘をついておらず、公式HPでデータも公開しています。
これは医者の多くが性能評価を誤認してしまったというベイズの定理の例え話と同じようなロジックです。
事前確率と事後確率を混同すると引っかかるので、有効性を曖昧にしたい時に使うレトリックでもあります。

課題2

「米国の州単位でのワクチン接種率と現在の感染状況を比較しよう」

米国ではワクチン接種率が50%を超え、ワクチンによってコロナウイルスに克服したと報道されています。
しかし、実際に接種率が50%を超えている州は、 アラスカ、カリフォルニア、コロラド、コネティカット、デラウェア、ハワイ、アイオワ、メーン、メリーランド、 マサチューセッツ、ミシガン、ミネソタ、ネブラスカ、ニューハンプシャー、ニュージャージー、ニューメキシコ、 ニューヨーク、オレゴン、ペンシルベニア、ロードアイランド、サウスダコタ、バーモント、バージニア、ワシントン、ウィスコンシン
辺りのブルーステートと呼ばれる民主党が強い州が中心です。

共和党が強いレッドステート、特にフロリダやテキサスの接種率は依然として低いです。
ワクチンを軽視した州がどうなったのか現在の感染状況を調べてみましょう。

課題3

「CT値の変更」

CDC(疾病予防管理センター)が4月17日に出したお知らせに下記のような記載が有りました。

上で説明した通り、CT値によって陽性者の数をコントロールできます。
CT値20の検出率はCT値40の10,000分の1です。

CT値を28サイクルまで下げるとどのような変化がもたらされるでしょうか?

情報と認知

例えば、ワクチンに関して肯定的な情報と否定的な情報があったとします。

否定的な情報群の中に明らかにおかしな情報が混じっており、ワクチンを否定する意見を述べる人は頭がおかしい人みたいな印象を受けます。
しかし、各情報は独立しており、おかしな情報が否定的な情報群全体に影響を与えるものでは無いはずです。

一部だけを見てそれが全体の代表であるかのように錯覚することを論理学では 合成の誤謬(fallacy of composition)や 早まった一般化 (hasty generalization)と言います。

人の認知は錯誤の固まりなので、意識して慎重に判断を下す習慣が身に付いてないと簡単にバイアスに捉われます。

データ分析を生業としている人間ですら、 国や地域によって感染者・重傷者・死者をカウントする基準が異なることに気づかず、飛躍した結論に達する人もいました。

まとめ

各国の人口動態統計から超過死亡者の数を算出すると、コロナウィルスがスペイン風邪と双肩するレベルのパンデミックで無いことはすぐに解ります。

コロナのリスクとワクチンのリスクを定量化して得られる効果を期待値として計算したところ、後者が高いとの予測が出ましたが、 ワクチン接種をいち早く実施したイスラエルが発表した実数は予想を超える深刻な値でした。
(イスラエルは英語と現地公用語であるヘブライ語の双方のデータを参照することをお勧めします。)
また、1年後や2年後に出てくる長期的な副作用については、まだ誰にも解りません。

今回、ワクチンを作った製薬会社は何が起きても責任を問われない免責特権を得ています。
日本は希望者のみが受ける任意接種なので、なにが起きても自己責任です。

政府は省庁のホームページを通じて、判断に必要な情報発信を行っていますが、 散々、コロナウィルスの恐怖を煽ってきたマスコミはワクチンに対しても、

[1]
恐らく副反応について報道するように達しが行っているのかと思いますが、 アリバイ作りのように極めて稀に起きるアナフィラキシーだけがワクチン接種後に起きる副反応であるかのように伝えている報道が散見されました。

[2]
厚生労働省のホームページに記載されている下記がファイザーのワクチンに関する公式情報です。

https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/vaccine_pfizer.html

ワクチンを接種すれば他人に感染しないと勘違いして予防策を怠る人を増産することになる為、かなり達の悪いミスリードです。

[3]
例えば、「医療従事者の99.5%は接種を終えています。」というニュースを何故か各局が揃って行っていましたが、 医療従事者のうち約半数は最初から接種を希望していないので、接種率が99.5%に達することは決して無いです。
[接種を希望する]を切り取るのは捏造報道です。

[4]
予防接種関連改正法の付帯決議には、「ワクチン未接種が接種していないことを理由として不利益を被ることは許されない。」 と有るので差別や冷遇すること自体が違法です。

ワクチンは薬と異なり、健康な人に投与するものなので、 接種にあたっては、各自がメリットとデメリットをよく考える必要があります。
従って、情報操作による誘導は上から下に悪質度が上がります。

  1. [接種妨害]嘘や例外的な副作用を針小棒大に伝え、ワクチン接種を止めさせる。
  2. [接種推奨]真実や懸念される短期的・長期的な副作用を伝えずに、ワクチンの接種を促す。
  3. [接種推奨]考えさせない

電波を使用し放送する権利を得ていながら、情報を歪めて伝え、自らの発信力の強さを利用し異論を封殺したマスコミの責任は重いです。

追記
公式データと報道の違い。
増えた・減った・居る・居ない 等のアナログ表現で物事を捉えると惑わされる見本です。

ちなみに、高齢者はワクチン接種が進んでいるので重傷者が激減していると報道していました。
グラフが微動だにしていない20代の重傷者は流石に盛れなかったのか個別インタビューでコロナ罹患の恐ろしさを語る印象形成記事になっていました。

分析に使えるデータ一覧

厚生労働省 データからわかる-新型コロナウイルス感染症情報-
https://covid19.mhlw.go.jp/

集計基準がちゃんと明示されているので信頼性が高いデータです。

【定義・計算式】
・現在厚生労働省HPで毎日更新している重症者数は、各自治体がウェブサイトで公表している数値を積み上げたものである。
これに対し、本指標における重症者数は、この公表数値を基に、厚生労働省が都道府県に詳細を確認できた数値を集計したものであるため、
両者の合計数は一致しない。
【日付に係る制約条件】
・当該グラフは、毎週火曜日に個々の患者の状況について自治体に確認を行った時点の聞き取り情報をもとに作成し、毎週木曜日に更新している。
【データ定義に関わる制約条件】
・重症者数については原則、①人工呼吸器を使用、②ECMOを使用、③ICU等で治療、のいずれかの条件に当てはまる患者を重症者と定義しているが、
一部例外の自治体が存在する。
【その他関わる制約条件】
・東京都は独自データのため、グラフ作成準備中。
(性別・年代別重症者数は毎日の報道発表資料に記載。)
Copyright © Ministry of Health, Labour and Welfare, All Rights reserved. v1.38

「厚生労働省 新型コロナワクチンの接種後の健康状況調査」
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/vaccine_kenkoujoukyoutyousa.html

「厚生労働省 新型コロナワクチンの副反応と死亡例の報告」
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/vaccine_hukuhannou-utagai-houkoku.html

「厚生労働省 厚生科学審議会 (予防接種・ワクチン分科会 副反応検討部会)」
https://www.mhlw.go.jp/stf/shingi/shingi-kousei_284075.html

日経「チャートで見る感染状況」
https://vdata.nikkei.com/newsgraphics/coronavirus-japan-chart/

「Statistics and Research」
総合ページ
https://ourworldindata.org/coronavirus

コロナ死亡者数
https://ourworldindata.org/covid-deaths

コロナワクチン接種状況
https://ourworldindata.org/covid-vaccinations

ちなみに、Kaggleでも2020年のコロナ発生当初から米国ホワイトハウス等から提供されたデータでデータサイエンスト向けの コンペが実施されていました。
データの不自然さに気づき、探求心を持って自発的に背景を調べた参加者は果たして何割居たのでしょうか?

COVID-19 Open Research Dataset Challenge (CORD-19)
https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

よく読まれてる記事
競馬予想AIを作る
難易度別AIを独学で学べる書籍
日本のIT化は何故遅れたのか

競馬予想AIを作る

日本のIT化は何故遅れたのか

難易度別AIを独学で学べる書籍