厚労省のオープンデータは、統計に乱れが生じていないか。毎日更新のGoogleの予想サイトをみておけ。

最新コロナ情勢
新規感染者全国1432人
東京311人
大阪262人
北海道151人

週が開けて、月曜。数値が低く出ている。検査体制と休日のせいで月曜は低く出がち。「月曜として最多更新」というわけわけではなさそうだ。ただ、

死者22人。
前日の死者16人。
先週最多31人。
(重症者:462人)

死者数は、重症者数に比例し、重症者数は感染者数に比例するから、しばらくの間、死者数は増えるだろう。12月21日の死者数は約50人と見積もられている。100人という見積もりの分析機関もある。

予想に意味があるのか?という疑問は自然だが、近頃は、PCR検査の実測値だけでは真の感染状況を把握できないという考えから、
1)ICL(インペリアルカレッジ・ロンドン)
2)LANI(ロスアラモス国立研究所)
3)IHME(保健指標評価研究所)
のやっている「実測値による統計から真の値を復元する手法」による分析が注目されている。

日本の感染者数などのデータは、法によって検査に制限をかけた状態で行なわれているので、制限がない場合の値ではない。LANIの専門家は、3月から4月にかけては検査でわかった数の10倍が真の値で、第3波では検査でわかった数の3倍を真の値をみなすのが正しいと、みなしている。ICLは、2.5倍。IHMEは1倍としている。1倍というのは検査報告値が実際の値と乖離していないということだが、検査陽性率が上昇している日本の場合、検査不足による感染者の見逃しが増えると考えられるため、見逃し率がプラスされる。

ICLの考えでいくと、検査で判明した数が2000人のとき実数は6000人だ。実測値5000人(実際値15000人)に達するのは、12月15日頃と予測された。

日本の検査体制では、実測される新規感染者数は、1日あたり5000~8000人で飽和してしまう。まだこの値にはなっていないが、厚生労働省のオープンデータは、保健所だよりの集計体制の脆弱さ(手書き集計、一部のfax集計による再入力のミス、報告の漏れ、遅れなど、11月15日以降酷くなっている)があるため、いまでも統計に乱れが発生していると考えられる。

GOOGLEの予想サイトも、上記の研究所でやっている方法と同じようなやり方で数値を出している。
「COVID-19 感染予測(日本版)」
URL:https://datastudio.google.com/reporting/

Visits: 228



コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA