メディアやネットをはじめ、世の中には間違ったデータ分析が溢れている。いまや現代人に必須の教養となったデータ分析リテラシーを身に付けるには、実際の失敗例を基にした問題を解くトレーニングが有効だ。政治学者の菅原琢さんの著書『データ分析読解の技術』(中公新書ラクレ)より、一部を紹介する――。

京都にある美容院の店内
写真=iStock.com/Yagi-Studio
※写真はイメージです

ネットに蔓延る「怪しい」データ分析

次の文章を読み、続く問いに答えてください

そもそも、なぜ秋田県は脳血管疾患率、がん死亡率、自殺率などで全国ワーストなのか。

「秋田県民は飲酒量が多く、漬物など塩分の高い食べ物を好む傾向があります。がんや脳血管疾患率が高いのは、それが原因でしょう。そして、健康状態が悪くなれば将来を悲観して自殺する人が増える。悪循環に陥っているのです」(熊谷嘉隆・国際教養大学教授)

確かに、脳梗塞で亡くなった筆者の祖父は大の酒好きで、塩辛い漬物をつまみにして毎日のように日本酒をあおっていた。地元の知り合いにも酒好きが多い。

加えて、自殺率の高さには気候も関係しているという。秋田県では冬季の晴天率がかなり低く、筆者の実感としても晴れの日がほとんどない。正直いって、冬の間は憂鬱ゆううつで仕方がなかった。さらに、見栄っ張りな県民性のためか、秋田県民は貯蓄も少ない。それも自殺率の高さに関係しているという。

「秋田県は人口10万人当たりの美容院の数が全国で1位。そのことからわかるのは、見栄っ張りでほかの地域よりも恥を感じやすい県民性だということです。その場その場で見栄を張るので、お金もコツコツ貯めずにパッと使ってしまうタイプの人が多い。当然、生活は苦しくなり、そうなれば周囲の視線に耐えられない。結果、自殺してしまう……。そんなケースも少なくないと考えられます」(同)

※引用元:布施翔悟「○○が全国ワースト1の秋田県に若者の移住が激増している理由…世界が注目する地域に?」Business Journal(一部修正)


 この文章では、人口10万人当たりの美容院数を「見栄っ張り」、「恥を感じやすい」という「県民性」の指標としています。これは、人口10万人当たりの美容院数という結果が、そのような「県民性」を要因として変動しているという、因果関係の主張です。

そこで、図表1を参考に、この指標がそのような意味を持つものではない(=そのような因果関係は存在しない)ということを、より説得的な別の説(要因)を示すことで主張してください。

この問題は本来、「人口10万人当たり美容院数=見栄っ張り」という数字の捉え方が「怪しい」と感付くところからスタートしたいところですが、問題として出題したので、みなさんの“感付き”の機会を奪った形になってしまいました。ただ、おそらくこのように問題にしなくても出題の箇所について「何だか怪しい」と感じることができる人は多いのではと思います。

一方で、「怪しい」と“感付く”自信がない人もいるでしょう。しかし、「怪しい」と気付くのに“勘”は必要ありません。数字の本来の意味と、議論で主張された意味とを比較して、かなり異なることに気が付けばよいだけです。そのためにここで必要なのは、勘や第六感の類ではなく、注意深さです。

文章中の数字がどう意味づけられているかを確認する

議論と数字のズレに気付くコツとしては、文章中に数字が出てきたら、それがどう意味づけられ、議論されているかを確認して等号(イコール)で結んでみるとよいです。何らかのデータを飾りで利用しただけのような記事であれば、数字と議論を直接等号で結んでみるこの方法でだいたい“引っかかり”を作ることができます。

今回の問題では、人口10万人当たり美容院数=住民の見栄っ張りさ、としてみます。イコールのこちら側とあちら側の内容は等号で結べるものでしょうか? 頭髪を整える場所の密度とその場所に住まう人の性格は一致するのでしょうか?

ある人が見栄っ張りだとしても、その露出の方法は美容院に限りません。立派なクルマや住居を所有しているのに、身だしなみに無頓着な人も世の中にはいるでしょう。逆に、見栄っ張りでない人が美容院に行くことも普通です。住民の「見栄っ張り」の度合いと美容院数を繋げるのは、かなり論理的な飛躍があるように感じます。

データ分析を見かけた際は、このように焦点となっている議論と数字をイコールで結んでみて、それに納得いくかどうか自分を試してみてください。