日経新聞の大喜利記事、読みましたか?
サッカー日本代表、歴代得点の56%は関西人 負けず嫌い気質が光る?:日本経済新聞
https://www.nikkei.com/article/DGXZQOUF165140W6A610C2000000/?n_cid=dsapp_share_ios
これで社内のGoが出たというのが信じがたい。 チェックした人間は誰一人、自分の頭で数字を疑わなかったということだ。記者自身を含めて。記者の仕事は「面白い数字を見つけること」じゃない。「その数字が本物か、自分で殴って確かめること」だ。それをやっていない。
⚫️違和感
一、自分のデータで自分の主張を絞め殺している。 「関西の気質と環境が得点を生む」と言いたいんだろう。なのに同じ記事の中で、関西は代表のたった19%なのに攻撃陣比率は61%だと、記者自身が書いている。この二つを並べた瞬間、56%という数字は「攻撃的ポジションに多く選ばれた人間がピッチに立って点を取った」だけで説明がつく。気質の出番はない。交絡という宝物を自分で掘り当てておきながら、それを追わずに「負けず嫌い」へ逃げた。これは見落としじゃない。発見から目を逸らしたんだ。記者として、いちばんやってはいけないことをやっている。
二、n=25で検定もCIもなしに「56%」と見出しを打つな。 素朴な二項でも95%信頼区間はおよそ36〜75%だ。「3分の1から4分の3のどこか」を、記者は断定形で一面に出そうとしている。しかも得点は独立試行ですらない。同じ選手・同じ試合で固まっているから、本当のブレはもっと大きい。さらに14点中4点が本田一人。大阪7点のうち4点も本田。これは「関西の気質」のデータじゃない。数人の天才の話を、地域の法則に化けさせている。 統計を口実に使った印象操作だ。
三、「関西」という線は、数字を見てから引いただろう。 正直に言え。先に「関西」という仮説があって検証したんじゃない。数字が高かったから関西で切ったんだ。日本を適当に分割すれば、偶然どこかが突出する。それを物語にした。末尾の関西ニュースレター誘導を見れば、企画の都合が先にあったのは明らかだ。結果を見てから仮説を立てて、それを最初からの予言のように書く。 やっていることに名前がある。HARKingだ。覚えておけ。一番やってはいけない作法だ。
四、救済の数字(61% vs 58%)も無価値。 差は3ポイント弱、選手一人ぶんもない。14/23を13/23にすれば56.5%で関東に負ける。たった一人の入れ替えで結論がひっくり返る数字を「比較的高い」と書く神経が分からない。
五、分母と期間がバラバラ。 得点は7大会25点、選手数は8大会122人。違う窓を平気で並べている。そのうえ、いま報じている26年大会の得点が、見出しの統計に入っていない。自分が何を数えているのか、記者自身が把握できていない。
六、「関西」の正体は「大阪・兵庫、ほぼ本田」だ。 14点中12点が大阪と兵庫。京都・奈良・和歌山はゼロ。なのに釜本(京都)を「関西の系譜」として持ち出す。データと美談が噛み合っていない。「関西」という言葉に、実態の何倍も働かせている。言葉で誤魔化すな。
七、出身地と育成地を混同している。 因果の話はセレッソ・ガンバのアカデミーなのに、使っている変数は「出身地」だ。測りたいものと測っているものが別物。土台から食い違っている。
八、分母(露出)が丸ごと抜けている。 シュート数も決定機もxGもない。「決める力」を語るのに、機会という分母を出さずに「点が多い=上手い」へすり替えた。volumeを見せないのは、都合の悪いものを隠したのと同じだ。
九、生態学的誤謬。 地域の集計から個人の「気質」を語っている。集計データは個人の因果を一切保証しない。学部生一年生が最初に叩き込まれる話だ。
十、世代効果を疑っていない。 本田・香川・乾・岡崎・堂安がたまたま同期に固まっただけかもしれない。特定世代の偶然を、恒久の法則に昇格させている。
⚫️コーチの証言について
「負けず嫌い」「俺が、俺が」——全部、反証できない後付けだ。 すでに「関西は点が多い」と聞かされた人間が、その結論を説明するために喋っている。確証バイアスの実演だ。どの地域のコーチに聞いても、どんな結果でも、この手の民間心理学はいくらでも出てくる。比較群も測定もないこの証言の因果的価値はゼロ。色付け以上のものではない。それを論拠のように配置するな。読者を舐めている。
⚫️改善案
単位を「得点」から「選手」に変える。母集団と地域定義(三重をどちらに入れるかも含め)を、データを見る前に決める。出場時間あたり得点や決定率を、攻撃陣同士・ポジションを揃えて比べる。地域を予測変数に、ポジション・出場時間・世代を統制変数に置いたポアソンかロジスティック回帰を組み、選手と大会をランダム効果でクラスター処理し、効果量とCIを出す。そして「この標本では有意差はまず出ない」と正直に書け。 因果ではなく、面白い記述的偶然として出す。それが誠実というものだ。
お、おぅ。(内容に異論はないのですが、「何に怒りを覚えるのかが自身のアイデンティティを形成している」という言葉を思い出してしまいました。ここまで熱くなれるだけの矜持をお持ちなのでしょう)