...

データの読み方 — 統計で騙されないための7つの視点

統計データリテラシーサンプルサイズバイアス

公開日: 2026年4月6日

はじめに

LOL DATABASE LABでは、Master+帯の実戦データを統計分析してビルドやマッチアップ情報を提供しています。しかし、統計データは万能ではありません。データを正しく読み、正しく判断するためには「統計の落とし穴」を知っておく必要があります。

この記事では、当サイトの実際のチャンピオンデータを例に使いながら、データ活用で知っておくべき7つの視点を解説します。

1. 小標本問題(Small Sample Problem)

少ない試合数のデータは信頼できない。

当サイトの実データを見てみましょう:

エズリアルエズリアル 勝率52.69%(1,190試合)
クレッドクレッド 勝率59.57%(47試合)

一見するとクレッドの方が勝率が高く「強い」ように見えます。しかし47試合という少ないサンプルでは、たまたま上手いプレイヤーが連勝しただけで勝率が跳ね上がります。一方、エズリアルの1,190試合は十分な量があり、52.69%という数値には安定した信頼性があります。

当サイトでは各データにサンプルサイズ(試合数)を併記しています。50試合以下のデータは参考値程度に留めてください。100試合以上あれば一定の信頼性があり、300試合以上で安定した傾向と判断できます。

2. 多重比較問題(Multiple Comparisons Problem)

たくさんの比較を行うと、偶然「意味がありそうなパターン」が見つかる。

172体のチャンピオンがそれぞれ数十のマッチアップを持つため、当サイトでは数千の勝率比較が同時に行われています。統計学では、有意水準5%で2,000回の検定を行うと、約100件が偶然だけで「有意」に見える計算になります。以下はその一例です:

グレイブスグレイブス vs ダイアナダイアナ 勝率77.78%(9試合)

勝率77%は圧倒的に見えますが、たった9試合です。9試合中7勝しただけで77%になります。数千のマッチアップ比較を行えば、こうした「偶然の極端な値」は統計的に必ず発生します。これが偽陽性です。

「勝率70%超のマッチアップだから絶対有利」と即断するのは危険です。必ず試合数を確認し、10試合未満のデータは無視するくらいの心構えが安全です。30試合以上あるマッチアップデータを基準にしてください。

3. 交絡変数(Confounding Variables)

隠れた第三の変数が、見かけの因果関係を作り出す。

当サイトのデータでは、各チャンピオンの「勝率最高アイテム」が表示されます。例えば:

エズリアル 勝率最高アイテム: モータル リマインダー
カルマカルマ 勝率最高アイテム: 女神の涙

「モータル リマインダーを積めばエズリアルの勝率が上がる」と解釈したくなりますが、これは危険です。モータル リマインダーは回復阻害アイテムであり、相手に回復チャンピオンがいる試合で購入されます。つまり「このアイテムが勝利の原因」なのではなく、「適切なゲーム判断ができるプレイヤーが買った結果」として勝率が高い可能性があります。

同様に、カルマの女神の涙は序盤に購入する安いアイテムです。勝率が高いのは「女神の涙が強い」からではなく、「序盤にマナ管理を重視する堅実なプレイヤーの勝率が高い」からかもしれません。

ビルドの勝率を見るときは、「このアイテムが勝利の原因か? それとも勝っているゲームの結果か?」を常に考えてください。

4. 選択バイアス(Selection Bias)

観測するデータが偏っていると、全体像を見誤る。

当サイトのデータはMaster+帯に限定されています。その結果、こんな傾向が出ます:

カタリナカタリナ 勝率60.55%(109試合)
アイバーンアイバーン 勝率60.00%(130試合)

カタリナは操作難度が非常に高いチャンピオンですが、Master+帯では勝率60%を超えています。これは「カタリナが強い」のではなく、「Master+帯でカタリナを使えるプレイヤーが極めて上手い」ことを意味します。

アイバーンも同様で、Master+帯では少数のOTP(ワントリック)プレイヤーが極めて高い精度でプレイしています。ゴールド帯やプラチナ帯で同じ勝率は期待できません。

データを自分のランク帯に適用する際は「自分が同じ精度で操作できるか?」を考慮してください。採用率が高く、かつ勝率も高いチャンピオンが、多くのプレイヤーにとって最も堅実な選択です。

5. 確証バイアス(Confirmation Bias)

人は自分の仮説を支持する情報を優先的に収集・解釈する傾向がある。

当サイトのデータから興味深い例を見てみましょう:

ライズライズ 勝率42.72% / 採用率18.33%

ライズは勝率42%台と低いにもかかわらず、採用率は18%以上という高い数値を示しています。「ライズは弱い」というデータがあるのに、多くのプレイヤーが使い続けています。

これは確証バイアスの一例です。ライズを好きなプレイヤーは「あの試合は味方が悪かった」「練習すれば勝てる」と自分に都合の良い解釈をし、勝率の低さを無視する傾向があります。

データを見るときは、自分の期待と反する情報にこそ注意してください。「自分の得意チャンピオンが実は勝率が低い」というデータを受け入れることが、ランクを上げる第一歩です。

6. 母集団の異質性(Population Heterogeneity)

異なる集団のデータを混同すると、誤った結論に至る。

当サイトではKRサーバーとJPサーバーのデータを並行収集していますが、採用率に大きな差があるチャンピオンが存在します:

アニビアアニビア KR 25.04% / JP 7.64%
ジェイスジェイス KR 25.68% / JP 11.74%
オーロラオーロラ KR 20.03% / JP 7.07%

アニビアはKRサーバーで圧倒的に人気ですが、JPサーバーでは3分の1以下の採用率です。これは「アニビアの強さ」が変わったわけではなく、サーバーごとのプレイスタイルやメタの違いを反映しています。

KRサーバーはアグレッシブなプレイスタイルが主流で、ウェーブクリアが強いチャンピオンが好まれます。JPサーバーでは異なるチャンピオンが好まれることがあり、同じデータでも解釈が変わります。

自分がプレイするサーバーのデータを優先的に参考にしてください。KRのメタをそのままJPに持ち込んでも、チームメイトの動きやマッチング環境が異なるため期待通りにいかないことがあります。

7. 平均への回帰(Regression to the Mean)

極端な成績は、次の測定で平均に近づく。これはナーナーフのせいではない。

あるパッチのWeek 1で、172体のチャンピオンの勝率を測定したとします。勝率トップ10のチャンピオンをマークして、何も変更されないままWeek 2の勝率を再測定すると、ほぼ全員の勝率が下がります。

これは「弱体化された」のではなく、Week 1のパフォーマンスに含まれていた幸運な偶然が、Week 2では繰り返されなかっただけです。逆にWeek 1のワースト10は、Week 2で改善する傾向があります。

Week 1 勝率トップ → Week 2でほぼ全員が下落
Week 1 勝率ワースト → Week 2でほぼ全員が上昇

LoLに適用すると:パッチ直後に「勝率急上昇!OPだ!」と騒がれるチャンピオンの多くは、翌週には元の水準に近づきます。逆に「弱すぎ」と言われたチャンピオンも回復します。1週間の極端な数値で判断するのは、回帰を無視した過剰反応です。

パッチノートに変更がないのに勝率が動いた場合、まず平均への回帰を疑ってください。2パッチ以上にわたって一貫した傾向を示すチャンピオンが、統計的に信頼できる「強い」チャンピオンです。

まとめ:データとの正しい付き合い方

正しい使い方

  • サンプルサイズを常に確認する(50試合以上を基準に)
  • 複数のマッチアップを総合的に見る(1つだけで判断しない)
  • 自分のランク帯・操作精度を考慮する
  • KR/JPの差を理解して自分のサーバーを優先
  • パッチ適用から1週間以上のデータを信頼する

危険な使い方

  • 試合数を見ずに勝率だけで判断する
  • 自分の信念に合うデータだけ採用する
  • Master+帯の勝率60%チャンピオンを即真似する
  • パッチ直後の不安定なデータを鵜呑みにする
  • 勝率最高アイテムを思考停止で毎試合積む

統計データは判断の材料であり、判断そのものではありません。データを参考にしつつ、自分のプレイスタイル・ランク帯・得意チャンピオンを考慮して、最終的な判断は自分で行ってください。

当サイトは、あなたがより良い判断を下すための情報を提供することを目的としています。

他のガイド記事

このサイトのデータを実戦に活かす方法