「75パーセンタイル」という言葉を、健康診断の結果や学力テストの成績表で見たことがある方も多いのではないでしょうか。
パーセンタイルは統計学における重要な概念のひとつであり、データの分布における「位置」を示す指標です。
本記事では、75パーセンタイルとは何か、その定義と意味、四分位数との関係、偏差値との違い、データ分析における活用方法まで、わかりやすく丁寧に解説していきます。
統計学が初めての方でも理解できるよう、具体例を交えながら説明しますので、ぜひ最後までお読みください。
75パーセンタイルとは?統計における位置の結論
それではまず、75パーセンタイルの定義と基本的な意味について解説していきます。
75パーセンタイル(第75百分位数)とは、データを小さい順に並べたとき、下から75%の位置にある値のことです。
言い換えると、「全体のうち75%のデータがこの値以下に収まる」という境界値を指します。
100人のデータであれば、75番目に小さいデータの値が75パーセンタイルに相当します。
75パーセンタイルは、自分のデータが全体の中でどの位置にあるかを把握するための非常に便利な指標といえるでしょう。
パーセンタイルの基本的な定義
パーセンタイル(percentile)は百分位数とも呼ばれ、データを100等分したときの各区切り点の値を指します。
たとえば「第50パーセンタイル」は中央値(メジアン)と等しく、データ全体のちょうど真ん中の値です。
「第75パーセンタイル」であれば、全データの75%がこの値以下に位置することを意味します。
【パーセンタイルの例(10人のテストスコアの場合)】
データ:30, 45, 50, 60, 65, 70, 75, 80, 90, 100(昇順)
第25パーセンタイル(P25)≒ 50点(下から25%の位置)
第50パーセンタイル(P50)≒ 67.5点(中央値)
第75パーセンタイル(P75)≒ 78.75点(下から75%の位置)
上記の例では、75パーセンタイルが約78.75点となり、この点数以下に全体の75%のデータが収まっていることを示しています。
75パーセンタイルの計算方法
パーセンタイルを計算する方法にはいくつかの定義がありますが、最も一般的な方法を紹介します。
【Pパーセンタイルの計算手順】
1. データをn個として昇順に並べる
2. 位置指数 L = (P/100) × n を計算する
3. Lが整数でない場合:切り上げた位置のデータ値がPパーセンタイル
4. Lが整数の場合:L番目とL+1番目の平均値がPパーセンタイル
【例:20個のデータで75パーセンタイルを求める場合】
L = (75/100) × 20 = 15
Lが整数なので、15番目と16番目のデータの平均が75パーセンタイル
ただし、統計ソフトウェアやエクセルによって計算方法が微妙に異なる場合があるため、ツールが使用している計算方式を確認することをおすすめします。
75パーセンタイルが示す「位置」の意味
75パーセンタイルの値にある人や数値は、全体の中で「上から25%以内」に位置することを意味します。
たとえば健康診断でLDLコレステロール値が75パーセンタイルに位置する場合、同じ年齢・性別の集団のうち75%の人がその値以下であり、その人は上位25%に属することがわかります。
75パーセンタイルは「良いか悪いか」の判断とは切り離して考える必要があり、測定する項目によって高いほうが良い場合も低いほうが良い場合もあります。
四分位数と75パーセンタイルの関係
続いては、統計学における「四分位数」の概念と75パーセンタイルの関係について確認していきます。
四分位数とは何か
四分位数(しぶんいすう)とは、データを4等分する3つの区切り値のことを指します。
それぞれ第1四分位数(Q1)・第2四分位数(Q2)・第3四分位数(Q3)と呼ばれ、以下のように定義されます。
| 名称 | 別名 | パーセンタイルとの対応 | 意味 |
|---|---|---|---|
| 第1四分位数(Q1) | 下四分位数 | 第25パーセンタイル(P25) | 下位25%の境界値 |
| 第2四分位数(Q2) | 中央値・メジアン | 第50パーセンタイル(P50) | データの中央値 |
| 第3四分位数(Q3) | 上四分位数 | 第75パーセンタイル(P75) | 上位25%の境界値 |
つまり、75パーセンタイルは第3四分位数(Q3)と完全に一致するということになります。
四分位数はデータのばらつきを把握するための基本的な指標であり、箱ひげ図(ボックスプロット)の作成にも使われます。
四分位範囲(IQR)との関係
四分位範囲(IQR:Interquartile Range)は、第3四分位数(Q3)から第1四分位数(Q1)を引いた値です。
四分位範囲 IQR = Q3(第75パーセンタイル) − Q1(第25パーセンタイル)
IQRはデータの中央50%の範囲のばらつきを示す指標です。
外れ値の影響を受けにくいため、標準偏差よりも頑健(ロバスト)な散布度の指標として広く使われています。
IQRはデータ分析において外れ値を検出する際にも活用され、Q1 − 1.5×IQR から Q3 + 1.5×IQR の範囲外にあるデータを外れ値とみなす「テューキーの基準」が有名です。
箱ひげ図における75パーセンタイルの役割
箱ひげ図(ボックスプロット)は、データの分布を視覚的に表現するグラフであり、5数要約(最小値・Q1・中央値・Q3・最大値)を使って描かれます。
箱ひげ図の箱(ボックス)の上端がQ3(=第75パーセンタイル)に相当し、下端がQ1(=第25パーセンタイル)になります。
箱の幅がIQRを視覚的に示しており、75パーセンタイルは箱ひげ図を正しく読み取るうえで欠かせない基準点です。
偏差値と75パーセンタイルの違い
続いては、日本の教育現場でおなじみの「偏差値」と75パーセンタイルの違いについて確認していきます。
どちらも「全体の中での位置」を示す指標ですが、計算方法と意味合いが異なります。
偏差値の定義と計算方法
偏差値は、平均点を50として、標準偏差を10として正規化した指標です。
偏差値 = (自分の得点 − 平均点) ÷ 標準偏差 × 10 + 50
偏差値50:平均点と同じ
偏差値60:平均より1標準偏差高い(上位約15.9%)
偏差値70:平均より2標準偏差高い(上位約2.3%)
偏差値はデータが正規分布(ベル型の分布)に従うことを前提とした指標であり、データの分布が正規分布から大きく外れている場合は正確な順位情報を反映しない場合があります。
75パーセンタイルと偏差値の対応関係
データが正規分布に従う場合、パーセンタイルと偏差値には以下のような対応関係があります。
| パーセンタイル | 偏差値(正規分布の場合) | 上位何%か |
|---|---|---|
| 第25パーセンタイル(Q1) | 約43.3 | 上位75%(下から25%) |
| 第50パーセンタイル(Q2) | 50.0 | 上位50%(平均) |
| 第75パーセンタイル(Q3) | 約56.7 | 上位25%(下から75%) |
| 第84パーセンタイル | 約60.0 | 上位約16% |
| 第97パーセンタイル | 約70.0 | 上位約3% |
75パーセンタイル(Q3)は正規分布において偏差値約56.7に対応するため、偏差値55〜57程度の位置と考えると直感的に理解しやすいでしょう。
パーセンタイルが偏差値より優れている点
パーセンタイルは偏差値と異なり、データが正規分布に従わない場合でも正確に「何%以下か」を示すことができます。
医療統計や健康診断の評価では、身長・体重・血液検査値のような実測データが必ずしも正規分布に従わないため、偏差値よりもパーセンタイルが好んで使われる場面が多いといえるでしょう。
また、パーセンタイルは直感的に「全体の何%以下にいるか」を示すため、解釈が簡単で専門知識がなくても理解しやすいというメリットがあります。
データ分析における75パーセンタイルの活用方法
続いては、実際のデータ分析において75パーセンタイルがどのように活用されるのかについて確認していきます。
ビジネスデータ分析での活用
ビジネスの現場では、売上データや顧客データの分析に75パーセンタイルが広く使われています。
たとえば「顧客の購入金額の75パーセンタイル」を求めることで、上位25%の高価値顧客がどの金額ラインから始まるのかを把握でき、優良顧客セグメントの定義に活用できます。
Webサービスのパフォーマンス指標では、レスポンスタイムの75パーセンタイル(P75)や95パーセンタイル(P95)がよく使われており、ユーザー体験の悪化を検出するための重要指標となっています。
医療・健康分野での活用
医療分野では、子どもの成長曲線(身長・体重の発育曲線)においてパーセンタイルが標準的に使われています。
日本の小児科でも、乳幼児の身長・体重が第3〜97パーセンタイルの範囲内にあれば正常範囲とされており、第75パーセンタイルは「同年齢の子どもの75%以下」という意味で使われます。
また、血圧・コレステロール・BMIなどの健康指標においても、集団内での位置を示すためにパーセンタイルが活用されています。
Excelでの75パーセンタイルの計算
エクセル(Excel)では、パーセンタイルを計算するための関数が用意されています。
| 関数名 | 書式 | 説明 |
|---|---|---|
| PERCENTILE関数 | =PERCENTILE(データ範囲, 0.75) | 75パーセンタイルを計算(旧バージョン対応) |
| PERCENTILE.INC関数 | =PERCENTILE.INC(データ範囲, 0.75) | 75パーセンタイルを計算(境界値含む) |
| PERCENTILE.EXC関数 | =PERCENTILE.EXC(データ範囲, 0.75) | 75パーセンタイルを計算(境界値除く) |
| QUARTILE.INC関数 | =QUARTILE.INC(データ範囲, 3) | 第3四分位数(=75パーセンタイル)を計算 |
エクセルで75パーセンタイルを求める場合は、PERCENTILE.INC関数またはQUARTILE.INC関数を使うのが最も一般的です。
第2引数に「0.75」を指定することで、指定したデータ範囲における75パーセンタイルの値が自動的に計算されます。
まとめ
本記事では、75パーセンタイルとは何かという基本的な定義から始まり、計算方法、四分位数との関係、偏差値との違い、データ分析における実際の活用方法まで幅広く解説してきました。
75パーセンタイルとは、データを昇順に並べたとき下から75%の位置にある値のことであり、第3四分位数(Q3)と同義です。
統計学やデータ分析において非常に基本的かつ重要な概念であり、ビジネス・医療・教育など幅広い分野で活用されています。
パーセンタイルを正しく理解することで、データの「位置」を客観的に把握し、より正確な分析・判断ができるようになるでしょう。
今後データを見る際には、ぜひ75パーセンタイルという視点を意識してみてください。