蚘述統蚈孊/芁玄統蚈ずは

Descriptive Statistics.

別名は, 芁玄統蚈(Summary Statistics), 基本統蚈(Basic Statistics).

デヌタの特城を蚘述する統蚈孊のサブゞャンル.

暙本の分垃の特城を定量的に蚘述し芁玄する統蚈量を扱う.

収集したデヌタの平均や分散, 暙準偏差などを蚈算し, 分垃を明らかにするこずで, デヌタの傟向や性質を把握する分野.


Wikipediaでは芁玄統蚈量のペヌゞず同じ扱いをされおいるように, デヌタを芁玄しお説明するための統蚈量を扱う.

🐥Glossary

📊芁玄統蚈量

芁玄統蚈量, 蚘述統蚈量, summary statistics.

暙本の性質を芁玄するための📊統蚈量.

代衚倀(representative value)ずもいう.

芁玄統蚈量䞀芧

定性的な意味も蚘述しおいく. 䜿いどころ.

比率

📝比(ratio)

なにかをなにかで割ったもの.

📝割合(proportion)

分子の郚分が分母にも含たれおいる類のratio.

📝率(rate)

率(rate): ある単䜍量あたりの倉化量.

📝パヌセント(%/percentage)

癟分率. 0.01.

📝パヌミル

千分率, 0.001.

📝ベヌシスポむント(bp)

basis point, bp. 耇数圢はbps. 䞇分率. 0.0001. %のうしろの○が3぀぀いおいたりする.

ファむナンス領域の📝金利などの小さい倉化率で利甚されるこずが倚い.

Measures of Chenter: 䞭心の枬定

Mode: 最頻倀

デヌタ矀や確率分垃で最も頻繁に出珟する倀. 䞀぀に定たらない堎合もある.

平均倀: Mean

芳枬されるデヌタから, 算術的に蚈算しお”埗られる, 統蚈的な指暙倀

䞀般的な Average は 平均倀のこず.

以䞋のような堎合には, 平均倀よりも, 䞭倮倀がよい

  • デヌタに異垞倀が混ざっおいお, 平均倀がその倀に匕きずられおしたう.
  • デヌタの分垃が非察称になっおいる.
  • 母平均

    母集団の党おの芁玠に関する盞加平均

  • 暙本平均

    母集団から抜出した暙本 (母集団の郚分集合) の芁玠に関する盞加平均

暙準偏差

Standard Deviation, SD.

デヌタの平均倀からのばら぀きを瀺す指暙.

分䜍数

代衚倀の䞀぀.

ぶんいすう, 分䜍点, 分䜍倀, quantile, クオンタむル.

䞭倮倀: Median

有限個のデヌタを小さい順に䞊べたずき䞭倮に䜍眮する倀.

1/2分䜍数.メディアン(median).

平均倀: Meanずずもにデヌタを芋る䞊での重芁指暙.


四分䜍数

有限個デヌタを5分割したずきの倀.

  • 第1四分䜍数(q1), 小さいほうから 1/4 のずころのデヌタ.
  • 第3四分䜍数(q3), 小さいほうから 3/4 のずころのデヌタ.

が文脈で぀かわれるこずが倚い.

第0四分䜍数は最小倀, 第2四分䜍数は䞭倮倀, 第5四分䜍数は最倧倀である.

5぀の四分䜍数をたずめたデヌタセットである📊五数芁玄をずIQRを合わせたものがよく䜿われる.

四方䜍範囲: IQR(interquantile range)

䞋䜍 50% ず 䞊䜍 50%の䞭倮倀の差.

levels of measurement: 尺床

デヌタの尺床. それぞれ性質がある.

質的デヌタ-本来数倀化できないデヌタ

名矩尺床-同䞀性を衚珟 (nominal scale)

枬定察象の違いをカテゎリヌごずに数倀ぞ割り圓おたす.

䟋:男性ず女性の区別を 1 ず 2 に割り圓おるような堎合です.

順序尺床-同䞀性・順序性を衚珟 (ordinal scale)

枬定察象の差を枬定倀間の倧小関係で衚したす.

䟋:氎の矎味しさを瀺すのに, 䞀番矎味しい氎から順に 1,2,3,・・・ず割り圓おるような堎合です.

量的デヌタ-数倀化可胜なデヌタ

間隔尺床-同䞀性・順序性・加法性を衚珟 (interval scale)

枬定察象の差を枬定倀間の等間隔の数倀ずしお衚したす.

䟋:枩床, 湿床, 奜悪の皋床を 1 (非垞に嫌い)~5 (非垞に奜き) の 5 段階に割り圓おる ような堎合です. 評定倀 1 ず 2 の差 は評定倀 4 ず 5 の差 ず等間隔ずみなしおいたす.

比率尺床-同䞀性・順序性・加法性・等比性を衚珟 (ratio scale)

間隔尺床ずの違いは絶察原点 0 (れロ) があるこずです.

䟋:身長, 䜓重, 高床, 深床などです.

統蚈の衚珟方法

📝デヌタ可芖化

📈盞関

盞関. colleration. 2 皮類のデヌタの関係, 類䌌性.

盞関の皮類

  • 正の盞関: 右肩䞊がり
  • 負の盞関: 右肩䞋がり
  • 完党盞関: 盞関が぀よい
  • 無盞関: 盞関が匱い

盞関係数

2 ぀の確率倉数の間の盞関 (類䌌性の床合い) を瀺す統蚈孊的指暙.

特城は以䞋.

  • -1 から 1 の間の実数倀をずる.
  • 1 に近いずきは 2 ぀の確率倉数には正の盞関がある
  • -1 に近ければ負の盞関がある

ピア゜ンの積率盞関係数

ピア゜ンの積率盞関係数ずは - 統蚈孊甚語 Weblio 蟞曞

この蚈算方法は線圢な関係の時しか, 利甚できない.

scatter plot によっおたずは芖芚化しお適甚できるかを芋極める.

質的デヌタ (Categorical) の盞関

定量的デヌタず定性的デヌタ はアプロヌチがこずなる.

  • 性別
  • 満足床
  • 地域 


ピア゜ンよりも, ポリコリック盞関係数のほうがよい倀がでる??

References