統計学とは

Statistics.

経験的に得られたバラツキのあるデータから, 🎓応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす学問.

🔖統計的手法

経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす.

📝科学的方法 + 統計学


統計学体系

大分類では記述統計学/推定統計学の2つ.

📊統計量

一組のデータに統計学的なアルゴリズムを適用して得られる数値.

以下の種類がある.

  • 📊要約統計量: 標本の性質を要約するための統計量.
  • 📈検定統計量: 統計学的検定に利用するために標本から算出する統計量.
  • 順序統計量: 標本を値の大小で並べたときの順序.

母集合と標本

Population and Sample


📝大数の法則

Variables

変数.

  • Categorical Values , qualitative variable. 定性的変数. カデゴリわけされた変数.
  • Numerical Values, 定量的変数. 測定可能変数.
    • 連続
    • 離散

Sample: 標本

母集団の部分集合. この母集団から部分集合を対応させる規則を標本抽出と呼ぶ.

  • 母集団を表現する数値を母数という
  • 標本を表現する数値を統計量という
  • 統計量で特に母数を推定するために用いられるものを推定量という

全体を調べることを census という (個体数調査)

Standard Error: 標準誤差

母集団からある数の標本を選ぶとき, 選ぶ組み合わせに依って統計量がどの程度ばらつくかを, 全ての組み合わせについての標準偏差で表したもの.

N が十分大きい場合は (標準偏差) / sqrt (n) or (標準誤差) / sqrt (n)

Confidence interval: 信頼区間

統計学で母数がどのような数値の範囲にあるかを確率的に示す方法.

U と V を, ある母数θ (観測できない) を含んだ確率分布に従う統計量 であるとし, 「 U はθ より小さく, V はθ より大きい」という確率を, 0 と 1 の間の数値.

  • 分布が正規分布に従う場合, 95%信頼区間は, 約平均± 2 ×標準誤差となる.
  • 分布が正規分布に従う場合, 99%信頼区間は, 約平均± 3 ×標準誤差となる.

記述統計学と推定統計学の架け橋. 一般的に推測統計学では 95%若しくは 99%の信頼区間を推定

数式

95%信頼区間は (* 1.96 (/ σ (sqrt n))

  • confidence interval = mean (x) +- margin of error
  • margin of error = Z x σ / sqrt (n)

🎓ベイズ統計学

得られた結果から原因を推測する.

ベイズ更新

得られた情報を元に、、確率を更新していく.

事前確率/事後確率

📐ベイズの定理

判断の数式.

Topics

🔗References

📚統計学が最強の学問である

統計学でのベストセラー本. オーディオブックで持ってたかな? 読み返したい.

これとマネーボールのブームくらいから📝データサイエンスという言葉が世間に広まった.