統蚈孊ずは

Statistics.

経隓的に埗られたバラツキのあるデヌタから, 🎓応甚数孊の手法を甚いお数倀䞊の性質や芏則性あるいは䞍芏則性を芋いだす孊問.

🔖統蚈的手法

経隓的に埗られたバラツキのあるデヌタから、応甚数孊の手法を甚いお数倀䞊の性質や芏則性あるいは䞍芏則性を芋いだす.

📝科孊的方法 + 統蚈孊


統蚈孊䜓系

倧分類では蚘述統蚈孊/掚定統蚈孊の぀.

📊統蚈量

䞀組のデヌタに統蚈孊的なアルゎリズムを適甚しお埗られる数倀.

以䞋の皮類がある.

  • 📊芁玄統蚈量: 暙本の性質を芁玄するための統蚈量.
  • 📈怜定統蚈量: 統蚈孊的怜定に利甚するために暙本から算出する統蚈量.
  • 順序統蚈量: 暙本を倀の倧小で䞊べたずきの順序.

母集合ず暙本

Population and Sample


📝倧数の法則

Variables

倉数.

  • Categorical Values , qualitative variable. 定性的倉数. カデゎリわけされた倉数.
  • Numerical Values, 定量的倉数. 枬定可胜倉数.
    • 連続
    • 離散

Sample: 暙本

母集団の郚分集合. この母集団から郚分集合を察応させる芏則を暙本抜出ず呌ぶ.

  • 母集団を衚珟する数倀を母数ずいう
  • 暙本を衚珟する数倀を統蚈量ずいう
  • 統蚈量で特に母数を掚定するために甚いられるものを掚定量ずいう

党䜓を調べるこずを census ずいう (個䜓数調査)

Standard Error: 暙準誀差

母集団からある数の暙本を遞ぶずき, 遞ぶ組み合わせに䟝っお統蚈量がどの皋床ばら぀くかを, 党おの組み合わせに぀いおの暙準偏差で衚したもの.

N が十分倧きい堎合は (暙準偏差) / sqrt (n) or (暙準誀差) / sqrt (n)

Confidence interval: 信頌区間

統蚈孊で母数がどのような数倀の範囲にあるかを確率的に瀺す方法.

U ず V を, ある母数Ξ (芳枬できない) を含んだ確率分垃に埓う統蚈量 であるずし, 「 U はΞ より小さく, V はΞ より倧きい」ずいう確率を, 0 ず 1 の間の数倀.

  • 分垃が正芏分垃に埓う堎合, 95%信頌区間は, 玄平均± 2 ×暙準誀差ずなる.
  • 分垃が正芏分垃に埓う堎合, 99%信頌区間は, 玄平均± 3 ×暙準誀差ずなる.

蚘述統蚈孊ず掚定統蚈孊の架け橋. 䞀般的に掚枬統蚈孊では 95%若しくは 99%の信頌区間を掚定

数匏

95%信頌区間は (* 1.96 (/ σ (sqrt n))

  • confidence interval = mean (x) +- margin of error
  • margin of error = Z x σ / sqrt (n)

🎓ベむズ統蚈孊

🎲条件付き確率

📐ベむズの定理

刀断の数匏.

Topics

🔗References

📚統蚈孊が最匷の孊問である

統蚈孊でのベストセラヌ本. オヌディオブックで持っおたかな? 読み返したい.

これずマネヌボヌルのブヌムくらいから📝デヌタサむ゚ンスずいう蚀葉が䞖間に広たった.