tags. 🔖Literate Programming 🔖DataScience

Reproducible Researchとは

再現可能な研究. 再現可能なデータ分析.

The ultimate product of academic research is the paper along with the full computational environment used to produce the results in the paper such as the code, data, etc.

Computational X の X の部分にすべて適用できる考え方

  • コンピュータ心理学
  • コンピュータ生理学
  • コンピュータ生物学 … etc.

クラシックの交響曲は様々な楽器かそれぞれのメロディーを奏でて,一つの音楽をつくる.

テンポや曲調がまったく同じ音楽を再現することは不可能だ(Replication:複製は不可能).

しかし, 楽譜にしたがって演奏することで, 演奏者が違っても, 世界中のどこでも, 作曲家の示した音楽を再現させることは可能だ. (Reproducible: 再現)

ref. 再現性 - Wikipedia

音楽における楽譜がデータ解析におけるスクリプトとなる.

以下のメリットがある.

  • Transparency
  • Data Availability
  • Software / Methods Availability
  • Improved Transfer of Knowledge

統計解析は異常値の除去の方法によって, 得られる結果が異なることがある. 得られた結果の論拠を強くするために, 論拠となったデータを誰もが分析できるかたちで共有することが重要となる.また, だれもがデータを分析できることで, より議論をタイムリーに生み出しやすくできる.

coursera のレクチャーでも紹介されたためになる動画.

Replication

複製.

The ultimate standard for strengthening scientific evidence is replicatoin of findings and conductiong studies with independent

  • Investigators
  • Data
  • Analytical methods
  • Laboratories
  • Insttuments

背景

技術の向上が, Reproducible Research の台頭を支えている.

  • コンピュータの計算能力が極めて向上し, 洗練された解析が可能になった.
  • 既存のデータベースが “megadatabeses”にマージ可能となった.
  • データ収集のスループットが新しい技術によって向上した.

Software

evidence-based data analysis

References

Coursera