tags. 🔖Literate Programming 🔖DataScience
Reproducible Researchとは
再現可能な研究. 再現可能なデータ分析.
The ultimate product of academic research is the paper along with the full computational environment used to produce the results in the paper such as the code, data, etc.
Computational X の X の部分にすべて適用できる考え方
- コンピュータ心理学
- コンピュータ生理学
- コンピュータ生物学 … etc.
クラシックの交響曲は様々な楽器かそれぞれのメロディーを奏でて,一つの音楽をつくる.
テンポや曲調がまったく同じ音楽を再現することは不可能だ(Replication:複製は不可能).
しかし, 楽譜にしたがって演奏することで, 演奏者が違っても, 世界中のどこでも, 作曲家の示した音楽を再現させることは可能だ. (Reproducible: 再現)
ref. 再現性 - Wikipedia
音楽における楽譜がデータ解析におけるスクリプトとなる.
以下のメリットがある.
- Transparency
- Data Availability
- Software / Methods Availability
- Improved Transfer of Knowledge
統計解析は異常値の除去の方法によって, 得られる結果が異なることがある. 得られた結果の論拠を強くするために, 論拠となったデータを誰もが分析できるかたちで共有することが重要となる.また, だれもがデータを分析できることで, より議論をタイムリーに生み出しやすくできる.
coursera のレクチャーでも紹介されたためになる動画.
- The Importance of Reproducible Research in High-Throughput Biology - YouTube
- Org-mode for Reproducible Research - YouTube
Replication
複製.
The ultimate standard for strengthening scientific evidence is replicatoin of findings and conductiong studies with independent
- Investigators
- Data
- Analytical methods
- Laboratories
- Insttuments
背景
技術の向上が, Reproducible Research の台頭を支えている.
- コンピュータの計算能力が極めて向上し, 洗練された解析が可能になった.
- 既存のデータベースが “megadatabeses”にマージ可能となった.
- データ収集のスループットが新しい技術によって向上した.
Software
evidence-based data analysis
- Treading a New Path for Reproducible Research: Part 1 | Simply Statistics
- Treading a New Path for Reproducible Research (Part 2) | Simply Statistics
References
- Reproducibility - Wikipedia, the free encyclopedia
- R で reproducible research
- knitr+pandoc ではじめる~『 R Markdown で Reproducible Research 』
- Writing reproducible reports in R with markdown, knitr and pandoc - Nice R Code
- 論文の再現性について - ある医療系大学長のつぼやき
- 再現性の無い研究論文を減らすにはどうすべきか | 堀川大樹