金融データサイエンス/ファイナンスデータ分析/トレード分析/市場分析まとめ

マーケット分析, 市場分析, ファイナンスデータ分析について.

分析を元にした🗃トレード戦略も参照.

各論

マーケット分析手法

📍マーケット分析: キモをえぐり出す問い

トレード戦略の仮説検証における逆引きイシューの参考資料. 定性的仮説生成.

再利用可能な分析の型やプロセスをまとめたい.

📍キモをえぐりとる問い

📍トレード市場の性質をどう評価するか?

  • どの統計量をつかうか?
  • どの指標を利用するか?
  • 性質をどうやって定量化するか?

References

📊ファイナンスデータ

📝バー(Bar)

データ分析のためには📝構造化データが必要であるが, とりわけファイナンスでは表形式の行をバーと呼ぶことが多い.

標準バー

決められた単位でサンプリングするデータ.

  • 📝タイムバー

    一定の時間間隔, タイムスタンプごとにサンプリングしたデータ.

    タイムバーをベースにしてデータ分析はいろいろ用語があり, 📝マーケットデータの基礎知識にまとめる.


    最も有名であるが, 最近はあまり評判かよくない. とはいえ, 最も手軽に手に入るのでこれでまずは確認. APIで取得できるのもこれ. 古い意味での📝テクニカル分析はこのタイムバー利用するものがほとんど.

  • 📝ティックバー

    取引ごとのバー. あらかじめ決めた取引数(1000とか)ごとにサンプリングしたデータ.

  • 📝出来高バー

    ボリュームバーとも. あらかじめ決めた出来高ごとにサンプリングしたデータ.

    具体的な計算方法について, 📝VPINとその関連資料がわかりやすい.

    📝出来高グラフは出来高バーの可視化.

  • 📝ドルバー

    あらかじめ決めた売買代金, 📊取引高が取引されるごとにサンプリングしたデータ. 売買高バー.

    ドルは米ドルを指すわけではなく俗称. ユーロでもポンドでもドルバーという.

情報ドリブンバー

新しい情報が到着するたびに情報をサンプリングして作成するバー. Infomation-Drivenバー.

日本語表記は怪しい(あまり翻訳されていない).

情報の偏りと連続性から, tick/Volume/LSを分解して6種類ある.

📝インバランスバー

情報の偏りに注目したサンプリング.

  • 📝ティックインバランスバー

    Tick Imbalance bar(TIB).

    ティックインバランスバー, ティック不均衡バー.

  • 📝ボリュームインバランスバー

    Volume Imbalance Bar(VIB).

    📝VOIバー, ボリュームインバランスバー, 出来高の偏り.

    📝逆選択リスクは情報の, とくに出来高の偏りから生じる気がする.

  • 📝ドルバランスバー

    Dollar Imbalance Bar(DIB). 売買代金不均衡バー.

📝ランバー

Runs Bar.

ここでいうRunsとは, 同じ値の繰り返し. 日本語だとランバーだけどランはRunではなくRuns, 複数形, つまり連続しているということ.

Runsを連と訳すのはイマイチな気がした.

  • 📝ティックランバー

    Tick Runs Bar(TRB).

  • 📝ドルバランスバー

    Doller Runs Bar(DRB).

📝ヒストリカルデータ

ファイナンスにおける時系列データをとくにヒストリカルデータ(Historical Data)と呼ぶ. 過去データとも.

💡時系列データの表記ゆれを整理

いろいろな用語がそれぞれのコンテキストででてきて混乱するので整理.

  • 1次情報は時刻と約定価格の約定履歴, それをリストにしたもの.
  • 約定履歴の単位時間における要約(group by/resample)がOHLC.

  • 約定履歴/歩み値/取引履歴/trades/executions/Timeseries
    • timestamp
    • price
    • volume
  • OHLCV/ローソク足/bar/tick/candle stick
    • Open price
    • High price
    • Low price
    • Close price
    • volume
  • BarSeries/ticks/bars
    • list of ohlcv
    • list of tick
    • list of bar

🔗References