🔖ETERNUSの開発者だったのでこのときの開発経験はわたしの価値観につよい価値観を与えた.
Insights
✨Gosship-Styleなシステム制御にとても興奮する
かっこいい. システマチックな機能美がそこにはある.
- 🔥好きなこと
- 📝Gossip Protocol
- ⛓Avalanche(AVAX)
- 💭スマートコントラクト開発とはまさか低レベル組込みファーム開発と相性がいいんじゃないか(23/08/23)
- 分散システムにおける異常検出とスゲぇ HeartBeat についてのまとめ | Futurismo
ETERNUS
⚫東証システムダウン障害(2020/10/01)
東京証券取引所様の株式売買システム「arrowhead」で発生した障害の原因と対策について : 富士通
障害が起こったのはETERNUS NR1000. わたしの開発してたのはETERNUS DX. よかった, 私のせいかとおもってた. 長野か?
⚫みずほシステム障害(2020)
多重障害、想定できず「極めてまれ」―みずほが原因説明:時事ドットコム
コントローラーモジュール間通信異常の1点故障をトリガにした両系ダウン…開発してたとこかも. もう社外の人間なので推測でしかないけど. 情報なさすぎるし仮に原因がわかったところでわたしにはなにもできないのでもう考えない.
想定できずといいつつ, いくら対策してももぐらたたきで障害が起こって残業地獄で対応した. 理論的には極めてまれなんだ, しかし苦悩することは起こるはずのない100年に1度のことが1年に1回くらい発生して, もはや完璧に対策したはずなのに発生するんだ. ハードを相手にするとソフトだけではどうしようもないこともある.
そもそも富士通のストレージは高信頼すぎるからこそ値段が高すぎて開発スピードもおそすぎて世界シェアが3%. EMCやIBMには障害はフィールドで叩くという文化があるようでとにかく製品を出すことを優先する販売戦略.
可用性についてはたしか標準的な尺度があったはず. 世間がなにをいおうと測定して算出していたはず. 世界最高がダメならほかももっとダメなはず, もはやそもそもストレージ単体での安定稼働はムーンショットなみの難しさ何じゃないかなと思う.
それでも海外製品の可用性が高いのは, 単体のストレージでの可用性ではなく, GoogleやAmazonのようにひとつひとつの可用性は低くても複数ストレージクラスタで分散システムを組んで可用性を上げているんじゃないかなと思った. 金がないと出来ない方法.