Agentic coding. Agentic Enginnerling

単なるエディタを越えた、開発プロセスに関わる開発. 2025年からの新しい主戦場はAI Agent駆動開発へ…

AI駆動設計

🤖AIコーディング

AI駆動実装.

行数長くなる問題

  • 理想: 200〜300行(AI が最も正確に動く)
  • 許容: 〜500行(実務でよく使われる一般基準)
  • 上限: 〜800行(これ以上はスメルとして扱う)
  • 禁止: 1000行超(AI のミス率が急増)

共通関数使ってくれない問題

原因

  • utils.ts のような汎用的な名前はファイル名から目的が推測しにくい
  • タスクに関係するか判断できずスキップされがち
  • ファイルが大きいと読み込みコストが高いと判断される

解決策

  1. 名前で責務を明示する(最重要)
  2. 共通ユーティリティindex

Tips

  • リファクタリングと機能追加を同じセッションで混ぜないこと。何か壊れてもどちらが原因か分からなくなる。1セッション1仕事が鉄則

コーディング規約を定めて伝える

📐コーディング規約

https://github.com/mizchi/ailab/tree/main/.cline/rules

  • rules自体の作成もChatに依頼すると生成してくれる.

AI駆動テスト

AI駆動開発の品質保証は3層構造が共通パターン:

AI生成PR → [自動CI] → [AIレビュー] → [人間レビュー] → マージ

CIを厳しくするほど人間レビューの負担が減る、という原則.

🤖ハーネスエンジニアリング

Harness Engineering

構成要素

Gergons

  • マクロハーネス: 人間の生活や業務に近いレイヤーを自動化します。メールの送受信、カレンダー管理、Web検索、ドキュメント作成、SNS運用などが該当します。これらは「人間が普段やっていること」をAIが代行するイメージです。Openclaw
  • ミクロハーネス: 開発作業に特化したレイヤーを自動化します。コーディング、デバッグ、リファクタリング、テスト作成などが該当します。これらは「開発者がやっていること」をAIが代行するイメージです。Claude Code

🤖エージェントハーネス

AIエージェントを安全・安定・効率的に長時間稼働させるための制御フレームワーク/実行環境

Google DeepMindのStaff Engineerであり、元Hugging FaceのTechnical Leadを務めたPhilipp Schmid氏は、エージェントハーネスを「AIモデルを包み込み、長時間実行されるタスクを管理するためのインフラストラクチャ」と定義.

「ハーネス」は本来、馬具の「馬具(胴締め)」や、工業用の「配線ハーネス」から来ており、複雑なものをまとめて制御・管理する構造. テストハーネス.

コンピュータシステムにおける 💻OS

AI-DLC

AI-DLC(AI-Driven Development Lifecycle)

AWSが提唱するハーネスエンジニアリングパターン.

  • 従来: 人間が質問し、AIが回答する
  • AI-DLC: AIが計画を提示し、人間が承認・判断する

https://github.com/awslabs/aidlc-workflows

RPI

AIが「Research(調査)→ Plan(計画)→ Implement(実装)」を順に実行する、AI側の実作業プロセス。

🤖Agentic-Loop

無限ループ開発.

✨UseCase: 完了条件が機械的に判定できるものに効果を発揮する

  • テストを通せ
  • 型チェックを通せ
  • Lintエラーをゼロにしろ
  • このAPIレスポンスのスキーマに合わせてリファクタしろ

<2026-03-17 Tue 19:37> このパターンは大規模リファクタリングて型エラーをとるとか、特定のエラーを解消し続けるパターンで役に立つ。すべての開発で適用できるわけではないことに気づいた.

Ralph-Loop

Ralph は,bash スクリプトで実装された自律的なコーディングループ. Claude Codeコミュニティ

  • 2025年7月: 開発者Geoffrey Huntleyが「Ralph Wiggum as a software engineer」という投稿を公開
  • 26/01に長時間稼働トレンドをつくった.
  • 進捗はファイルとgit履歴に残る(LLMのコンテキストウィンドウではなく)
  • <2026-03-17 Tue 18:06>少し勘違い. ralph-loopは手動起動する.

2026/02. Cコンパイラを16Agentsで開発.

https://www.anthropic.com/engineering/building-c-compiler,

もはやCコンパイラつくれるならなんでも作れる説.

  • ① 無限ループで動かし続ける
    • 肝心のAGENT_PROMPT.mdには「問題を小さく分解して、進捗を追跡して、次に取り組むべきものを自分で判断して、完璧になるまで続けろ」
    • ログは agent_logs/ に保存されるので、あとから全セッションの行動を追跡
    • テストがないプロジェクトでこれをやると破壊的な変更を延々コミットし続ける危険がある
  • ② 16体を並列で動かす仕組み. 各エージェントはDockerコンテナの中で動き、共有のgitリポジトリにpush/pullする
  • この実験は興奮する成果だが、同時に不安も感じる。人間が開発に立ち会うことで品質を保証してきたのが、自律システムではテストが通れば終わりと思いがちになる。

3つのAgentic loops

  • Planner…マイルストーンのゴールをウェーブ構造のタスク群に分解し、詳細仕様書を書く
  • Builder…タスクの実装者。個別ワークツリーで実装とユニットテストの通過までに責任をもつ
  • Verifier…Builderのブランチを順にマージし、E2Eやブラウザ上での品質検証を行う。失敗時には修正も担う。

ref. ClaudeCode無限ループ(ralph-loop)による完全自律開発ワークフローで開発者のウェルビーイングを取り戻す!|Jun Ito

📜Closing the Loop - Peter Steinberger

ループを閉じろ!

Agentが自律的に動けば動くほどに、生産性は上がるという、これからのスローガン.

アプリの8割は消えるApp is Deadの時代?【OpenClaw開発者 Peter Steinberger 感想戦】 - YouTube, Peter Steinbergerの開発手法として紹介.

🦞OpenClawとエージェンティック・エンジニアリング:AIが変える開発の未来

🔦AI Aggentは評価の時代/経験の時代

ベンチマークを理解して評価指標を定義する, 評価指標をつくったらPMF. アプリレイヤのセンターピンはここ. 👨🏼Devinの哲学. 今こそ技術を学ぶべき?AIアプリケーションの「評価の時代」【Devin創業者 スコット・ウー 感想戦】 - YouTube https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf, David Silver氏とRichard S. Sutton. 強化学習レジェンド! David SilverさんはAlpha Goだ.

Welcome to The Era of Evals, AIエージェントを経済全体に適用するための主な障壁は、「あらゆる領域のevalを構築すること

🔬AutoResearch

loop型の機械学習基盤.

ドキュメント管理

LLMに読みやすいソースコードを手軽に生成する方法.

  • 小規模ならば単一ファイルにまとめる.

DeepWiki

uithub

GitHubのコードを参照してコード生成

  • git cloneしたファイルをfolderメンションで参照させる.
    • 範囲が広すぎるかも.
  • docメンションで直接フォルダ、ファイルを指定.
  • notepadにスニペットを作成して参照させる.
  • https://uithub.com/ はGitHubをひとつのテキストに変換してくれるサービス.
    • トークン数に注意しつつ利用する.

llm/files-to-prompt

Workflow Patterns

Issue to PR

Issueを登録したらPRをあげるワークフロー

Plan -> approve -> PR

人間のApproveをはさむ.

Issue粒度はエージェントが35分で作業できる単位

Devin研究より。

Incident to PR

インシデントチケットからの障害切り分け、解析、PR

ベストプラクティス

  • エージェントにとって大事なのは 名前だけで用途と使い方が推測できること

ビルド/lint/テストなどで高速にフィードバック

チートシートを作る

よく使うコマンドやライブラリはチートシート作れ

Topics

TAPE

My Workflow for Agentic Coding · Szymon Krajewski

mcp vs sdk vs api vs cli

api >= cli > mcp, sdkは別枠.

  • cliは運用用途: 人間が見やすい. エージェント的にはapiかあれば不要
  • mcpよりもcli(UNIXライク)のほうがコンテクストや使い勝手で優れる
  • sdkは開発用途

💡AI駆動開発と技術的負債

🔨技術的負債

Cline(Roo Code)を暴走列車にしたら4日間で数ヶ月分のコードが生成できた

  • コーディングエージェントは短期間で大量のコード生成が可能だが、技術的負債も急速に蓄積するため、定期的で小粒度な負債解消が必須。
  • 技術的負債解消をAIに任せる場合、「一度にひとつの明確な課題」だけに集中させ、作業を必ず完結させる方法が効果的である。
  • AIエージェントは既存コードを「正」として模倣し増殖させる傾向があるため、初期のコード品質確保と明確な制約指示が重要となる。
  • モデルやプロンプトの複雑性が技術的負債の増減に強く影響するため、シンプルな指示や適切なモデル選定が必要である。

🎵Vibe Coding

2025/02にAndrej Karpathy氏が提唱(CNNの人). vibe=雰囲気でコーディング.

コードが存在することすら忘れる.

Vibe coding is a new coding style that builds on AI tools. A programmer can describe a program in words and get an AI tool to generate working code, without requiring an understanding of the code.

Vibe coding - Wikipedia

🎵Vibes

🎰Slot machines coding

スロットマシンアプローチ.

現在の状態をコミットした後、Claude Codeに30分間自律実行させ、結果を評価して採用か再実行かを判断する手法。 修正を試みるより最初からやり直す方が高い成功率を示す.

確率的な要素(AIの非決定性)を活用して、複数回の試行から最適な結果を得る.

AI agents are ‘slot machines for programmers.

https://steipete.me/posts/2025/when-ai-meets-madness-peters-16-hour-days, 2025/6/25の投稿が出典. Peter Steinberger

claude code pdfでもある. Data Scienceの分析作業.

https://www-cdn.anthropic.com/58284b19e702b49db9302d5b6f135ad8871e7658.pdf

treat it like a slot machine

Save your state before letting Claude work, let it run for 30 minutes, then either accept the result or start fresh rather than trying to wrestle with corrections. Starting over often has a higher success rate than trying to fix Claude’s mistakes.

AI駆動開発はTypeScriptが強い

2025現在、とくにWebフロントエンドは一択.

  • 型チェックと生成AIのコード検証の相性のよさ
  • 圧倒的ユーザ数
    • Stackoverflow
    • Sample Code

💭AI駆動開発時代で静的型付け言語の型チェックで動的言語に対して圧倒的優位になった(25/03/08)

Opinons

🔦ソフトウェア開発においてAIは実装を効率化できるが他は限定的 - Pragmatic Enginneer

ソフトウェア開発の本質はコーディングだけではない. ソフトウェア開発には、以下のような要素が含まれます.

  • 何を作るかの決定(What)
  • どう作るかの計画(How)
  • 実装(Build)
  • 検証(Verify)
  • デプロイ(Ship it)
  • 監視とオンコール(Monitoring and oncall)
  • メンテナンス(Maintain)
  • マイグレーション(Migrate)

AIは「実装」部分を大幅に効率化できますが、他の要素ではその効果は限定的です。

https://newsletter.pragmaticengineer.com/p/how-ai-will-change-software-engineering