BLOG

ハーネスエンジニアリング(Harness Engineering)とは何か——AIエージェントを「動かす」から「信頼できる状態で動かし続ける」へ

執行役員の鬼頭です。

「ハーネスエンジニアリング」という言葉が、2026年3月に入って海外のAI・エンジニアリング界隈で急速に広がっています。Xでは「2026年を定義するスキル」「モデルの性能よりハーネスが大事」という議論が続いており、エンゲージメントの高い投稿がいくつも出ています。

コーディングの話に聞こえるかもしれません。でも本質は「AIエージェントを信頼できる状態で動かし続けるための設計思想」です。これはマーケターにとっても他人事ではありません。


プロンプト→コンテキスト→ハーネス、という進化

AIの使い方は段階を経て進化してきました。

最初はプロンプトエンジニアリング——何を聞くか、どう聞くかを磨く段階。次にコンテキストエンジニアリング——モデルに何を見せるか、どの情報をウィンドウに入れるかを設計する段階。そして今、ハーネスエンジニアリングという第三の段階が始まっています。

ハーネスとは馬具のことです。馬(AIモデル)は強力で速い。でも手綱もブレーキもなければ、どこへでも行ってしまいます。ハーネスエンジニアリングとは、モデルの周りに「ツール」「権限」「制約」「フィードバックループ」「ログ」「リトライ」「チェックポイント」を設計する技術です。(出典:Louis Bouchard「Harness Engineering: The Missing Layer Behind AI Agents」2026年3月24日

プロンプトは「モデルに何を聞くか」。コンテキストは「モデルが何を見るか」。ハーネスは「システム全体がどう動くか」です。コンテキストエンジニアリングはハーネスの一部ですが、ハーネスはもっと広い。


OpenAIが証明したこと——100万行・人間が1行も書かずに

2026年2月、OpenAIが衝撃的な事例を発表しました。社内プロダクトを約100万行のコードで5ヶ月かけて開発したが、人間が書いたソースコードは1行もない、というものです。(出典:OpenAI「Harness engineering: leveraging Codex in an agent-first world」2026年2月11日

人間の役割は「steer(手綱を引く)」だけになりました。ただしそれを可能にしたのは、モデルの性能だけではありません。その周りに構築したシステムです——構造化されたリポジトリドキュメント、エージェント間のレビューループ、linterとテストによるアーキテクチャ境界の強制、バックグラウンドで動くクリーンアップエージェント。これがハーネスです。

Martin Fowlerはこの事例を受けて「ハーネスは安全のためだけでなく、エージェントをより有能にする」と分析しています。(出典:Martin Fowler、2026年2月17日


Anthropicハッカソン優勝者の設定集がハーネスの実装そのものだった

2026年1月、Anthropic x Forum Venturesハッカソンで優勝した開発者が「everything-claude-code」というリポジトリを公開しました。10ヶ月以上の実際のプロダクト開発で使い込んだClaude Codeの設定集で、Xで90万view・1万ブックマーク以上を獲得しています。(出典:とつか「Anthropicハッカソン優勝者のClaude Code設定集『everything-claude-code』を読み解く」Zenn、2026年1月19日

このリポジトリの構成を見ると、ハーネスの概念がそのまま実装されています。

ディレクトリ 役割 ハーネスとしての意味
agents/ 専門サブエージェント 役割分担・必要最小限のツール付与
skills/ 再利用可能なワークフロー定義 文脈の構造化・一貫性の確保
rules/ 常に従うべきガイドライン ガードレール・セキュリティ制約
hooks/ イベント駆動の自動化 フィードバックループ・自動チェック
commands/ スラッシュコマンド 人間が手綱を引くインターフェース

特に興味深いのはサブエージェントの設計思想です。コードレビュー・セキュリティ監査・ビルドエラー解決・ドキュメント更新など、役割ごとに専門エージェントが定義されています。重要なのは「50個のツールを持つエージェントより、5個に絞ったエージェントの方が効率的に動作する」という原則です。必要最小限のツールだけを渡すことで、実行が速くなりフォーカスも維持される。

私たちが「Claude Code Channels」7人のAIエージェントを組織化して運用した話で触れた構成も、振り返るとこの発想と同じです。自己改善・効率化・自動化・セキュリティ監視を担うサブエージェントが存在しており、それぞれに役割と権限の境界を持たせています。当時はそれをハーネスと呼んでいませんでしたが、設計の本質は同じでした。

everything-claude-codeは11万Star超えの勢い


マーケターにとっても他人事ではない

「Claude Codeという名前だからエンジニアの話」と思った方、少し待ってください。

実際にはマーケターがClaude Codeを使うケースが増えています。コードを書くためではなく、競合リサーチ・レポート自動生成・データ分析・スケジュール管理・Slackへの通知・広告アカウントのCSV解析——そういう日常業務の自動化に使っている人が確実に増えています。

そしてここが重要なのですが、マーケターがAIエージェントに複数の業務を任せ始めたとき、直面する問題はエンジニアが直面したものと構造的に同じです。

  • エージェントが「完了した」と言ったのに実際には間違っていた
  • 長いタスクの途中で文脈を失って엉뚱한方向に進んだ
  • 一つの修正が別の場所に悪影響を与えた
  • 何が起きているかログが残っておらず原因がわからない

これらはモデルの性能の問題ではなく、ハーネスの問題です。エージェントに何を許可し、何を禁止し、どこで確認を求め、失敗したときどうリカバリーするか——その設計がないと、AIは「デモでは動くが本番では壊れる」状態のままです。


ハーネスが整うと何が変わるか

NxCodeのガイドが整理した5つの柱が参考になります。ツールオーケストレーション(何を使えるか)、メモリ管理(文脈をどう持続させるか)、エラーハンドリング(失敗をどう回収するか)、オブザーバビリティ(何が起きているかを見えるようにする)、セキュリティ(許可・禁止の境界)。(出典:NxCode「What Is Harness Engineering?」2026年3月26日

これが整ったとき、AIエージェントは「うまくいくこともある便利なツール」から「信頼して任せられるチームの一員」に変わります。LangChainはモデルを変えずにハーネスだけを改善して、ベンチマーク順位をトップ30圏外からトップ5に上げました。同じモデル、違うシステム。

「AIを使えるようにする」より「AIが安定して動き続ける環境を作れる」人間の方が、これからの時代に価値を持ちます。それはエンジニアだけの話ではありません。


AIエージェントの業務活用について相談したい方はお問い合わせからご連絡ください。

参考:OpenAI「Harness engineering」(2026年2月11日)Louis Bouchard(2026年3月24日)とつか on Zenn(2026年1月19日)NxCode(2026年3月26日)

     

広告の運用をもっと確実なものにしませんか。
ペタビットマーケティングは広告運用代行からインハウス支援まで伴走型支援いたします。

GA4などのアクセス解析やヒートマップ。LookerStudio、BigQueryなど用いてデータマーケティングのプロがサポートします。ClaudeやChatGPT、GeminiなどのAIを駆使したサポートからAI活用の企業研修まで行っています。

   

この記事のライター

鬼頭 健

執行役員 / マーケター 鬼頭 健

1982年生まれ、神戸生まれ、神戸育ち。1児の父。
2016年ペタビットマーケティング立ち上げ。その前は広告運用←CRM←自動車業界の会社で勤めていました。担当領域はデジタルマーケティング全般ですが、特にインハウス広告運用の支援とAIを使ったデータマーケティングやそのAI基盤構築。LookerStudioによるダッシュボード構築も得意です。BtoBマーケティングのお仕事を多く担当させていただいています。