AIが書いたコードをレビューするな:前提合意と設計判断を先にすべき理由をPjM視点で解説

当ページのリンクには広告が含まれています。
IT女子 アラ美
💡 PjMスキル、今の職場で正当に評価されてるの?
マネジメント経験を高く評価するハイクラス求人を無料で紹介してもらいなさい
ITエンジニアのハイクラス転職なら【TechGo(テックゴー)】
この記事の結論
AI生成コードのレビューで本当にチェックすべきは、コードの品質ではなく「実装前の前提合意」です。AIが書いたコードを一行ずつ読む時間があるなら、テスト方針・外部依存・エラー戦略の3点を先に言語化して合意するほうが、チーム全体の生産性が上がります。

お疲れ様です!IT業界で働くアライグマです!

「AIが生成したコードのレビュー、一行ずつ読むのがしんどい」「AIの出力に引っ張られて、レビューが形骸化している」——こんな声が開発チームから増えています。2026年3月にInfoQが報じた調査では、AIコーディングアシスタントは開発速度を上げなかったという結果が出ました。原因は明確で、コーディングは元々ボトルネックではなかったからです。では本当のボトルネックは何か。それは「認識のズレ」です。本記事では、AI時代のコードレビューを「驚きの連続」から「確認作業」に変えるためのフレームワークを解説します。

目次

なぜAIが書いたコードのレビューは辛いのか

IT女子 アラ美
💡 技術×マネジメントのスキル、コンサルで活かせるわよ!
IT戦略コンサルへの転職を専門サポート。無料カウンセリングで適性を確認して
コンサル転職エージェント MyVision

AI生成コードのレビューが辛い理由は、「書いた本人の意図がわからない」ことに集約されます。

人間がコードを書く場合、レビュアーは「この人のスキルレベルならこのあたりで間違いやすい」「前回のPRでこの設計方針を合意している」という文脈を持っています。ところがAI生成コードにはこの文脈がありません。動くコードが突然PRに乗ってくるので、レビュアーは以下の問いを一から考える必要があります。

  • なぜこの設計パターンを選んだのか
  • 外部ライブラリの追加は合意済みか
  • エラーハンドリングの方針は既存コードと一致しているか
  • テストは書くのか、書かないのか

これらは本来、実装前に合意しておくべき事項です。人間同士の開発では暗黙的に共有されていた前提が、AIを介した途端に断絶する。ここにAIコードレビュー問題の本質があります。

以前開発チームのAI活用ルール設計をPjM視点で考える記事でも触れましたが、「AIの出力をどう扱うか」のルールがないチームほど、レビュー工数が膨らみやすい傾向があります。

IT女子 アラ美
わかる。AIが書いたPR見ると、動くけど「なんでこの書き方なの?」って聞く相手がいないのよね。

ITアライグマ
そうなんです。人間のPRなら「この部分の意図は?」と聞けますが、AIには聞けないですからね。

ケーススタディ1:AIコードを一行ずつレビューし続けたチーム

IT女子 アラ美
💡 開発プロセスを自分で変えられる職場にいるの?
ツール導入もプロセス改善も裁量がある社内SEの求人を無料で探せるわよ
社内SEを目指す方必見!IT・Webエンジニアの転職なら【社内SE転職ナビ】

状況(Before)

木下さん(仮名・36歳・PjM・経験10年)が率いる6名のチームでは、GitHub CopilotとClaude Codeを全員が使い始めたタイミングでPR数が週10本から週25本に急増しました。一見すると生産性が上がったように見えましたが、問題はレビュー側にありました。

木下さんとシニアエンジニア1名がレビューを担当していましたが、AI生成コードは「一見正しいが微妙に既存の設計方針と合わない」ケースが多く、1PRあたりのレビュー時間が従来の1.5倍に。結果として、PRが週に10本以上滞留する状態が1ヶ月続きました。

何が問題だったのか

  • 前提の未共有:「テストは必ず書く」「外部依存は増やさない方向」といった暗黙の前提が言語化されておらず、AI生成コードがそれに違反するたびに差し戻しが発生
  • レビュー粒度の問題:AI生成コードも人間のコードと同じ粒度でレビューしていたため、レビュアーの認知負荷が限界を超えた
  • 品質のばらつき:同じチームメンバーでも、AIへのプロンプトの出し方によって生成コードの品質が大きく異なり、レビュー基準が定まらなかった

木下さんは「コードの量は増えたが、マージできるコードは増えていなかった」と振り返っています。以前紹介したCodex CLIによるAIコードレビュー環境の構築ガイドのようなツールを導入する前に、まず「何をレビューするか」の合意が必要だったのです。

IT女子 アラ美
PR数が2.5倍に増えてレビュアーは2人のまま。それ、レビュー崩壊するのは時間の問題よね。

ITアライグマ
「PR数が増えた=生産性向上」と見えてしまうのが罠ですよね。マージ率を見ていませんでした。

ケーススタディ2:前提合意で差し戻し率を5分の1にしたチーム

行動(Action)

木下さんは失敗を踏まえ、「前提合意シート」を導入しました。PRを作成する前に、以下の3点を必ずIssueコメントに書くルールです。

  • テスト方針:このPRでテストを書くか。書くならどのレベル(ユニット/インテグレーション)か
  • 外部依存:新しいライブラリやサービスを追加するか。追加する場合の理由
  • エラー戦略:エラーハンドリングの方針(リトライ/フォールバック/ログのみ)

この3点が明記されたIssueに対してのみ、実装を開始してよいという運用に変更しました。AI生成コードであっても、人間が書いたコードであっても、同じルールを適用します。

結果(After)

  • PR差し戻し率:42% → 8%(5分の1に削減)
  • 1PRあたりのレビュー時間:45分 → 15分(レビュアーは「前提合意シートの3点と差分が一致しているか」だけを確認)
  • 週間マージ数:15本(PR25本中)→ 22本(PR23本中。PR数自体は減ったがマージ率が大幅改善)

振り返り・教訓

木下さんは「レビューの問題はレビューでは解決できない。問題は常に上流にある」と語っています。AI生成コードの品質をレビューで担保しようとするのではなく、実装前の合意で品質の方向性を揃えることが、AI時代のチーム開発における正解だったのです。

この教訓は技術的負債の可視化と返済計画ガイドでも強調している「問題を後工程に持ち込まない」原則と同根です。

IT女子 アラ美
差し戻し率42%→8%は劇的ね。前提合意シートって、たった3項目で効果出るの意外だわ。

ITアライグマ
シンプルだからこそ定着しやすいんですよね。10項目のチェックリストだと誰も書かなくなります。

明日から試せる「前提合意」の始め方

木下さんのチームの事例を参考に、どのチームでも明日から始められる導入ステップを整理します。

ステップ1:Issueテンプレートに3項目を追加する(10分)

GitHub/GitLabのIssueテンプレートに以下の3項目を追加するだけです。

  • テスト方針:(ユニットテスト追加 / 既存テストの修正 / テスト不要)
  • 外部依存の変更:(なし / ライブラリ追加: ○○ / サービス追加: ○○)
  • エラー戦略:(リトライ / フォールバック / ログ出力のみ / 既存踏襲)

ステップ2:1週間のパイロット運用

まずは1週間、チーム全員にこの3項目の記入を義務化します。「書いてないIssueにはPRを出さない」というルールをセットにすると定着しやすいです。

ステップ3:振り返りと調整

1週間後に振り返りを実施します。「項目が足りない」「この項目は不要」というフィードバックを反映して、チームに合った形にカスタマイズしてください。重要なのは最初から完璧を目指さないことです。3項目から始めて、必要に応じて追加していくアプローチが現実的です。

チーム運営の視点でキャリアを広げたい方は、フルスタックエンジニアのキャリア現実と生存戦略で紹介している「技術力+マネジメント力」の複合キャリアパスや、ハイクラスエンジニア転職エージェント3社比較も参考になります。

IT女子 アラ美
Issueテンプレート3項目追加するだけって、ハードル低くて助かるわ。来週から試せそう。

ITアライグマ
最初のハードルが低いと続きますよね。やってみて効果が出ると自然と定着していきます。

よくある質問

Q. 前提合意シートはAI以外のコードにも有効ですか?

はい、人間が書いたコードにも同じ効果があります。むしろ「AI生成コード用」と「人間用」でプロセスを分けないことが重要です。全てのPRに同じ前提合意を適用することで、レビューの基準が統一されます。

Q. 3項目以外に追加すべき項目はありますか?

チームの状況に応じて「パフォーマンス要件」「セキュリティ考慮」「破壊的変更の有無」などを追加できます。ただし、項目が5つを超えると記入負荷が上がり定着しにくくなるため、最初は3項目に絞ることを推奨します。

Q. レビュアーがAI生成コードを見分ける必要はありますか?

必要ありません。「誰が書いたか」ではなく「前提と合っているか」をレビューするフローにすれば、AI生成かどうかは問題になりません。逆に「AIが書いたから甘く見る」「AIが書いたから厳しく見る」というバイアスを排除できるメリットもあります。

Q. 前提合意シートの導入にPjMの承認は必要ですか?

チーム内の合意だけで始められます。Issueテンプレートの変更はリポジトリのコミット権限があれば可能です。PjMやリーダーが率先して自分のIssueに3項目を書くことが、チーム全体への浸透を促す最も効果的な方法です。

マネジメント経験を活かしたキャリアアップに興味がある方は、以下のエージェント比較も参考にしてください。

さらなる年収アップやキャリアアップを目指すなら、ハイクラス向けの求人に特化した以下のサービスがおすすめです。

比較項目 TechGo レバテックダイレクト ビズリーチ
年収レンジ 800万〜1,500万円ハイクラス特化 600万〜1,000万円IT専門スカウト 700万〜2,000万円全業界・管理職含む
技術スタック モダン環境中心 Web系に強い 企業によりバラバラ
リモート率 フルリモート前提多数 条件検索可能 原則出社も多い
おすすめ度 S技術で稼ぐならここ A受身で探すなら Bマネジメント層向け
公式サイト 無料登録する - -
IT女子 アラ美
年収を上げたいんですが、ハイクラス求人ってハードルが高そうで迷います…
ITアライグマ
技術力を武器に年収を上げたいならTechGo一択!でも、自分の市場価値を幅広くチェックしたいならビズリーチも登録しておくと安心ですよ。

まとめ

AI生成コードの時代に必要なのは、レビューの強化ではなく「レビュー前の前提合意」です。本記事のポイントを振り返ります。

  • AI生成コードのレビューが辛いのは、コードの品質ではなく「実装前の前提が共有されていない」ことが原因
  • 前提合意シート(テスト方針・外部依存・エラー戦略の3項目)を導入するだけで、PR差し戻し率を大幅に削減できる
  • レビューの問題はレビューでは解決できない。問題は常に上流にある
  • 3項目のIssueテンプレートを追加するだけで、明日から始められる

まずはIssueテンプレートに3項目を追加し、1週間のパイロット運用を試してみてください。「レビューが確認作業に変わる」体験が、チームの開発リズムを大きく変えるはずです。

IT女子 アラ美
レビューが「驚きの連続」から「確認作業」に変わるって、レビュアーとしては最高のゴールよね。

ITアライグマ
その状態が実現すると、レビューへの心理的負担がなくなって、フィードバックの質も上がりますね。

厳しめIT女子 アラ美による解説ショート動画はこちら

作者が開発したサービス「DevPick」

この記事をシェアする
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

ITアライグマのアバター ITアライグマ ITエンジニア / PM

都内で働くPM兼Webエンジニア(既婚・子持ち)です。
AIで作業時間を削って実務をラクにしつつ、市場価値を高めて「高年収・自由な働き方」を手に入れるキャリア戦略を発信しています。

目次