Claude Codeをうまく使いこなせていない方へ～非エンジニア経営者のための品質チェックリスト14項目～

代表の後藤です。

いつも観ていただき、誠にありがとうございます。

このブログでも何度か書いてきましたが、弊社は日々の仕事のほとんどをClaude Codeに任せています。「ブログの下書き」も、「提案資料」も、「経理の一次チェック」も、気づけばAIがまず最初に手を動かしています。

で、最初のころ困ったのが「品質のムラ」でした。同じような頼み方をしているつもりなのに、ある日はそのまま社外に出せる完成度（高品質）で返ってくる。別の日は、数字が怪しかったり、頼んでいないことまで勝手にやっていたりする（低品質）。「今日はなぜダメだったんだろう？」と、そのつど現場でパッチを当てるような対処をしていた時期がありました。

この原因は、プロンプトの書き方を覚えたかどうかの話ではありませんでした。

もっと手前の、AIとの付き合い方全体の設計の話だったんです。

品質管理と呼べる状態というのは、そのまま社外に出せる成果物が、「毎回」「人手を最小限に」「安定して」出てくる状態だと考えています。一度うまくいくのは運で、毎回出てくる仕組みを作るのが「品質管理」です。

弊社が実際に効果を感じた工夫を、「14項目」「4つのレベル」に分けて整理しました。上から順に、レベル1から着手するのがおすすめです。難易度が低いものほど今日から効果が出やすく、後のレベルほど前段の土台が必要な作りになっています。

【レベル1 】まず今日から（話し方のみ）

まずは設定も契約も要らない、話し方だけで変わる4つです。

①プロンプトは「役割・お手本・形式」をそろえて渡す

AIに何かを頼むとき、弊社では丸投げしません。

「あなたは中小企業向けの編集者です」のように役割を伝え、過去のいい成果物を3〜5個お手本として渡し、「箇条書きで、2000字以内で、スプレッドシートの表で」のように形式と分量まで指定します。公式ドキュメントでも、お手本を渡すのが最も効果的な方法の一つと明言されています。

あと地味に効くのが、「専門用語を使うな」ではなく「中学生にもわかる言葉で」のように肯定形で伝えることです。ここを外すと、初稿の精度がそもそも低く、あとの手直し工数がそのままコストとしてのしかかってきます。

②大きな変更は「計画→承認→実行」の順に。小さい修正は直接依頼

「資料の骨子を作り直す」「機能を追加する」といった大きい変更は、先に手順だけを出してもらい、OKを出してから実行してもらいます。

「誤字の修正」のような小さい修正は、都度確認せず直接お願いしましょう。逆に手順を決めずに「とりあえずやって」で進めると、出来上がってから「これじゃない」となり、結局作り直しのほうが時間がかかります。

③コンテキスト（文脈）は都度リセットする

「別の作業に移るときは/clearで会話をリセットする」
「1つの会話では1つの案件だけを扱う」
「長くなってきたら/compactで要約する」
「失敗したら/rewindでやり直す」

これを徹底しています。

公式でも「コンテキストは最も管理すべき資源」だと言われている通り、コンテキストが詰まると精度が落ちます。実際、案件を混ぜたまま会話を続けて、別の数字が提案書に紛れ込みかけたことがあります。

④「できました」を鵜呑みにせず、証拠を出してもらう

AIが「できました」と言っても、そのまま信じません。

「テストを実行して結果を貼って」「その数字とURLは実物を確認してから書いて」と、必ず証拠を出させます。というのも、Claudeはそれっぽい数字やURL、会社名を自然に創作することがあるからです。公式も「成功を主張させるな、証拠を出させろ」という言い方をしています。

最後の人の目視だけは、省かないようにしましょう。

【レベル2 】軽い設定をする

ここからは少し設定が必要になりますが、一度作ればずっと効いてくる土台の話です。

⑤CLAUDE.mdに「よく使う指示」と「禁止事項」をまとめる

よく使う指示や絶対に守ってほしいルールは、CLAUDE.mdという1つのファイルにまとめています。

「メールの返信は敬体で」
「数字はfreeeやGA4の実物を確認してから書く」
「誇大表現はNG」

といった内容です。

目安は200行以内。公式でも、肥大化した指示書はかえって肝心のルールを無視させると言われています。載せるのは「これが無いとAIが間違えること」だけに絞り、知識のほうはリンクで渡すのがコツです。CLAUDE.mdそのものの作り方はこちらの記事（CLAUDE.mdとは？）でも詳しく書いています。

⑥memoryに「現場の気づき」を貯める

同じ注意を毎回繰り返すのは無駄なので、「覚えておいて」と伝えてmemoryに残してもらいます。

・人：恒久的なルールはCLAUDE.mdに記載

・AI：現場で気づいた細かい注意点はmemoryに貯めていく

という役割分担です。

古くなったmemoryは更新したり削除したりします。ここをやらないと、同じミスを何度も同じ言葉で注意することになり、地味に時間を失います。ただし、これはあくまで補助です。絶対に止めたいこと（誤削除や誤送信のような取り返しのつかないこと）は、memoryに頼らず、このあと説明するhooksで物理的に止めます。

⑦ファイルは1つ1役割、フォルダで整理する

1つのファイルには1つの役割だけを持たせ、役割ごとにフォルダを分けています。

そして、大きくなりすぎたファイルは分割します。これをやっておくと、AIが「どこを見ればいいか」で迷わなくなります。ここが混ざったままだと、AIが関係ない資料を参照して見当違いの提案をしてくることがあります。

⑧命名・配置のルールを統一する

ファイル名は「20260603_見積_A社」のように「日付_内容_相手」で統一し、置き場所も一時ファイルと本番ファイルで分けています。

これを決めておかないと、古いバージョンや別案件のファイルが混ざり込むという品質事故が起きます。地味なルールですが、AIに触らせるファイルが増えるほど効いてきます。

【レベル3 】ツールをつなぐ・自動で止める

ここからは効果が大きいところです。

⑨MCPで外部ツールに直接つなぐ

「freee」「Gmail」「Slack」といった外部ツールにAIを直接つなぎます。

「入金が未確認の請求書を出して、催促メールの下書きを作って」のように、実データを見ながら動いてもらえるので、転記ミスや古い数字を見て判断するようなことが減るはずです。

ただし、MCPをつなぐ前には提供元の信頼性を必ず確認しましょう。公式でも、不正な文章でAIを誤誘導される危険（プロンプトインジェクション）が指摘されています。

⑩危険な操作だけ「確認してから」にする（権限モード）

「削除」「Gmailの送信」「本番環境への反映」といった取り返しのつかない操作だけは、必ず「確認してから実行」するようにしています。

逆に、「下書き作成や整形」「要約」のような軽い定型作業は、確認なしで自動で速く進めてもらいます。取り返しがつくものは自動、つかないものは確認、というだけのシンプルな線引きです。ここを分けずに全部自動にしてしまうと、間違えて送ってはいけないメールを送ってしまうような事故につながります。

ちなみに「autoモード（確認をほぼ省いて任せられるモード）」も、実行前に別の判定役が危険をチェックしてはくれますが、「安全な全自動」ではありません。削除や送信、本番反映は、このあと説明するhooksや確認の仕組みで別途止めておく前提です。

⑪絶対NGは「自動で必ず止まる」仕組みにする（hooks）

CLAUDE.mdはあくまで「お願い」、hooksは「確定（必ず実行される）」ものだと公式でも整理されています。弊社でも、危険な削除コマンドの実行はhooksで物理的にブロックしています。

hooksが無いと、CLAUDE.mdに「削除禁止」と書いてあっても、AIがそれに気づかないまま実行してしまう、という事故が起こり得ます。お願いは破られることがありますが、hooksは物理的に強制するので、人手をかけなくても品質の最低ラインが守られます。詳しい仕組みはこちらの記事（Claude Codeの「hooks」とは？）にまとめています。

【レベル4 】任せて回す（上級）

ここまでできると、あとは任せる範囲を広げていく段階です。

チーム規模の会社ほど効いてきます。

⑫大量の調べ物はサブエージェントに分担させる

「競合10社の料金を一覧化する」のような大量の調べ物は、サブエージェントに分担させて、結論だけを受け取るようにしています。本体の会話を汚さずに済むので、本筋の判断の質が下がりません。

セキュリティチェックのような専門的な確認は、専任のサブエージェントに任せます。

ちなみに「分担」(サブエージェントに任せて結果報告だけ受け取る)と「チーム」(複数のAIが会話しながら並行して動くagent teams)は別物で、チームのほうがコストもかかります。まずは分担で十分というのが今のところの実感です。

⑬よくやる手順は「スキル」や「コマンド」として定型化する

「ブログ記事作成」や「月次レポート」、「議事録作成」のようなよくやる手順は定型化して、AIに頼むだけで動くようにしています。

CLAUDE.mdが常時のルールだとすると、スキルは頼んだときだけ動く手順書というイメージです。

手順書が無いと、毎回イチから指示をやり直すことになり、頼むタイミングや言い方によって成果物の質がバラつきます。これをやっておくと、担当が変わっても同じ品質を再現できます。

⑭定型作業は自動化（Routines）で回す

「毎朝9時に、昨日のGA4のデータをまとめてGmailに下書きしておいて」のような定型作業は、自動で回るようにしています。

Routines（現時点ではリサーチプレビュー段階の機能です）はクラウド上で動くので、PCを閉じていても実行されます。手作業のままだと、忙しい時期ほど後回しになり、結局対応が遅れるということが起きます。

ただし、無人で回すぶんミスに気づきにくくなるので、④で触れた「結果の確認」は必ずセットにしています。まずは影響の小さい作業から自動化するのがおすすめです。

以前、AIエージェントの作り方｜1人社長がClaude Codeで「AI社員」を作った方法という記事で、Claude Codeに実務を任せる「AI社員」をどう作るかを書きました。今回の14項目は、その仕組みづくりを、非エンジニアの経営者でも自己点検できる形に整理し直したものです。

完全版（チェックボックス付き自己診断）を無料で配布しています

ここまで14項目をレベル別に見てきました。

とはいえ、記事を読みながらその場で14個をチェックするのは大変だと思います。14項目を☑で自己診断できる完全版（チェックボックス付き）を用意しました。自社が今どこまでできていて、どこからが手つかずかを、こちらから無料でダウンロードできます。

是非、現状の使い方を検証してみてください。

FAQ

Q. プロンプトの書き方さえ覚えれば十分では？

A. それだけでは足りません。プロンプトが良くても、コンテキストが詰まっていたり、確認の仕組みが無かったりすると、品質は安定しません。丸投げしないプロンプトの工夫（レベル1）はスタート地点で、そのあとの土台づくり（レベル2以降）まで含めて初めて「毎回安定する」状態になります。

Q. 非エンジニアでも設定できますか？

A. レベル1・2は話し方と1つのファイルを用意するだけなので、エンジニアでなくても始められます。レベル3のMCPやレベル4の自動化は専門家の手を借りる場面も出てきますが、「何をつなぐか」「何を自動化するか」の判断は経営者自身がやる部分です。

Q. どれから手を付ければいいですか？

A. レベル1から順番に着手するのがおすすめです。特に④の「証拠を出させる」は、設定が要らないのに効果が大きいので、最初にやってみてください。

Q. 小さな会社でも意味がありますか？

A. むしろ小さな会社ほど効きます。チェックする人手が限られているぶん、AIの成果物がそのまま社外に出る場面が多いからです。弊社も1人の会社ですが、この仕組みのおかげで最終チェックの負担がかなり減りました。

Claude Codeを自社の業務にどう組み込むか迷う方は、お気軽にご相談ください。弊社の実体験をもとに一緒に考えます。

Claude Codeをうまく使いこなせていない方へ～非エンジニア経営者のための品質チェックリスト14項目～

後藤佑輔