代表ブログ一覧に戻るテクノロジー

中小企業のWebサイトを調べたら、AI検索(LLMO)対応は"半分だけ"だった

中小企業のWebサイトを調べたら、AI検索(LLMO)対応は"半分だけ"だった
後藤 佑輔

この記事を書いた人

後藤 佑輔

IGS代表

大和証券・アクセンチュアを経て、2023年にIGSを設立。非エンジニアながらClaude Codeで自社業務の多くを自動化し、AI事業開発を行っている。

Threads @yuigs_ai

こんにちは、代表の後藤です。

最近、「近くのおすすめな美容室を教えて」などと、ChatGPTやGeminiなどのAI検索をする人が増えてきています。Googleで検索する感覚で、AIで検索する。そういう行動が、じわじわと広がっているように思います。

このような状況の中、一つ気になることがありました。「中小企業のWebサイトは、そもそもAIに見つけてもらえる状態になっているのか?」と。

実際に89社を調べてみたところ、「AIにサイトを読ませる準備」は9割近くできていましたが、AIが内容を読み取りやすい「内容の整備」は半分程度にとどまっていました。

何を調べたか

Webサイトを持つ中小企業89社のサイトを実際にクロールして、5つの指標を○×で確認しました。対象は下記6業界から選んでいます。

  • 工務店・リフォーム(15社)
  • 税理士・社労士(12社)
  • 歯科クリニック(17社)
  • 美容サロン(15社)
  • 飲食店(15社)
  • 小売・EC(15社)

調べた5つの指標はこちらです。

指標

何を確認したか

AIクローラ許可

GPTBotなどAIのクローラをブロックしていないか

構造化データ

Schema.org/JSON-LDで情報を整理しているか

見出し構造

h1が1つ・h2が3つ以上あるか

sitemap.xml

サイトマップファイルを設置しているか

llms.txt

AI向けのllms.txtを設置しているか

内容を簡単に説明すると、この5つはどれも「AIにサイトを見つけてもらい、中身を正しく読み取ってもらうための用意」ができているかを見る指標です。大きく2種類に分かれていて、

  • 前半の「AIクローラ許可」「sitemap.xml」:AIをサイトに"通す"ためのもの
  • 後半の「構造化データ」「見出し構造」「llms.txt」:AIが中身を"正しく読み取る"ための整理まわり

というイメージです。

専門用語が並んでいますが、やっていることは「AIにとって親切なサイトになっているか」を1つずつ確認しているだけです。

また、この89社にはWebサイトを持たない中小企業は含まれていないので、「日本の中小企業全体の◯%がこうだ」という話ではありません。あくまで「サイトを運営している中小企業を実際に調べたら、こうだった」という結果です。この点は後の「調査の限界」セクションでも改めて触れます。

AIのクローラは、93%が許可済みだった

まず、AIクローラについてです。

89社のうち、AIクローラをブロックしていたのは6社だけ。残りの93.3%(83社)は通れる状態でした。ただ、これはAIを歓迎しているという話ではありません。AIクローラを止めるには、自発的にrobots.txtに「入るな」と設定する必要があるので、何もしなければ通れるのが初期状態だからです。つまり83社はわざわざ塞いでいないだけで、むしろ能動的に動いたのは、手間をかけて塞いだ6社のほうです。

サイトマップ(sitemap.xml)も83.1%(74社)が設置済みでしたが、これもWordPressなどが自動で作ってくれる部分が大きい。

要するに、「AIを通す」ところまでは、特別なことをしなくても、たいていの会社ができています。問題は次です。

でも、AIが読み取りやすい形は半分だけだった

AIを通すところまでは、たいていの会社ができています。でも、AIが内容を正確に読み取れる形に整えるのは、そこから「自分で手を動かす作業」です。で、結果を見ると半分しかできていませんでした。

まず、構造化データが入っていたのは49.4%(44社)です。半数以上は、AIが情報を読み取る際の「目次」が用意されていない状態でした。見出し構造(h1が1つ・h2が3つ以上)が整っていたのも57.3%(51社)にとどまります。

また、llms.txtは11.2%(10社)でした。

llms.txtとは、「このサイトの大事なところはここですよ」とAIに教えるためのファイルです。検索エンジン向けサイトマップ(sitemap.xml)の、AI版だと思ってください。2024年ごろから広がり始めた比較的新しい仕組みで、大手AI検索が実際に参照しているかどうかの確証もまだない段階です(詳細はFAQに書いています)。採用が少ないのは、むしろ「まだやる必要を感じていない」人が多いということかもしれません。

中小企業89社のAI検索(LLMO)対応・5指標の対応率。AIクローラ許可93.3%、sitemap83.1%、見出し57.3%、構造化データ49.4%、llms.txt11.2%

スコアの分布(89社の全体像

89社の平均スコアは5点満点で2.94点でした。

スコアの分布はこうなっています。

スコア

社数

5点(全指標対応)

3社

4点

21社

3点

40社

2点

18社

1点

7社

0点

0社

3点が最多(40社)というのは、「AIクローラ許可・sitemap・あと1つ(見出し構造or構造化データ)」くらいまではできていて、残りが抜けているケースが多いということですAIを通すところまではできていても、その先まで手が回っていない、が平均像です。

業界別に見ると、どこもそこまで差はない

業界

N

平均スコア

歯科クリニック

17

3.18

工務店・リフォーム

15

3.07

税理士・社労士

12

3.00 ※

小売・EC

15

2.93

美容サロン

15

2.87

飲食店

15

2.60

(※税理士・社労士はN=12のため、傾向値として参考程度にご覧ください)

正直、業界による大きな差はありません。飲食がやや低い(2.60)のは、見出し構造の対応率が33.3%と全業界で最も低かったことが効いています。ただし最上位と最下位の差は0.58点で、どの業界も「構造化データと見出しが弱い」という共通の課題を持っています。

AI活用や業務改善について、お気軽にご相談ください

無料で相談する

では何をすればいいか

難しい話ではありません。

「AIクローラを許可する」「sitemapを置く」は、特別なことをしなくても9割超が満たせています。差がつくのは、自分で手を動かす必要がある「構造化データ」と「見出し構造」の2つです。

構造化データ」はWordPressなら専用プラグインで対応できます。手動の場合もJSON-LDを数行追加するだけです。見出し構造はコンテンツを整理する作業なので、技術的な難易度はほぼゼロです。この2つを整えるだけで、AIに読み取られやすさは大きく変わります。

llms.txt」は、設置コストがほぼゼロなので置いておいて損はありませんが、AI検索への効果はまだ未知数です。詳細はFAQに書いています。

自社サイトの対応状況が気になる方は、弊社の診断ツールで確認できます。

この結果は、こう読んでください

数字を鵜呑みにされないよう、3つだけ補足します。

①今回の89社は、Webサイトを持ち、検索で見つかる程度にWeb活用している企業です。サイトを持たない企業や更新が止まったサイトは入っていません。「全中小企業の実態」ではなく「Web活用している層の実態」として見てください。

②これが一番大事です。今回測ったのは「準備度」であって「実際にAIに引用された率」ではありません。「AIに見つけてもらいやすい技術的な準備があるか」を見ただけで、ChatGPTやClaudeが実際にどれだけ引用しているかは測っていません。この5つを整えれば必ずAI検索に載る、という話ではないのでご注意ください。

③税理士・社労士だけサンプルが12社と少なめです。業界別の数字は傾向値として見てください。

自社サイトのAI検索対応が気になる方は、お気軽にご相談ください。弊社の診断ツール(サイト採点くん)で、いまの対応状況をその場で確認することもできます。

FAQ

Q. llms.txtって、本当に効果があるんですか?

A. 正直に言うと、AI検索に効くという確証はまだありません。OpenAI・Anthropic・Googleなどの大手は「llms.txtを検索や回答に使う」と公式に表明しておらず、AIのクローラも実際にはほとんど取得していないという調査もあります。今の主な使い道は、Claude CodeのようなコーディングAIがドキュメントを読み込む用途です。設置はほぼコストゼロなので「置いておいて損はない」くらいの位置づけで見るのが正確です。

Q. 構造化データがないと、AI検索に出てこないんですか?

A. 必ずしもそういうわけではありません。ただ、構造化データがあるとAIが情報を正確に読み取りやすくなります。特に「営業時間」「住所」「サービス内容」は、構造化データで明示することで、AIが誤った情報を引用するリスクが下がります。

Q. 自社サイトの対応状況は、どうやって確認できますか?

A. 各指標は技術的な知識がなくても確認できます。llms.txtは https://自社ドメイン/llms.txt にアクセスするだけ。構造化データはGoogleのリッチリザルトテストにURLを入力すると確認できます。弊社の診断ツールでまとめて確認することもできます。

Q. この調査、次回はいつやりますか?

A. 現時点では定期更新の予定はありません。ただ、llms.txtの普及状況は急速に変わる可能性があるため、半年から1年後に再調査したいと思っています。変化があればブログで報告します。

関連記事

後藤 佑輔

この記事を書いた人

後藤 佑輔

IGS代表

大和証券・アクセンチュアを経て、2023年にIGSを設立。非エンジニアながらClaude Codeで自社業務の多くを自動化し、AI事業開発を行っている。

Threads @yuigs_ai

無料サイト診断

あなたの会社のサイト、何点?

URLを入れるだけで、SEO・AI検索対応など20項目を30秒で自動採点。IGS運営の無料ツール「サイト採点くん」が、いま直すべき点を教えてくれます。

無料でサイトを採点する
Claude Code 品質ガイドライン 表紙

Whitepaper

Claude Code 品質ガイドライン|14項目チェックリスト

「プロンプトの書き方」だけでは、AIは使いこなせない。公式準拠の14項目で自社のAI活用を点検できる、自己診断チェックリスト付き全19ページを無料でお届けします。

無料でダウンロードする