ブログ一覧に戻る

llms.txt を置いても AI に引用されない? 137Kサイトの実証と、代わりにやること(2026年版)

2026年7月5日 公開

llms.txt を置いてみたけれど、AI の回答に自分の記事が引用されるようになった手応えは、正直ない——。2025年に広まったこのファイルを設置した人なら、一度は感じたことかもしれません。この記事は、その体感が「気のせい」なのかを2026年の実証データで確かめ、もし効かないなら代わりに何が被引用に効くのかまでを、一次情報で追ったものです。

先に結論

llms.txt を置いても、AI 検索に引用されやすくなる直接効果はほぼ確認されていません。ただし「完全に無意味」とまで言うと言い過ぎで、正確には二層に分けて捉える必要があります。

  • 被引用(AI検索の回答に載る)には効かない。 Ahrefs が約137,000サイトを分析した結果、大手クローラは llms.txt をほとんど読んでおらず、大半のファイルは一度も読まれていませんでした。llms.txt の有無と AI 被引用の間に統計的に有意な相関は見つかっておらず、被引用を予測するモデルからむしろ外した方が精度が上がった、という分析すらあります。2026年時点で OpenAI・Google・Anthropic のいずれも、本番の検索・回答系で llms.txt を読むとは公式に約束していません。
  • コーディングエージェントへの入口としては有用。 IDE のエージェントに API ドキュメントをトークン効率よく渡す用途では意味があります。開発者向けツールが今も llms.txt を出しているのはこの文脈で、被引用のためではありません。

つまり「llms.txt を入れれば AI に引用される」は誤り。設置コストは低いので置いておくのは構いませんが、被引用の主戦力として期待するのは筋が違います。効くのは別のところです(後述)。

データは2026年前半時点のものです。この領域は各エンジンの挙動が変わりやすいので、重要な判断の前には最新の一次情報を確認してください。

立場(この記事を書いた理由)

先に立場を書いておきます。私は、こうした「置くだけで効く」とされるものには、実証が出るまで得点を与えないべきだと思っています。効くと言われているものを、効く前提でチェックリストに足すのは簡単です。でも、それは利用者にとっては誇張でしかない。この記事で llms.txt を追っていくと、結局は「実測されていない効果を、あたかもあるように扱わない」という一点に行き着きます。

llms.txt は本当に読まれていないのか

llms.txt は本来、「AI に読んでほしい内容の地図」をサイト側から提示する、という発想のファイルです。良いアイデアに聞こえますが、実際にクローラがそれを読み、回答の材料にしているかは別の問題です。

大規模な調査の答えははっきりしています。約137,000サイトを対象にした分析で、設置された llms.txt の大半にアクセスの形跡がありませんでした。被引用との相関も統計的に有意ではなく、予測に使うとかえって精度を落とす要因になりえた。要するに、ファイルは置かれているが、AI 側はそれを見て回答を組み立ててはいない、という状況です。

補足すると、被引用率そのものがエンジンによって大きく違います。出典を積極的に引くエンジンもあれば、ほとんど引かないエンジンもある。llms.txt の有無以前に、「どのエンジンで、どう引用されるか」の方がはるかに支配的な変数です。llms.txt という単一ファイルで被引用が動く、という単純な絵は成り立ちません。

では、何が被引用に効くのか

「効かない」で終わっては次に進めないので、実際に効く方を整理します。AI が回答に引用しやすいのは、おおむね次の順で条件がそろったページです。

  1. そもそも到達可能である(クロール可能・プレビュー許可済み)。ここが欠けると他が全部無駄になります。
  2. すでに検索で上位にある。AI 被引用は既存の検索上位と強く重なります。
  3. 問いに一致している。読者が実際に打つ質問形のクエリと、記事の中身が噛み合っていること。
  4. エンティティが濃い。製品名・数値・具体例が入った具体的な記述が、汎用的なアドバイスに勝ちます。

GEO の初期研究(大規模ベンチマークでの検証)でも、可視性を最も押し上げたのは 引用の挿入・統計の明示・インライン出典でした。いずれも数十パーセント単位で効いています。鮮度(更新の新しさ)も無視はできませんが、上の要素に比べれば中位の因子です。

裏を返すと、被引用は「llms.txt を置く」ような一手で買えるものではなく、記事本文そのものの作りと、そのページが到達可能で既にランクしているかで決まる、ということです。

実際に測ってみて

これは正直に書くと、まだ自分の手元で数値を出せていません。今やろうとしているのは単純な比較で、自分の記事群で llms.txt を置いたページと置いていないページを用意し、同じ質問形クエリで実際に AI 検索に引用されるかを一定期間モニターする、というものです。外部の137Kサイト分析が示す方向と、自分の小さなサンプルが一致するかを確かめる。結果が出たら、予想と違っても含めてここに追記します。

だから、こう設計した

この考え方は、そのまま自分たちの GEO スコアの作りに出ています。Polypost の GEO スコアは、記事本文の作りだけを11項目で測っています——結論を先に出しているか、見出しの階層、統計や数値、出典、内部アンカー、エンティティの密度、といったものです。llms.txt の有無は指標に一切入れていません。

理由は単純で、被引用への効果が実証されていないものに得点を与えると、スコア自体が誇張になるからです。「llms.txt があるので +5点」と出した瞬間、その点数は利用者に嘘をつくことになる。だから測るのは、AI 検索の初期研究が実際に効くと示した本文側の要素だけに絞りました。無料の GEO スコアチェッカー(polypost.dev/geo-score)で自分の記事を測ると、点が動くのは本文の構造であって、設置ファイルではありません。それは仕様ではなく、実データに合わせた設計判断です。

よくある質問

Q. llms.txt は今すぐ消すべき? いいえ。設置コストは低く、消す実益もほとんどありません。IDE のコーディングエージェントに API ドキュメントを渡す用途では有用なので、開発者向けサイトなら置いておく意味はあります。ただしAI検索での被引用を狙う手段としては期待しない、という切り分けが要ります。

Q. robots.txt や sitemap.xml とは何が違う? robots.txt と sitemap.xml は主要クローラが実際に参照し、挙動が仕様化されています。llms.txt は「読んでくれることを期待して置く」提案段階のファイルで、大手検索・回答系が読むと公式に約束していない点が決定的に違います。

Q. じゃあ被引用に一番効くのは? 記事本文の作り(結論先出し・統計や数値・出典・エンティティの密度)と、そもそもそのページが到達可能で、すでに検索でランクしていることです。単一の設置ファイルではなく、コンテンツと到達性の掛け算で決まります。

1テーマから複数媒体へ、GEO最適化コンテンツを自動生成

X・Zenn・Qiita向けの下書きを自動生成し、既存記事のGEO診断とリライトもできます。無料トライアル・クレジットカード不要。