トップページ > 構造化データはAIのコンテンツ理解に役立たない!?←実験から判明

構造化データはAIのコンテンツ理解に役立たない!?←実験から判明

2026年5月時点の補足 — AI Ron

「構造化データはAIに役立たない」という実験結果と、「構造化データで引用率が3.2倍になる」という別の調査。どちらも正しい——矛盾を解く鍵は「どのAIの、どの動作モードか」にあります。

「役立たない」と「3.2倍効く」が両方とも正しい理由

構造化データをめぐっては、相反する2つの実験結果が知られています。この矛盾を正しく分解できないと、「スキーマを入れたのに引用されない」「入れても無駄だった」という誤った結論に至ります。

AIの動作モード構造化データの効果理由
リアルタイム検索
(ChatGPT Search / Perplexity / AI Overview)
効果大(引用率が大きく向上)ページに直接アクセスし、JSON-LDを機械可読な「意味の地図」として処理するため
内部知識からの回答
(学習済みモデルの記憶ベース)
効果限定的学習データのスナップショットに現在のスキーマが反映されておらず、本文テキストから意味を推論しているため

「役立たない」という実験は内部知識モードを測っていた可能性が高く、「3.2倍効く」という調査はリアルタイム検索(AI Overview引用)を測っていた。測定対象が違うのです。

2026年5月の決定的な変化 — スキーマは「検証材料」に役割転換した

2026年5月7日、GoogleはFAQリッチリザルトの表示を完全終了しました。見た目の装飾は消えましたが、スキーマの本質的価値はむしろ上がっています。理由は、AIがコンテンツの主張を裏取りする「検証材料」としてスキーマを参照するようになったからです。

  • AI Overview / AI Mode は、本文の主張と構造化データの整合を照合して「信頼できる情報か」を判定する
  • 検索結果Top10とAI引用元の重なりは約70%から20%未満に低下——順位だけでは引用されない
  • 構造化データは、AI引用を取りにいくための数少ない能動的な技術レバーとして残っている

実務的結論: 「実験で役立たないと出たから外す」は誤判断です。AI検索(リアルタイム参照)で引用されたいなら、構造化データとLLM:役立つ場合と役立たない場合で示したTier 1スキーマ(FAQPage / HowTo / Article)を実装し、AI対応診断ツールで整合性を点検してください。

2026年6月補足 — 「効くか」を論じる前に「正しく書けているか」を検証する

構造化データが「役立つ/役立たない」を議論する前提として、そもそも記述が正しく読み取れる状態かを確かめる必要があります。JSON-LDのカンマ抜けや必須プロパティの欠落があれば、AIにもGoogleにも無視され、「効果ゼロ」という誤った結論になってしまうからです。

  • リッチリザルトテスト(search.google.com/test/rich-results)— Google固有の解釈で、検索・AI Overviews 向けに認識されるかを確認
  • Schema Markup Validator(validator.schema.org)— schema.org 仕様準拠で構文的な正しさを確認
  • 両方でエラー0を確認してから「効果があるか」を測るのが正しい順序

検証ツールの詳しい使い分けは 構造化データとLLM:役立つ場合と役立たない場合 にまとめています。「役立たないと思っていたが、実は壊れていただけ」というケースは少なくありません。

構造化データに頼らずAI検索に引用される方法 — 代替施策

「構造化データが効かないなら、何で引用されるのか」。スキーマに依存しないで AI検索(ChatGPT Search / Perplexity / AI Overview)に引用されるための施策は、実は数多くあります。

  • 結論の先出し(front-loading): AIは答えをページ上部に置くコンテンツを好む。ある実データでは LLM引用の44.2%がページ上部30%から取られている。スクロールが必要な答えは引用されにくい
  • 抽出しやすい構造: 明快な見出し階層、Q&A形式、明確な結論。AIは段落・表・構造化された回答を抜き出す
  • 一次情報・独自データ・精密な事実: Perplexityは検証可能な情報を探す。曖昧な記述より、具体的事実・オリジナルデータが引用されやすい
  • 複数ソースでの一貫性(consensus signals): 業界メディア・レビュー・各所で同じ情報が一貫して現れると、AIが「合意シグナル」で自信を持つ。名称・URL・説明などエンティティの一貫性が鍵
  • 被リンク・権威性: プラットフォーム横断の言及・引用が土台

なお、ChatGPTとPerplexityの両方に引用されるドメインはわずか11%、Google AI OverviewsとAI Modeが同一URLを引用するのも13.7%のみ。AIごとに情報源の好みが異なるため、1プラットフォーム最適化ではなく、総合的な権威性と一貫性が必要です。(出典: AI検索最適化に関する各種 2025-2026 調査)

ペトロヴィッチの実験は何を示し、業界はどう受け止めたか

この記事の元になった実験を、改めて正確に整理します。Dan Petrovic(DEJAN)は、同一HTMLを「JSON-LD あり版」と「なし版」の2つのURLに用意し、ChatGPT(GPT-5)のブラウジング機能で取得・分析させました。結果、ブラウジングツールは両ページともプレーンテキストのみを返し、JSON-LDやメタスキーマは抽出されなかった。彼の結論は「スキーマがモデルに届いている証拠は見当たらない」でした。

これに対し、業界の受け止めは賛否に分かれています。

  • 賛同寄り: 「スキーマは LLM の学習に使われていない」として拡散された
  • 補正・反論: 「一部のAIプラットフォームはスキーマを使い、他は使わない=設計上の選択である」との指摘。また「AIが隠れたスキーマを直接読まなくても、スキーマは検索スニペットをリッチにし、AIがそのスニペットを消費する=間接的に効く」との見解
  • 構造化データ推進派: 「エンティティをリンクしたスキーマは、AIにブランド理解の文脈を与える」と戦略的価値を主張

論争の本質は「スキーマが直接モデルに届くか」と「間接的・エンティティ確立に効くか」で論点がずれていることにあります。「直接は届かない、だが間接的価値はある」が、2026年時点の妥当な理解です。

なぜトークン化が構造化データ理解を難しくするのか

LLMは、JSON-LD文字列を含むHTMLを、他の散文と同じようにトークン化して処理します。このため一部の論者は「構造化データが明確な知識レイヤーとして扱われず、『統計的スープ』に還元される」と批判します。トークン化によって、階層やキーと値の関係といった構造情報が平坦化されうる、という技術的論点です。

ただし反論もあります。推論モデル・RAG(検索拡張生成)・ナレッジグラフと組み合わせれば、現代のLLMは構造化データを活用できるようになりつつある。推進派は「本当の問題はトークン化ではなくハルシネーションであり、スキーマは機械可読な明示フォーマットで曖昧さを排除する」と主張します。トークン化の弱点を認めつつ、別の価値を強調する立場です。

📌 関連コンテンツ

・ダン・ペトロヴィッチ氏の実験で、AI(ChatGPT)が構造化データを取得していないことが確認された。
・GPT-5のブラウジングツールは、構造化データを含むページからプレーンテキストのみを抽出。
・トークン化プロセスが構造化データの構造を破壊し、識別や明示性を失わせる可能性がある。
・構造化データは、全体として処理されないと意味を成さない。
・グラウンディングの段階では構造化データが影響する可能性があり、GoogleのAIは間接的に関連するかもしれない。

この記事でこんな事が
学べそうですね

AI|技術|SEO

ポイント要約

構造化データはAIのコンテンツ理解に役立たない可能性が示され、トークン化プロセスがその理由とされている。

このトピックで身につけるべきスキル

学習の要点

  • 1
    構造化データを明示的に指示する方法を学ぶ
    見てみる
    構造化データの実装に関する具体的な手順を学ぶ
  • 2
    トークン化の影響を考慮したコンテンツ作成
    見てみる
    AIを活用したコンテンツ作成の実践的な方法
  • 3
    AIツールを活用したデータ取得の最適化
    見てみる
    AIツールを活用したデータ取得の最適化方法

重要キーワード・学習リソース

トークン化

トークン化に関する理論と応用を学べるリソース

トークン化の理論を深く学べるサイト詳しく学ぶ
グラウンディング

グラウンディングに関する最新の研究を学ぶ

グラウンディングの研究詳しく学ぶ
ナレッジグラフ

ナレッジグラフの理論と実践を学べるリソース

ナレッジグラフの理論を学べるサイト詳しく学ぶ

本記事の参照元

構造化データはAIのコンテンツ理解に役立たない!?←実験から判明

出典: 海外SEO情報ブログ

元記事を読む外部サイト
2025/05/31
THU
00:00:00

ブラウザ・OS 最新バージョン

毎日更新:2026-06-15 調査更新済
  • Android(stable) 未取得
  • Chrome Android(stable) 149.0.7827.114
  • Chrome iOS(stable) 149.0.7827.137
  • Chrome(beta) 150.0.7871.13
  • Chrome(dev) 151.0.7872.0
  • Chrome(stable) 149.0.7827.115
  • Edge(stable) 149.0.4022.52
  • Firefox(stable) 151.0.4
  • Opera(stable) 132.0.5905.37
  • Safari iOS(stable) 未取得
  • Safari(stable) 未取得
  • iOS(stable) 未取得

現在の貴方のIPアドレス

216.73.216.206

このサイトで書いている人

株式会社ツクルン

株式会社ツクルン

Webアドバイジング・クリエイター
池田南美夫
もうすぐ●●歳。ずっーと現役SE。日本にインターネットが上陸してから、ずっーと携わる。 ほんとは超アナログ人間のギター弾き、バンドマン。でも音楽活動とSE、案外似てる。