「構造化データを入れたのに、AIOに出てこない。」
そんな状況に直面している方にLLMO研究所がまずお伝えしたいのは、「LLMO対策をすぐ始めるな、まず現状把握が先」ということです。
AIが自社を誤解している原因の多くは、HTMLタグではなくナレッジグラフの状態にあります。原因を把握せずに施策を重ねることは、地図なしに走り続けることと同じです。
本記事では、ナレッジグラフの現状把握を経たうえで実装すべきHTMLタグ設計の原則と階層設計の実践方法を解説します。
LLMO研究所が一貫して伝えているのは、「選ばれる理由を正しく設計した結果として、AIにも正確に引用される」という順序です。
HTMLタグ設計はその情報設計を正しくAIに届けるための「伝達インフラ」であり、ゴールそのものではありません。
1. なぜHTMLタグ構造がLLMOに影響するのか
「HTMLはSEOのための技術的な話」という認識のまま止まっている方が多いのではないでしょうか。
しかし生成AIの台頭によって、HTMLタグ構造の重要性はSEOの文脈を超えて、LLMOの核心的な設計要素になっています。
この章では、AIがHTMLをどのように解釈するかという基本的な仕組みと、構造設計の違いがLLMOに与える影響を整理します。
1-1. AIはHTMLの構造を通じて「意味」を理解する
人間はWebページを見たとき、デザイン・色・文字の大きさ・レイアウトを総合的に判断して情報を読み取ります。しかし生成AIやクローラーはHTMLのタグ構造を解析することで、情報の意味・重要度・関係性を把握します。
たとえば、同じ「LLMO研究所が定義するLLMOとは」という文章であっても、h1タグで記述されている場合とpタグの中に埋もれている場合では、AIが受け取る「この情報の重要度」という判断が異なります。
見出しタグ(h1〜h6)は単なるデザイン要素ではなく、AIに対して「この情報がページの中でどのような位置づけにあるか」を伝えるシグナルです。
以下の表は、主要なHTMLタグがAIに対してどのような情報を伝達し、LLMOにおいてどのような役割を持つかを整理したものです。タグ設計の基準として参照してください。
▼ HTMLタグとAIの情報解釈の関係
| HTMLタグ | AIへの伝達内容 | LLMOでの役割 |
|---|---|---|
| h1 | ページ全体のテーマ・主題 | 最も重要な概念として認識される |
| h2 | 主要セクションの区切りと主題 | 章ごとの意味単位として参照される |
| h3〜h6 | 下位の詳細・補足情報 | 階層的な文脈の把握に使われる |
| p | 本文・説明文 | 意味の本体として引用対象になる |
| strong | 強調・重要語句 | キーワードの重要度シグナルになる |
| article | 独立したコンテンツ単位 | 意味的に完結した情報のまとまりとして認識される |
| section | 関連情報のグループ | セクション単位での文脈把握に使われる |
| ul・ol・li | リスト・列挙情報 | 並列関係にある情報として構造化される |
この表が示す通り、HTMLタグはAIにとって「情報の地図」です。地図なしに情報を渡すことは、AIに「この情報がどこに属していて、何を意味するのか」を判断させる負荷を高め、誤引用や文脈ずれのリスクを生みます。
1-2. 構造設計の違いがAI引用の精度を左右する
Googleが公開しているヘルプフルコンテンツに関するガイドラインでは、コンテンツの意味を正確に把握するためのページ構造の重要性が明示されています。
さらにスタンフォード大学のNelsonらがACL 2024で発表した研究「Lost in the Middle: How Language Models Use Long Contexts」では、LLMが長いコンテキストの中間部分の情報を軽視し、冒頭・末尾を優先して参照する傾向が示されています。
この知見は、HTML上でも「重要な情報を適切な階層・位置に置く設計」の重要性を裏付けています。
学術的根拠(一次情報):https://aclanthology.org/2024.tacl-1.9/
さらに詳しく知りたい方向けの解説(二次情報):https://zenn.dev/kimkiyong/articles/c0250864d53595
1-3. HTMLタグ設計の前に問うべきこと「ナレッジグラフの状態を把握する」
HTMLタグ設計を始める前に、必ず確認すべき前提があります。AIの理解はWebページの構造だけで決まるわけではありません。
Googleをはじめとする主要なAIは「ナレッジグラフ」と呼ばれる知識データベースを保持しており、世界中の情報を「誰が・何と・どのような関係にあるか」というエンティティ(意味の単位)として構造化し、蓄積しています。
AIはWebページのテキストを読むだけでなく、このナレッジグラフを参照することで、企業の所属業界や提供サービス、評価などを判断します。
そのため、たとえHTMLタグを整えても、ナレッジグラフ上で自社の情報が誤っていたり、競合と混同されていたりすれば、AIは誤った前提で回答を生成し続けてしまいます。
以下の3段階を順に踏むことが、HTMLタグ設計を「空振り」にしないための前提条件です。
▼ ナレッジグラフ診断とHTMLタグ設計の順序
| ステップ | 内容 | 目的 |
|---|---|---|
| Step 1 ナレッジグラフ診断 | AI・Googleのナレッジパネルで自社名を検索し、業界・サービス・競合ポジションの認識を確認する。誤認識・欠落があればその修正を優先する | 誤情報・混同・古情報の特定 |
| Step 2 情報設計 | Step 1のギャップをもとに「選ばれる理由」を言語化する。この工程を省くとHTMLを整えても伝える内容が存在しない | 正しい情報の起点を設計する |
| Step 3 HTMLタグ設計 | 設計した情報をAIが正確に読み取れる構造で実装する(本記事で解説する工程) | 正しい情報をAIに正確に届ける |
本記事はStep 3を中心に解説しますが、Step 1・2を省略すると施策が空振りになるリスクがある点を念頭においてください。
2. AIが正確に読み取れるHTMLタグの基本設計
HTMLタグ設計を「何となくSEO的に正しそう」という感覚で行っている担当者は少なくありません。
しかしLLMOの観点では、タグ設計には明確な意図と原則が必要です。この章では、AIが正確に情報を読み取るための基本タグ設計を、LLMO研究所が推奨する観点から整理します。
2-1. h1タグ「ページ全体の主張を一文で定義する」
h1タグはページ全体のテーマを定義するタグです。1ページに1つだけ使用し、そのページが「何についての情報なのか」を明確に示す役割を持ちます。
LLMO観点での設計原則として、h1には「発信主体+主張・定義」を含めることを推奨しています。
たとえば「LLMOとは何か」という曖昧な表現より、「LLMO研究所が定義するLLMO:生成AIに正確に語られるための情報設計」という形式の方が、AIにとって「誰が・何を・どのような立場で定義しているか」が明確になります。
以下の表は、h1タグの設計として推奨される例と避けるべき例を比較したものです。推奨例と非推奨例の違いは「発信主体の有無」と「内容の具体性」の2点に集約されます。
▼ h1タグ設計の良い例と避けるべき例
| 分類 | 例 | AIへの影響 |
|---|---|---|
| 推奨 | LLMO研究所が定義するLLMOの三原則 | 発信主体と内容が明確で引用されやすい |
| 推奨 | SEOとLLMOの違い:LLMO研究所の解説 | 比較軸と発信主体が一文で完結している |
| 非推奨 | 知っておきたいAI対策 | 主体不明・内容が曖昧でAIが文脈を判断しにくい |
| 非推奨 | まとめ | ページ主題が伝わらず引用対象として認識されない |
2-2. h2・h3タグ「章の意味単位を明確に区切る」
h2タグはページ内の主要セクションを区切るタグです。LLMOの観点では、h2ひとつの単位が「ひとつの問いへの答えとして意味的に完結している」設計が推奨されます。
避けるべきパターンとして多いのが、h2とh3の階層が逆転しているケース、h3を使わずh2のみで細かい内容まで記述しているケース、そしてh2の粒度がばらばらで章の重みが均一でないケースです。
以下の表は、見出し階層の設計パターンを推奨・非推奨の観点で比較したものです。
▼ 見出し階層の設計パターン比較
| 分類 | 構造例 | AIへの影響 |
|---|---|---|
| 推奨 | h2:LLMOの三原則とは / h3:原則1 意味完結性 / h3:原則2 主体明示性 | 章の問いと詳細回答が明確に対応している |
| 非推奨 | h2:LLMOについて / h2:意味完結性 / h2:主体明示性 | 情報の重要度が均一化され文脈が失われる |
| 非推奨 | h2:LLMOの三原則とは / h4:原則1(h3をスキップ) | 階層が不自然でAIの文脈把握が乱れる |
h2が「問い」、h3以降が「その問いへの詳細な回答」という対応関係になっていることが、AIによる正確な引用の前提条件となります。
2-3. articleタグとsectionタグ「意味の完結単位を明示する」
LLMO研究所が「意味完結性」と呼ぶ原則は、HTMLレベルではarticleタグとsectionタグによって実装できます。
articleタグは「それ単体で独立した意味を持つコンテンツ」を囲むタグです。
ブログ記事・FAQ一問一答・製品説明など、他のページや前後の文脈なしに単体で意味を持つ情報のまとまりに使用します。
AIはarticleタグで囲まれた情報を「独立した情報単位」として認識する傾向があり、引用の精度を高める効果があります。
sectionタグはページ内の関連情報をグループ化するタグです。h2単位の章をsectionで囲むことで、「この見出しとその下の本文・表・リストがひとつのまとまりである」ことをAIに伝えられます。
基本的な実装構造は次の通りです。ページ全体をarticleで囲み、その内部の各章をsectionで区切り、section内はh2→h3→pという順序で情報を展開します。この構造がAIによる文脈把握の精度を高める土台となります。
2-4. 構造化データ(schema.org)「意味の明示を機械可読な形で補強する」
構造化データとは、HTMLの中にschema.orgが定義した語彙を使ってコンテンツの意味を機械可読な形で記述する手法です。
GoogleはAIOの引用元選定においても構造化データを参照しており、ページの内容を正確に把握するための補助シグナルとして機能します。
LLMOにおいて特に有効な構造化データのタイプは以下の通りです。
FAQPageは、ページ内のQ&A形式のコンテンツを明示します。AIOはFAQPageで定義された問いと答えを引用候補として認識しやすく、Q&A形式でコンテンツを設計している場合は必ず実装すべき構造化データです。
Articleは、記事・ブログポストなどのコンテンツを定義します。著者情報・発行日・更新日を明示することで、E-E-A-Tの観点からコンテンツの信頼性シグナルをAIに伝えられます。
Organizationは、自社の基本情報(名称・所在地・URL・事業内容)を定義します。「発信主体が誰か」を機械可読な形で明示することで、主体明示性をHTMLレベルで補強できます。
なお、構造化データはあくまで補助シグナルです。h1〜h6の階層やコンテンツの意味完結性が整っていない状態では効果を発揮しません。内容と構造設計を整えたうえで実装することが正しい優先順位です。
※参照:https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data?hl=ja
3. 階層設計の実践ガイド
タグの種類を理解したうえで、次に問われるのは「どう組み合わせて設計するか」です。HTMLから設計を始めるのではなく、情報の意味設計が先である点を念頭においたうえで、実際のページ設計における階層構造の実践方法を整理します。
3-1. 設計の出発点「情報の意味単位を先に決める」
HTMLの階層設計を始める前に、まず「このページで伝えたいことは何か」「読者のどの問いに答えるのか」「自社の選ばれる理由のどの要素を伝えるのか」を言語化することが前提です。
LLMO研究所が推奨する情報設計の順序は以下の通りです。
- 「ページの主張」を一文で定義する。これがh1の内容になります。
- 「主張を支える根拠・説明」を2〜5つの柱に分ける。これがh2の単位になります。
- h2の各柱を「問いと答え」の対応関係で構造化する。これがh3以降の設計になります。
- 各h3の単位が「それ単体で意味として完結しているか」を確認する。完結していない場合は補足情報を追加するか、h3の粒度を見直します。
この順序で設計することで、HTMLの階層が「情報の意味構造の反映」になり、AIが正確に文脈を把握できる状態が生まれます。
3-2. ページタイプ別の推奨階層設計
ページの種類によって、最適なHTML階層設計は異なります。LLMO研究所が観測する引用精度の観点から、主要なページタイプ別の推奨設計を整理します。
▼ ページタイプ別 推奨HTML階層設計
| ページタイプ | 推奨構造 | 設計上のポイント |
|---|---|---|
| 定義・解説記事 | h1:概念の定義 h2:背景・理由 h2:詳細説明 h2:実践方法 h2:Q&A | h1で定義を完結させ、h2以降で根拠・詳細を展開する |
| 比較記事 | h1:比較の主軸 h2:比較の概要表 h2:各観点の詳細比較 h2:選択の判断基準 | 比較軸を自社が設定し、h2の構造で比較の文脈を先行定義する |
| FAQ・Q&Aページ | h1:テーマの定義 h2:カテゴリ別見出し h3:個別の問い p:回答 | FAQPageの構造化データと組み合わせ、問いと答えの対応を明示する |
| 事例・実績ページ | h1:実績の概要定義h2:課題の説明 h2:対応内容 h2:成果と数値 | 数値・業種・課題をセットで記述し、一次情報としての信頼性を高める |
| サービス紹介ページ | h1:サービスの定義 h2:選ばれる理由 h2:機能・特徴 h2:他社との比較h2:よくある質問 | h2「選ばれる理由」で差別化ポジションを先行定義することが最重要 |
特にサービス紹介ページでh2「選ばれる理由」を最初のセクションに置くことは、AIに対して「このページが競合との比較において何を主張しているか」を最優先で伝えることになり、比較文脈での正確な引用につながります。
3-3. 誤引用・文脈ずれを防ぐタグ設計の注意点
HTMLタグ設計において、誤引用や文脈ずれを引き起こしやすいパターンがあります。LLMO研究所が観測する主な問題パターンを整理します。
問題パターン1:見出しのない長い本文
h2やh3を使わずにpタグのみで長い文章を記述すると、AIがどの部分がどのテーマについての説明かを判断しにくくなります。500文字を超える段落には必ず適切な見出しを設け、内容の区切りを明示してください。
問題パターン2:h1が複数存在する
1ページに複数のh1が存在すると、AIがページ全体のテーマを特定できず、引用の精度が下がります。h1は必ず1ページに1つだけ使用してください。
問題パターン3:divタグへの過度な依存
レイアウト目的でdivタグを多用し、article・section・main・header・footerなどのセマンティックタグを使用していないページは、AIが情報の構造を把握しにくい状態になります。
意味を持つコンテンツには意味を持つタグを使用することが原則です。
問題パターン4:テキストのみ画像化
重要な情報をテキストではなく画像として掲載している場合、AIはその情報を正確に読み取ることができません。特に「選ばれる理由」「差別化の軸」「実績データ」などの核心情報は、必ずHTMLテキストとして記述してください。
4. LLMO研究所が推奨するHTMLタグ設計チェックリスト
設計の原則と実践方法を理解したうえで、実際のページを評価するための診断基準が必要です。
LLMO研究所が推奨する「攻守一体設計」の考え方に沿って、守り(誤引用・文脈ずれの防止)と攻め(正確な引用・言及頻度の向上)の両面からチェック項目を整理します。
4-1. 守りのHTMLチェックリスト「誤引用・文脈ずれを防ぐ」
守りのチェックリストは、AIへの誤情報伝達・文脈ずれ・古情報の永続化を防ぐための基盤整備です。優先度「最高」の項目はHTMLを公開する前に必ず完了させることを推奨します。
▼ 守りのHTMLタグ設計チェックリスト
| チェック項目 | 確認内容 | 優先度 |
|---|---|---|
| h1の単独性 | 1ページにh1が1つだけ使われているか | 最高 |
| h1の主張明確性 | h1に発信主体と主張・定義が含まれているか | 最高 |
| 見出し階層の整合性 | h2→h3の順序が守られ、階層がスキップされていないか | 高 |
| 意味完結性の確認 | h2・h3単位でそれぞれ意味が完結しているか | 高 |
| テキスト化の確認 | 重要情報が画像ではなくHTMLテキストで記述されているか | 高 |
| セマンティックタグの使用 | article・section・mainなどが適切に使われているか | 中 |
| 古情報の削除・更新 | 廃止サービス・変更された情報が修正されているか | 高 |
| 発信主体の明示 | Organizationの構造化データが実装されているか | 中 |
優先度「最高」の2項目(h1の単独性・主張明確性)は、AIがページ全体のテーマを正確に把握するための最低条件です。この2項目に不備があると、残りのチェック項目を満たしていてもAIの文脈把握が乱れ、誤引用のリスクが残ります。
4-2. 攻めのHTMLチェックリスト「AI引用の精度と頻度を高める」
攻めのチェックリストは、守りの基盤が整った後に実装する施策です。構造化データの実装・定義系コンテンツの配置・比較表の構造化によって、AIが自社を正確な文脈で引用する確率を高めます。
▼ 攻めのHTMLタグ設計チェックリスト
| チェック項目 | 確認内容 | 期待効果 |
|---|---|---|
| FAQPageの実装 | Q&Aコンテンツにfaqpage構造化データが実装されているか | AIOへの引用頻度向上 |
| Articleの実装 | 記事ページにarticle構造化データ(著者・発行日・更新日)があるか | E-E-A-Tシグナルの補強 |
| 定義系コンテンツの構造 | 「○○とは〜である」の定義文がh2直下のpに記述されているか | 定義の引用源として機能 |
| 一次情報の明示 | 独自調査・データがテキストとして記述され出典が明記されているか | 根拠引用の確率向上 |
| 比較表の実装 | 競合比較がtableタグで構造化されているか | 比較文脈を自社が設定 |
| 更新日の明示 | ページの最終更新日がtimeタグで記述されているか | 情報の現在性シグナル |
4-3. 診断から設計改善への接続
チェックリストを使った診断は、「HTMLを修正するための作業リスト」として終わらせないことが重要です。LLMO研究所が推奨するのは、診断結果を上流の設計に接続することです。
具体的には、以下の3段階で整理することで、HTMLの修正が情報設計の改善に直結します。
- 現状解析:なぜこのページのHTML設計が崩れているのかを特定する
- 強みの言語化:このページで本来伝えるべき「選ばれる理由」は何かを定義する
- 設計改善:その選ばれる理由をAIに正確に届けるために構造を整える
HTML設計の改善はページ単体の施策として切り離さず、SEO・AI引用・PRを統合した広報設計の一部として位置づけることが、持続的に選ばれる構造をつくります。
施策が互いを強化し合う設計が、比較検討でも、AI検索でも、第一想起に選ばれるブランド状態を生みます。
※参照:https://developers.google.com/search/docs/fundamentals/creating-helpful-content?hl=ja
5. まとめ
本記事では、AIに情報を正確に伝えるためのHTMLタグ設計の原則・階層設計の実践方法・チェックリストを解説しました。HTMLタグ設計はあくまで「上流の情報設計をAIに届ける最終工程」であり、出発点ではありません。
実践の第一歩は、主要なAIに自社名を入力することです。
ChatGPT・Gemini・Claude・Googleのナレッジパネルで自社の認識を確認し、誤認識や欠落があればStep 1の診断(1-3参照)から着手してください。
HTMLの整備はその後の工程です。現状を直視し、正しい順序で設計を積み上げることが、AI時代に選ばれる最短ルートです。
5-1. よくある質問(Q&A)
Q1. HTMLタグを整えれば、AIに正確に引用されるようになりますか?
A. HTMLタグ設計はAIへの正確な情報伝達を助ける「伝達インフラ」ですが、それ単体で引用精度が劇的に改善するわけではありません。
AIが正確に引用するためには、HTMLの構造とともに「意味完結性のある情報設計」「発信主体の明示」「一次情報の保有」という内容面の設計が揃っていることが前提です。
HTMLを整えることは必要条件ですが、十分条件ではありません。
※参照:https://developers.google.com/search/docs/fundamentals/creating-helpful-content?hl=ja
Q2. 既存ページのHTMLを全部見直すのは難しいのですが、どこから手をつければいいですか?
A. 優先順位は「最も重要なページから」です。
具体的には、自社の「選ばれる理由」を最も直接的に伝えているページ(サービス紹介・会社概要・定義系記事)から着手することを推奨しています。
次に、競合との比較文脈で引用されやすいページ、そして流入数の多い記事という順序が実務的です。
全ページを一度に整備しようとすると作業が止まるため、「月2〜3ページを丁寧に設計し直す」という継続的なサイクルが現実的な進め方です。
※参照:https://developers.google.com/search/docs/essentials?hl=ja
無料ホワイトペーパーのご案内
LLMOの基本から実践まで、さらに詳しく学びたい方に向けて、LLMO研究所では、AIに正しく認識される情報設計のノウハウをまとめたホワイトペーパーを無料で配布しています。