Google Search Console

「重複しています。ユーザーにより、正規ページとして選択されていません」を放置するとどうなる?原因と対処法を解説

「重複しています。ユーザーにより、正規ページとして選択されていません」を放置するとどうなる?原因と対処法を解説 Google Search Console

サーチコンソールの「ページのインデックス登録」レポートを確認しているとき、「重複しています。ユーザーにより、正規ページとして選択されていません」というステータスが表示されることがある。

本記事では、このメッセージの意味や放置した場合のSEOへの影響、発生原因、具体的な解決法についてわかりやすく解説する。

「重複しています。ユーザーにより、正規ページとして選択されていません」の意味とは?

このメッセージは「サイトに重複コンテンツが存在しているが、どれが正規ページかをサイト管理者がGoogleにきちんと伝えていないため、Googleが独自に正規ページ・非正規ページを判断しました」という意味だ。

重複コンテンツとは「表示される画面は同じだがURLが異なる複数のページ群」のことを指す。例えば以下のように、URL文字列が異なるが表示画面がまったく同じページがある場合、これらは重複コンテンツと呼ばれる。

重複コンテンツ

また正規ページ(正規URL)とは、重複コンテンツのなかでも代表して評価するページのことを言う。上記3つのなかでいうと、普通はURL構造が最もシンプルな「https://webanalytics-tatsujin.com/」になる。
重複コンテンツが存在している場合に、検索結果に表示されるURLはこの正規ページのみであり、選ばれなかった2つのURLは通常、検索結果には表示されない。

「どのページを正規ページとするか」は、後述する方法によりサイト管理者がGoogleに明示的に伝えることができるのだが、それを行っていないとGoogle自身が正規ページと非正規ページを判断することになり、それによって今回問題となっているメッセージが表示される。

なお、似たメッセージとして「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」というものもあるが、こちらはサイト管理者が正規ページを明示したにもかかわらず、Googleがそれを無視して別のURLを正規ページに選んだケースを意味する。

放置するとどうなる?SEOへの主な影響

「重複しています。ユーザーにより、正規ページとして選択されていません」を放置することで、検索順位が即座に急落するといったペナルティを受けるわけではないが、以下3つの点でデメリットがある。

  1. SEO評価の分散
  2. クロールバジェットの無駄な消費が発生する
  3. サーチコンソールの集計が複雑化する

1.SEO評価の分散

重複コンテンツがあると、Googleはどれを正規ページとして扱うべきかの判断に迷い、最悪の場合、本来インデックスされるべきURLが検索結果に表示されなくなる可能性がある。

意図したページがきちんとインデックスされてたとしても、似たページがいくつもあることで、ランキングにかかわるGoogleからの評価や外部サイトからの被リンク評価が複数のURLに分散され、1つの正規ページに集約されるはずだったSEO評価が薄れる恐れもある。

2.クロールバジェットの無駄な消費が発生する

クロールバジェットとは、検索エンジンのクローラーが1回の訪問当たりにサイトに対して割けるクロールリソースのことを指す。
クローラーはサイトへ訪れた際、必ずしもすべてのコンテンツを巡回するとは限らないため、重複コンテンツがあると、非正規ページにクロールリソースを使ってしまい、本当にクロールすべき重要なページへの巡回が行われない可能性がある。

ページ数がそこまで多くない中小規模のサイトであればそこまで気にする必要もないが、大規模になるほどこの影響が顕著になる。

3.サーチコンソールの集計が複雑化する

重複コンテンツがあると、サーチコンソールの検索パフォーマンスレポートで確認できるクリック数や表示回数などの指標が複数URLに分散して記録されるため、集計や分析が難しくなる。

「重複しています。ユーザーにより、正規ページとして選択されていません」が発生する主な原因

このメッセージが表示される原因は、「サイトに重複コンテンツが存在する」ことと「URLの正規化(正規ページをGoogleに伝えること)ができていない」ことの2段階の事象が発生することによって起こる。

サイトに重複コンテンツが存在する

重複コンテンツが発生する原因としてよく挙げられるのは以下のケースだ。

  • URLのプロトコルの違いやホスト名の有り無し、ファイル名の有り無しが不統一になっている
    • 表示されるコンテンツは同じでも、「http」と「https」の違いや、「www.」の有り無し、URL末尾の「/index.html」の有り無しなど、URLのルールが統一化されていない
  • デバイスによって同じコンテンツを異なるURLで展開している
    • 「https://www.example.com/sp/…」や「https://sp.example.com/」のように、SP版ではPC版と異なるURLでコンテンツが配信されている場合など
  • 同じ言語のサイトを多地域で展開している
    • 日本のサイトではあまり多く見られないが、複数の国で同じ言語を使用している場合に多いケース。例えば、アメリカ向けとイギリス向けのコンテンツを異なるURLで配信しているが、実質的には同じ言語の同じコンテンツである場合などが該当する
  • サイトの機能的な側面
    • カテゴリページの並び替え機能やフィルタ機能で結果が生成される場合など
  • 広告配信用のパラメータをつけている
    • 集客チャネルを識別するためのパラメータを付けている場合など
  • サイトのデモ版やテスト版が残っている
    • クローラーがアクセスできる状態のまま、サイトのデモページやテストページが残っている場合など

ただし、重複コンテンツの発生はサイトの運用上仕方がない部分が多く、ほとんどのサイトに存在すると言ってもよい。
ゆえに「重複しています。ユーザーにより、正規ページとして選択されていません」の本質的な原因は、どちらかというと次に述べる対処ができていないことが大きい。

URLの正規化ができていない

GoogleにどのURLを正規ページと認識してもらうかはサイト管理者側で提示することができ、このことを一般的に「URLの正規化」と言ったりする。

URLの正規化

方法として、効果の高い順に以下の3つが挙げられる。

  • リダイレクト処理
    • 非正規URLから正規URLへリダイレクトすることにより、半強制的に正規URLの指定ができる
  • canonical指示
    • リダイレクト処理のようにURLが正規のものに統一されるわけではないが、HTMLタグ等で内部的にどれが正規ページなのかを検索エンジンに伝える
  • サイトマップに正規ページを記載
    • XMLサイトマップなど、検索エンジン向けのサイトマップに正規URLを記載する

これらいずれかの対処ができていないことで、“ユーザーにより、正規ページとして選択されていません”となる。
なお、サイトマップに正規ページを記載する方法は、正規化のシグナルとしては少々弱いため、通常は「リダイレクト処理」か「canonical指示」のいずれかの方法をとる。

「重複しています。ユーザーにより、正規ページとして選択されていません」の対処法

前章で挙げた「リダイレクト処理」「canonical指示」「サイトマップに正規ページを記載」がおもな対処法となるため、以下より解説する。

リダイレクト処理

リダイレクト処理は通常、301リダイレクトを利用するやり方が一般的であり、これは旧URLへのアクセスを新URLへ恒久的に転送する設定のことだ。設定が有効なケースは以下の通りだ。

  • 旧URLと新URLで内容が同一であり、旧URLを残す必要がない場合
  • httpとhttpsが混在しており、httpsに統一したい場合
  • www有無やスラッシュ有無が混在しており、どちらかに統一したい場合
  • URLを変更したが旧URLのインデックスが残ったままになっている場合

301リダイレクトの実装方法は、ホスティングやサーバーの環境、サイトのバックエンドのスクリプト言語によって異なるが、mod_rewriteが使用できるApacheサーバーであれば、「.htaccess」を使用するのがおすすめである。
以下が記述例だ。

# 「https://www.example.com/」のページを正規URLとし、http→https、wwwなし→wwwあり、index.htmlあり→index.htmlなしのルールに沿ってリダイレクトさせている
RewriteEngine
RewriteCond%{HTTPS} off [OR]
RewriteCond%{HTTP_HOST} ^example¥.com$ [NC]
RewriteRule^(.*)$ https://www.example.com/$1 [R=301,L]
RewriteCond%{THE_REQUEST} ^.*/index¥.html
RewriteRule^(.*)index¥.html$ https://www.example.com/$1 [R=301,L]

301リダイレクトはコードの変更やサーバー操作が必要になるため、実施の際はシステム担当者や制作会社への依頼を前提に検討するとよい。

canonical指示

canonicalは、正規ページを明示したいがリダイレクト設定をしたくない場合に有効な手法だ。

やり方としては、HTMLの<link>タグを使用する方法と、HTTPレスポンスヘッダーを使用する方法の2通りがある。HTMLファイルであれば通常は<link>タグを使用するが、PDF・動画ファイル・画像ファイルなど、HTML以外のリソースにはHTTPレスポンスヘッダーを使用する。

<link>タグを使用する場合は、重複コンテンツすべてのページに対して以下のように記述する。

<link rel="canonical" href="正規ページのURL">

例えば、前章の「URLの正規化のイメージ」の図解でいうと、3つのURLすべての<head>タグ内に以下のようなコードを記述する必要がある。

<link rel="canonical" href="https://webanalytics-tatsujin.com/">

HTTPレスポンスヘッダーを使用する場合は、以下のような記述になる。

Link: <正規URL>; rel="canonical"

TOPページを正規化する場合は以下。

Link: <https://webanalytics-tatsujin.com/>; rel="canonical"

なお、canonicalによる正規化はあくまでGoogleへの「ヒント」であり「命令」ではない。そのため、canonicalを設定したとしても必ずしも意図したページが正規ページとして選ばれるわけではないため注意しよう。

サイトマップに正規ページを記載

サイトマップには、原則正規ページしか記載してはならないというGoogle公式のルールがある。

サイトマップを作成することにより、どの URL を検索結果に表示したいか検索エンジンに指示できます。これらが正規 URL です。同じコンテンツを指す URL が複数ある場合は、その中から正規 URL にするものを 1 つ選択し、それをサイトマップに含めます。同じコンテンツを指す他の URL は原則含めません。

サイトマップの作成と送信 | Google 検索セントラル

そのため重複コンテンツがあるときは、正規ページのURLのみをサイトマップに記載することで、Googleに正規化のシグナルを送ることができる。

対処後はサーチコンソールで正規ページの確認をしよう

canonicalや301リダイレクトを設定した後は、サーチコンソールの「ページのインデックス登録」レポートをふたたび確認し、該当のメッセージがなくなっているか、あるいは数が減っているかを確認するとよい。
ただし対処した後は、Googleによる再評価の時間が必要になるため、ある程度日を空けてから行うようにしよう。

特定のページのみを個別で確認する場合は、サーチコンソールの画面上部にあるURL検査から行うとよい。
まず、検索窓でURLを入力し検索する。

画面上部に「URLがGoogleに登録されていません」と表示された場合は、そのURLは非正規ページと認識されている可能性が高いため、その下の「ページのインデックス登録」タブ内にある「Googleが選択した正規URL」から、今時点でどのURLが正規ページとみなされているか確認しよう。

サーチコンソール 「Googleが選択した正規URL」

なお、「URLはGoogle に登録されています」と正常にインデックスされていることが確認できた場合でも、もしかしたら別のページが正規ページと認識されている可能性もあるため、念のため確認しておくとよい。

おわりに

本記事では、サーチコンソールでよく確認される「重複しています。ユーザーにより、正規ページとして選択されていません」の意味やSEOへの影響、発生原因、解決法について解説した。

ペナルティを受けるほどの悪影響はないものの、放置すると、SEOや分析効率の点でいくつかデメリットがある。サイト規模が大きいほど影響も大きくなるため、もしサーチコンソールでこのステータスを発見したら、他のステータスよりも優先して改善に取り組むことを推奨する。

タイトルとURLをコピーしました