Google Search Console

「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」とは?原因と対処法を解説

「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」とは?原因と対処法を解説 Google Search Console

サーチコンソールの「ページのインデックス登録」レポートを開いたとき、まれに「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」というメッセージを見かける。

このステータスは、放置するとSEOに悪影響を及ぼす可能性があるため注意が必要だ。そこで本記事では、このメッセージの意味や発生原因、対処法について解説する。

「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」の意味とは?

このメッセージは「サイト管理者が、サイトに存在する重複コンテンツのなかで正規ページがどれかをきちんとGoogleに明示しているにもかかわらず、Googleがその指定を無視して別のURLを正規ページとして選択した」という状態だ。

通常はサイト管理者が正規URLを指定すれば、検索エンジンもそのURLを正規ページと認識することが多いのだが、まれに別の重複ページを正規と判断することがあり、そのようなときにこのステータスが表示される。

「重複しています。ユーザーにより、正規ページとして選択されていません」との違い

同じレポート内の似たメッセージに「重複しています。ユーザーにより、正規ページとして選択されていません」というものがあるが、こちらはサイト管理者が正規ページの指定をしていない場合に発生する。

どちらのステータスも重複コンテンツの存在が前提にあるが、正規ページの指定をサイト管理者が行っているかどうかで違う。

重複コンテンツが存在する上で…

  • サイト管理者が正規URLを指定しておらず、Googleが独自に判断した
    ⇒「重複しています。ユーザーにより、正規ページとして選択されていません」
  • サイト管理者が正規URLを指定したが、Googleが別のURLを正規ページと判断した
    ⇒「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」

放置するとSEOにどんな影響がある?

「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」を放置することで、Googleからペナルティを受け検索順位が大幅に下がることはないが、以下の点でデメリットがある。

  1. SEO評価が分散する
  2. クロールバジェットを浪費する
  3. 分析時に集計が複雑化する

1.SEO評価が分散する

重複コンテンツがあると、「どのページを検索結果に表示させるのか」といった検索エンジンによるインデックスの判断を迷わせることにつながる。通常、非正規ページとなったURLはインデックスされないため、意図したページが正規として認識されないと、そのURLは検索結果に出てこなくなる。

また、ランキング評価の分散にもつながる恐れがある。本来1つのページに集約されるはずだったPageRankが複数URLへバラバラに行きわたり、結果、中途半端な評価しかしてもらえないといったイメージだ。
コンテンツのSEOポテンシャルを最大限に引き出すためにも、1つの意図した正規ページに対してランキングシグナルを統合するというのが理想の在り方となる。

2.クロールバジェットを浪費する

そもそもクロールバジェットとは、Googleのクローラーが1回の訪問あたりにサイトへ割り当てられるクロールリソースの総量を指す。クローラーはサイトを訪れるたびにすべてのページを巡回するわけではないため、このような限界点が設けられている。

重複コンテンツが存在すると、このリソースが非正規ページの巡回に消費され、本来クロールされるべき重要なページが後回しになるリスクが生じる。

特にECサイトや求人サイトなど、検索機能・フィルタリング機能がカギとなるようなサイトでは重複コンテンツが存在する状態になりやすく、クロールバジェットの消耗が深刻になる。ページ数が少ない中小規模のサイトではそこまで気にする必要はないが、サイトのスケールが大きくなるほどこの問題は無視できなくなる。

3.分析時に集計が複雑化する

重複コンテンツが存在すると、サーチコンソールの検索パフォーマンスレポートで確認できるクリック数・表示回数・平均CTR・平均掲載順位といった指標や、「ウェブに関する主な指標」で確認できるCore Web Vitalsの指標が、複数のURLに分かれて記録される。

データが分かれると、実態より良く見えたり悪く見えたりするため正確な分析が難しくなり、改善すべきページの特定が困難になる。

Googleがサイト管理者の指定した正規ページを無視する原因

Googleが、サイト管理者の指定した正規ページとは別のページを正規と認識する原因には大きく2つのケースが考えられる。

  • 本来非正規としたいページのほうが良質と判断されている
  • 正規化のシグナルが統一されていない

本来非正規としたいページのほうが良質と判断されている

Googleは、検索ユーザーにとって最も完成度が高く有用であると判断したページを正規URLとして認識することを公式ページで言及している。そのためサイト管理者が指定したページよりも、別の重複コンテンツのほうが質が高いと判断されている可能性が高い。

同一のように見えるか、メイン コンテンツが非常に似通っている複数のページを Google が見つけた場合、インデックス登録プロセスで収集された要素(シグナル)に基づいて、検索ユーザーにとって最も完成度が高く有用であると客観的に判断されるページを選択し、そのページを正規としてマークします。

Google がインデックス登録で正規 URL を選択する方法 – URL 正規化とは何か | Google 検索セントラル

正規化のシグナルが統一されていない

Googleは正規ページを判断する際に、以下に挙げるいくつかのシグナルを参考にしており、これらの情報に矛盾が生じている可能性がある。

  • リダイレクト処理
    • リダイレクト先のURLは、他の重複コンテンツとくらべて正規URLとして優先されるシグナルとなる
  • canonicalの指示
    • canonicalが向けられているURLは、他の重複コンテンツとくらべて正規URLとして優先されるシグナルとなる
  • プロトコル
    • 同じコンテンツが「http」と「https」のいずれのパターンでも配信されている場合、「https」のURLが正規URLとして優先されるシグナルとなる
  • サイトマップに記述されているURL
    • サイトマップは通常、正規URLのみを記載するというルールがあるため、サイトマップに記載されているURLは、他の重複コンテンツとくらべて正規URLとして優先されるシグナルとなる
  •  内部リンク
    • <a>タグなどで指定されているアンカーリンクURLが、他の重複コンテンツとくらべて正規URLとして優先されるシグナルとなる
  • 多地域・多言語サイトにおけるhreflangの設置状況
    • 例えば、日本・中国・アメリカの3か国向けに、異なるURLでコンテンツが配信されているサイトにおいて、日本向けと中国向けのコンテンツには相互にhreflang指定があるが、アメリカ向けのコンテンツにはhreflang指定がない場合、日本向けと中国向けのURLが正規URLとして優先されるシグナルとなる

例えば、ページAとページBが重複コンテンツだったとして、canonicalではページAを正規ページとして指示しているが、サイトマップに記載されているURLはページBであるケースなどが考えられる。

このように正規化のシグナルが不統一だと、検索エンジンはどれを正規ページとするかの判断に迷うことがある。

Googleが選択している正規URLを確認する方法

GoogleがどのURLを正規と判断したかを確認したいときは、「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」のメッセージをクリックしたあとに表示されるURLの右側にある虫眼鏡マークをクリックする。

「ページのインデックス登録」のタブのなかに、サイト管理者とGoogleが選択したURLがそれぞれ表示されているため、そこから確認できる。

なお、はじめから調査したいURLが決まっている場合には、画面上部の検索窓から行う方法が最も手っ取り早い。検索をかけると、上と同じ画面が表示される。

「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」の対処法

このメッセージが表示されたときの対処法としては、以下3つが挙げられる。

  • 301リダイレクトで強制的に正規化する
  • canonical設定やサイトマップをを見直す
  • 内部リンクURLを見直す

301リダイレクトで強制的に正規化する

301リダイレクトは、後述する方法とくらべて正規化のシグナルが最も強く、確実性が高い手段である。
リダイレクト前のページが持っていたPageRankも転送先のURLへ完全に引き継がれるため、SEO面でのデメリットもない。

ただしこの方法は、重複コンテンツを複数のURLで維持する必要がある場合には適さないため、そのようなときは次のcanonicalやサイトマップの設定で対応する。301リダイレクトが有効なケースには以下のようなものがある。

  • httpとhttpsが混在しており、httpsに統一したい場合
  • www有無やスラッシュ有無が混在しており、どちらかに統一したい場合
  • /index.htmlや/index.php有無が混在しており、無しのパターンに統一したい場合

canonical設定やサイトマップをを見直す

canonicalは、<link>タグを使用する方法とHTTPレスポンスヘッダーを使用する方法の2つあるが、タグを使用する一般的なやり方の場合、重複コンテンツすべてのページに正規ページへ向けたcanonicalタグを設置する必要がある。

正規ページに別のURLへ向けたcanonicalタグが入っていたり、それぞれのURLでcanonicalの指示が矛盾していたり、そもそもcanonicalタグが入っていなかったりすると、検索エンジンは正規ページの判断に迷い、別のページを選択しかねないので、漏れなく正確な記述ができているかを今一度確認する必要がある。

最も手っ取り早いのは、ページを開いた状態で「Ctrl+U」を押す方法だ。以下のように、ソースコードが表示されるので、<head>内に<link rel=”canonical”…>の記述はあるか、記述内容は間違っていないかを確かめてみよう。

コードの探し方のテクニック

ソースコードが開けたら、「Ctrl+F」で文字検索するとスムーズに確認できる

またサイトマップにおいても、記述できるURLは正規URLに限られるため、非正規のURLが記述されていないかを確認するとよい。
サイトマップが配置されている場所やファイル形式が何かにもよるが、大抵はルート直下に「/sitemap.xml」と入力することで見れるケースが多い。

内部リンクURLを見直す

サイトの各所にある内部リンクのURLが、きちんと正規URLで設置されているかを確認しよう。
内部リンクは、301リダイレクトやcanonical、サイトマップとくらべると正規化の手法として一般的ではないが、先述したように、Googleが正規ページを判断する際のシグナルとして利用しているため、これらを修正するだけでも多少の効果は期待できる。

おわりに

本記事では、「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」というメッセージの意味や放置したときの悪影響、発生原因、対処法について解説した。

重複コンテンツの問題は一度修正すれば終わりではなく、サイトに変更を加えたときやプラグイン更新の際に再発することもあるため、サーチコンソールの「ページのインデックス登録」レポートは定期的に確認し、早期発見・早期対処に努めることが重要である。

タイトルとURLをコピーしました