重複コンテンツによって起こる問題と対処方法

少しの重複は容認されるが大量の重複コンテンツはペナルティになる

URLの正規化ができていないために起こる重複コンテンツ

例えばトップページがhttps://yourdomain.com、https://www.yourdomain.com、https://yourdomain.com/index.html、https://www.yourdomain.com/index.htmlでアクセスできる状態になっていると、重複コンテンツです。このように同じ内容のコンテンツが違うURLで表示される状態を重複コンテンツと言います。印刷物は同じものを大量に印刷しますが、ウェブページは同一の記事のページがweb上に複数存在する必要は無く、ドメイン内に重複コンテンツが大量にあるサイトを検索エンジンはとても低く評価します。ホームページはそれぞれのページで独自の情報を提供する必要があり、重複コンテンツが存在する理由が無いのです。ユーザーにとっても重複している同じページを何度も見せられるのは迷惑なので、Googleはインデックスしません。

重複ページはSearch consoleのカバレッジの除外の中に「重複しています」と記載されている中のURLをクリックしてURL検査をクリックすると、Googleが重複と判断しているページがどのページと重複しているのかが分かります。

重複しているページはインデックスされず、検索結果には表示されません。重複ページが大量に認識されている場合は、Googleから低い評価をされる可能性があり、順位が上がらないなどの悪影響が出ることがありますので、重複を回避するように改善する必要があります。サイト内に生じる重複に該当するページは削除出来れば最も良い方法ですが、削除出来ない場合は、正規化したURLを指定することで、重複を回避することが出来ます。重複の少ない適切なサイトになればGoogleは評価してくれます。

WordPressの場合は、サイトアドレス (URL)で指定したURLでしか表示されないので、重複の心配はありません。

他のサイトからコピーしたコンテンツは著作権に抵触する恐れもあるので、他のサイトのコピーコンテンツを作成するのは止めましょう。

canonicalを指定して正規URLをGoogleに伝える

重複ページを残したまま、Googleに正規のURLを指定する場合は、canonicalを使用して、重複ページのhead内に記述し、正規化したいURLを記載します。正規化を行うことで正規化で指定したページに統一され重複を解消することが可能です。

<link rel=”canonical” href=”www.example.jp”>

.htaccessを利用して他のURLを指定されても正規URLにリダイレクトする

.htaccessはサーバーによっては使えない場合がありますので、サーバー会社に確認した上で使用して下さい。

記載方法は

Options +FollowSymLinks
RewriteEngine on
RewriteCond %{THE_REQUEST} ^.*/index.html
RewriteRule ^(.*)index.html$ https://yourdomain.com/$1 [R=301,L]

Windowsの場合、.htaccessのファイル名を作成出来ないので、a.htaccessなど適当なファイル名で、メモ帳で作成してFTPでアップロードした後に、サーバー側のa.htaccessを名前を変更で、aを削除すれば機能します。

モバイルページをサブディレクトリで運営している

最近は、レスポンシブ対応が主流になって、モバイルページをサブディレクトリで運営している例は少なくなりましたが、古いサイトをそのまま運営している場合には、サブディレクトリで運営しているサイトも比較的多くあります。

このような場合は、対象のページを出来るだけ早くレスポンシブ対応に移行するようにしましょう。

非ログインページが商品数の数だけある

会員登録が必要なサイトでログインせずに会員ページにアクセスした場合に「会員登録が必要です」などと表示されるページが全ての商品ページのURLで表示される場合は、重複コンテンツであると同時に低品質なコンテンツでもあります。これはとても重大な問題で、低品質なコンテンツが大量にしかも重複して存在するwebサイトは、サイトの約半分は低品質なコンテンツで、このようなサイトはGoogleから大きく評価を落とすことになります。

このような価値の無いページが大量に存在する場合は、必ずnoindexにして、Googleが収集しないようにしましょう。

パラメータで大量の重複ページを吐き出す

多言語対応しているサイトで、外国語を選択した時に、プログラムで言語を切り替える設定にしている場合に、正規のURLと?lang=enなどのパラメータ生成されるページ原因で重複することがあります。

このようなパラメーターを使用する方法をGoogleは非推奨としていて、良い方法ではありません。そして、このパラメータによって、サイトにある全ページが重複コンテンツになってしまいます。

これを避けるためには、多言語のページをサブディレクトリにして、パラメータを使用しないようにすることです。

マンションの物件ページの説明があまりに簡潔だと類似ページです

不動産のポータルサイトで、マンションの物件ページの物件の説明を詳しく掲載していないと、ほとんどの物件ページが画像と間取り程度になってしまい、物件ごとにオリジナリティのあるページではなくなってしまいます。

このようなページは類似ページであると同時に低品質なページにもなるので、物件毎に丁寧な説明を記載しましょう。ページ毎にオリジナルな詳しい記載が無く、ほとんど同じテキストしか記載されていないと類似ページになります。