Deepcrawl is now Lumar. Read more.
DeepcrawlはLumarになりました。 詳細はこちら

Canonicalタグの重要性

Canonicalタグがあらゆるサイト構造に欠かせない理由とは?Canonicalタグを使うことでGoogleやその他の検索エンジンにどのURLをインデックスさせたいか伝えることができます。

 

Canonicalタグがあらゆるサイト構造に欠かせない理由

Canonicalタグを使うことでGoogleやその他の検索エンジンにどのURLをインデックスさせたいか伝えることができます。

同じページに異なるバージョンが存在する場合、重複コンテンツが発生することを防ぐことができます。例:同じページのオリジナル版と印刷用、セッションID、同じ商品の色違いの商品ページなど

 

正規化URLとは?

正規化URLは、そのコンテンツの主要なバージョンです。 このURLがまさにGoogleの検索結果に表示されるべきURLということになります。

サイトの正規化URLのセットは、それらに一貫性があることを確実にするルールを設定することで作成できます。例えば、正規化URLが常にスラッシュ(トレイリングスラッシュ)で終わる、または正規化URLにURLパラメータが含まれないといったものです。

 

正規化されたURLとは?

正規化された(正規化済の)URLは、canonicalタグを含むページのことを指し、そのタグ内に異なるURLが入っている状態のページのことです。

ページ上のcanonicalタグに異なるURLを含めることで、GoogleにページのURLの代わりに正規化URLをインデックスするように指示することができます。

正規化されたURLで収集されるオーソリティシグナルが、正規化URLを優先するように機能します。

 

canonicalタグを追加する位置と方法

以下のタグを正規化したいページに追加してください。

<link rel=”canonical” href=”http://www.example.com/a-different-page” />

または、HTTPヘッダーに追加することもできます。

Link: <http://www.example.com/a-different-page>; rel=”canonical”

 

canonicalタグを追加するルール

canonicalタグが機能するには、以下のように、適切にかつ一貫性を持って利用される必要があります。

  • フルドメインを含む絶対URLを使う

  • URLの最後にスラッシュを使うか使わないか、一貫したルールを用いる

  • 大文字と小文字を混同しない:例) 大文字を常に使うか、全く使わない

  • Googleウェブマスターツールを使ってGoogleがパラメーターを扱う方法を指定し、固有のコンテンツを返さないパラメーターを除外する。正規化URLから同じパラメーターを除外する。

  • 文字コード (&など)に一貫性を持たせるか、全く使わない

 

これらと301リダイレクトの違いは?

canonicalタグは検索エンジンにのみ検出され、ユーザーはそのURLに留まることになります。一方、301はユーザーと検索エンジンをリダイレクトします。

リダイレクトされたURLはアナリティクスには蓄積されませんが、正規化されたURLはトラックされます。

もしユーザーがURLにアクセスできるようにしたい場合、canonicalタグを使ってください。

 

注意すべき問題

検索エンジンは以下のような場合にはcanonicalタグを無視してしまいます。

正規化URLと正規化されたURLの間でコンテンツが異なる場合:
Googleは正規化URLと正規化済みURLでコンテンツが異なる場合には、canonicalタグを無視してしまうかもしれません。

canonicalタグのないページ:
重複を避けるため、正規化ページを含むすべてのページにcanonicalタグが設置されている必要があります。

間違ったURLへの正規化:
正規化URLが正規化されたURLとあまり類似していない場合、Googleはおそらくそれを無視します。

複数のcanonicalタグ:
同じページ上のcanonicalタグが異なる場合、Googleはそのどちらも無視します。

正規化ループ:
正規化が解除されたページへの正規化

リンクされていない正規化ページ:
ほとんどの正規化URLは、サイトの重要な部分であるため、少なくとも一度はサイト内部でリンクされています。

正規化URLが直接リンクされていない場合、正規化URLが間違っている可能性があります。

正規化URLのリダイレクト:
正規化URLが他のURLにリダイレクトする場合、それは本当の正規化URLではありません。

壊れた正規化URL:
正規化URLが有効なURLではない場合、Googleはそれを無視すると思われますが、これはクロールの効率性を阻害する時間の浪費に他なりません。

空のcanonicalタグ:
URLを含まないcanonicalタグ

 

canonicalタグをモバイル向けに使う

別のURLでモバイルサイトがある場合、Googleはそのモバイルサイトをデスクトップサイトに正規化してalternate属性を補完することを推奨しています。

 

ページネーションのためのcanonicalタグ

すべてのページでページネーションを実装(一般的には多くのページに分割される記事に用いられる)している場合、Googleはすべてのページ分割された部分を、 全体のバージョンに正規化することを推奨しています。

 

DeepCrawlを使ってcanonicalタグをトラッキングする

DeepCrawlの提供する3つのcanonicalタグに関するレポートを使って、全ての正規化されたページ、canonicalタグのないページ、リンクされていない正規化ページを見つける事ができます。

 

1. 正規化されたページを見つける

Tこのレポートはcanonicalタグで指定された正規化URLとは異なるURLを、HTMLかHTTPヘッダーのいずれかに持つ全てのページを検出します。

インデックス > 正規化されているページへと進んでください。

ここで全ての正規化されたページのリストに加え、それらの場所、正規化URLなどの詳細を確認できます。

indexation canonicalised pages DeepCrawl

 

2.canonicalタグのないページを検出する

検証 > canonicalタグのないページへと進んでください。

ここでは、canonicalタグのないページを一覧で確認することができます。

validation pages without canonical tags DeepCrawl

 

3.リンクされていない正規化ページを見つける

検証 > リンクされていない正規化ページへと進んでください。

ここではリンクされていないcanonicalタグで見つかった全てのページをリストで確認することができます。

validation unlinked canonical pages DeepCrawl

DeepCrawlは常にあらゆる正規化URLに従ってクロールするので、どこかが壊れている場合には、これらのページはエラーレポートで検出されることになります。