Google、Yahoo!、Microsoftの検索3大手がCanonical Link要素(正規リンク)の導入で一致した。Canonical Linkは正規化された唯一のURLを情報として提供するというもので、あるコンテンツに対して複数のURLが存在する「重複ページ」に対するひとつの回答となるものだ。
Canonical Linkがどういったものであるかは、Matt Cutts氏の発表内容がCanonical Link Element: presentation from SMX Westに編集されて掲載されたため、ここを参考にするのがわかりやすい。たとえば次のURLがすべて同じコンテンツをさしているとしたら、どうすれば重複を判断できるかといえば、
- www.example.com
- example.com
- www.example.com/
- example.com/
- www.example.com/index.html
- example.com/index.html
- www.example.com/Home.aspx
- example.com/Home.aspx
Canonical Link要素をつかってこれに対して正規化されたURLを情報として付加できるようにすることで解決しようというものだ。head要素に次のような要素を付加することで同一のコンテンツであることを示す。
- <link rel="canonical" href="http://example.com/index.html" />
重複ページの特定が容易になれば、その分検索インデックスを圧縮して高速化できるようになるし、より多くのコンテンツを検索対象に追加しやすくなる。