Канонічний URL, або як підвищити рейтинг однакового контенту

Канонічний URL, або як підвищити рейтинг однакового контенту

url

Причин виникнення дублів контенту може бути багато: особливості CMS сайту, сторінки з динамічними параметрами URL, сайт доступний за https://www.site.com/ і за https://site.com/, http://site.com/ і так далі. Якщо не вказати пошуковій системі пріоритетну - канонічну сторінку з дублюючим контентом, робот обере її на свій розсуд і наслідки можуть бути неприємними, особливо для власників сайтів.

Бізнес Майстерня говорить про поняття канонічності сторінок та атрибут rel = "canonical".

Що таке атрибут rel = "canonical"?

Атрибут rel = "canonical" вказує роботам пошукових систем, яку сторінку необхідно вважати пріоритетною. Він присвоюється тегу link і розташовується в <head></head> сторінки. Сторінка, зазначена в атрибуті rel = "canonical", починає сприйматися пошуковими роботами як пріоритетна (канонічна).

анімація

Наприклад:  <link rel="canonical" href="http://[url]" />, де [url] - доменна адреса канонічної інтернет сторінки.

Припустимо, для інтернет сторінки «http://site.com/?get=12345» канонічною є «http://site.com/». В такому випадку на сторінці «http://site.com/?get=12345» тег буде таким: <link rel="canonical" href="http://site.com/" />.

схема

Сторінка, зазначена в атрибуті, починає сприйматися пошуковими роботами як пріоритетна (канонічна)

Google підтримує даний атрибут з 2009.

Навіщо вказувати canonical?

  • Усунути повні або часткові дублі контенту на сайті.
  • Захистити контент від дублювання на ресурсах, які частково або повністю можуть кешувати сайт (наприклад, веб-архіви).

У яких випадках потрібно визначати канонічність?

Сторінки пагінації

Для сторінок пагінації є два вирішення питання з канонічними сторінками. Вибір варіанту залежить від того, чи є в кожної категорії сайту сторінка «Показати все», наприклад, http://site.com/category-1/show-all, на якій доступні всі товари з категорії.

Якщо така сторінка є, Google рекомендує на кожній сторінці пагінації вказати канонічної сторінку «Показати все».

Наприклад, http://site.com/category-1/page-2 повинна містити канонічне посилання: <link rel="canonical" href="http://site.com/category-1/show-all" />.

Якщо сторінки «Показати все» немає і ми маємо справу з класичною пагінацією, слід як канонічні, вказувати ці ж сторінки.

Наприклад, сторінка http://site.com/category-1/page-2 повинна містити канонічне посилання: <link rel="canonical" href="http://site.com/category-1/page-2" />.

Сторінки з UTM-мітками

Необхідно налаштувати сервер так, щоб при знаходженні UTM-параметрів в адресі сторінки, віддавався код «200 ОК» і сторінка містила абсолютне канонічне посилання на URL цієї сторінки без UTM-мітки.

Мова про наступні UTM-параметри:

  • gclid
  • utm_medium
  • utm_source
  • utm_campaign
  • utm_content
  • utm_term
  • _openstat

Так, сторінка http://site.com/?utm_source=testk&utm_medium=test&utm_campaign=test повинна містити канонічне посилання: <link rel="canonical" href="http://site.com/" />.

Сторінки фільтрації

На сторінках фільтрації слід в якості канонічних вказувати самі сторінки фільтрації.

Наприклад, для сторінки http://site.com/category-1/filter-1/ потрібне посилання: <link rel="canonical" href="http://site.com/category-1/filter-1/" />.

Дублювання контенту на різних доменах

Іноді, при переході на нове доменне ім'я, використовується сервер, який не підтримує переадресацію на своєму боці. У такому випадку можна використовувати міждоменний атрибут rel = "canonical" в елементі link.

Просто потрібно вказати канонічні посилання зі всіх доменів, на яких є дубльований контент, на основний - кращий для індексування.

копії

Важливо: на даний момент міждоменний канонікал розуміє тільки Google.

Про що слід пам'ятати, під час простановки rel = "canonical"?

  1. Посилання в атрибуті слід ставити абсолютні - з http:// або https://. Так скорочується ризик появи помилок.
  2. Якщо на сторінці з дублюючим контентом вказуєте на іншу сторінку як канонічну, не забудьте в <head></head> тієї сторінки також прописати її як канонічну.
  3. Якщо на сторінці вказано декілька канонічних адрес, пошуковий робот проігнорує їх і визначить канонічну сторінку самостійно.
  4. Якщо канонічною вказана сторінка, що віддає код відповіді 404, пошуковий робот не зможе використовувати цю рекомендацію.
  5. Щоб уникнути помилок, не варто використовувати ланцюжок канонічних сторінок.
  6. Пошукові роботи сприймають атрибут rel = "canonical" не як сувору директиву, а як рекомендацію, тобто вказаний URL може бути проігнорований.
  7. При самостійному визначенні канонічних сторінок, пошукова система Google віддає перевагу сторінкам на https.

Висновки

Були випадки, коли контент з сайту копіювали повністю, разом з внутрішньої текстовою перелінковкою і канонічними доменними адресами. Тому атрибут rel = "canonical" варто вказувати на всіх сторінках.

Особливо важливо визначати канонічність для:

  • сторінок пагінації
  • сторінок з UTM-мітками
  • сторінок фільтрації

Це допомагає боротися з дублюванням контенту і убезпечити сайт від копіювання.

Фото: flickr.com
Обробка: Vinci
назад
далі