
Причин виникнення дублів контенту може бути багато: особливості CMS сайту, сторінки з динамічними параметрами URL, сайт доступний за https://www.site.com/ і за https://site.com/, http://site.com/ і так далі. Якщо не вказати пошуковій системі пріоритетну - канонічну сторінку з дублюючим контентом, робот обере її на свій розсуд і наслідки можуть бути неприємними, особливо для власників сайтів.
Бізнес Майстерня говорить про поняття канонічності сторінок та атрибут rel = "canonical".
Що таке атрибут rel = "canonical"?
Атрибут rel = "canonical" вказує роботам пошукових систем, яку сторінку необхідно вважати пріоритетною. Він присвоюється тегу link і розташовується в <head></head> сторінки. Сторінка, зазначена в атрибуті rel = "canonical", починає сприйматися пошуковими роботами як пріоритетна (канонічна).

Наприклад: <link rel="canonical" href="http://[url]" />, де [url] - доменна адреса канонічної інтернет сторінки.
Припустимо, для інтернет сторінки «http://site.com/?get=12345» канонічною є «http://site.com/». В такому випадку на сторінці «http://site.com/?get=12345» тег буде таким: <link rel="canonical" href="http://site.com/" />.

Сторінка, зазначена в атрибуті, починає сприйматися пошуковими роботами як пріоритетна (канонічна)
Google підтримує даний атрибут з 2009.
Навіщо вказувати canonical?
- Усунути повні або часткові дублі контенту на сайті.
- Захистити контент від дублювання на ресурсах, які частково або повністю можуть кешувати сайт (наприклад, веб-архіви).
У яких випадках потрібно визначати канонічність?
Сторінки пагінації
Для сторінок пагінації є два вирішення питання з канонічними сторінками. Вибір варіанту залежить від того, чи є в кожної категорії сайту сторінка «Показати все», наприклад, http://site.com/category-1/show-all, на якій доступні всі товари з категорії.
Якщо така сторінка є, Google рекомендує на кожній сторінці пагінації вказати канонічної сторінку «Показати все».
Наприклад, http://site.com/category-1/page-2 повинна містити канонічне посилання: <link rel="canonical" href="http://site.com/category-1/show-all" />.
Якщо сторінки «Показати все» немає і ми маємо справу з класичною пагінацією, слід як канонічні, вказувати ці ж сторінки.
Наприклад, сторінка http://site.com/category-1/page-2 повинна містити канонічне посилання: <link rel="canonical" href="http://site.com/category-1/page-2" />.
Сторінки з UTM-мітками
Необхідно налаштувати сервер так, щоб при знаходженні UTM-параметрів в адресі сторінки, віддавався код «200 ОК» і сторінка містила абсолютне канонічне посилання на URL цієї сторінки без UTM-мітки.
Мова про наступні UTM-параметри:
- gclid
- utm_medium
- utm_source
- utm_campaign
- utm_content
- utm_term
- _openstat
Так, сторінка http://site.com/?utm_source=testk&utm_medium=test&utm_campaign=test повинна містити канонічне посилання: <link rel="canonical" href="http://site.com/" />.
Сторінки фільтрації
На сторінках фільтрації слід в якості канонічних вказувати самі сторінки фільтрації.
Наприклад, для сторінки http://site.com/category-1/filter-1/ потрібне посилання: <link rel="canonical" href="http://site.com/category-1/filter-1/" />.
Дублювання контенту на різних доменах
Іноді, при переході на нове доменне ім'я, використовується сервер, який не підтримує переадресацію на своєму боці. У такому випадку можна використовувати міждоменний атрибут rel = "canonical" в елементі link.
Просто потрібно вказати канонічні посилання зі всіх доменів, на яких є дубльований контент, на основний - кращий для індексування.

Важливо: на даний момент міждоменний канонікал розуміє тільки Google.
Про що слід пам'ятати, під час простановки rel = "canonical"?
- Посилання в атрибуті слід ставити абсолютні - з http:// або https://. Так скорочується ризик появи помилок.
- Якщо на сторінці з дублюючим контентом вказуєте на іншу сторінку як канонічну, не забудьте в <head></head> тієї сторінки також прописати її як канонічну.
- Якщо на сторінці вказано декілька канонічних адрес, пошуковий робот проігнорує їх і визначить канонічну сторінку самостійно.
- Якщо канонічною вказана сторінка, що віддає код відповіді 404, пошуковий робот не зможе використовувати цю рекомендацію.
- Щоб уникнути помилок, не варто використовувати ланцюжок канонічних сторінок.
- Пошукові роботи сприймають атрибут rel = "canonical" не як сувору директиву, а як рекомендацію, тобто вказаний URL може бути проігнорований.
- При самостійному визначенні канонічних сторінок, пошукова система Google віддає перевагу сторінкам на https.
Висновки
Були випадки, коли контент з сайту копіювали повністю, разом з внутрішньої текстовою перелінковкою і канонічними доменними адресами. Тому атрибут rel = "canonical" варто вказувати на всіх сторінках.
Особливо важливо визначати канонічність для:
- сторінок пагінації
- сторінок з UTM-мітками
- сторінок фільтрації
Це допомагає боротися з дублюванням контенту і убезпечити сайт від копіювання.
Обробка: Vinci