Що таке «сутності» і чому вони важливі для SEO

Що таке «сутності» і чому вони важливі для SEO

сутності

На сьогоднішній день сутності є найважливішою концепцією для розуміння сучасної SEO оптимізації. Чому? Розглянемо в статті. Це не про принципи індексації сайтів, це скоріше про розуміння пошуковиками сенсу зарита користувача і пошуку найкращої відповіді.

Як стало відомо раніше, трьома найважливішими факторами ранжування Google є контент, посилання і RankBrain. З тих пір, як було розкрито цю інформацію, всі ці області зазнали змін та змінили пошукову оптимізацію сайтів, але вони як і раніше важливі.

Ми знаємо, що Google визначає сутність, як «річ або поняття, яке є особливим, унікальним, чітко визначеним і помітним».

Важливо розуміти, що під «речами» тут маються на увазі не тільки фізичні об'єкти, але і такі поняття, як дата, колір, ідея і т.д.

Тепер давайте знову подивимося на згадані вище три чинники ранжування.

Контент

Контент, з точки зору SEO оптимізації, є об'єднанням пов'язаних між собою сутностей. Так, у твердженні «пошукова оптимізація мертва» є сутність пошукова оптимізація і сутність «мертва» і між ними є зв'язок, який з'єднує їх між собою.

Посилання

Посилання являють собою зв'язки між сутностями, які існують ще до того, як ми (або Google) подумаємо про них як про таких (взаємопов'язаних).

Посилання декларують зв'язок і напрямок зв'язку між сторінками в інтернеті. Ці сторінки в свою чергу є сутностями, які містять інші сутності.

Далі, сутність анкорного тексту через відношення підключене до теми (також сутності) і ця тематична сутність також підключена через спрямоване відношення (посилання) до сутності цільової сторінки.

RankBrain

RankBrain не є фактором ранжування в традиційному сенсі. Його завдання не діяти як сигнал, а визначати, яку вагу слід привласнити кожному сигналу, який бере участь в ранжуванні.

Отримуючи запит на інформацію, RankBrain визначає, які сигнали будуть найбільш значущими для надання найкращого результату.

Наприклад, для запиту [найкращі подарунки до Нового року] вирішальне значення матиме такий фактор, як час публікації. При цьому для такого запиту, як [громадянська війна в США], авторитетність буде більш важливим сигналом, ніж свіжість.

Що ми знаємо про сутності?

Більшість з того, що ми знаємо про сутності, стало відомо з окремих патентів Google і висловлювань експертів галузі. Хоча всі патенти бажано читати з певною часткою скепсису, нижче ми розглянемо ті з них, які з високою ймовірністю використовуються в системах Google.

Ранжування результатів пошуку на підставі метрик сутностей

Цей патент Google отримав у 2015 році. З повним аналізом цього документа можна ознайомитися, але там багато тексту і формул, тому нижче ми розглянемо тільки основні моменти.

Згідно з цим патентом, ранжування сутностей для пошуку включає в себе облік чотирьох чинників, таких як:

Зв'язаність

Зв'язаність визначається на підставі спільної появи сутностей. Так, якщо дві сутності часто згадуються в інтернеті разом (наприклад, «Дональд Трамп» і «президент»), то ми отримаємо приблизно такі результати пошуку в Google:

Трамп

Ці сутності з'являються разом досить часто і на досить авторитетних ресурсах, щоб отримати єдиний результат. Як видно на прикладі нижче, цей же процес пов'язує інші сутності з терміном, коли ми надаємо йому форму множини: кожна людина в каруселі нижче є сутністю, і всі ці люди пов'язані з сутністю «президент».

президент

Популярність

Щоб визначити, наскільки відомою є сутність, Google використовує досить просту формулу (в патенті). Зокрема, чим більш цінною є сутність (виходячи з таких речей, як посилання, відгуки, згадки і релевантність) і чим нижче цінність тієї категорії або теми, в якій вона конкурує, тим вище буде її популярність. Наприклад, якщо мова йде про велику рибу в невеликому ставку, то ця риба буде більш відомою, ніж така ж риба в океані.

Внесок

Цей фактор визначається за допомогою зовнішніх сигналів, таких як посилання і відгуки, і є мірилом вкладу сутності в тему. Відгук від відомого і шанованого ресторанного критика більше вплине на цю метрику, ніж відгук рядового користувача в Yelp, оскільки внесок критика в цьому просторі буде більш цінним.

Нагороди

Ця метрика враховує ті нагороди, які отримала сутність. Це може бути Нобелівська премія, «Оскар» або «Особистість року в пошуку». Тип нагороди визначає її вагу, і чим більш значущою була ця нагорода, тим більше цінності буде присвоєно даній сутності.

Процес ранжування починається з надходження запиту користувача на інформацію про сутність.

Наприклад, користувач вводить запит [кращі актриси]. Далі Google виконує свій процес в наступному порядку:

  1. Визначає зв'язаність інших сутностей і привласнює значення;
  2. Визначає популярність цих сутностей і привласнює кожній з них певне значення;
  3. Визначає внесок цих сутностей і привласнює значення;
  4. Визначає, чи отримували ці сутності будь-які нагороди, і привласнює значення;
  5. Визначає відповідну вагу кожної з них, виходячи з типу запиту;
  6. Визначає кінцеву оцінку для кожної можливої сутності.

Після цього Google генерує SERP, яка може виглядати так:

актриси

Так, алгоритми Google не бездоганні, але і не погані.

Відповіді на питання з використанням посилань на сутності в неструктурованих даних.

Цей патент Google отримав у 2016 році. Основні тези:

  • Кожній сутності присвоюється унікальний ідентифікатор. Це, ймовірно, має відношення до придбання Metaweb в 2010 році.
  • Визначення найбільш імовірної сутності, запитуваної користувачем пошуку, може бути виконано через визначення того, яка сутність найчастіше з'являється в топ-10 пошукової видачі. Наприклад, якщо користувач вводить запит [dave davies], то більшість результатів в топі пошукової видачі буде посилатися на сутність гітариста рок-групи The Kinks. Відповідно, це та сутність, яка буде використовуватися для формування панелі видачі Мережі знань.
  • Існує база сутностей. Щоб заощадити час на обробку топ-результатів кожен раз при отриманні запиту на інформацію, існує база даних, де зберігаються сутності і зв'язки між ними. Це схоже на контрольний граф, але для сутностей.
  • Сутності ранжуються за показником якості. Цей показник може включати такі метрики, як свіжість, попередні вибори користувачів, вхідні посилання і, можливо, вихідні посилання. Пам'ятайте, це всього лише патент - тому вам не потрібно посилатися на кожний сайт, який ви можете знайти. За нашими спостереженнями ця частина має вагу лише в особливих ситуаціях.
  • Коли виконується запит на сутність, визначається релевантність інших сутностей для результату. Наприклад, для запиту [dave davies] Google необхідно визначити, які сутнісні метрики найбільш важливі для нього. Такі сутності, як «дата народження», «брат», «група» і ряд інших здаються досить важливими для того, щоб сформувати панель знань. Той факт, що музикант був восьмою дитиною в сім'ї не виглядає досить важливим. Варто зазначити, що важливість сутностей визначається не тільки щодо панелей знань, просто це одна з найбільш наочних ілюстрацій для цього процесу.

У Google також є методи, які допомагають йому вивести контекст для декількох об'єктів з однаковою назвою. Наприклад, така сутність, як «Філадельфія» може бути містом, сортом сиру і фільмом. Якщо користувач запитає «де», то Google покаже результати для міста, «хто знімається в» - фільму, «що добре поєднується з» - сиру.

Ця техніка дозволяє Google визначати сутності і зв'язки між ними, коли дані є неструктурованими. Даний метод також дозволяє пошуковій системі дізнаватися про нові сутності.

У зв'язку з досягненнями Google в розумінні природної мови і машинному навчанню, важливість сутностей постійно зростає.

Пов'язані сутності

Останній патент, який ми розглянемо, Related Entities, був виданий компанії раніше цього року.

В цьому патенті ми знову бачимо згадки бази сутностей. Ця база являє собою не просто список відомих сутностей, а й інформацію про те, як вони пов'язані з іншими сутностями. Так, сутність «Дейв Девіс» може бути пов'язана з такими сутностями, як:

  • «3 лютого 1947 року» в зв'язку з «його день народження»
  • «Деніел Девіс» у зв'язку з «його син»
  • «Com» в зв'язку з «його сайт» і т.д.

Всі ці зв'язки містяться в базі даних.

У Google є механізм для визначення пріоритетних сутностей. Як зазначалося вище, порядок народження Дейва Девіса в його родині - відома сутність, проте вона не така важлива в порівнянні з іншими сутностями, визначеними як ті, що можуть викликати інтерес у користувача.

Чому сутності важливі для SEO?

Сутності значимі для SEO тому, що за своєю суттю вони являють собою реальний світ. Ми і самі розуміємо все, що нас оточує, в контексті сутностей і зв'язків між ними. Це особливість людського мислення.

Однак, щоб використовувати цю концепцію, Google необхідне машинне навчання. Без машинного навчання Google не може достатньо добре розуміти мову для того, щоб інтерпретувати сторінки і зв'язки між сутностями.

Без машинного навчання і, зокрема, RankBrain, Google не міг би дізнатися, як коректно і «на льоту» пріоритезувати сигнали, а також адаптуватися до невідомих раніше сутностей і вивчати їх.

Тому зараз ми бачимо, як Google змінює механізми своєї роботи, що також тягне за собою великі зміни в ранжуванні сторінок.

Разом з сутностями у пошукової системи з'являються нові можливості. Завдяки використанню цієї концепції Google здатний:

  • розрахувати ймовірність задоволення наміру користувача з більш високою точністю;
  • зрозуміти з промови і тону, яким буде результат - позитивним або негативним.

При цьому різко знижується залежність від посилань.

Посилання залишатимуться сигналом ранжування, але вони стануть просто одним з багатьох механізмів для визначення значущості сутностей.

Щоб проводити пошукову оптимізацію в цьому новому світі, нам потрібно змінити своє уявлення про сайти і про просування сайтів на ринку.

Якщо ми хочемо ранжуватися за запитом [blue widgets], нам потрібно врахувати той факт, що Google вже розуміє або скоро зрозуміє всі сутності, пов'язані з ним, а також те, в якому порядку вони будуть відповідати пошуковому наміру користувача.

Тому оптимізаторам потрібно подумати, які сутності потрібні їм на сайті, і як вони повинні бути пов'язані між собою, щоб Google вибрав саме їх ресурс як той, що з більшою ймовірністю задовольнить потреби користувачів, ніж конкуруючі сайти.

Сутності та посилання

Напевно, найбільш значущими для SEO-фахівців будуть зміни в ролі посилань. Судячи з усього, і це здається неминучим, посилання стануть просто ще одним коннектором для сутностей серед багатьох.

Навіщо Google потрібно буде передавати цінність через посилання, якщо будуть інші сигнали і чітке розуміння того, як сутності пов'язані між собою?

Google не потрібно, щоб в цій статті ми посилалися на сайт Дейва Девіса з The Kinks. Пошукова система знає з контексту, що в статті згадується ця сутність, і вона пов'язує її з рядом інших сутностей. При цьому системи Google здатні визначити, що в статті відсутній такий фактор, як зв'язаність, тому зв'язок між цією статтею і гітаристом The Kinks буде мінімальним.

Виходячи з викладеного вище, намагайтеся враховувати логічні зв'язки, незалежно від того, яким напрямком SEO ви займаєтеся.

Якщо ви створюєте контент, подумайте про інші сутності, які повинні бути присутніми на сторінці або на сайті, і додайте їх. Подивіться на топ-10 сайтів і з'ясуйте, які ще сутності містяться на цих сторінках.

Коли ви займаєтеся лінкбілдінгом, подумайте про ті сутності, з якими повинен асоціюватися сайт, і отримаєте посилання від тих ресурсів, де вони є.

Наприклад, якщо ваша компанія надає ріелторські послуги в Одесі, то вам потрібно отримати посилання не тільки від сайтів нерухомості, але і від сайтів, що мають відношення до Одеси. Ви також можете просунутися на крок далі і подумати, які типи сайтів мають виражене відношення до сфери нерухомості.

Наприклад, іпотечні брокери будуть мати сильний зв'язок з сутністю нерухомості і таким чином, будуть являти собою добрі зв'язки другого рівня.

Сутності будуть використовуватися і надалі

Сутності необхідні Google, щоб надавати нам ту інформацію, яка нам потрібна, коли ми запитуємо сутність «піца» разом з сутністю «поруч зі мною».

Тому замовте собі улюблену піцу і почніть думати про те, який контент повинен бути на вашому сайті.

Фото: flickr.com
Обробка: Vinci
назад
далі