Алгоритм «Палех» от Яндекс

//Алгоритм «Палех» от Яндекс

Алгоритм «Палех» от Яндекс

Поисковая система Яндекс заявила о запуске нового алгоритма под названием «Палех», который работает с использованием нейронных сетей для лучшего ранжирования низкочастотных ключевых слов.

Подробнее о самом алгоритме и том, как с ним «подружиться» мы опишем в данной статье.

Мы запустили новый поисковый алгоритм — «Палех». Он позволяет поиску Яндекса точнее понимать, о чём его спрашивают люди. Благодаря «Палеху» поиск лучше находит веб-страницы, которые соответствуют запросам не только по ключевым словам, но и по смыслу. За сопоставление смысла запросов и документов отвечает поисковая модель на основе нейронных сетей.

Алгоритм Яндекс Палех

График частотного распределения запросов в Яндексе часто представляют в виде птицы (Жар-птицы, которая часто появляется на палехской миниатюре):
Клюв — высокочастотчные ключевые слова.
Туловище — среднечастотные ключевые слова.
Длинный хвост — низкочастотные ключевые слова и единичные, а порой даже и уникальные и очень длинные запросы, которые так и называются, длинный хвост.

Подробно разберем алгоритм Яндекс Палех

Работа алгоритма нацелена на низкочастотные ключевые слова и запросы которые имеют описательный характер. Среднечастотные и высокочастотные ключевые слова под «власть» Палеха не подпадают.

Что значит описательный? Возьмем пример с блога Яндекса:

Запросы из «длинного хвоста» очень разнообразны, но среди них можно выделить несколько групп. Например, одна из них — запросы от детей, которые пока не освоили язык общения с поиском и часто обращаются к нему как к живому собеседнику: [дорогой яндекс посоветуй пожалуйста новые интересные игры про фей для плантика]. Ещё одна группа — запросы от людей, которые хотят узнать название фильма или книги по запомнившемуся эпизоду: [фильм про человека который выращивал картошку на другой планете] («Марсианин») или [фильм где физики рассказывали даме про дейтерий] («Девять дней одного года»).

Как мы видим — запросы сложные с точки зрения обработки обычными алгоритмами по соответствию запроса к контенту и заголовку документа. Но, для нейронных сетей это задачка значительно проще.

Сейчас Палех запущен именно для низкочастотных ключевых слов, и его результаты значительно лучше чем применение того же BM25. Мы думаем, что со временем Яндекс начнет применять Палех и для среднечастотных ключевых слов, но пока основной упор сделан именно на низкочастотные ключевые слова.

Релевантность документа к запросу в Палех оценивается на отрицательных примерах. Для выборки релевантного документа, изначально выбираются все нерелевантные и отсекаются. Исключив все нерелевантные документы в несколько  десятков итераций, нейронная сеть выбирает релевантные. На построение такого принципа выборки документов, нейронная сеть обучается.

Низкочастотные ключевые слова

Почему в качестве семантического вектора был выбран именно сегмент низкочастотных ключевых слов?

  • ВЧ и СЧ ключи ранжируются правильно и в них нет такой жутко неразберихи как это было с НЧ
  • НЧ ключи формируют основную массу(около 50-75%) поискового трафика у всех видов сайтов по всем видам запросов (информационный, навигационный, транзакционный).
  • Борьба за качество выдачи с Google.
  • Обширность кол-ва запросов.

Этот список можно продолжать еще долго, но главное, что хочется в нем подчеркнуть это действительно очень большой объем низкочастотных ключевых запросов.

Мы уже упоминали о важности продвижения сайта по низкочастотным ключевым словам (читать статью).

НЧ запросы — более уточненные и ввиду этого конверсия от трафика по НЧ ключам выше.

Контент сайта

Так или иначе, поисковые машины оценивают сайт по его содержимому. Палех оценивает релевантность документа к запросу по описательной характеристике. Таким образом Палех оценивает не вхождение ключевых слов в заголовки и теги, а именно смысл содержимого.

Если плотность и вхождение ключевых слов в документе для Палех не важны, то соответственно контент страниц должен быть максимально широким, что означает большой объем контента. Естественно качество контента должно быть высоким. Старые приемы с «напичкиванием» текста ключевыми словами — не пройдут.

By | 2017-10-04T15:53:00+00:00 Июль 18th, 2017|Рубрика SEO|Комментарии к записи Алгоритм «Палех» от Яндекс отключены

About the Author: