Виды алгоритмов ранжирования

Для продвижения сайта важно понимать, как именно и по каким принципам поисковик оценивает ресурсы.

Методы ранжирования можно условно классифицировать на три вида:
1. Поточечный подход (pointwise approach). Для каждой пары запрос-документ выдает какое-то численное значение, характеризующее релевантность (та самая дырка в XML выдаче и значение Relevance). Такой подход может использоваться в методах машинного обучения.
2. Попарный подход (pairwise approach). На вход системы подаются два документа, которые необходимо сравнить. Из двух документов выбирается тот, который наилучшим образом соответствует запросу.
3. Списочный подход (listwise approach). На вход поступают сразу все документы, которые отвечают на запрос-документ. Дальше используется какая-либо модель ранжирования, благодаря которой на выходе получаем упорядоченный список.

Матрикснет соответствует классификации Learning to Rank for Information Retrieval, т.е. его можно причислить к Поточечному подходу. Однако сама технология Спектр не ложится в классификацию Learning to Rank for Information Retrieval.

Да и в итоге сам Спектр является гибридным методом, т.к. на входе модель ранжируется по Поточечному подходу, а на выходе, при построении итоговой выдачи, список формируется по Списочному подходу.

Сами по себе поисковые системы не используют в чистом виде какой-то конкретный подход, а на различных этапах расчета могут применяться различные классификаторы ранжирования.

Классификация документов в поиске

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

14 + один =