Как работает поисковая система Yandex?

URL’s:

Яндекс — это русскоязычная поисковая система. На сегодняшний день она имеет самую большую базу данных, размещенную на нескольких серверах.

Популярность поисковой системы Яндекс в России

статистика по России

У Яндекса достаточно быстрая ПС, после 2-4 часов регистрируемая страница появляется в выдаче. Но это означает лишь то, что она поставлена в очередь на полную индексацию. После того, как сайт проходит полную индексацию, она может пропасть со страницы выдачи, если робот сочтет ее за спам, либо из-за каких-нибудь технических проблем. Если ваш ресурс после первичной проверки вышел на первые места по тому или иному запросу, то после полной индексации, возможно, он будет совсем на других позициях. Положение нужно отслеживать в течение нескольких дней.

Не стоит волноваться, если попадете в следующую ситуацию:

Страница после полной индексации заняла хорошую позицию. Но после одной из проверок ее место в списке результатов ниже, чем обычно. А на следующий день — опять все по-прежнему. Список результатов может меняться в зависимости от загруженности серверов. Это происходит потому, что база данных имеет кластерную структуру и разнесена на несколько серверов.

Цитата

В 2009 году Яндекс внедрил новый метод машинного обучения — Матрикснет. С его помощью строится формула ранжирования. Важная особенность этого метода — в том, что он устойчив к переобучению. Это позволяет учитывать очень много факторов ранжирования — и при этом не увеличивать количество оценок асессоров и не опасаться, что машина найдет несуществующие закономерности.

С сайта yandex.ru

Советы по оптимизации:

  • Не нужно делать очень маленькие или очень большие документы. Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в ALT описании, но вес слов в этом тэге ниже.
  • Хорошо индексируются страницы, созданные скриптами cgi, php. Это касается гостевых книг, форумов и т.п. Для остальных (кроме главной) требуется примерно 2 недели.
  • Если портал на русском языке, а домен не в зоне .ru, то Яндекс все равно проиндексирует.

UserAgent

Имя поискового робота: Yandex/1.03.00х, где х — тип паука, в зависимости от типа индексации (первичная, полная).

Поддержка мета-тэгов

Мета-тэги keywords и description: ключевые слова в них не помогают достигать хороших позиций. В мета-тэгах нужно писать лишь те слова, которые встретятся в тексте страницы.

Тег description используется в описании страницы в результатах поиска. Это нужно учитывать при его составлении, т.к. это будет один из критериев, по которым пользователь решает, заходить на сайт или нет.

Мета-тэги, такие как revisit-after, content — не поддерживаются.

Советы по улучшению позиции сайта.

  • Прописывайте ключевые слова в тегах: Title, заголовки (h1-h6), содержание страницы, ALT.
  • В формулу вычисления релевантности включен Взвешенный Индекс Цитирования, аналог Page Rank в Google. Обычный Индекс Цитирования используется только при сортировке порталов в каталоге Яндекса. Влияние на положение в результатах поиска оказывает ВИЦ .

Спам

Разработана технология определения спама, но пока она является крайне неэффективной. Команда разработчиков работает над этим.