Главная Компания Статьи Яндекс антиспам. Принципы и особенности работы.

Яндекс антиспам. Принципы и особенности работы.

Каждый день огромное количество людей пользуется поисковыми системами. По статистике в день совершается до пятидесяти миллионов переходов с ресурсов Яндекса на сторонние страницы. Само собой,  владельцы интернет ресурсов заинтересованы в том, чтобы их сайт появился, например, в топ-10 выдачи и, зачастую, для достижения этой цели многие используют не совсем честные приемы. Самым  распространенным из них является поисковый спам.

Что это такое и зачем он нужен? Все до банального просто. Поисковый спам включает в себя веб страницы или их элементы, которые создаются для обмана поисковой системы с целью изменения результатов  выдачи. Самым банальным примером является размещение на странице мелкого и незаметного для глаза обычного пользователя текста с популярными запросами. Для взгляда обычного человека на сайте, как  будто бы, ничего лишнего нет, но поисковик отлично видит эти тексты и индексирует их.

Дорвей

В первую очередь спамеры создают так называемую "промежуточную" страницу, которая называется ключевыми словами. Например, [купить стальные двери]. Для того, чтобы поисковику было сложнее обнаружить  спам, ключевые слова вставляются внутри текста. В зависимости от употребляемых слов, этот самый дорвей будет появляться в выдаче поисковика при определенных запросах. Дальше все довольно просто -  после индексации страницы пользователь, желающий, например, купить стальную дверь обнаруживает ее в результатах, выдаваемых поисковиком и переходит по ссылке. После этого ситуация может развиваться в  двух направлениях - или юзер перенаправляется на целевой сайт автоматически (иногда вы можете даже не заметить перехода) или ему предлагается нажать на кнопку "вход". Итогом подобного обмана является  то, что пользователь или попадает или на совершенно ненужный ему ресурс либо ему предлагается заплатить за необходимую информацию. Наибольшей популярностью такая схема пользуется среди мошенников,  которые посредством дорвеев распространяют вирусное ПО, воруют личные данные. Ежедневно поисковая система Яндекс в автоматическом режиме отслеживает дорвеи и удаляет их из результатов поиска.

Выдача яндекса

Результаты выдачи яндекса по запросу "скачать фильмы бесплатно". Именно тут может затаиться "потенциальный" дорвей.

Поисковый антиспам

Наличие спама в выдаче мешает как пользователю так и поисковику. Само собой, заинтересованы в его отсутствии обе стороны. Если пользователю приходится пробираться через горы абсолютно ненужной  информации (и более того - рисковать своей безопасностью), то поисковая система тратит свои ресурсы на индексирование и хранение данных о недоброкачественных сайтах. Для того, чтобы избавиться от этой  проблемы, Яндекс постоянно совершенствует и дополняет свой алгоритм поиска некачественного контента. Все проиндексированные сайты постоянно проверяются и перепроверяются. Если система замечает  отклонения от нормы, то результатом может быть принятие санкций или полное исключение из выдачи.

Система антиспама и ее обновление

Актуальность системы поискового антиспама Яндекса обеспечивается за счет наличия технологии обучения "Матрикснет" и работы целого штата специально обученного персонала. В первую очередь "в бой"  вступают асессоры. Эти специалисты оценивают качество поиска и уровень соответствия результатов выдачи определенным запросам. Найденный спам отмечается и классифицируется. Вторым шагом является  выделение определенных признаков спама. Именно благодаря им, в последствии, система антиспам учится отличать качественный контент. Важным пунктом в этом случае является "измеримость" признака, как,  например, процентное содержание в тексте страницы определенных слов или их сочетаний. Следующим пунктом является составление специального списка доброкачественных и недоброкачественных сайтов.  Сравнивая их контент, машина учится определять нормальные веб страницы и исключать спам из выдачи. Поскольку один признак не является достаточным основанием для применения санкций к ресурсу,  поисковик учитывает их комплексно. Результатом является исключение веб страниц из выдачи на основе множества признаков наличия на ней спама.

Поддержка

К сожалению, современные технологии не настолько совершенны и поэтому бывают случаи, когда поисковик исключает из выдачи хорошие страницы. В этом случае необходимо обратиться в службу технической поддержки и проконсультироваться с сотрудниками "Яндекса". Если будет подтвержден тот факт, что алгоритм ошибся, ресурс вернут в выдачу в течение нескольких дней. Если вы смогли доказать свою "невиновность", поисковик учитывает это и корректирует работу алгоритма для того, чтобы в дальнейшем избежать подобных неприятных ситуаций.

Наверх