Google использует эту систему, чтобы понять, о какой конкретной сущности (например, месте или человеке) идет речь на веб-странице, особенно когда названия неоднозначны. Система анализирует доминирование упоминаний сущности на странице (соотношения), …
Разборы патентов
Яндекс патентует метод выявления аномального трафика (накрутки ПФ) путем анализа истории посещений пользователей. Система строит граф, связывающий сайты, которые часто посещаются одними и теми же пользователями. Если группа сайтов сильно …
Google обучает свои языковые модели (Трансформеры), интегрируя внешние сигналы, такие как PageRank, авторство, свежесть и вовлеченность, непосредственно в Механизм Внимания (Attention Mechanism). Во время обучения, если контент поступает из авторитетного …
Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти …
Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они …
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес …
Яндекс использует гибридный метод для точного определения времени создания веб-страниц, когда эта информация неизвестна или ненадежна. Система сначала извлекает даты из URL и HTML, оценивая их надежность по иерархии доверия. …
Яндекс патентует метод оптимизации ранжирования, основанный на детальном анализе поведения пользователей после просмотра выдачи («параметры постпросмотра»). Система автоматически определяет вес различных поведенческих сигналов (клики, время просмотра, пропуски, удовлетворяющие клики) для …
Google использует систему машинного обучения для оценки авторов и аккаунтов на онлайн-платформах, объединяя сигналы качества (E-E-A-T) и популярности (взаимодействия пользователей) в единый показатель. Этот показатель используется для определения того, следует …
Google использует модель машинного обучения для расчета оценки качества сайта (Quality Score). Эта оценка зависит не только от собственных характеристик сайта (например, юзабилити или поведенческих факторов), но и от характеристик …
Яндекс использует механизм для корректировки оценки качества сайта, сравнивая ее с эталонным значением, ожидаемым для сайтов с аналогичным объемом трафика или уровнем лояльности. Если сайт показывает аномально высокие метрики качества …
Патент раскрывает ядро алгоритма CatBoost — основного метода машинного обучения Яндекса для ранжирования. Он описывает, как система преобразует категориальные признаки (например, URL, домен, регион) в числовые значения. Чтобы избежать переобучения …
Google анализирует тексты ссылок (анкоры), ведущих на страницу, чтобы определить ее основную тему или сущность (Unifying Subject). Система выбирает наиболее репрезентативный анкор, используя частотность, авторитетность ссылающихся сайтов (Page Importance Metric) …
Яндекс использует машинное обучение для идентификации оригинального источника контента среди множества перепечаток. Система группирует похожие публикации в «тематические кластеры» и анализирует исходящие ссылки внутри них. Оценивая репутацию источников, время публикации …
Патент Google, описывающий механизм, позволяющий вебмастерам встраивать инструкции непосредственно в HTML-код ссылок. Эти инструкции сообщают поисковой системе, как обрабатывать конкретную ссылку, например, блокировать ее учет или изменять ее вес при …
Яндекс патентует систему автоматического создания «мета-признаков» для улучшения ранжирования. Эти признаки рассчитываются не изолированно для документа, а в контексте всей поисковой выдачи (SERP). Например, система оценивает значение фактора (скажем, CTR) …
Яндекс патентует систему прогнозирования популярности контента (например, просмотров видео), особенно размещенного на внешних платформах. Система агрегирует данные из трех источников: поисковые логи (клики в SERP), логи браузера (прямые заходы) и …
Google расширяет понимание тематики документа за пределы его контента, анализируя внешние сигналы. Система косвенно выводит концепции, изучая, откуда приходят пользователи (входящие ссылки и запросы), куда они уходят (исходящие ссылки, клики …
Патент Google, описывающий методы автоматического обнаружения синонимов и эквивалентных фраз. Система анализирует последовательные запросы пользователя в рамках одной сессии: если запросы имеют общие слова (контекст), то различающиеся слова считаются потенциальными …
Google использует механизм для борьбы со спамом, который намеренно вносит временные задержки или непредсказуемые колебания (например, временное понижение) в ранг документа после его изменения или получения новых ссылок. Система отслеживает …

