Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю …
Разборы патентов
Патент Google, описывающий систему извлечения информации о бизнесе (название, телефон) из неструктурированного текста веб-страниц. Система находит адрес в документе, определяет кандидатов на роль названия и телефона поблизости и использует статистическую …
Google использует алгоритм для определения наиболее авторитетной (официальной) страницы для конкретного бизнеса или адреса. Система анализирует кластер связанных страниц, изучая, как они ссылаются друг на друга, а также совпадение названия …
Google может обрабатывать запросы, включающие определенные метки (labels). Система идентифицирует домены, связанные с этими метками через внешние аннотации (annotations), которые определяют соответствие метки и шаблона URL (URL pattern). Поисковая выдача …
Google анализирует взаимодействие пользователей (клики, время пребывания, вовлеченность) с контентом в Поиске, Соцсетях и Новостных лентах, чтобы определить, в каких темах конкретный источник (сайт или автор) является экспертным. Если источник …
Яндекс патентует метод ранжирования, который учитывает как общий смысл документа, так и точное вхождение ключевых слов. Система использует три вектора: запроса, документа (для семантики) и специально отобранных фраз из документа …
Яндекс патентует эффективный способ персонализации выдачи с помощью тяжелых нейросетевых моделей (типа BERT/YATI). Система сначала анализирует историю поиска пользователя и текущий запрос (Ступень 1), создавая компактное представление контекста пользователя. Затем …
Патент Google описывает систему, которая анализирует ссылки на любой веб-странице и присваивает им оценку (Score), используя метрики, такие как PageRank, CTR и популярность. На основе этих оценок система может динамически …
Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий …
Яндекс патентует метод приоритизации сканирования новых страниц. Система прогнозирует не только общую будущую популярность (количество визитов) страницы, но и скорость, с которой этот интерес будет угасать. Страницы, которые, как ожидается, …
Google анализирует поведение пользователей на выдаче, создавая "Профили Взаимодействия". Система учитывает продолжительность кликов (Short/Long Clicks), их последовательность (Single/Multiple Clicks, Pogo-sticking) и уточнение запросов. Эти данные используются для оценки удовлетворенности пользователей, …
Яндекс патентует механизм мгновенного уточнения поисковой выдачи. Система отслеживает микровзаимодействия пользователя с конкретными элементами на SERP (слова, фразы в сниппетах) — например, выделение текста или скорость прокрутки. На основе накопленного …
Google использует метрику Codomain Relationship Measure (CDR), чтобы определить, какой сайт показать в качестве целевой страницы в Поиске по Картинкам. Система анализирует связь между доменом контента и доменом хостинга изображения. …
Google использует механизм "псевдо-рендеринга" для анализа геометрической структуры веб-страницы и ее разделения на семантически различные области (чанки), такие как основное содержимое, навигация, футер и реклама. Это позволяет системе определять важность …
Google анализирует последовательности действий пользователей ("Action Trails"), чтобы выявить общие "Задачи" (например, планирование отпуска). Система кластеризует эти данные и определяет ключевые темы и лучшие ресурсы для каждого этапа задачи на …
Яндекс патентует метод оценки интересов пользователя путем перевода разнородных событий (поисковые запросы, посещенные сайты, геолокация) в единое векторное пространство. Система использует иерархию нейронных сетей для создания эмбеддингов, отражающих поведение на …
Яндекс патентует метод информирования пользователей о надежности веб-ресурса прямо в поисковой выдаче. Система рассчитывает оценку доверия (Trust Score) для сайта и изменяет внешний вид его фавиконки (например, размер, цвет, прозрачность …
Google может персонализировать выдачу, определяя сайты, которые пользователь предпочитает (Document Bias Set) и которые одновременно являются глобально авторитетными (High Quality Document Set). Если эти авторитетные и предпочитаемые сайты ссылаются на …
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и …
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При …

