Яндекс патентует механизм, который определяет, когда результат вертикального поиска (Колдунщик или Виджет) настолько релевантен запросу, что стандартные органические результаты можно полностью исключить. Система рассчитывает степень уверенности на основе позиции виджета, …
Разборы патентов
Яндекс патентует метод автоматического определения важности (веса) различных поведенческих сигналов (клики, dwell time, пропуски). Система создает и оптимизирует «Целевую функцию», которая оценивает релевантность на основе этих сигналов. Затем эта функция …
Google анализирует набор документов, связанных с целевой страницей (например, другие страницы того же сайта или статьи того же автора). Система вычисляет агрегированную оценку для этого набора, отражающую общую тематическую релевантность …
Яндекс патентует технологию автоматической идентификации ключевых подразделов сайта. Система определяет эти разделы независимо от владельца ресурса, используя критерии популярности и удобства использования. Затем она предоставляет пользователю прямые ссылки на эти …
Патент описывает, как поисковая система магазина приложений (например, Google Play) улучшает свои результаты, используя данные из интернета. Система модифицирует исходный запрос пользователя, отправляет его в веб-поиск, анализирует найденные веб-страницы на …
Яндекс патентует метод идентификации оригинального источника информации среди множества перепечаток. Система кластеризует похожие документы по теме, извлекает исходящие ссылки и использует машинное обучение для определения первоисточника. Ключевые факторы анализа включают …
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». …
Яндекс патентует метод улучшения ранжирования для новых или редких запросов. Система использует модель (Second MLA), обученную предсказывать поведенческую схожесть запросов на основе их текста. Для нового запроса находятся похожие прошлые …
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая …
Патент Яндекса описывает многоэтапный процесс обучения моделей ранжирования (вероятно, трансформеров типа YATI). Система сначала обучается на огромном массиве данных о кликах пользователей, а затем дообучается на меньшем, но более качественном …
Патент Яндекса, лежащий в основе алгоритма CatBoost, описывает методы обработки категориальных признаков (таких как URL, домены, имена авторов) в машинном обучении. Система преобразует эти признаки в числа, используя упорядоченную статистику …
Яндекс патентует метод улучшения ранжирования для новых или редких запросов (проблема «холодного старта»). Система обучается предсказывать поведенческую схожесть запросов на основе их текста. Для нового запроса система находит похожие прошлые …
Google разрабатывает систему сбора пользовательского контента (UGC) о веб-страницах, называемого «Link Notes». Система использует генеративный ИИ для создания персонализированных подсказок, мотивируя пользователей оставлять качественные отзывы на основе их экспертизы. Эти …
Яндекс патентует метод обогащения ранжирования за счет использования похожих прошлых запросов. Система определяет схожесть запросов на основе пересечения результатов и поведенческих данных (для известных запросов) или на основе текстовой близости …
Google использует модель Марковских цепей (Transition Matrix) для количественной оценки силы взаимосвязей между поисковыми сущностями (запросы, документы, сессии, время) на основе истории поиска. Эта инфраструктура применяется для выявления и нейтрализации …
Google использует агрегированные данные о том, как пользователи взаимодействуют с контентом внутри документа. Система отслеживает время, проведенное на определенных разделах, и частоту добавления в закладки. Эта информация используется для определения …
Google анализирует запросы, введенные в адресную строку браузера. Если система с высокой степенью уверенности определяет один «очень релевантный» результат, основываясь на высоком историческом CTR и значительном отрыве его оценки релевантности …
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если …
Яндекс патентует двухэтапный метод обучения трансформерных моделей (типа BERT/YATI) для предсказания вероятности клика конкретного пользователя на документ. Сначала модель предварительно обучается на широком наборе данных (все показанные результаты), а затем …
Патент (Hewlett-Packard) описывает гибридный метод кластеризации документов. Система анализирует логи сессий, чтобы определить, какие документы просматриваются вместе (co-visitation). Эти документы объединяются в «Супердокументы». Затем система проводит контентный анализ, используя эти …

