Яндекс патентует комплекс методов для улучшения представления сущностей (Object Card) на SERP. Система адаптирует состав и порядок блоков в карточке под интент пользователя, позволяет интерактивно фильтровать информацию по аспектам (например, «Биография», «Фильмография»), показывает связанные сущности из разных доменов и добавляет в карточку ссылки на наиболее релевантные органические результаты (Best-Matching Results) для каждого аспекта.
Автор: Виктор Репин
Яндекс патентует механизм для улучшения выдачи в Поиске по Картинкам путем группировки визуально похожих изображений, найденных на одной веб-странице, в «Серии». Эти серии отображаются в выдаче как единый, визуально отличимый блок и ранжируются по релевантности лучшего изображения в группе. Это позволяет пользователям быстрее находить коллекции связанных изображений, такие как пошаговые инструкции или фотогалереи.
Патент Google, описывающий систему автозаполнения для языков, использующих идеограммы (например, иероглифы Кандзи) и фонетический ввод (например, Кана). Система анализирует исторические запросы и учитывает все возможные фонетические варианты написания идеограмм. Это позволяет предсказывать полный идеографический запрос, даже когда пользователь находится в процессе ввода фонетических символов до их преобразования.
Яндекс патентует метод оптимизации поисковой выдачи (SERP), учитывающий физический размер (высоту) и позицию элементов. Система рассчитывает «оценку полезности» для обучения ML-моделей. Если пользователь пропускает большой элемент (например, виджет или расширенный сниппет) и кликает ниже, пропущенный элемент получает штраф, пропорциональный его размеру. Это позволяет Яндексу точнее интерпретировать поведение пользователей и оптимизировать компоновку выдачи.
Яндекс патентует метод автоматической генерации высококачественных негативных обучающих примеров для моделей ранжирования. Система анализирует сессии, где пользователь уточняет запрос (например, с А на Б). Результаты из выдачи А используются как негативные примеры для запроса Б, особенно если время взаимодействия с ними было коротким (менее 30 сек). Это позволяет модели лучше различать релевантность при близких, но разных интентах.
Патент описывает архитектуру клиентского поискового движка (например, Google Desktop), который в реальном времени фиксирует взаимодействия пользователя с контентом (веб-страницы, документы, email). Система индексирует этот контент локально и может генерировать автоматические (имплицитные) запросы на основе текущего контекста пользователя, объединяя локальные и веб-результаты.
Патент описывает инфраструктуру Google для оценки различных стратегий отбора документов в индекс. Система поддерживает актуальный набор данных (Query-to-Resource Mapping), периодически добавляя свежий контент и новые запросы. Это позволяет Google сравнивать разные алгоритмы индексации через A/B тесты и оценку асессорами, чтобы определить, какая стратегия обеспечивает более качественную выдачу.
Google динамически отображает индикаторы (пины) на карте для сущностей, соответствующих наиболее вероятной поисковой подсказке (Autocomplete), пока пользователь еще вводит запрос. Система автоматически предсказывает интент, выполняет фоновый поиск и обновляет карту в реальном времени, учитывая текущую видимую географическую область.
Яндекс разрабатывает систему для глубокого понимания контента (текста и изображений) путем анализа того, как пользователи взаимодействуют с ним. Система создает единое векторное пространство (User Item Space), где поведенческие паттерны (в частности, совместный просмотр в рамках одной сессии), текстовые описания и визуальные характеристики товаров или баннеров напрямую сопоставимы. Это позволяет Яндексу рекомендовать релевантные элементы, основываясь на визуальной схожести или поведенческой близости.
Анализ патента Google, описывающего инфраструктуру для интеграции платного контента (For-Pay Content) в поисковую выдачу. Система предлагает использовать отдельные алгоритмы ранжирования для платного контента, учитывающие цену, уникальность, отзывы пользователей и историю споров/возвратов. Также описан автоматизированный механизм управления репутацией и разрешения споров.
Яндекс патентует механизм выбора обогащенного ответа (Rich Suggest) в поисковых подсказках. Система агрегирует вероятность перехода на конкретный ресурс по всем релевантным подсказкам, связанным с вводимым префиксом. Если совокупный вес (Cumulative Resource Weight) одного ресурса доминирует, Яндекс показывает его контент (карточку объекта) прямо в выпадающем списке еще до отправки запроса.
Google использует механизм для повышения релевантности и разнообразия рекламных объявлений при неоднозначных запросах. Система анализирует контексты (темы) в результатах органического поиска и использует их как эталон. Затем она корректирует ранжирование рекламы так, чтобы оно лучше соответствовало распределению тем в органической выдаче, обеспечивая диверсификацию.
Яндекс патентует метод повышения точности обучающих данных, получаемых через краудсорсинг (например, Толока). Система рассчитывает «Метрику Согласованности» — вероятность того, что большинство асессоров дали правильный ответ, учитывая их персональные показатели качества. Для будущих задач система формирует группы асессоров так, чтобы максимизировать эту метрику, итеративно исключая тех, кто не согласен с большинством. Это обеспечивает высокое качество Ground Truth для обучения ключевых алгоритмов поиска.
Яндекс патентует метод, который вводит контекст самой поисковой выдачи как фактор ранжирования. Система рассчитывает векторную близость (D2D proximity) между документами, попавшими в топ. Измеряется, насколько документ похож на «средний» документ выдачи (Reference Vector) или на самый релевантный результат. Эти значения используются как признаки ранжирования, позволяя идентифицировать аутлаеров (outliers) и дополнять недостающие данные о документах.
Google патентует систему организации результатов поиска в иерархию категорий (фасетную навигацию). Пользователи могут модифицировать эту иерархию: добавлять/удалять категории, голосовать за их полезность и связывать страницы с темами. Система сохраняет эти изменения для персонализации будущих результатов пользователя и агрегирует обратную связь для глобального улучшения категоризации.
Яндекс использует Transfer Learning для решения проблемы «холодного старта» в рекомендательных системах (например, Дзен). Когда у нового контента мало взаимодействий, система не может применить коллаборативную фильтрацию. Патент описывает, как Яндекс обучает модель предсказывать коллаборативные эмбеддинги (поведенческие векторные представления), используя только текст статьи. Это позволяет рекомендовать новый контент так, как если бы у него уже была богатая история взаимодействий.
Яндекс патентует метод улучшения ранжирования, который анализирует, насколько семантически похожи друг на друга документы, уже отобранные в качестве кандидатов. Система вычисляет «базисный вектор» (смысловой центр выдачи) и использует близость каждого документа к этому центру как дополнительный фактор ранжирования. Также метод позволяет переносить признаки (факторы ранжирования) с одного документа на другой, если они семантически очень близки.
Яндекс патентует систему для борьбы с накруткой отзывов. Система строит граф связей между организациями на основе общих рецензентов. Если группа организаций тесно связана (образует «клику») и распределение их оценок аномально (например, только максимальные баллы), система идентифицирует это как скоординированную атаку, удаляет фейковые отзывы и помечает аккаунты нарушителей.
Анализ патента Google, описывающего систему таргетинга рекламы для локальных запросов. Когда пользователь ищет конкретный локальный бизнес, система определяет его категории на основе исторических данных, включая предыдущие рекламные кампании. Эти категории используются как дополнительные ключевые слова для показа релевантной локальной рекламы, которая также ранжируется по расстоянию.
Яндекс патентует механизм для повышения качества рекомендаций (например, в Дзен) путем выявления и пессимизации кликбейта. Система сравнивает популярность источника контента внутри рекомендательной платформы с его популярностью в интернете в целом. Если контент аномально популярен внутри системы, но малоизвестен в Вебе, он признается потенциальным кликбейтом, и его рейтинг агрессивно понижается.