Яндекс использует машинное обучение, чтобы решить, стоит ли показывать контентные рекомендации (например, Дзен) в Яндекс.Браузере, пока пользователь просматривает веб-сайт. Система анализирует действия пользователя (например, прокрутку) и контент сайта для расчета оценки достоверности. Если контент, вероятно, интересен, система выбирает оптимальный визуальный формат (например, маленький фрагмент или большое окно), чтобы показать рекомендацию, не мешая пользователю.
Автор: Виктор Репин
Патент описывает интерфейс Персональной Панели Знаний (PKP), который появляется в результатах поиска, когда пользователь ищет свое собственное имя. Этот интерфейс позволяет редактировать профильную информацию (например, профессию, работодателя) прямо на странице выдачи, не переходя в настройки аккаунта. Эти данные используются Google для обновления профиля пользователя и могут вызвать немедленное переранжирование персонализированных результатов поиска для устранения неоднозначности сущностей.
Патент описывает механизм унифицированного поиска на устройствах, который одновременно запрашивает данные с локального устройства, из магазинов приложений и веб-поиска. Система использует специфический алгоритм смешивания: сначала показывает фиксированное количество лучших результатов из каждого источника для гарантии разнообразия, а затем объединяет оставшиеся по общему рейтингу.
Яндекс патентует метод для показа результатов поиска (SERP) офлайн. На устройство загружается база популярных запросов. Для экономии памяти элементы SERP (заголовки, URL, сниппеты) дедуплицируются и хранятся один раз, а выдача собирается по шаблонам. Система также использует схожесть выдачи (Contextual SERP Similarity) для определения синонимов и использования общих шаблонов.
Google использует модели последовательностей (например, LSTM, RNN, Attention Models) для анализа истории действий пользователя, учитывая их порядок и время. Система создает эмбеддинг (векторное представление) текущих интересов пользователя на основе этих данных. Этот эмбеддинг интегрируется в существующие модели прогнозирования, позволяя системе точнее определять, в каком контексте пользователь совершит конверсию (например, скачает приложение), и персонализировать рекомендации.
Патент описывает систему для расчета персонализированных и субъективных оценок влияния (Influence Scores) пользователей социальных сетей. Вместо использования единого глобального рейтинга, система позволяет пользователю фильтровать данные по контексту (темы, время, источник) и вручную корректировать оценки влияния других людей на основе личного доверия или офлайн-знаний.
Google использует обработку естественного языка (NLP), чтобы понять запросы о ранее просмотренном контенте (например, «найди рецепт, который я читал на телефоне»). Система ищет ответ в персональных данных пользователя (история браузера, email). Кроме того, патент описывает механизм персонализации, где прошлые взаимодействия пользователя с результатами поиска влияют на его будущую выдачу по схожим темам.
Яндекс патентует метод для персонализации товарных рекомендаций на e-commerce платформе. Система сначала определяет товары, которые часто покупают вместе (оценка взаимной популярности). Затем она ранжирует эти товары для конкретного пользователя, используя модели машинного обучения, которые учитывают его социально-демографические характеристики, историю просмотров и данные об устройстве.
Патент Google, описывающий инфраструктурный механизм для повышения эффективности обработки текста. Вместо анализа всех возможных фраз (n-грамм) система фокусируется на «ключевых словах» (core unigrams), удаляя стоп-слова и применяя стемминг. Это позволяет быстро индексировать и находить значимые фразы в специализированных ресурсах, таких как словари или глоссарии, снижая вычислительную нагрузку.
Патент Google, описывающий внутренний алгоритм систем планирования путешествий (например, Google Flights). Он позволяет эффективно рассчитывать стоимость авиабилетов для разного количества пассажиров в рамках одного поискового запроса, учитывая наличие мест по конкретным кодам бронирования. Это оптимизирует вычислительные ресурсы и ускоряет обновление результатов при изменении числа путешественников.
Google использует двухэтапный процесс для предоставления контекстной информации о том, что отображается на экране устройства (например, в Google Lens или Assistant). Для экономии трафика и ресурсов система сначала анализирует только текст на экране. Только если текста недостаточно для понимания контекста, система запрашивает и анализирует отображаемые изображения.
Патент Google, описывающий интерфейс для поиска и навигации по большим массивам данных, в частности, контенту, собранному носимыми устройствами (например, HMD). Система организует данные в кластеры на основе общих атрибутов (время, местоположение, тип контента) и позволяет пользователю итеративно уточнять поиск, выбирая дополнительные фильтры (фасеты). Это механизм представления результатов, а не ранжирования веб-страниц.
Яндекс патентует механизм синхронизации истории браузера между разными устройствами. Система сохраняет на сервере детальные действия пользователя: введенные запросы, клики по результатам поиска (SERP) и навигацию. Это позволяет пользователю продолжить сессию на другом устройстве с сохранением полного контекста взаимодействия, формируя кросс-девайсную историю поведения.
Google использует внутреннюю систему для проверки своих антиспам-алгоритмов. Система хранит базу «запросов высокого риска» (тех, что ранее приводили к спаму) и периодически отправляет их в поиск. Если спам проходит через фильтры, соответствующий алгоритм помечается как неисправный.
Google агрегирует социальные одобрения (например, +1) для изображений на уровне канонической (репрезентативной) версии, независимо от того, где изображение размещено. При поиске система аннотирует результаты, показывая, кто из социального круга пользователя одобрил картинку, и может использовать эти данные для корректировки ранжирования.
Google использует механизм для генерации поисковых подсказок (Autocomplete), когда пользователь вводит запрос, смешивая разные языки или системы письма. Система создает альтернативные, «неоднозначные» представления ввода, запрашивает подсказки и фильтрует их. Это позволяет корректно интерпретировать сложный ввод (например, сочетание китайских иероглифов, пиньиня и английских слов) и предлагать релевантные варианты.
Патент описывает внутреннюю систему Google для оценки алгоритмов кластеризации, критически важных для Local Search и Knowledge Graph. Система использует «рефери-алгоритм» для измерения двух ключевых ошибок: «Дублирование» (когда одна сущность разделяется на несколько записей) и «Чрезмерная кластеризация» (когда разные сущности ошибочно сливаются в одну).
Патент описывает метод, позволяющий пользователям вводить весь поисковый запрос на одном языке (например, английском), но указывать, что отдельные термины должны быть найдены на других языках. Система автоматически транслитерирует эти термины в алфавит (скрипт) целевого языка перед выполнением поиска. Это упрощает сложный мультиязычный поиск без переключения раскладки клавиатуры.
Патент Google, описывающий дизайн пользовательского интерфейса для сбора отзывов о компаниях и местах (Ratable Entities). Система использует пошаговую «Карточку рейтинга» (Rating Card): сначала запрашивается общая оценка, затем текстовый комментарий (часто с анимацией переворота карточки), и, наконец, оценки по конкретным категориям (например, сервис, цена).
Яндекс патентует метод повышения качества моделей машинного обучения (в частности, деревьев принятия решений, используемых в ранжировании) путем введения случайного шума во время их обучения. Этот механизм регуляризации предотвращает переобучение модели и способствует использованию более разнообразного набора факторов ранжирования, делая итоговую модель более точной и устойчивой.