Яндекс патентует метод для динамической настройки пропорций различных типов контента (например, видео, статьи, нативный контент) в персонализированных рекомендательных лентах. Система сравнивает, как конкретный пользователь взаимодействует (CTR, время просмотра) с каждым типом контента относительно среднего пользователя. Если пользователь активнее потребляет определенный формат, система увеличивает его долю в ленте в рамках заданных ограничений.
Автор: Виктор Репин
Google использует механизм для уточнения поисковых подсказок после того, как пользователь покинул SERP. Система генерирует персонализированные предложения на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту текущей страницы. Этот механизм также ограничивает показ подсказок, если пользователь слишком глубоко ушел по ссылкам от исходного результата.
Яндекс патентует механизм автоматического перенаправления пользователя на наиболее релевантный результат, минуя SERP. Система активируется, если топ-1 результат значительно превосходит остальные по релевантности, и если анализ URL, заголовка и исторических кликов подтверждает высокую вероятность того, что этот результат полностью удовлетворит запрос.
Google использует механизм для улучшения покрытия и качества подсказок в Autocomplete. Система идентифицирует описательные термины (прилагательные, наречия) вводимом пользователем запросе, временно удаляет их для поиска популярных базовых запросов, а затем вставляет описательные термины обратно. Это позволяет предлагать пользователям релевантные длинные подсказки, даже если они никогда ранее не вводились именно в такой формулировке.
Анализ патента Google, описывающего базовую архитектуру для работы устанавливаемых веб-приложений (PWA). Патент детализирует, как браузер использует Манифест для упаковки сайта в устанавливаемый объект, управляет локальным хранилищем для офлайн-доступа и строго контролирует разрешения в рамках определенного домена источника (Origin Domain).
Яндекс патентует метод оценки важности предложений в тексте для создания резюме (сниппетов) и определения тематики документа без использования внешних словарей. Система разбивает текст на «концептуальные фразы» и оценивает их значимость на основе двух метрик: семантической связи (CIR – насколько фразы пересекаются по словам) и контекстной связи (CDR – как часто фразы встречаются вместе в предложениях). Предложения, содержащие наиболее важные комбинации фраз, используются для генерации сниппета.
Патент Google, описывающий механизм ранжирования диплинков для контента, который доступен в нескольких нативных приложениях (например, YouTube и YouTube Kids). Система создает список предпочтений, и при клике на ссылку устройство пользователя автоматически открывает наиболее предпочтительное из установленных приложений, улучшая пользовательский опыт.
Патент описывает технику Multiscale Quantization (MSQ), используемую Google для повышения скорости и точности поиска по сходству (векторного поиска). MSQ решает проблему снижения точности стандартных методов сжатия векторов (эмбеддингов), когда векторы имеют разную длину (норму). Разделяя вектор на направление и масштаб, Google может эффективнее хранить и быстрее находить семантически похожий контент в своем индексе.
Яндекс патентует методы генерации сложных (hard negatives) обучающих примеров для улучшения точности ранжирования. Система использует граф связей между запросами и документами, а также анализ позиций общих документов в выдаче, чтобы найти документы, которые тематически связаны с запросом, но нерелевантны ему. Эти примеры помогают обучить модели (MLA) лучше различать тонкие различия в интенте пользователя.
Анализ патента Google, описывающего технологию автоматического поиска связанного контента внутри одного веб-сайта. Система анализирует текст просматриваемой страницы, извлекает и взвешивает ключевые термины на основе их уникальности, а затем использует их как поисковый запрос (Query by Example) для нахождения тематически похожих документов на том же сайте. Используются классические формулы информационного поиска (TF-IDF/BM25).
Яндекс патентует механизм пропуска стандартной страницы выдачи (SERP) для ускорения поиска. Если система уверена, что Топ-1 документ полностью удовлетворяет запрос, она может сразу перенаправить пользователя на этот сайт. Решение принимается на основе анализа отрыва лидера (Relevancy Differential), а также соответствия Title, URL и исторического CTR (Likelihood Parameter) запросу пользователя.
Яндекс патентует систему рекомендаций медиаконтента (например, видео), которая определяет схожесть объектов, комбинируя совпадение тегов (тематика, жанр) с поведенческими метриками (время просмотра, CTR). Запатентованная формула использует сумму поведенческих показателей обоих объектов как множитель для количества совпадающих тегов, приоритизируя тематически схожий и высоко вовлекающий контент.
Яндекс патентует метод обогащения поисковой выдачи путем анализа HTML-структуры веб-страниц. Система автоматически обнаруживает повторяющиеся шаблоны кода (например, карточки товаров или объявления) и извлекает из них конкретные данные (цены, изображения, заголовки). Эти данные отображаются прямо на странице результатов поиска, заменяя стандартное описание, и могут использоваться для фильтрации выдачи.
Яндекс патентует систему генерации контекстно-зависимых результатов поиска, основанную на «Сценариях» (например, командировка, переезд) и местоположении пользователя. Система агрегирует релевантные «Объекты интереса» (POI), группирует их по типам и упорядочивает на основе приоритета (важности) в рамках сценария, а не только расстояния. Цель — формировать структурированную выдачу для решения конкретной жизненной задачи.
Яндекс патентует метод анализа структуры веб-страниц для выявления «повторяющихся шаблонов» (например, карточек товаров или объявлений). Система автоматически извлекает «неповторяющиеся сегменты данных» (цены, изображения, заголовки) из этих шаблонов и отображает их непосредственно в сниппете, часто заменяя стандартное описание и добавляя интерактивные фильтры на SERP.
Google использует механизм для анализа содержания топовых органических результатов поиска с целью извлечения «коррелирующих сущностей» (часто встречающихся терминов и фраз). Эти сущности позволяют системе расширить понимание контекста исходного запроса. Данные используются в первую очередь для подбора релевантной рекламы, особенно если по исходному запросу объявлений недостаточно.
Google использует генеративные модели для понимания семантики текста, группируя связанные слова в «кластеры» (концепции). Этот патент описывает механизм оптимизации этих моделей во время обучения. Система автоматически удаляет кластеры, которые являются слишком маленькими (имеют мало связей) или редко используются. Это позволяет бороться с переобучением (overfitting) и фокусироваться на широких, статистически значимых концепциях.
Яндекс патентует метод выявления вредоносных или нежелательных сайтов путем анализа логов браузера и истории поиска. Система отслеживает подозрительные автоматические открытия сайтов (не инициированные пользователем) и сравнивает их частоту с популярностью сайта в органическом поиске. Если сайт часто открывается автоматически, но редко появляется в поиске или имеет низкий органический трафик, он классифицируется как нежелательный и добавляется в черный список.
Google использует механизм для автоматического запуска нативных приложений в ответ на определенные поисковые запросы. Если система определяет, что запрос имеет четкое намерение использовать конкретное приложение («Focus Intent») и это приложение значительно превосходит другие результаты в ранжировании, Google может запустить его напрямую, минуя страницу результатов поиска (SERP). Система также учитывает обратную связь от пользователей, прекращая автозапуск, если пользователи часто сразу закрывают приложение.
Google использует систему для проверки релевантности предлагаемых ключевых слов (например, в Google Ads), анализируя контент конкретного веб-сайта. Система генерирует семантически связанные термины, но затем проверяет, как часто они фактически встречаются вместе с исходным словом на этом сайте. Это позволяет автоматически отфильтровать нерелевантные предложения и разрешить семантическую неоднозначность, адаптируя подсказки к контексту домена.