Автор: Виктор Репин

Патент описывает инфраструктуру (Mobile User Query Service), позволяющую пользователям отправлять поисковые запросы через SMS или MMS и получать результаты тем же способом. Система классифицирует тип запроса (например, карты, новости, товары) и направляет его в соответствующую поисковую вертикаль, а затем форматирует ответ для доставки на мобильное устройство.

Google использует сложный метод анализа тепловых карт (Heat Maps) для обнаружения совпадений между двумя наборами данных, например, для поиска дубликатов или фрагментов одного видео в другом. Система разбивает потенциальные совпадения на короткие линии, оценивает их интенсивность, плотность и сложность, чтобы отфильтровать шум и ложные срабатывания. Затем она объединяет надежные сегменты и проверяет непрерывность для точной идентификации совпадений, даже если контент был изменен или зашумлен.

Google разрабатывает систему для индексации невзаимозаменяемых токенов (NFT) путем сканирования как непосредственно блокчейнов, так и веб-платформ (маркетплейсов). Патент описывает механизм дедупликации, который определяет, ссылаются ли разные записи индекса на один и тот же цифровой актив. Система анализирует подлинность, используя данные о транзакциях и дате создания, чтобы скорректировать индекс, удаляя или объединяя дубликаты и влияя на отображение NFT в результатах поиска.

Google использует систему для измерения аудитории офлайн-медиа (ТВ, радио). Система отслеживает эфир и ищет резкие всплески («spikes») связанных поисковых запросов. Если запрос резко возрастает сразу после трансляции соответствующего контента, система делает вывод, что пользователи, отправившие запрос, вероятно, смотрели эту трансляцию и сопутствующую рекламу.

Яндекс патентует метод машинного обучения для автоматической трансформации текста. Система анализирует пары «исходная фраза» и «целевая фраза», сравнивая грамматические и семантические признаки слов. На основе этого анализа она генерирует правила (удалить, добавить, изменить форму слова). Это используется для суммаризации текста (например, в сниппетах) и нормализации контента или запросов пользователя.

Google патентует механизм поиска видеоконтента по его аудиосодержанию. Система принимает текстовый запрос, находит точные сегменты в разных видео, где произносятся эти термины (используя транскрипты и таймкоды), и автоматически объединяет эти сегменты в одно новое композитное видео (нарезку или «mashup»). Также описан механизм регенерации результата.

Google оптимизирует поисковую инфраструктуру, разделяя индекс на две части. Основной индекс («Replicated Content») содержит глобально важные документы и копируется во все дата-центры. Дополнительно каждый дата-центр получает уникальный «Regional Content» — документы, соответствующие локальному языку и шаблонам запросов. Это повышает эффективность и релевантность для международных пользователей.

Google использует систему фильтрации для управления межъязыковым поиском (CLIR). Система анализирует язык запроса, язык интерфейса пользователя и его местоположение. Если пользователь вводит запрос на языке, отличном от языка интерфейса, Google предполагает мультиязычность и не переводит запрос, экономя ресурсы. Перевод активируется, если язык запроса совпадает с языком интерфейса, особенно если локальных результатов мало.

Google использует механизм повышения релевантности рекламы для запросов, состоящих исключительно из геокодируемых терминов (например, «Чикаго»). Если текущий запрос является только локацией, система анализирует предыдущий запрос пользователя (например, «рестораны») и подбирает рекламу на основе комбинации обоих запросов. Этот механизм применяется только к рекламе и не влияет на органические результаты поиска.

Google использует механизм для точного определения языка коротких фрагментов текста, таких как посты в социальных сетях. Если сам текст слишком короткий или неоднозначный для анализа, система анализирует социальный граф автора: на каких языках автор писал ранее и на каких языках общаются его контакты. Эти данные, взвешенные по силе социальной связи, позволяют точно классифицировать язык контента.

Патент описывает технологию Google для улучшения релевантности контекстной рекламы. Система сохраняет информацию о предыдущих поисковых запросах пользователя (например, в cookie) и использует ее для выбора рекламы на последующих страницах, которые посещает пользователь, даже если эти страницы уже не содержат контекста исходного поиска.

Google анализирует поисковый запрос и состав выдачи (типы контента, даты), а также историю использования фильтров пользователями. На основе этого анализа система динамически определяет, какие инструменты (например, фильтры по времени, типу контента или инструменты визуализации) наиболее релевантны для пользователя, и отображает их на видном месте в интерфейсе поисковой выдачи.

Google использует систему для автоматического определения того, какой параметр в URL предыдущей посещенной страницы содержит поисковый запрос пользователя. Анализируя разнообразие значений параметров (Diversity Metric), система создает шаблоны для извлечения этих запросов из реферальных URL. Извлеченные данные затем используются для показа релевантной рекламы на текущей странице.

Google использует систему взаимодействия с агентами (Agent Interaction System) для генерации лидов прямо из SERP. Если стандартные результаты не содержат специфической информации (например, цены или наличия), пользователь может отправить запрос зарегистрированным бизнесам («Агентам»). Система использует модель Pay-Per-Lead, ранжируя агентов по ставкам (Bids) и отправляя им лид последовательно (Timeslots): кто платит больше, тот получает доступ раньше.

Яндекс патентует метод выявления вредоносных сайтов путем анализа логов браузера и поисковой статистики. Система ищет сайты, которые автоматически открываются подозрительными программами при запуске браузера (неорганический трафик), но при этом имеют низкую популярность в органическом поиске. Такое несоответствие позволяет классифицировать ресурс как нежелательный и добавить его в черный список.

Патент описывает инфраструктурный механизм безопасности для систем управления контентом (CMS). Система автоматически разделяет статический контент (текст) и динамический контент (исполняемый код, например, JavaScript). Статический контент обслуживается с основного домена, а динамический код выполняется в изолированной «песочнице» на отдельном домене, чтобы предотвратить доступ вредоносного кода к данным основного сайта.

Яндекс патентует механизм ранжирования для рекомендательных систем (например, Яндекс.Дзен). Система балансирует показ персонализированного контента с необходимостью обеспечить гарантированное минимальное число показов для авторов платформы («нативный контент»). Для этого в ранжировании учитываются «Параметр Релевантности» и «Параметр Завершения» (насколько выполнен план по показам). Менее релевантный контент может ранжироваться выше, если ему не хватает показов до выполнения квоты.

Яндекс патентует интерфейсное решение для поисковой выдачи, позволяющее отображать список результатов (SERP) и выбранный пользователем сайт одновременно в режиме разделенного экрана (например, в двух колонках). Это устраняет необходимость использовать кнопку «назад» для возврата к выдаче. Также описан вариант с автоматической загрузкой и показом сайта, занимающего первую позицию.

Яндекс патентует метод для диалоговых систем (например, Алисы), позволяющий выбирать ответы, которые не только логически подходят к запросу, но и соответствуют стилю разговора. Система использует нейросеть (Dual Encoder) для создания векторов контекста и ответа. Финальный выбор основан на комбинации двух оценок: лингвистической схожести текущего диалога с прошлыми диалогами и логико-лингвистической схожести потенциального ответа с текущим контекстом.

Патент Google описывает механизм максимизации дохода от рекламы в поиске. Если стандартных платных объявлений (Type-1) недостаточно или они низкого качества, Google заполняет пустые слоты ссылками на релевантные страницы издателей-партнеров (Type-2), например, участников AdSense. Отбор основан на релевантности и ожидаемом доходе (eCPM) от рекламы на этих страницах.