Автор: Виктор Репин

Google использует механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность пользователя и отслеживает появление релевантного контента. Как только авторитетный ответ становится доступен (например, обновляется Knowledge Graph), система автономно предоставляет его пользователю через уведомление или в рамках последующего, даже не связанного по теме, диалога с Ассистентом.

Патент Google описывает систему, которая одновременно выбирает и ранжирует как основные элементы (например, сущности, продукты), так и их атрибуты для показа в структурированных результатах (карусели, панели знаний). Вместо последовательного выбора система оптимизирует всю структуру целиком, используя машинное обучение для моделирования зависимостей между элементами и атрибутами, чтобы максимизировать общую релевантность, разнообразие или согласованность выдачи.

Google патентует систему кросс-языкового поиска, которая заранее переводит документы и ссылающийся на них анкорный текст. Для повышения точности перевода используется контекстно-зависимая модель, анализирующая анкорный текст входящих ссылок и структуру сайта. Это позволяет пользователям находить релевантный контент независимо от языка оригинала.

Яндекс патентует метод борьбы с накруткой поведенческих факторов (ПФ). Система анализирует историю посещений и строит граф связей между сайтами. Если пользователи массово посещают группу сайтов, которые не связаны ни тематически, ни общими интересами аудитории, система маркирует эти посещения как аномальные (накрутку), а сайты пессимизирует в выдаче.

Google может динамически изменять сниппеты (заголовки и описания) в результатах поиска, чтобы выделить ту часть контента на странице, которая соответствует долгосрочным интересам пользователя или его недавней истории поиска. Система генерирует альтернативные сниппеты, взвешивая релевантность текущему запросу и персональным интересам, чтобы повысить информативность выдачи и CTR.

Яндекс патентует систему для выравнивания качества сайта и объема его трафика. Система рассчитывает «Сырую оценку качества» на основе поведенческих метрик и сравнивает ее с «Эталонной оценкой», ожидаемой для данного уровня посещаемости. При обнаружении расхождения система корректирует ранжирование сайта, чтобы привести будущий трафик в соответствие с качеством ресурса. Патент содержит противоречивые описания направления этой корректировки.

Google использует систему для глубокого концептуального анализа видео. Она определяет объекты, их взаимосвязи (через Графы Знаний) и визуальную значимость этих концепций в кадре (Presence Share). На основе этого формируется Concept Index. Видео кластеризуются по концептуальному сходству. Система анализирует пользовательское взаимодействие с кластером и использует эти инсайты для оптимизации распространения (ранжирования и рекомендаций) всех видео в кластере, включая новые.

Google анализирует историю поиска и посещенных сайтов пользователя для прогнозирования его будущих географических перемещений или интересов. Система заранее извлекает и подготавливает контент (например, рекламу, данные карт, обзоры), связанный с этими местами, чтобы показать его без задержек, когда пользователь запросит информацию или окажется поблизости, или даже для использования офлайн.

Google патентует систему, которая индексирует пользовательский контент (UGC) и позволяет искать по нему сразу для нескольких сущностей (отели, товары). Результаты отображаются в сравнительном интерфейсе с релевантными сниппетами. Система также использует содержание UGC для фильтрации результатов поиска и, что критически важно, как сигнал ранжирования для связанных веб-страниц в основном поиске.

Google использует систему для оптимизации контента на портальных страницах (например, Discover или News). Система рассчитывает «полезность» каждой статьи, комбинируя вероятность клика (CTR) и ожидаемый доход (RPV) или время вовлечения на целевой странице. Цель – максимизировать доход при минимальной потере кликабельности, персонализируя ленту для каждого пользователя.

Google использует систему для автоматического извлечения структурированных данных (пар атрибут-значение) непосредственно из веб-страниц, ранжирующихся в топе выдачи. Система проверяет достоверность фактов с помощью механизмов консенсуса (Thresholding) и усиления (Reinforcement), а затем отображает их в отдельном блоке (например, Панели Знаний) на SERP вместе со ссылками на источники.

Этот патент описывает фундаментальную архитектуру мобильного визуального поиска Google (например, Google Lens). Он детализирует, как изображение с телефона анализируется несколькими специализированными движками (объекты, текст, лица). Критически важно, что система использует контекст, такой как время суток и местоположение, для повышения точности распознавания и учитывает различные ракурсы и условия освещения перед возвратом релевантной информации.

Яндекс патентует метод борьбы с накруткой поведенческих факторов (ПФ). Система строит граф посещений сайтов и ищет группы сайтов, которые посещаются одними и теми же пользователями, но не имеют естественной связи (ни тематической, ни поведенческой). Такие паттерны считаются аномальными (накруткой), и эти данные исключаются из ранжирования, а сайты могут быть пессимизированы.

Анализ патента Google, описывающего систему кросс-языкового поиска (CLIR). Система определяет, стоит ли автоматически переводить запрос пользователя на другой язык для поиска более релевантных результатов. Ключевыми факторами являются наличие в запросе локальных или иностранных сущностей, уверенность в качестве машинного перевода и популярность (частота) запроса в целевом языке.

Google использует систему для мониторинга живых потоков данных (социальные сети, поисковые запросы) для обнаружения развивающихся событий. Для этих событий создаются временные «Event-Specific Provisional Knowledge Graphs», которые агрегируют информацию в реальном времени до того, как она будет проверена и добавлена в основной Граф Знаний. Это позволяет поиску быстро предоставлять информацию о последних новостях.

Google использует систему для сбора и обновления информации о точках интереса (POI), таких как локальный бизнес. Система принимает изображения (фотографии интерьера, визитки, вывески), извлекает из них текст с помощью OCR (название, телефон, адрес) и анализирует визуальное содержимое для определения типа бизнеса и его атрибутов. Эти данные используются для создания новых или обновления существующих записей в базе данных Google (например, в Google Maps).

Google использует систему unsupervised learning для распознавания объектов внутри видео и изображений в масштабе. Система использует существующие метаданные (теги, описания) как исходные обучающие данные, а затем итеративно уточняет визуальные модели с помощью Dimensionality Reduction и Consistency Learning. Это позволяет Google понимать визуальное содержание контента, автоматически генерировать теги и проверять точность пользовательских метаданных для улучшения ранжирования в поиске по видео и картинкам.

Google использует модель с двумя отдельными нейронными сетями (Two-Tower Model) для понимания семантической релевантности между запросами и контентом. Одна сеть обрабатывает запрос, другая — контент, преобразуя их в векторы (embeddings). Релевантность определяется близостью этих векторов, а не совпадением ключевых слов. Эта архитектура позволяет Google предварительно вычислять векторы для всего контента во время индексации, обеспечивая быстрый семантический поиск в реальном времени.

Google использует механизм для динамического понимания акронимов в запросах. Система анализирует заголовки и сниппеты первичных результатов поиска, чтобы найти часто встречающиеся расшифровки акронима. Если найдена доминирующая расшифровка, запрос автоматически переписывается для уточнения выдачи и повышения релевантности.

Google анализирует запросы на наличие названий брендов, новостных источников или других сущностей. Если название уникально (например, «MSNBC»), система может автоматически переписать запрос, чтобы ограничить поиск этой сущностью. Если название является обычным словом (например, «Time» или «Apple»), система выполняет исходный поиск, но предлагает ссылку на ограниченный поиск, чтобы устранить неоднозначность интента.