Автор: Виктор Репин

Google группирует поисковые запросы в Image Search, основываясь на том, насколько визуально похожи их результаты (анализ на уровне пикселей). Для каждого такого кластера («визуального концепта») система создает отдельную функцию ранжирования (Distance Function), которая определяет, какие визуальные характеристики (цвет, форма, текстура) наиболее важны для этой группы запросов.

Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.

Патент Google описывает, как системы распознавания речи (ASR) автоматически адаптируются к новым словам и трендам. Система анализирует частотность слов в текстовых поисковых запросах и изучает произношение из медиа с субтитрами. Это позволяет Google быстро реагировать на новости и сленг, повышая точность голосового поиска как на сервере, так и локально на устройствах пользователей.

Google использует автоматизированную систему для определения различных значений (senses) слова путем анализа и кластеризации его гиперонимов (более общих понятий), извлеченных из интернета. При обработке запроса или текста система устраняет неоднозначность, сравнивая кластеры гиперонимов для каждого значения слова с контекстом, чтобы выбрать наиболее подходящий смысл и улучшить результаты поиска.

Google использует механизм для защиты своих антиспам-алгоритмов от анализа спамерами, особенно в локальном поиске. К рассчитанной оценке спама (Spam Score) добавляется контролируемый случайный шум. Это делает результаты применения санкций (блокировка или понижение) непредсказуемыми, усложняя спамерам понимание того, какие именно факторы и пороги использует Google.

Google использует систему для связи медиаконтента (например, видео на YouTube) со структурированными данными из Базы Знаний (Knowledge Graph). Описывается, как создаются ассоциации между видео и сущностями путем анализа метаданных, что позволяет пользователям искать контент по идентификаторам сущностей и автоматически тегировать медиафайлы, улучшая их обнаруживаемость.

Патент Google описывает архитектуру многоэтапного (каскадного) ранжирования. Система поэтапно применяет разные группы факторов (популярность, близость терминов, атрибуты текста, контекст) для повышения эффективности. Ключевой особенностью является двухпроходное выполнение запроса: система анализирует результаты первого прохода, автоматически расширяет запрос связанными терминами (Relevance Feedback) и выполняет его повторно для повышения релевантности.

Google анализирует иерархию заголовков (H1-Hn) документа, чтобы понять контекст потенциального ответа. Система оценивает, насколько заголовки соответствуют запросу, какова глубина расположения отрывка и насколько полно он охватывает свой исходный текстовый блок (Passage Coverage Ratio). Эти контекстные сигналы используются для корректировки оценки релевантности и выбора наилучшего фрагмента (Featured Snippet) для показа в выдаче.

Google использует систему машинного обучения для анализа контекста и поведения пользователей, чтобы предсказать, какие запросы будут повторяться в будущем. Для этих «повторяемых запросов» система упрощает ввод через ярлыки или меню. При повторном выполнении Google может намеренно изменять выдачу, предоставляя динамические результаты, и приоритизировать сканирование связанного контента.

Яндекс патентует метод для оптимизации проверки веб-ресурсов на вредоносный контент. Система строит граф связей и присваивает ресурсам «Оценку Доверия» (Trust Score), основанную на исторических данных о ранжировании и поведении пользователей. Ресурсы, на которые ссылаются наименее доверенные сайты, проверяются в первую очередь. Для определения приоритета используется алгоритм поиска кратчайшего пути.

Google использует механизм для организации поисковой выдачи по широким запросам. Если результатов слишком много или активируются сигналы персонализации, система динамически группирует результаты по категориям (например, по типу, цене или характеристикам). Это помогает пользователям быстрее сориентироваться и уточнить свой интент, выбирая наиболее релевантную категорию.

Google использует систему для классификации изображений, объединяющую пиксельные данные, метаданные (время, место) и контекстуальную информацию (включая личные данные пользователя или контекст веб-страницы). Патент раскрывает формулу ранжирования изображений, основанную на уверенности в классификации, релевантности запросу, а также качестве и популярности изображения.

Google использует механизм для улучшения поисковой выдачи в E-commerce, анализируя распределение цен для различения основных продуктов и их аксессуаров. Если система определяет, что пользователь ищет основной продукт, результаты, классифицированные как аксессуары (часто из-за значительно более низкой цены), понижаются в ранжировании. Это предотвращает зашумление выдачи сопутствующими товарами.

Google автоматизирует создание наборов «эталонных запросов» (ground truth) для категоризации пользовательского интента, используя большие языковые модели (LLM). Система генерирует разнообразные запросы, представляющие интерес к определенной категории (например, услуге), а затем использует векторные эмбеддинги для сопоставления новых запросов с этими эталонами, что повышает точность выбора релевантного контента и рекламы.

Анализ патента Google, описывающего гибридную систему поиска по изображению. Система обучается понимать визуальное сходство на основе оценок людей (Similarity Feedback). Она уточняет семантику изображения, анализируя текстовые метки визуально похожих картинок (High Confidence Labels), и применяет сложные фильтры (Co-distance, Dominant Characteristic) для обеспечения визуальной однородности финальных результатов.

Анализ заявки на патент (Google является одним из заявителей), описывающей гибридную систему машинного обучения (SSRL) для улучшения рассуждений в Графе Знаний (KGR). Система сочетает Supervised Learning (SL) для обеспечения широкого охвата всех возможных правильных путей между сущностями и Reinforcement Learning (RL) для быстрого и эффективного выбора оптимального ответа. Это позволяет Google находить более точные и полные ответы на сложные вопросы, масштабируя процесс на большие объемы данных.

Google использует механизм для анализа контента, активно отображаемого на экране устройства (веб-страницы, приложения, чаты). По общему триггеру (например, долгое нажатие или жест) система идентифицирует ключевые сущности только в видимой области. Она определяет их важность на основе визуального представления (размер, цвет, позиция) и типа контента, причем логика определения важности адаптируется (например, в чате приоритет у недавних сообщений внизу экрана).

Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.

Патент Google, раскрывающий механизмы перехода от ключевых слов к семантическим «концептам» для повышения точности таргетинга рекламы. Система сравнивает векторные или графовые представления концептов рекламы и запроса для разрешения лексической неоднозначности. Также используется обратная связь по эффективности (CTR/конверсии) для корректировки релевантности концептов, демонстрируя базовые принципы семантического анализа Google.

Патент описывает, как Google Assistant создает и использует «Правила параметров источника» (Source Parameter Rules), чтобы отдавать приоритет контенту из источников, указанных пользователем. Система проверяет качество и актуальность этих источников и может предложить альтернативы, если предпочтительный источник устарел или недоступен, уведомляя пользователя о соблюдении или нарушении его предпочтений.