Автор: Виктор Репин

2019 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google использует диалоги с Ассистентом и поведение пользователей для глубокого понимания контекста изображений

Google использует естественный язык (например, разговоры с Ассистентом) для идентификации значимых событий. Система анализирует фотографии, сделанные в этот период, и использует поведенческие сигналы (время просмотра, редактирование, пересылка) и распознавание объектов, чтобы определить, какие фото связаны с событием. Эти данные используются для аннотирования изображений и обучения ML-моделей.

2015 Google Shopping Индексация Патенты Google Семантика и интент

Как Google использует иерархию запросов для точной идентификации сущностей (товаров, статей), даже при наличии ошибок в данных

Google использует метод «Поиска известного элемента» для надежной идентификации конкретных сущностей (например, научных статей или товаров), даже если исходный запрос содержит ошибки. Система создает несколько запросов с разными комбинациями атрибутов и выполняет их иерархически — от самых точных (например, по DOI/GTIN) к менее точным (по названию/автору). Это позволяет находить нужный объект, игнорируя ошибки в отдельных атрибутах, и используется для сверки данных и каноникализации сущностей.

2008 Мультиязычность Патенты Google Семантика и интент

Как Google использует машинный перевод, FAQ и логи поиска для определения контекстуальных синонимов и расширения запросов

Google использует технологию статистического машинного перевода (SMT) для генерации синонимов и перефразирования запросов на одном языке. Система обучается на уникальных наборах данных: парах «Вопрос-Ответ» из FAQ, парах «Запрос-Сниппет» из логов поиска и кликов, а также через языковое посредничество (Pivoting). Это позволяет Google понимать контекст запроса и выбирать наиболее релевантные синонимы для его расширения, решая проблему многозначности слов.

2011 SERP Мультимедиа Патенты Google Семантика и интент

Как Google распространяет метки между изображениями, используя не визуальные данные (время, место, контекст)

Google улучшает понимание содержания изображений, распространяя семантические метки (labels) между ними. Если два изображения связаны не визуальными признаками (сняты в одно время, в одном месте, или сгруппированы в один альбом), система переносит метки с одного изображения на другое. Это позволяет точнее определять контекст и улучшает ранжирование в поиске по картинкам.

2023 SERP Мультимедиа Патенты Google Семантика и интент

Как Google использует ИИ-оркестратор (Router Model) для анализа конкретных фрагментов видео и ответов на запросы пользователей

Google разрабатывает систему мультимодального поиска по видео. Когда пользователь задает вопрос во время просмотра, специальная ИИ-модель (Router Model) анализирует запрос и контекст (таймкод), выделяет релевантный видеоклип и определяет, какая специализированная система (например, VLM или Поиск) должна его обработать. Это позволяет давать точные ответы на гранулярные вопросы без необходимости обрабатывать весь видеофайл.

2007 Ashutosh Garg Kedar Dhamdhere Патенты Google Персонализация Поведенческие сигналы

Как Google использует контекст текущей поисковой сессии для умного исправления ошибок в запросах

Google анализирует предыдущие запросы пользователя в рамках текущей сессии, чтобы понять контекст. Если текущий запрос содержит ошибку (опечатку или неподходящее по смыслу слово), система предлагает исправление, которое соответствует этому контексту, отфильтровывая технически правильные, но семантически неверные варианты.

2011 EEAT и качество Google Shopping Индексация Патенты Google

Как Google оценивает надежность интернет-магазинов, сверяя обещанные и фактические сроки доставки

Google использует автоматизированную систему (Merchant Trustworthiness Evaluator) для оценки надежности продавцов. Система собирает обещанные сроки доставки в момент заказа (например, через пиксель конверсии) и сверяет их с фактическими данными, полученными от курьерских служб по трек-номеру. На основе точности выполнения обязательств и с учетом антифрод-проверок формируется рейтинг доверия магазина.

2010 Knowledge Graph Патенты Google Семантика и интент

Как Google автоматически извлекает и проверяет Сущности и их Классы из текста для построения Базы Знаний

Google использует этот метод для автоматического построения и уточнения Базы Знаний (Knowledge Graph). Система извлекает пары «Сущность-Класс» (например, «Джордж Буш» — «президенты») из текста с помощью шаблонов, а затем проверяет и фильтрует эти данные, используя кластеризацию по контекстному сходству (Distributional Similarity) и статистические фильтры (J и K). Это повышает точность извлеченных данных, которые затем используются для улучшения понимания запросов и ранжирования.

2013 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google понимает контекст и неоднозначность в последовательных голосовых запросах

Google анализирует акустические сигналы (например, ударение) и грамматическую структуру в последующих голосовых запросах, чтобы понять, к чему относятся местоимения (например, «он», «это») или неоднозначные фразы из предыдущих поисковых сессий. Это позволяет системе поддерживать контекст разговора, внутренне переписывать неоднозначный запрос и предоставлять точные ответы.

2017 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google предсказывает поисковые запросы на основе контекста пользователя в реальном времени (например, в чате или клавиатуре)

Google использует механизм для интеграции поиска в сторонние приложения (например, клавиатуры или мессенджеры). Система анализирует текущий контекст пользователя (переписку, местоположение, время) и автоматически предлагает релевантные поисковые запросы из предопределенного набора. Это позволяет пользователям выполнять поиск и делиться результатами, не вводя текст запроса и не покидая текущее приложение.

2024 SERP Патенты Google Семантика и интент

Как Google моделирует неопределенность и широту темы, используя вероятностные распределения вместо векторных точек

Google использует метод для улучшения dense retrieval, представляя запросы и документы не как отдельные точки (векторы) в семантическом пространстве, а как многомерные вероятностные распределения (области). Это позволяет системе учитывать неопределенность в понимании контента и широту охвата темы, повышая точность поиска за счет сравнения этих распределений.

2019 Google Shopping Мультимедиа Патенты Google Семантика и интент

Как Google обучает автоматизированных ассистентов визуально понимать и использовать сайты для выполнения задач без API

Google разрабатывает технологию, позволяющую автоматизированным ассистентам (например, Google Assistant) самостоятельно взаимодействовать с веб-сайтами для выполнения транзакций (покупки, бронирования). Система анализирует визуальный и геометрический контекст элементов (кнопки, формы), создавая устойчивые идентификаторы (UIM), и использует машинное обучение (Reinforcement Learning) для навигации по сайту от имени пользователя.

2005 SERP Индексация Патенты Google Семантика и интент

Как Google определяет семантическую связь запросов через сравнение схожести поисковой выдачи (SERP Overlap)

Патент (Yahoo) описывает метод определения связи между разными поисковыми запросами. Если два запроса возвращают схожий набор органических результатов (URL), система считает их семантически связанными. Этот механизм используется для показа релевантной рекламы по связанным запросам и оценки стоимости ключевых слов, а также критически важен для понимания интента пользователя в органическом поиске.

2005 Knowledge Graph Индексация Патенты Google Семантика и интент

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах

Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.

2023 SERP Патенты Google Персонализация Семантика и интент

Как Google использует LLM и Few-Shot Learning (PROMPTAGATOR) для быстрого обучения специализированных поисковых моделей без больших датасетов

Google патентует метод (PROMPTAGATOR) для быстрого обучения специализированных моделей поиска новым задачам или нишам. Используя всего несколько примеров (Few-Shot Learning) в качестве промптов, Большая Языковая Модель (LLM) генерирует обширный набор синтетических данных (пары запрос-документ). Затем на этих данных обучается эффективная модель поиска (Dual-Encoder), позволяя системе быстро адаптироваться к специфическим поисковым интентам без необходимости ручной разметки данных.

2009 Антиспам Мультимедиа Патенты Google

Как Google создает устойчивые к изменениям «цифровые отпечатки» для обнаружения дубликатов изображений и видео

Google использует метод надежного хеширования для идентификации почти дублирующихся медиафайлов (изображений, видео, аудио), даже если они были обрезаны или изменены. Система генерирует устойчивую гистограмму признаков файла, а затем применяет взвешенное хеширование (weighted min-hash) для создания компактного отпечатка. Это позволяет эффективно находить дубликаты в Google Images и YouTube.

2013 Индексация Патенты Google Персонализация Семантика и интент

Как Google использует контекст из предыдущих ответов или уведомлений для скрытого переписывания последующих запросов пользователя

Google использует механизм для поддержания контекста разговора (Discourse Context). Система анализирует ранее предоставленную информацию (например, блок с ответом или уведомление), чтобы извлечь ключевые атрибуты (время, местоположение). Если следующий запрос пользователя относится к этому контексту, Google незаметно переписывает его (Discourse Query), добавляя атрибуты из предыдущего взаимодействия для повышения точности ответа.

2019 Victor Carbune Патенты Google Свежесть контента Семантика и интент

Как Google использует графовые нейросети для обнаружения развивающихся событий через анализ социальных сетей и поисковых запросов

Google использует систему для обнаружения развивающихся событий (например, срочных новостей) путем мониторинга потоков данных в реальном времени (социальные сети) и поисковых запросов. Система моделирует распространение информации в виде графа и применяет специализированные модели машинного обучения (например, GCN, GAN) для оценки вероятности события и его релевантности для пользователя, позволяя предоставлять актуальную информацию до ее появления в традиционных источниках.

2012 Патенты Google Семантика и интент

Как Google использует анализ совместной встречаемости слов в запросах для оценки качества синонимов и контекстов

Google оценивает, является ли один термин хорошей заменой (синонимом) для другого, анализируя, какие другие слова часто появляются рядом с ними в поисковых запросах. Система строит векторы частот совместной встречаемости для обоих терминов и сравнивает их. Высокое сходство векторов подтверждает качество замены. Этот же механизм используется для определения того, добавляет ли конкретный контекст значимое семантическое значение к правилу замены.

2023 Метрики качества поиска Патенты Яндекс Поведенческие факторы Ранжирование Холодный старт

Как Яндекс нормализует ранжирование, сравнивая оценку качества сайта с ожидаемым уровнем трафика

Яндекс патентует механизм, который сравнивает фактическое качество сайта (Raw Quality Score), основанное на согласованности поведенческих метрик и лояльности пользователей, с эталонным качеством (Reference Score), ожидаемым для его уровня трафика. При обнаружении отклонения от эталонной кривой тренда система корректирует оценку ранжирования (Adjusted Quality Score), чтобы привести будущий трафик и качество сайта к балансу.