Патент Google описывает систему персонализации подсказок в Autocomplete. Система анализирует социальный граф пользователя и ранжирует поисковые подсказки на основе активности его контактов. Учитывается, как часто контакты искали этот запрос и насколько они одобряли (лайкали, делились, ссылались) результаты поиска по этому запросу (Endorsement Score).
Автор: Виктор Репин
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
Патент Google описывает систему оценки качества пользовательских отзывов (Quality Score). Система анализирует длину текста, грамматику, ценность используемых слов (используя TF-IDF) и свежесть отзыва. На основе этой оценки выбираются лучшие отзывы для показа пользователю и определяются наиболее информативные предложения для создания сниппетов.
Патент Google описывает систему глубокого анализа изображений для распознавания лиц, одежды и текста на объектах. Система генерирует уникальные «сигнатуры распознавания» и создает индекс на их основе, что позволяет искать изображения по их визуальному содержанию. Также описана технология «объективированных изображений», где распознанные элементы становятся интерактивными, закладывая основу для функциональности типа Google Lens.
Google использует структурированные данные (например, географические базы) и логи запросов для создания вероятностных языковых моделей в областях с огромным количеством комбинаций (например, адреса). Система вычисляет вероятность различных структур запроса (Template Distribution) и популярность конкретных сущностей (Location Distribution). Это позволяет эффективно исправлять опечатки и интерпретировать запросы в Картах и Локальном поиске.
Google расширяет понимание запросов, используя транзитивные синонимы (если A=B и B=C, то A=C) и декомпозицию составных слов (например, разбивая «vlcmediaplayer» на «vlc media player»). Это позволяет системе находить релевантные документы, даже если они используют термины, семантически удаленные на несколько шагов от исходного запроса пользователя.
Google использует технологию для идентификации и маркировки «пространственно-временных объемов» (spatio-temporal volumes) внутри видео, которые соответствуют конкретным объектам или действиям (например, «бегущая кошка»). Это позволяет системе индексировать контент на гранулярном уровне, улучшать поиск по видео, автоматически генерировать обучающие данные для ИИ и предоставлять пользователям возможность создавать новые видео из этих сегментов.
Google использует систему для корректировки поисковой выдачи в зависимости от типа устройства пользователя (например, Android, iOS, десктоп). Контент, полезный для данного устройства, повышается в ранжировании, а бесполезный — понижается. Однако корректировка происходит только при наличии полезных альтернатив и только если это не противоречит явному намерению пользователя (интенту).
Google использует технологию, позволяющую инициировать поиск жестами (например, обведением объекта на экране). Система анализирует выбранный контент (текст, изображения, видео), извлекает ключевые темы, учитывает контекст страницы и пользователя (местоположение, время), взвешивает эти данные и автоматически формирует релевантный поисковый запрос.
Анализ технологии Information Retrieval (на примере патента Citrix), которая конвертирует слова и предложения в числовые векторы (эмбеддинги) с помощью глубокого обучения (например, Word2Vec). Система оценивает семантическую близость между вектором запроса и векторами документов в многомерном пространстве, позволяя находить релевантные результаты даже без точного совпадения ключевых слов.
Google использует алгоритмы для анализа базы данных сущностей и выявления иерархических отношений (родитель-потомок). Система группирует потенциально связанные сущности по классификации, адресу, местоположению или названию. Затем она сравнивает их характеристики (например, совпадение названий, географическое вложение, популярность), чтобы определить, какая сущность является главной. Эти данные используются для структурирования выдачи, страниц организаций и локальных результатов.
Google использует систему абстрактивной суммаризации для генерации новых, объективных заголовков для новостных сюжетов. Система изучает эквивалентные синтаксические шаблоны, определяя, как разные фразы описывают одно и то же событие. Это позволяет идентифицировать главное событие в наборе статей и сгенерировать для него заголовок, даже если он не встречался в исходных текстах. Технология также используется для автоматического обновления Knowledge Graph на основе новостных событий.
Патент Google, раскрывающий фундаментальные механизмы геокодирования и извлечения адресов. Система преобразует текстовые описания мест в точные координаты, используя «Массу Локации» (количество адресов в регионе) для оценки значимости. При наличии «Гео-подсказки» (например, местоположения пользователя) система отдает приоритет ближайшим результатам. Также описан процесс автоматического извлечения адресов с веб-страниц.
Яндекс патентует метод обогащения инвертированного индекса данными о кликах. Если пользователи кликают на документ, в котором отсутствует одно из слов запроса (найденный по «правилу кворума»), система добавляет «клик-постинг» для этого документа в список постинга отсутствующего слова. Это позволяет документу в будущем находиться по запросам, для которых ранее ему не хватало текстовой релевантности для прохождения порога отбора кандидатов.
Яндекс патентует механизм корректировки ранжирования, который использует базу данных исторических пар «запрос-документ» и их показателей полезности (например, CTR или оценки асессоров). Если текущая пара «запрос-документ» похожа на историческую пару с высокой полезностью, система генерирует корректирующую оценку (rank-adjustment score). Эта оценка комбинируется с базовой оценкой ранжирования для повышения позиции документа в SERP.
Google патентует систему для улучшения понимания видеоконтента. Используя машинное обучение, система анализирует транскрипцию видео и прогнозирует, какие сущности зрители, скорее всего, захотят найти в поиске. Когда такая сущность упоминается, система синхронно показывает описательную «Карточку сущности» (Entity Card), позволяя пользователю получить контекст, не покидая видеоплатформу.
Google анализирует контекст запроса медиаконтента (например, видео), определяя источник перехода (referral source). Система сканирует исходную страницу, чтобы найти другой контент, размещенный на ней (например, другие встроенные видео), и использует эту информацию для формирования списка рекомендаций, показываемых пользователю после просмотра.
Google анализирует частичные запросы по мере их ввода и определяет местоположение пользователя. Если система прогнозирует, что запрос имеет локальный интент (основываясь на поведении других пользователей), она предиктивно добавляет название локации к поисковой подсказке (например, в Autocomplete). Это направляет пользователя к локализованному поиску еще до отправки запроса.
Этот патент описывает, как Google может использовать Сверточные Нейронные Сети для анализа уличных изображений (например, Street View) и автоматического обнаружения физических витрин магазинов. Система определяет точное местоположение каждого бизнеса с помощью ограничивающих рамок, что позволяет впоследствии извлекать названия компаний (через OCR) и атрибуты для создания или обновления локального бизнес-индекса Google (например, Google Maps).
Google анализирует прошлые взаимодействия пользователей (поисковые запросы, выбор функций), связанные с конкретным видом карты (местоположение и уровень масштабирования). Эти агрегированные исторические данные определяют тематический профиль локации. Система использует этот профиль для выбора релевантной рекламы для новых пользователей, просматривающих ту же область карты, улучшая таргетинг за пределы простого географического соответствия.