Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует интерактивное уточнение контекста для улучшения результатов и обучения ML-моделей

    REFINED SEARCH WITH MACHINE LEARNING (Уточненный поиск с использованием машинного обучения)
    • US20230121138A1
    • Google LLC
    • 2023-04-20
    • 2018-06-13
    2018 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

    Патент Google описывает систему контекстного поиска, которая предлагает результаты на основе текущих действий пользователя (например, просмотра веб-страницы или звонка). Пользователь может выбрать один из исходных критериев поиска (например, сущность на экране), чтобы уточнить выдачу. Система использует этот выбор и реакцию пользователя на новые результаты для обучения ML-модели и улучшения понимания намерений.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неточности интерпретации намерений пользователя, особенно в сценариях проактивного или контекстного поиска (когда поиск инициируется системой на основе пассивных сигналов, а не явного запроса). В таких случаях системе сложно правильно определить относительную важность (confidence) различных критериев поиска, извлеченных из контекста (например, сущностей на просматриваемой странице), что приводит к нерелевантным результатам. Изобретение предоставляет механизм для корректировки этих приоритетов пользователем и создает петлю обратной связи для обучения поисковой системы.

    Что запатентовано

    Запатентована система интерактивного уточнения поиска и машинного обучения на основе явной обратной связи. Система генерирует результаты на основе контекста (passive criteria), позволяет пользователю выбрать конкретные критерии для перевзвешивания (up-confidence) и генерирует уточненные результаты (refined search results). Это взаимодействие используется для обучения компонента машинного обучения (Machine-Learning Component) и улучшения будущих поисковых выдач.

    Как это работает

    Система работает в несколько этапов:

    • Анализ контекста: Система пассивно собирает Search Criteria на основе действий пользователя (просмотр веб-страницы, звонок) и присваивает им начальный вес (confidence).
    • Проактивный поиск: Выполняется первоначальный поиск и предлагаются результаты.
    • Интерфейс уточнения: Система представляет извлеченные критерии как выбираемые элементы (Selectable Items), например, выделяя сущности на экране.
    • Уточнение пользователем: Пользователь выбирает элемент, тем самым повышая его confidence относительно других критериев.
    • Уточненный поиск: Система мгновенно генерирует и представляет refined search results.
    • Обучение модели: Система отслеживает реакцию пользователя (Positive/Negative Indication) на новые результаты и использует эту информацию для обновления Machine-Learning Component.

    Актуальность для SEO

    Высокая. Контекстный и проактивный поиск (Google Assistant, Google Lens, функции анализа экрана) являются стратегическими направлениями развития. Использование взаимодействия с пользователем в качестве прямых обучающих сигналов для улучшения интерпретации намерений в сложном контексте является фундаментальным аспектом современных ML-систем в поиске.

    Важность для SEO

    (5.5/10). Патент имеет низкое прямое влияние на традиционное веб-SEO, так как фокусируется на UI/UX и проактивном поиске на уровне устройства/ОС. Однако он имеет высокое стратегическое значение для понимания того, как Google оценивает значимость (salience) сущностей и контекста. Он демонстрирует, как машинное обучение используется для корректировки весов (confidence) критериев на основе реального поведения пользователей.

    Детальный разбор

    Термины и определения

    Confidence (Уверенность / Вес)
    Метрика или вес, присваиваемый каждому критерию поиска, определяющий его важность для генерации результатов. Выбор пользователя может повышать (up-confidence) эту метрику.
    Machine-Learning Component (Компонент машинного обучения)
    Часть поисковой системы, которая обучается на основе выбора пользователя и Positive/Negative Indications для улучшения точности будущих поисков.
    Passive Criteria (Пассивные критерии поиска)
    Критерии, определенные автоматически на основе контекста пользователя (например, текст на экране, текущий телефонный звонок, история), без явного ввода запроса.
    Positive/Negative Indication (Положительная/Отрицательная индикация)
    Сигналы, основанные на действиях пользователя после получения уточненных результатов, указывающие на их полезность (вовлечение) или бесполезность (игнорирование, новый поиск).
    Refined Search Results (Уточненные результаты поиска)
    Новый набор результатов, сгенерированный после того, как пользователь выбрал определенный критерий поиска для повышения его веса.
    Selectable Items/Controls (Выбираемые элементы/Элементы управления)
    Интерактивные элементы интерфейса (например, выделенный текст, кнопка), связанные с конкретным критерием поиска, позволяющие пользователю выбрать его для уточнения.

    Ключевые утверждения (Анализ Claims)

    Важное замечание: Существует расхождение между Детальным Описанием (Description) и Формулой изобретения (Claims) в патенте US20230121138A1 (который является заявкой-продолжением).

    Описание фокусируется на уточнении поиска путем выбора критериев поиска (входных данных), например, выделенных слов в статье.

    Claims фокусируются на выборе результатов поиска (выходных данных), что запускает уточнение и проактивно открывает второе приложение.

    Анализ Claims (Юридический объем защиты):

    Claim 1 (Независимый пункт): Описывает процесс проактивного действия и взаимодействия между приложениями.

    1. Отображение выбираемых результатов поиска (selectable search results), основанных на контенте из первого приложения.
    2. В ответ на выбор одного из этих результатов.
    3. Определение уточненных результатов поиска.
    4. В ответ на это и без явного запроса пользователя (проактивное действие).
    5. Выбор второго приложения на основе уточненных результатов.
    6. Представление уточненных результатов посредством этого второго приложения.

    Защищенное изобретение здесь — это функция уровня ОС или ассистента, которая автоматически запускает другое приложение на основе взаимодействия с результатами контекстного поиска.

    Claim 7 (Зависимый): Включает изменение поисковой системы (altering a search engine) на основе Positive или Negative Indication, связанных с уточненными результатами (петля обратной связи ML).

    Анализ Описания (Техническая реализация, релевантная для SEO/IR):

    Описание патента детализирует механизмы (Method 200 и 600), которые более релевантны для понимания работы поиска:

    • Интерактивное уточнение (Method 200): Описывает цикл, где пользователь выбирает критерий поиска (а не результат) для корректировки его confidence. Это позволяет пользователю явно указать, что является главным в текущем контексте.
    • Процесс обучения (Method 600): Описывает, как выбор критерия и последующая реакция пользователя (Indication) используются для обновления Machine-Learning Component, чтобы система лучше расставляла приоритеты в будущем.

    Где и как применяется

    Изобретение применяется в средах контекстного и проактивного поиска (например, Google Assistant, функции ОС Android).

    QUNDERSTANDING – Понимание Запросов
    Ключевой этап. Система интерпретирует контекст пользователя (passive criteria) как неявный запрос. Machine-Learning Component используется для определения начальных весов (confidence) критериев и обучается на основе прошлых уточнений пользователей для улучшения этой интерпретации.

    RANKING – Ранжирование
    Система выполняет как первоначальный, так и уточненный поиск. Ключевым механизмом является корректировка confidence критериев в реальном времени на основе выбора пользователя.

    RERANKING – Переранжирование
    Выбор пользователем Selectable Item действует как немедленный сигнал для переранжирования. Система корректирует выдачу, отдавая предпочтение критериям, выбранным пользователем.

    METASEARCH – Метапоиск и Смешивание
    Механизм может искать данные в разных источниках (веб, локальные приложения, почта) и, как указано в Claim 1, инициировать запуск разных приложений для представления результатов.

    Входные данные:

    • Пассивные критерии (контент на экране, веб-страница, email, данные о телефонном звонке).
    • Выбор пользователем критерия или результата для уточнения.
    • Действия пользователя после уточнения (Positive/Negative Indication).

    Выходные данные:

    • Первоначальные и уточненные результаты поиска.
    • Selectable controls для критериев.
    • Обновления для модели машинного обучения.

    На что влияет

    • Типы контента: Контент, богатый сущностями (статьи, обзоры, электронные письма), где намерение пользователя может быть неоднозначным.
    • Специфические интерфейсы: В первую очередь влияет на системы контекстного поиска (Google Assistant, Google Lens, функции анализа экрана), а не на основной веб-поиск.
    • Среда: Мобильные и интегрированные среды (смартфоны, умные устройства), где система имеет доступ к широкому спектру контекстуальных сигналов.

    Когда применяется

    • Условия работы: Когда система выполняет поиск на основе множества критериев (особенно пассивных) и существует неопределенность в их относительной важности.
    • Триггеры активации: Просмотр информационно насыщенного контента, совершение действия (например, звонка), которое система интерпретирует как возможность для проактивного поиска.

    Пошаговый алгоритм

    Процесс работы системы по уточнению поиска и обучению (на основе Description):

    1. Определение критериев поиска: Система анализирует контекст пользователя для извлечения passive criteria и присваивает им начальные значения confidence.
    2. Первоначальный поиск и представление результатов: Выполняется поиск и отображаются результаты.
    3. Представление элементов управления: Система отображает Selectable Items, связанные с использованными критериями (например, выделяя текст на экране). Может исключать критерий с самым высоким confidence.
    4. Взаимодействие с пользователем: Система получает выбор одного из элементов от пользователя.
    5. Корректировка весов: Система повышает confidence выбранного критерия относительно других.
    6. Выполнение уточненного поиска: Генерируется и представляется новый набор результатов (Refined Search Results).
    7. Мониторинг реакции пользователя: Система отслеживает дальнейшие действия для определения Positive или Negative Indication.
    8. Обновление поисковой системы: Machine-Learning Component использует эту информацию для изменения поисковой системы (персонализированно или глобально) и улучшения будущих результатов в аналогичных контекстах.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы (Пассивные): Текст из просматриваемого в данный момент контента (веб-страницы, email). Система извлекает сущности и термины как критерии поиска.
    • Поведенческие и Контекстуальные факторы: Текущая активность пользователя (чтение статьи, совершение телефонного звонка). История пользователя. Данные из активных приложений.
    • Пользовательские факторы: Личные данные пользователя и его связи (например, члены семьи), данные из локальных приложений (почта, контакты).
    • Данные о взаимодействии: Явный выбор пользователем критерия поиска. Последующие действия (Positive/Negative Indication).

    Какие метрики используются и как они считаются

    • Confidence (Уверенность / Вес): Ключевая метрика. Вес, присваиваемый каждому критерию поиска. Начальное значение рассчитывается ML-моделью. Метрика корректируется:
      • Немедленно: Пользовательский выбор повышает Confidence для текущего сеанса.
      • Долгосрочно: Machine-Learning Component корректирует базовые модели расчета Confidence на основе агрегированных данных.
    • Positive/Negative Indication (Индикация удовлетворенности): Метрика, оценивающая успешность уточненного поиска. Рассчитывается на основе анализа поведения пользователя после отображения Refined Search Results. Используется как целевая переменная для обучения ML-модели.

    Выводы

    1. Контекст как неявный запрос: Патент демонстрирует механизмы обработки пассивно собранной информации (контекст экрана, активность) как passive search criteria для инициации поиска без явного запроса. Это критически важно для работы систем-ассистентов.
    2. Определение значимости сущностей (Entity Salience): Система активно пытается определить относительную важность (Confidence) различных сущностей в контексте. Пользователям предоставляется механизм для интерактивной корректировки этих весов, если система ошиблась.
    3. ML-обучение через прямую обратную связь: Взаимодействие пользователя по уточнению поиска служит прямым обучающим сигналом для Machine-Learning Component. Система учится, какие контекстуальные сигналы более важны для пользователей в определенных ситуациях.
    4. Фокус на уровне устройства и межприложенческое взаимодействие: Описанные механизмы, особенно те, что защищены в Claims (автоматический запуск второго приложения), предполагают глубокую интеграцию с операционной системой и возможность взаимодействия между приложениями для выполнения задач (Task Completion).

    Практика

    Best practices (это мы делаем)

    Хотя патент фокусируется на проактивном поиске и UI, он дает важные стратегические инсайты для SEO.

    • Фокус на значимости сущностей (Entity Salience): Структурируйте контент так, чтобы основные сущности и их взаимосвязи были четко определены. Это поможет системе правильно назначить начальные Confidence при контекстном анализе страницы. Используйте заголовки, списки и семантическую верстку для подчеркивания ключевых сущностей.
    • Оптимизация под извлечение (Extraction Optimization): Убедитесь, что контент легко парсится, а ключевые сущности (имена, места, продукты) представлены в ясной форме, удобной для извлечения системами NLP. Используйте микроразметку Schema.org для однозначной идентификации сущностей.
    • Предвосхищение контекстного уточнения: Обеспечьте авторитетное покрытие связанных подсущностей. Если пользователи часто переключаются на определенную подсущность при изучении вашей основной темы (что Google может узнать через этот механизм), ваш контент должен удовлетворять этот уточненный интент.
    • Для ASO и разработчиков (на основе Claim 1): Обеспечьте интеграцию вашего приложения с поисковой системой. Если ваше приложение может обрабатывать определенные интенты (например, бронирование, навигация), оно может быть выбрано системой как «второе приложение» для представления уточненных результатов.

    Worst practices (это делать не надо)

    • Неоднозначный контент: Создание контента, в котором основной фокус неясен или смешано множество несвязанных сущностей. Это затрудняет системе назначение начальных Confidence и извлечение релевантных Search Criteria.
    • Игнорирование вторичных интентов и сущностей: Фокусировка исключительно на основной теме и игнорирование связанных сущностей, к которым пользователи могут обращаться для уточнения информации.
    • Скрытие информации в непарсируемых форматах: Размещение важного текста внутри изображений или сложных скриптов, которые не могут быть легко извлечены как passive criteria системами анализа контекста.

    Стратегическое значение

    Патент подтверждает стратегический фокус Google на развитии контекстного, проактивного и ассистивного поиска за пределами традиционной поисковой строки. Для SEO это означает необходимость глубокого понимания принципов извлечения сущностей (Entity Extraction) и NLP. Оценка контента смещается к пониманию того, насколько хорошо он структурирован и удовлетворяет кластеру намерений вокруг темы в различных контекстах потребления.

    Практические примеры

    Сценарий: Оптимизация статьи о путешествии для контекстного извлечения

    Вы оптимизируете статью «Путеводитель по Окленду». В ней упоминаются парк «Cesar Chavez Park» и архитектор «Julia Morgan».

    1. Действия SEO:
      • Используйте структурированные данные (Schema.org) для разметки сущностей (Place, Person).
      • Структурируйте статью так, чтобы сущности были четко выделены в тексте.
    2. Как работает система Google: Когда пользователь читает статью на устройстве, система Google извлекает «Окленд» (высокий Confidence), «Cesar Chavez Park» и «Julia Morgan» (низкий Confidence). Система проактивно предлагает общую информацию об Окленде.
    3. Уточнение пользователем: Пользователь выбирает (касается) имени «Julia Morgan» на экране (используя интерфейс типа Google Assistant/Lens). Система повышает Confidence для этой сущности.
    4. Результат: Система обновляет выдачу, показывая информацию о работах архитектора. Если пользователь взаимодействует с результатом (Positive Indication), ML-модель научится, что в контексте этой статьи «Julia Morgan» имеет высокую значимость.

    Вопросы и ответы

    Описывает ли этот патент алгоритмы ранжирования основного веб-поиска Google?

    Нет, напрямую он их не описывает. Патент сфокусирован на системах контекстного и проактивного поиска (как Google Assistant или анализ экрана), которые предлагают информацию на основе текущих действий пользователя. Он описывает, как эти системы интерпретируют контекст и как они обучаются на основе интерактивных уточнений пользователя.

    Что такое «Confidence» в контексте этого патента и как он влияет на SEO?

    Confidence – это вес или уровень уверенности, который система присваивает каждому критерию поиска, извлеченному из контекста. Он определяет влияние критерия на результаты. Для SEO это подчеркивает важность значимости сущностей (Entity Salience). Если ваша ключевая сущность имеет низкий Confidence в глазах Google в контексте вашей страницы, она может быть проигнорирована в пользу других сущностей.

    Что такое «пассивные критерии поиска» (Passive Search Criteria)?

    Это информация, которую система использует для поиска без явного запроса пользователя. Примеры включают текст статьи, которую пользователь сейчас читает, информацию о текущем телефонном звонке или данные активного приложения. Система использует этот контекст для предугадывания потребностей пользователя и проактивного поиска.

    Как система определяет, какие критерии предложить пользователю для уточнения (Selectable Items)?

    Система извлекает несколько критериев из контекста. В патенте упоминается, что для выбора часто предлагаются критерии с более низким confidence (второстепенные темы или сущности). Логика в том, что исходный поиск уже сфокусирован на критериях с высокой уверенностью, и если результаты неудовлетворительны, вероятно, пользователя интересует один из вторичных критериев.

    Как Google определяет, был ли уточненный поиск успешным?

    Система отслеживает Positive or Negative Indication. Положительной индикацией считается взаимодействие пользователя с уточненными результатами (клик, просмотр). Отрицательной – игнорирование результатов, немедленный запуск нового поиска или повторное уточнение с выбором другого критерия. Эта обратная связь используется для обучения ML-модели.

    Как мы можем повлиять на начальный уровень «Confidence» для наших сущностей?

    На это можно повлиять через практики, направленные на повышение значимости сущностей (Entity Salience). Это включает четкую структуру контента, выделение ключевых терминов, внутреннюю перелинковку и обязательное использование микроразметки Schema.org для однозначной идентификации сущностей и их свойств.

    В чем заключается расхождение между Описанием (Description) и Формулой изобретения (Claims) в этом патенте?

    Описание фокусируется на выборе пользователем критериев поиска (например, текста в статье) для уточнения запроса. Однако Claim 1 защищает механизм, при котором пользователь выбирает результат поиска, что приводит к автоматическому открытию второго приложения с уточненными данными. Это различие указывает на специфический юридический фокус на взаимодействии между приложениями.

    Применяются ли изменения в ML-модели глобально или они персонализированы?

    Патент указывает, что изменения могут быть как универсальными (применяться к поисковой системе в целом), так и специфичными для пользователя, который совершил действие. Агрегированные данные о том, как пользователи уточняют поиск, могут влиять на глобальное понимание контекстов и веса сущностей.

    Имеет ли этот патент отношение к функциям типа «Что на моем экране» или Google Lens?

    Да, этот патент напрямую связан с такими технологиями. Он описывает техническую реализацию анализа контекста экрана, предоставления опций уточнения (например, выбор объекта через Lens или текста на экране) и использования этого взаимодействия для машинного обучения с целью улучшения релевантности.

    Какие практические шаги следует предпринять Senior SEO специалисту на основе этого патента?

    Необходимо уделять больше внимания оптимизации для извлечения сущностей (Entity Extraction Optimization) и анализу их значимости (Entity Salience). Стратегия должна включать создание контента с четкой иерархией информации, который легко интерпретируется системами контекстного поиска, а также внедрение структурированных данных.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.