Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует контекст страницы и распознавание сущностей для показа специализированных ответов при выделении текста (механизм «Touch to Search»)

    GENERATING CONTEXTUAL SEARCH PRESENTATIONS (Генерация контекстных поисковых представлений)
    • US10394841B2
    • Google LLC
    • 2019-08-27
    • 2014-06-18
    2014 Knowledge Graph Патенты Google Персонализация Семантика и интент

    Google анализирует текст, выделенный пользователем на странице, и окружающий контекст (включая местоположение и язык пользователя). Система определяет, относится ли выделенный текст к сущности (Entity), валюте или требует перевода, и на основе этого показывает специализированный формат ответа (например, Knowledge Panel или Answer Box) вместо стандартного определения.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу предоставления пользователю максимально релевантной информации о фрагменте текста (слове или фразе), выделенном им в документе (например, на веб-странице). Цель — улучшить пользовательский опыт (UX), предоставив специализированный ответ с учетом как контекста самого документа, так и контекста пользователя (местоположение, язык, валюта), не требуя покидать текущую страницу.

    Что запатентовано

    Запатентована система генерации контекстных поисковых представлений (Contextual Search Presentations). Когда пользователь выделяет текст (Selection Data), система анализирует его вместе с окружающим контекстом (Context Data). Ключевым механизмом является определение того, удовлетворяются ли критерии для «специальных случаев» (Special Case) — в первую очередь, является ли текст распознанной сущностью. В зависимости от результата генерируется либо специализированное (Special Case), либо стандартное (Default) представление.

    Как это работает

    Механизм активируется при взаимодействии пользователя с контентом (например, выделение текста):

    • Сбор данных: Устройство собирает Selection Data (выделенный текст) и Context Data (окружающий текст, данные о местоположении, языке пользователя).
    • Анализ сущностей (Приоритет): Данные отправляются в Entity Disambiguation System, чтобы определить, является ли фрагмент сущностью в данном контексте.
    • Генерация ответа (Специальный случай): Если сущность распознана, генерируется представление сущности (Knowledge Panel). Если нет, проверяются другие условия (например, нужна ли конвертация валюты или перевод), основываясь на сравнении контента с контекстом пользователя.
    • Генерация ответа (Стандартный случай): Если ни один специальный случай не применим, генерируется стандартное представление (например, словарное определение — Definitional Answer Box).

    Актуальность для SEO

    Высокая. Описанные механизмы напрямую соответствуют функциям контекстного поиска, таким как «Touch to Search» в мобильных браузерах и приложениях. Фокус Google на распознавании сущностей, учете контекста пользователя и предоставлении прямых структурированных ответов является центральным направлением развития поиска.

    Важность для SEO

    Среднее влияние (6/10). Патент не описывает алгоритмы ранжирования основного поиска. Он фокусируется на UI/UX и интерпретации контента «на лету». Однако он критически важен для понимания работы Entity Disambiguation (распознавание и разрешение неоднозначности сущностей). Для SEO это подчеркивает стратегическую важность оптимизации контента под сущности и предоставления четкого контекста для правильной интерпретации содержания страницы.

    Детальный разбор

    Термины и определения

    Answer Box (Блок с ответом)
    Форматированная презентация контента. В патенте упоминаются типы: Definitional (определение), Currency (валюта), Translation (перевод), Time Zone (часовой пояс).
    Context Data (Контекстные данные)
    Данные, используемые для понимания выделенного текста. Включают контент документа (окружающий текст, заголовок документа, заголовки разделов, подписи изображений, анкорный текст входящих ссылок), а также данные о пользователе (User Profile Data) и устройстве (местоположение, язык).
    Contextual Search Presentation (Контекстное поисковое представление)
    Выдача (представление), сгенерированная системой для выделенного пользователем термина. Может быть стандартной или специальной.
    Default Contextual Search Presentation (Стандартное представление)
    Представление, генерируемое, если критерии специальных случаев не выполнены. Часто это Definitional Answer Box.
    Entity Disambiguation System (Система разрешения неоднозначности сущностей)
    Система, которая анализирует выделенный текст и контекстные данные и определяет, относится ли этот текст в данном контексте к определенной сущности (Entity).
    Knowledge Panel (Панель знаний)
    Также упоминается как Knowledge Card. Форматированная презентация контента о сущности. Включает атрибуты сущности и релевантный контент. Используется в представлении типа Entity.
    Selection Data (Данные выделения)
    Данные, идентифицирующие термин (одно или несколько смежных слов), выбранный пользователем в документе.
    Special Case Contextual Search Presentation (Специальное представление)
    Специализированные форматы представлений. Примеры включают Entity type, Currency type, Translation type, Time Zone type.

    Ключевые утверждения (Анализ Claims)

    Патент US10394841B2 является продолжением (continuation) более ранней заявки и имеет Claims, сфокусированные конкретно на процессе идентификации сущностей с помощью Entity Disambiguation System как триггера для выбора представления.

    Claim 1 (Независимый пункт): Описывает основной процесс идентификации и отображения информации о сущности.

    1. Система получает данные выделения (first selection data) и контекстные данные (context data).
    2. Эти данные предоставляются в Entity Disambiguation System.
    3. Система получает от Entity Disambiguation System данные, указывающие, что выделение идентифицирует сущность.
    4. В ответ на это система получает entity-type special contextual search presentation (представление, специально отформатированное для показа контента о сущности).
    5. Это представление предоставляется для отображения в пользовательском интерфейсе.

    Claim 2 (Зависимый от 1): Описывает сценарий обработки выделения, которое НЕ является сущностью, но подпадает под ДРУГОЙ специальный случай.

    Если Entity Disambiguation System указывает, что данные НЕ идентифицируют сущность, система проверяет, удовлетворяют ли данные критериям для другого типа специального представления (например, валюта, перевод). Если да, то предоставляется этот другой тип.

    Claim 3 (Зависимый от 1): Описывает сценарий обработки по умолчанию (Default).

    Если данные НЕ идентифицируют сущность и НЕ удовлетворяют критериям для других типов специальных представлений, система предоставляет Default Contextual Search Presentation.

    Claim 4 (Зависимый от 1): Уточняет, что получение entity-type special contextual search presentation включает получение Knowledge Panel для идентифицированной сущности.

    Где и как применяется

    Изобретение применяется в момент взаимодействия пользователя с контентом и затрагивает этапы понимания запроса и генерации выдачи.

    INDEXING – Индексирование и извлечение признаков
    Для работы системы необходима инфраструктура, созданная на этапе индексирования. Entity Disambiguation System полагается на проиндексированные данные о сущностях и их связях (Knowledge Graph).

    QUNDERSTANDING – Понимание Запросов
    Это основной этап применения патента. Система интерпретирует «запрос», сформированный комбинацией выделенного текста (Selection Data) и контекста (Context Data). Происходит распознавание и разрешение неоднозначности сущностей (Entity Disambiguation) и классификация намерения.

    METASEARCH – Метапоиск и Смешивание (Presentation Layer)
    На этом этапе принимается финальное решение о формате представления. Система выбирает между Special Case Presentation или Default Presentation и генерирует соответствующий ответ (Knowledge Panel, Answer Box). Представление также может включать стандартные результаты поиска (Search Results).

    Входные данные:

    • Selection Data (выделенный пользователем текст).
    • Context Data (окружающий текст, заголовок документа, заголовки, подписи изображений, анкоры входящих ссылок).
    • Данные пользователя и устройства (User Profile Data, местоположение, языковые настройки).

    Выходные данные:

    • Contextual Search Presentation (в формате Special Case или Default).

    На что влияет

    • Типы контента и запросы: Влияет на обработку информационного контента, где присутствуют именованные сущности (люди, места, организации), а также контента, содержащего упоминания валют, времени или иностранных слов.
    • Устройства: Наибольшее влияние оказывается на мобильный поиск, где функции контекстного поиска («Touch to Search») наиболее распространены.

    Когда применяется

    Алгоритм применяется при выполнении следующих условий:

    • Триггер активации: Взаимодействие пользователя с контентом — выделение текста (например, касание или долгое нажатие).
    • Условия для специальных случаев: Система активирует Special Case Presentation, если выполняется одно из условий (в порядке приоритета):
      1. Выделенный текст в контексте распознан как сущность (подтверждено Entity Disambiguation System).
      2. Текст идентифицирует валюту, отличную от валюты пользователя.
      3. Текст написан на языке, отличном от языка пользователя (требуется перевод).
      4. Текст идентифицирует время в часовом поясе, отличном от часового пояса пользователя.

    Пошаговый алгоритм

    Процесс генерации контекстного поискового представления:

    1. Получение данных: Система получает Selection Data и Context Data от пользовательского устройства.
    2. Приоритетная проверка сущности: Система передает данные в Entity Disambiguation System для определения, относится ли выделенный текст к сущности в данном контексте.
    3. Обработка сущности (Если ДА):
      • Система определяет, что критерии для представления сущности выполнены.
      • Система запрашивает у поисковой системы Knowledge Panel для этой сущности (например, отправляя запрос с именем и типом сущности или идентификатором сущности).
      • Генерируется Entity Contextual Search Presentation. Процесс завершается.
    4. Проверка других специальных случаев (Если НЕТ): Если сущность не распознана, система проверяет критерии для других специальных случаев (валюта, перевод, часовой пояс), сравнивая контент с контекстом пользователя.
    5. Обработка специального случая (Если ДА на шаге 4):
      • Система запрашивает соответствующий Answer Box (например, используя предопределенный синтаксис запроса: «translate [word] into [user language]»).
      • Генерируется соответствующая Special Case Contextual Search Presentation. Процесс завершается.
    6. Обработка стандартного случая (Если НЕТ на шаге 4):
      • Система генерирует Default Contextual Search Presentation.
      • Например, запрашивается Definitional Answer Box (используя запрос: «define: [word]»).
    7. Предоставление результата: Сгенерированное представление предоставляется пользователю для отображения.

    Какие данные и как использует

    Данные на входе

    Система использует комбинацию контентных и пользовательских данных для принятия решений.

    • Контентные факторы:
      • Выделенный текст (Selection Data).
      • Контекст документа (Context Data): окружающие слова (в пределах порогового числа слов), заголовок документа, заголовки разделов, подписи к изображениям, анкорный текст входящих ссылок.
    • Пользовательские факторы:
      • User Profile Data: Идентификатор аккаунта, данные профиля (страна проживания, известные пользователю языки). Используются для определения базовой валюты, языка и часового пояса пользователя.
    • Географические факторы:
      • Местоположение устройства: Используется для определения текущего контекста (валюта, часовой пояс), особенно если данные профиля недоступны.
    • Технические факторы:
      • Языковые настройки устройства.

    Какие метрики используются и как они считаются

    Патент не фокусируется на метриках ранжирования (Ranking Scores). Вместо этого он использует набор условий (критериев) для выбора формата представления.

    • Entity Recognition (Распознавание сущностей): Результат работы Entity Disambiguation System. Это приоритетная проверка.
    • Сравнение контекста: Система выполняет сравнение атрибутов контента с атрибутами пользователя. Решение принимается, если атрибуты отличаются:
      • Сравнение валюты (Идентифицированная валюта vs. Валюта пользователя).
      • Сравнение языка (Язык текста vs. Язык пользователя).
      • Сравнение часового пояса (Идентифицированный пояс vs. Пояс пользователя).
    • Методы анализа текста (NLP): Используются для определения языка выделенного текста, а также для распознавания упоминаний валют, единиц измерения и времени в тексте.

    Выводы

    1. Распознавание сущностей — первый приоритет: При обработке контекстного запроса система в первую очередь пытается связать выделенный текст с сущностью. Entity Disambiguation является ключевым шагом, определяющим дальнейшую логику.
    2. Приоритет структурированных ответов: Патент демонстрирует стремление Google предоставлять специализированные, структурированные ответы (Knowledge Panels, Answer Boxes) вместо запуска стандартного веб-поиска, когда намерение можно определить из контекста.
    3. Критическая роль контекста (Двух типов): Контекст является определяющим фактором:
      • Контекст документа (окружающий текст, структура, ссылки) необходим для разрешения неоднозначности сущностей.
      • Контекст пользователя (местоположение, язык) необходим для активации специальных случаев, таких как перевод или конвертация валют.
    4. Интерпретация контента «на лету»: Механизм показывает, как Google интерпретирует контент страницы в реальном времени в ответ на действия пользователя, что является основой для функций улучшения UX типа «Touch to Search».
    5. Инфраструктурная зависимость: Эффективность системы зависит от качества базовых технологий: точности Entity Disambiguation System и полноты базы знаний (Knowledge Graph).

    Практика

    Best practices (это мы делаем)

    Патент дает важное понимание работы Entity Disambiguation, что имеет прямое отношение к SEO.

    • Оптимизация под сущности (Entity Optimization): Необходимо обеспечить, чтобы ключевые сущности на странице (продукты, компании, люди, места) были четко определены. Контент должен предоставлять достаточный контекст для их однозначного распознавания системой Entity Disambiguation System.
    • Устранение неоднозначности в контенте: Используйте ясный и недвусмысленный язык. Контекст вокруг упоминания сущности должен помогать ее идентификации. Например, при упоминании сущности с распространенным именем (например, «Apple»), убедитесь, что окружающий текст проясняет, о чем идет речь (компания или фрукт).
    • Внедрение структурированных данных (Schema.org): Используйте микроразметку для явного указания сущностей и их атрибутов. Это облегчает работу систем распознавания сущностей и способствует корректному формированию Knowledge Graph.
    • Использование семантической структуры: Грамотно используйте заголовки и структуру документа. Патент упоминает, что заголовки, подписи изображений и даже анкоры входящих ссылок могут быть частью Context Data, помогая лучше понять роль термина в документе.
    • Четкое указание локальных данных: Для контента, релевантного для интернациональной аудитории, четко указывайте валюты (например, USD, EUR) и часовые пояса. Это позволит Google корректно активировать соответствующие Answer Boxes (конвертеры) для пользователей из других регионов.

    Worst practices (это делать не надо)

    • Создание двусмысленного контента (Entity Ambiguity): Упоминание сущностей без достаточного контекста, использование сокращений или жаргона, который может быть неверно интерпретирован. Это затрудняет работу Entity Disambiguation System.
    • Игнорирование семантической структуры: Фокусировка исключительно на ключевых словах без учета семантических связей и сущностей. Патент подтверждает, что анализ контента происходит на уровне понимания смысла и идентификации объектов реального мира.
    • Изолированное использование ключевых слов: Упоминание терминов без окружающего семантического контекста. Система полагается на Context Data для понимания значения термина.

    Стратегическое значение

    Патент подтверждает стратегический вектор развития Google от поисковой системы к «системе предоставления ответов» и фокус на семантическом поиске. Для SEO это означает, что контент должен быть структурирован так, чтобы система могла легко извлекать факты и использовать их для формирования прямых ответов (Knowledge Panels, Answer Boxes). Способность оптимизировать контент с учетом того, как работает Entity Disambiguation в контексте, становится ключевым элементом долгосрочной SEO-стратегии.

    Практические примеры

    Сценарий: Оптимизация статьи для корректного распознавания сущности

    Ситуация: Вы пишете обзор нового смартфона «Nova 10». Слово «Nova» может относиться к астрономическому явлению, модели автомобиля или музыкальной группе.

    Плохая практика (Затрудняет Disambiguation):
    Заголовок: Обзор Nova 10.
    Текст: Мы протестировали Nova 10. У Nova отличная камера и быстрый процессор…

    Хорошая практика (Облегчает Disambiguation):
    Заголовок: Обзор смартфона Huawei Nova 10.
    Текст: Смартфон Huawei Nova 10 предлагает впечатляющие возможности камеры. Мы протестировали эту модель Android-устройства… Процессор Qualcomm Snapdragon в Nova 10 обеспечивает высокую производительность.

    Ожидаемый результат: При использовании хорошей практики Entity Disambiguation System правильно идентифицирует «Nova 10» как модель смартфона, используя контекстные подсказки (Context Data: «смартфон», «Huawei», «Android», «Qualcomm»). Если пользователь выделит «Nova 10» на странице, система покажет Knowledge Panel о смартфоне, а не об астрономии.

    Вопросы и ответы

    Является ли этот патент описанием функции «Touch to Search» в Google Chrome?

    Да, патент описывает базовые механизмы и логику, которые лежат в основе функций контекстного поиска, таких как «Touch to Search». Он объясняет, как система решает, что именно показать пользователю (Knowledge Panel, переводчик или определение), когда тот выделяет текст на веб-странице.

    Как система определяет, является ли выделенный текст сущностью?

    Система использует Entity Disambiguation System. Она анализирует не только выделенное слово (Selection Data), но и окружающий его текст, заголовок страницы и другие элементы документа (Context Data). Сопоставляя эту информацию со своей базой знаний (Knowledge Graph), система определяет, относится ли этот фрагмент к конкретной сущности в данном контексте.

    Что такое «специальный случай» (Special Case) в контексте этого патента?

    Специальный случай — это ситуация, когда система распознает специфический интент и может предоставить специализированный формат ответа. Патент выделяет четыре основных типа: Сущность (Entity), Перевод (Translation), Валюта (Currency) и Часовой пояс (Time Zone). Приоритет отдается распознаванию сущностей.

    Что произойдет, если система не распознает сущность и не найдет других специальных случаев?

    В этом случае система сгенерирует стандартное контекстное представление (Default Contextual Search Presentation). В патенте указано, что часто это бывает блок с определением термина (Definitional Answer Box), но это также могут быть стандартные результаты поиска по выделенному тексту.

    Как Google определяет мой язык или валюту для активации перевода/конвертации?

    Система использует Context Data, которые включают информацию о пользователе и устройстве. Это могут быть данные профиля пользователя (User Profile Data), если он залогинен, языковые настройки устройства или текущее местоположение устройства, определенное по IP или GPS.

    Как этот патент влияет на мою SEO-стратегию?

    Он подчеркивает критическую важность оптимизации под сущности (Entity Optimization). Ваша задача — сделать контент максимально понятным для Entity Disambiguation System. Используйте четкий язык, предоставляйте достаточный контекст для устранения неоднозначности и внедряйте микроразметку Schema.org.

    Что входит в состав Context Data, который анализирует Google?

    Согласно патенту, Context Data включает слова, окружающие выделенный текст (в пределах определенного порога), заголовок документа (Title), заголовки внутри документа (Headings), подписи изображений и даже анкорный текст входящих ссылок. Все это используется для лучшего понимания контекста.

    Влияет ли этот патент на ранжирование моего сайта в обычном поиске?

    Нет, патент описывает механизмы генерации выдачи для контекстного поиска (по требованию), а не алгоритмы ранжирования основного веб-индекса. Однако технологии, используемые здесь (например, Entity Disambiguation System), также используются в основном поиске для понимания контента и запросов.

    Почему важен контекст документа для распознавания сущности?

    Контекст необходим для разрешения неоднозначности. Например, слово «Apple» может означать фрукт или компанию. Окружающий текст (например, слова «iPhone», «технологии» или «рецепт», «пирог») позволяет Entity Disambiguation System точно определить, какая именно сущность имеется в виду в данном конкретном случае.

    Что важнее для SEO в контексте этого патента: ключевые слова или контекст?

    Контекст и сущности значительно важнее. Патент демонстрирует, что Google стремится понять значение выделенного термина, анализируя его семантическое окружение (Context Data) и связывая его с сущностями. Это подтверждает переход от оптимизации под ключевые слова к оптимизации под семантику и сущности.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.