Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google автоматически встраивает персонализированные ссылки и рекламу в контент, комбинируя тематику страницы и профиль пользователя

    ENHANCED DOCUMENT BROWSING WITH AUTOMATICALLY GENERATED LINKS TO RELEVANT INFORMATION (Улучшенный просмотр документов с автоматически генерируемыми ссылками на релевантную информацию)
    • US9697205B2
    • Google LLC
    • 2017-07-04
    • 2004-06-30
    2004 Shumeet Baluja Патенты Google Персонализация Поведенческие сигналы Ссылки

    Google использует механизм для динамического обогащения просматриваемых веб-страниц. Система анализирует контент страницы и персональные данные пользователя (история поиска, местоположение, интересы), формирует комбинированный внутренний поисковый запрос, находит релевантные внешние документы или рекламу и встраивает ссылки на них непосредственно в текст исходной страницы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу улучшения пользовательского опыта при просмотре контента путем предоставления гипер-релевантной дополнительной информации. Традиционные методы часто показывают связанные ссылки вне основного контента и основываются только на содержании текущего документа, игнорируя персональный контекст пользователя. Изобретение улучшает релевантность, учитывая как контекст документа, так и профиль пользователя, и интегрирует ссылки непосредственно в текст (in-line).

    Что запатентовано

    Запатентована система динамической модификации документов. Ключевым механизмом является генерация Descriptive Information (описательной информации, часто в виде поискового запроса) путем комбинирования анализа контента текущего документа (например, извлечение Named Entities) и Personal Information пользователя (местоположение, история поиска, интересы). Эта комбинированная информация используется для поиска дополнительных релевантных документов или рекламы, которые затем встраиваются в исходный документ.

    Как это работает

    Система функционирует в момент запроса документа:

    • Сбор данных: Система получает текущий документ и доступ к Personal Information пользователя.
    • Анализ и Синтез: Контент анализируется для извлечения сущностей и ключевых слов. Эти данные комбинируются с профилем пользователя для формирования Descriptive Information (внутреннего поискового запроса).
    • Поиск: Этот комбинированный запрос используется для поиска дополнительных релевантных документов.
    • Встраивание (Embedding): Система модифицирует исходный документ, встраивая ссылки на найденные материалы in-line, рядом с текстом, к которому они контекстуально относятся.

    Актуальность для SEO

    Высокая. Хотя патент является продолжением заявки от 2004 года, концепции персонализации, извлечения сущностей и контекстного таргетинга являются фундаментальными для современных информационных систем и рекламы. Принципы объединения контекста страницы и профиля пользователя лежат в основе работы рекомендательных систем (например, Google Discover) и контекстной рекламы. Хотя динамическое изменение стороннего HTML на лету в браузере не стало мейнстримом, описанные методы анализа и персонализации крайне актуальны.

    Важность для SEO

    Патент имеет значительное стратегическое значение (7/10). Он не описывает алгоритмы ранжирования в основной выдаче (SERP). Однако он детально раскрывает, как Google комбинирует анализ контента (сущности) и глубокое профилирование пользователей (интересы, локация) для определения релевантности. Этот механизм может генерировать высоко таргетированный трафик в обход традиционного поиска. Чтобы стать целевым ресурсом для таких ссылок, сайт должен быть оптимизирован под комбинацию сущностей и конкретных профилей пользователей.

    Детальный разбор

    Термины и определения

    Descriptive Information (Описательная информация)
    Данные, сгенерированные путем комбинации контента текущего документа и персональной информации пользователя. Используются как поисковый запрос (search query) для поиска дополнительного контента.
    Personal Information (Персональная информация)
    Данные о пользователе: географическое положение, история поисковых запросов (previous search queries), история просмотров (browsing history), данные аккаунта, временная информация (например, сезон) и выведенные интересы.
    Named Entities (Именованные сущности)
    Конкретные объекты (люди, места, организации, продукты), извлекаемые из текста документа. Служат основой для понимания контекста и точками для встраивания ссылок.
    In-line Embedding (Встраивание в строку/текст)
    Метод интеграции ссылок или сниппетов непосредственно в текст текущего документа, рядом с релевантными словами или фразами.
    Additional Documents (Дополнительные документы)
    Внешние документы или реклама (advertisement), найденные системой как релевантные Descriptive Information.
    Category Matching Techniques (Методы сопоставления категорий)
    Техники для вывода интересов пользователя на основе анализа его предыдущих поисковых запросов и сессий.
    Descriptive Information Generator
    Компонент системы, отвечающий за анализ входных данных и формирование Descriptive Information.
    Formatting Component
    Компонент, отвечающий за модификацию текущего документа и встраивание ссылок.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод персонализированного обогащения веб-страниц.

    1. Система идентифицирует информацию (термины) в контенте первой веб-страницы, к которой обращается пользователь.
    2. Система формирует поисковый запрос, основанный на комбинации двух элементов: идентифицированной информации (из контента) И информации, связанной с пользователем (персональные данные).
    3. Система идентифицирует вторую веб-страницу на основе этого комбинированного запроса.
    4. Система модифицирует первую веб-страницу, вставляя ссылку (reference) на вторую веб-страницу. Ссылка включает текст, связанный с контентом второй страницы.
    5. Система предоставляет модифицированную первую веб-страницу пользователю.

    Ядро изобретения — это использование комбинации контекста документа и персонализации для поиска и встраивания внешних ресурсов.

    Claim 2 (Зависимый от 1): Уточняет, что вставка ссылки происходит in-line (в строку) с идентифицированной информацией, обеспечивая контекстуальность.

    Claim 4 (Зависимый от 1): Детализирует методы анализа контента первой страницы. Идентификация информации включает парсинг для выявления терминов, появляющихся чаще определенного порога, дат, информации об авторе или публикации.

    Claim 5 (Зависимый от 1): Описывает процесс валидации идентифицированной информации. Она сравнивается с хранимой информацией (например, базой сущностей), и совпадения используются для формирования поискового запроса.

    Claim 6 (Зависимый от 1): Уточняет типы персональной информации: географическое положение, данные регистрации аккаунта или история просмотров (browsing history).

    Claim 7 (Зависимый от 1): Указывает, что ссылка на вторую веб-страницу может быть рекламой (advertisement).

    Где и как применяется

    Этот патент описывает систему дополнения контента (Content Augmentation), которая функционирует в момент доставки контента пользователю, затрагивая несколько этапов обработки информации.

    INDEXING – Индексирование и извлечение признаков (На лету)
    Когда пользователь запрашивает документ, система должна быстро проанализировать его контент для извлечения Descriptive Information (например, Named Entities, ключевых слов, авторов). Это может происходить в реальном времени.

    QUNDERSTANDING – Понимание Запросов (Профилирование и Внутренний Запрос)
    Система использует предварительно собранную Personal Information и анализирует историю поиска для вывода интересов пользователя (Category matching techniques). Затем Descriptive Information Generator интерпретирует контекст (документ + пользователь) и преобразует его во внутренний поисковый запрос.

    RANKING – Ранжирование (Внутренний поиск)
    Search Component выполняет поиск по внутреннему запросу и ранжирует найденные Additional Documents. Используются метрики релевантности (query match score) и качества документа (упоминается link-based measurement of document quality).

    RERANKING / Presentation Layer (Уровень представления)
    Основное применение патента. Formatting Component отвечает за финальный этап – модификацию исходного документа и встраивание ссылок (in-line embedding) в контекстуально релевантных местах перед показом пользователю.

    Входные данные:

    • Текущий документ, запрошенный пользователем.
    • Personal Information пользователя (геолокация, история поиска/просмотров, интересы, временной контекст).

    Выходные данные:

    • Модифицированная версия текущего документа с встроенными ссылками на дополнительные документы или рекламу.

    На что влияет

    • Типы контента: Наибольшее влияние на информационный контент (статьи, новости, блоги), богатый именованными сущностями, которые служат анкорями для дополнительных ссылок.
    • Реклама: Патент явно описывает механизм для высокоточного таргетинга контекстной рекламы, учитывающей и контент, и профиль пользователя.
    • Ниши и тематики: Влияет на тематики, где важна персонализация и локализация (путешествия, хобби, новости, товары).

    Когда применяется

    • Условия работы: Алгоритм применяется в момент, когда пользователь запрашивает или просматривает документ через систему, реализующую данную технологию (например, агрегатор новостей, рекламная сеть или специализированное приложение).
    • Триггеры активации: Наличие в документе идентифицируемых Named Entities или ключевых слов И наличие доступной Personal Information о пользователе, позволяющей персонализировать поиск дополнительных материалов.

    Пошаговый алгоритм

    Процесс динамического обогащения документа:

    1. Получение персональной информации: Система получает или определяет Personal Information пользователя (местоположение, интересы из истории поиска, временной контекст).
    2. Получение текущего документа: Система получает документ, запрошенный пользователем.
    3. Генерация описательной информации (Descriptive Information):
      • Анализ документа: Извлечение именованных сущностей, частотных терминов, дат, авторов.
      • Анализ пользователя: Определение интересов пользователя, например, с помощью Category matching techniques.
      • Синтез: Комбинирование данных документа и пользователя для формирования одного или нескольких внутренних поисковых запросов.
    4. Поиск дополнительных документов: Внутренние запросы отправляются в поисковую систему (общую, новостную, товарную).
    5. Ранжирование и отбор: Полученные результаты ранжируются по релевантности комбинированному запросу и качеству. Отбираются Топ-N документов или рекламных объявлений.
    6. Встраивание (Embedding): Система определяет наиболее релевантные места в текущем документе и модифицирует его, встраивая ссылки in-line.
    7. Возврат документа пользователю: Модифицированная версия документа отображается пользователю.

    Какие данные и как использует

    Данные на входе

    Система использует два основных потока данных:

    1. Данные, основанные на контенте:

    • Контентные факторы: Текст документа анализируется для извлечения Named Entities (имена людей, локации, компании, продукты) и частотных терминов (с учетом общей частоты в языке).
    • Временные факторы: Даты, упомянутые в документе, или дата публикации.
    • Метаданные: Автор и название публикации.

    2. Данные, основанные на пользователе (Personal Information):

    • Поведенческие факторы: История поисковых запросов (previous search queries) и история просмотров (browsing history).
    • Географические факторы: Текущее местоположение пользователя (например, на основе IP-адреса).
    • Пользовательские факторы: Информация из аккаунта пользователя.
    • Временные факторы: Текущая дата или сезон (temporal information), используемые для корреляции с контентом.

    Какие метрики используются и как они считаются

    • Вывод интересов пользователя (Interest Inference): Используются Category matching techniques для анализа истории поиска и сессий (user search sessions). Например, запросы «Nikon» и «f-stop» могут быть связаны с категорией «фотография».
    • Частота терминов (Term Frequency): Используется для выявления важных терминов в исходном документе. Может учитываться общая частота термина в языке.
    • Формирование запроса: Метрикой является сгенерированный поисковый запрос, который представляет собой комбинацию (например, конкатенацию) терминов из контента и персональных данных.
    • Query Match Score (Оценка соответствия запросу): Используется для определения релевантности дополнительных документов сгенерированному комбинированному запросу.
    • Document Quality (Качество документа): Патент упоминает возможность использования метрик качества (например, link-based measurement) для ранжирования найденных дополнительных документов.

    Выводы

    1. Релевантность = Контент + Персонализация: Ключевая идея патента — релевантность дополнительной информации определяется строго на пересечении тематики текущего документа и личного профиля пользователя (интересы, локация, история).
    2. Важность Именованных Сущностей (Named Entities): Сущности являются основным механизмом для понимания контекста документа. Они служат анкорями для генерации Descriptive Information и определяют места для контекстуального встраивания ссылок.
    3. Глубокое профилирование интересов: Система активно выводит интересы пользователя из его поискового поведения (Category Matching), даже если пользователь явно не искал эту тему. Анализ сессий поиска используется для построения сложного профиля.
    4. Динамическое обогащение контента (In-line Embedding): Система модифицирует контент на лету, встраивая ссылки непосредственно в текст для обеспечения максимальной контекстуальности.
    5. Интеграция рекламы: Механизм явно предназначен для встраивания высоко таргетированной рекламы (advertisement), которая релевантна как контенту, так и пользователю.

    Практика

    Best practices (это мы делаем)

    • Оптимизация под сущности (Entity Optimization): Убедитесь, что ваш контент четко сфокусирован на конкретных Named Entities. Это повышает вероятность того, что ваш контент будет идентифицирован как релевантный дополнительный материал, когда эти сущности упоминаются на других сайтах.
    • Создание контента для пересечения интересов (Topical Breadth): Разрабатывайте контент, который учитывает смежные интересы аудитории. Поскольку система комбинирует тему и интересы пользователя (например, Тема: Эверест + Интерес: Фотография), контент, покрывающий эти пересечения, имеет больше шансов быть показанным.
    • Усиление локальных сигналов (Local SEO): Геолокация является ключевым компонентом Personal Information. Для локального бизнеса критически важно создавать контент с четкой географической привязкой, чтобы система могла рекомендовать его пользователям, находящимся поблизоosti.
    • Понимание профилей аудитории: Анализируйте поведение и интересы вашей аудитории. Используйте эти знания для создания контента, который соответствует их долгосрочным профилям интересов, что актуально для систем типа Google Discover, работающих на схожих принципах.

    Worst practices (это делать не надо)

    • Создание общего контента без конкретики: Контент, из которого сложно извлечь четкие Named Entities или факты, будет плохо обрабатываться подобными системами. Он не предоставит достаточно данных для генерации качественной Descriptive Information.
    • Игнорирование персонализации: Фокусировка только на общих ключевых словах без учета того, как контент может быть связан с различными профилями пользователей (интересы, локация), снижает потенциал в системах динамического связывания и рекомендаций.

    Стратегическое значение

    Этот патент демонстрирует стратегию Google по предоставлению информации максимально контекстуально и персонализировано. Для SEO это подтверждает важность перехода от оптимизации под ключевые слова к оптимизации под комбинацию сущностей (Entities) и профилей пользователей (User Profiles). Долгосрочная стратегия должна учитывать, что релевантность все больше определяется не только соответствием «запрос-документ», но и соответствием «контекст-пользователь-документ».

    Практические примеры

    Сценарий 1: Персонализация на основе предполагаемых интересов

    • Ситуация: Пользователь, который ранее часто искал информацию о фототехнике (определено через Category Matching как интерес «Фотография»), читает статью о путешествии в Кению.
    • Действие системы:
      1. Анализ контента: Извлечены сущности «Кения», «Сафари».
      2. Анализ пользователя: Определен интерес «Фотография».
      3. Генерация запроса: Формируется внутренний запрос, например, «Оборудование для фотосъемки на сафари».
      4. Встраивание: В статью о Кении встраивается ссылка на авторитетный обзор «Лучшие объективы для фотосъемки дикой природы».
    • Результат для SEO (Сайт с обзором): Сайт получает высоко таргетированный переход от пользователя с релевантным интересом из статьи на смежную тему.

    Сценарий 2: Локализация и Реклама

    • Ситуация: Пользователь, находящийся в Сан-Хосе (определено по IP), читает статью о походе на гору Эверест.
    • Действие системы:
      1. Анализ контента: Извлечены сущности «Эверест», «поход», «снаряжение».
      2. Анализ пользователя: Определено местоположение «Сан-Хосе».
      3. Генерация запроса: Формируется запрос, например, «магазин походного снаряжения Сан-Хосе».
      4. Встраивание: В статью встраивается реклама (advertisement) местного магазина снаряжения (как показано в примере патента).
    • Результат для SEO (Магазин): Локальный бизнес получил высокоцелевой показ пользователю с релевантным контекстом чтения.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в основном поиске Google (SERP)?

    Напрямую нет. Патент описывает систему дополнения контента (Content Augmentation), которая работает после того, как пользователь открыл документ. Он не касается алгоритмов ранжирования в SERP. Однако он показывает, какие факторы (сущности, качество контента, интересы пользователя) Google считает важными для определения релевантности, что косвенно связано с общими принципами поиска.

    Как система определяет интересы пользователя, если он не искал эту тему напрямую?

    Патент описывает использование Category matching techniques на основе анализа истории поиска и сессий. Если пользователь искал термины, которые часто связаны с определенной категорией (например, запросы о моделях камер связаны с категорией «фотография»), система делает вывод об интересе пользователя к этой категории, даже если он не вводил это слово.

    Что такое «Descriptive Information» и как она формируется?

    Descriptive Information — это ядро изобретения. Это внутренний поисковый запрос, который система генерирует путем объединения ключевых элементов из просматриваемого документа (сущности, ключевые слова) и персональных данных пользователя (местоположение, интересы). Это синтез контекста контента и контекста пользователя.

    Какова роль Named Entities (Именованных сущностей) в этом патенте?

    Они критически важны. Named Entities являются основным способом понимания контекста документа. Они извлекаются для формирования Descriptive Information и также служат анкорями для определения оптимального места вставки (in-line embedding) дополнительной ссылки в тексте.

    Может ли эта система встраивать рекламу?

    Да, абсолютно. Claim 7 прямо указывает, что встраиваемая ссылка может быть рекламой (advertisement). Механизм обеспечивает очень точный таргетинг, так как учитывает и сиюминутный контекст чтения, и долгосрочный профиль пользователя.

    Как SEO-специалисту оптимизировать контент под этот механизм?

    Необходимо сосредоточиться на создании контента, богатого Named Entities, и четко таргетировать его на пересечение тематики и конкретных профилей интересов пользователей. Чем лучше ваш контент соответствует такой комбинации, тем выше вероятность его выбора в качестве дополнительного релевантного документа.

    Насколько важна геолокация в этом патенте?

    Она очень важна и является ключевой частью Personal Information. Система активно использует местоположение пользователя для поиска локально релевантного контента или рекламы. Это подчеркивает важность локального SEO и учета географического контекста пользователя при создании контента.

    Учитывает ли система качество дополнительных документов, на которые ссылается?

    Да. При поиске дополнительных документов система использует компонент ранжирования. Патент упоминает, что ранжирование может основываться на оценке соответствия запросу (query match score) и других показателях качества, таких как link-based measurement of document quality.

    Означает ли это, что Google переписывает контент на моем сайте?

    Патент описывает технологию, которая модифицирует документ перед показом пользователю. Это не означает изменение контента на вашем сервере. Модификация может происходить на стороне клиента (например, через браузер или приложение), через промежуточный сервис, или если контент просматривается на платформе Google (например, Google News).

    Учитывает ли система сезонность или время?

    Да, патент упоминает использование временной информации (temporal information), такой как текущая дата или сезон. Это позволяет системе коррелировать события в документе с текущим временем, например, предлагать ссылки на актуальные события или сезонные активности, если время их проведения совпадает с моментом чтения статьи.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.