Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует пользовательские аннотации и коллекции (Web Notebooks) для определения релевантности контента, даже если ключевые слова отсутствуют на странице

    PRESENTING SEARCH RESULT INFORMATION (Представление информации о результатах поиска)
    • US11775535B2
    • Google LLC
    • 2023-10-03
    • 2007-05-10
    2007 Патенты Google Поведенческие сигналы Ссылки

    Google может определять релевантность веб-страницы запросу, опираясь на аннотации, заголовки или комментарии, добавленные пользователями в их коллекциях контента («Web Notebooks»). Этот механизм позволяет странице ранжироваться по терминам, которых нет в ее собственном тексте, используя человеческую категоризацию как сигнал релевантности. Также сохраненные фрагменты могут использоваться для генерации сниппетов.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему «словарного несоответствия» (vocabulary mismatch) в информационном поиске — ситуации, когда релевантный документ не содержит точных терминов, используемых в запросе пользователя. Он позволяет системе преодолеть ограничения анализа текста самой страницы, интегрируя сигналы человеческой курации и интерпретации для более точного определения контекстуальной релевантности. Кроме того, в описании патента рассматривается улучшение качества сниппетов.

    Что запатентовано

    Запатентована система, использующая данные из Web Notebooks (пользовательских коллекций веб-контента, таких как Google Collections/Saves). Ключевым изобретением (Claim 1) является механизм установления релевантности документа запросу на основе текста, добавленного пользователем в коллекцию (аннотации, заголовка), даже если сам документ не содержит терминов запроса.

    Как это работает

    Система анализирует, как пользователи сохраняют и аннотируют контент.

    • Определение релевантности (Claim 1): Если Пользователь А сохраняет Документ Б и добавляет аннотацию (user-supplied free-form text) с Термином Х, а Документ Б не содержит Термин Х, система может показать Документ Б Пользователю В, который ищет Термин Х. Релевантность устанавливается через интерпретацию Пользователя А.
    • Ранжирование и Сниппеты (Описание патента): В описании также указано, что система может повышать ранг (increasing a ranking) страниц, сохраненных в релевантных блокнотах, и использовать сохраненные фрагменты (Clipped Content) для генерации сниппетов.

    Актуальность для SEO

    Высокая. Хотя патентное семейство берет начало в 2006 году (эпоха Google Notebook), этот конкретный патент-продолжение был выдан в 2023 году. Это подчеркивает стратегическую важность использования сигналов человеческой курации для Google. Механизм использования пользовательских аннотаций для преодоления словарного разрыва остается крайне актуальным в современном поиске.

    Важность для SEO

    Патент имеет значительное стратегическое влияние на SEO (70/100). Он демонстрирует конкретный механизм, при котором релевантность может определяться внешними, сгенерированными пользователями сигналами, которые могут функционально перекрывать on-page факторы. Это подчеркивает важность создания контента, который пользователи считают достаточно ценным для сохранения и категоризации, так как их интерпретация может напрямую влиять на видимость в поиске.

    Детальный разбор

    Термины и определения

    Web Notebook (Веб-блокнот / Коллекция)
    Документ, созданный пользователем путем агрегации контента из различных веб-источников в одном месте. Аналог Google Collections или Saves.
    User-supplied free-form text (Введенный пользователем неструктурированный текст)
    Ключевой элемент Claims. Текст, добавленный пользователем в Web Notebook. Включает аннотации (user-annotation), названия (titles) и заголовки (headings).
    Entry (Запись)
    Отдельный элемент в Web Notebook, включающий ссылку на исходный документ и user-supplied free-form text.
    Clipped Content (Скопированный контент)
    Конкретная часть веб-страницы, которую пользователь сохранил. В описании патента упоминается как предпочтительный источник для генерации сниппетов.
    Ranker (Ранжировщик)
    Компонент системы, использующий контент Web Notebooks для определения релевантности и корректировки ранжирования.
    Snippetizer (Генератор сниппетов)
    Компонент, который может использовать Clipped Content для создания сниппетов (упомянут в описании).

    Ключевые утверждения (Анализ Claims)

    Патент US11775535B2 является продолжением (continuation) ранних заявок. Его формула изобретения (Claims 1-14) сфокусирована на конкретном механизме установления релевантности. Важно отметить, что механизмы повышения ранга (boosting) и генерации сниппетов описаны в тексте патента (Description), но не включены в Claims этого конкретного патента B2.

    Claim 1 (Независимый пункт): Описывает метод использования пользовательского текста для определения релевантности документа запросу, когда документ не содержит терминов запроса.

    1. Система идентифицирует запись (entry), созданную Пользователем А (given user) о Веб-документе Б (созданном другим автором).
    2. Запись содержит user-supplied free-form text (Текст Т), добавленный Пользователем А.
    3. Критическое условие: Веб-документ Б НЕ содержит определенных терминов из Текста Т.
    4. Система получает поисковый запрос от Пользователя В (additional user), содержащий эти термины.
    5. Система определяет, что Веб-документ Б релевантен запросу, основываясь на том, что термины присутствуют в Тексте Т (аннотации Пользователя А).
    6. Система предоставляет результат поиска для Веб-документа Б Пользователю В.

    Ядро изобретения — это механизм преодоления словарного несоответствия. Пользовательские аннотации и заголовки в коллекциях функционируют как внешний контекст, аналогично анкорному тексту (anchor text) ссылок. Они позволяют системе понять, что страница о «Кафе А» релевантна запросу «лучший тирамису», если пользователь сохранил страницу и подписал ее «лучший тирамису», даже если на сайте кафе это слово не упоминается.

    Claims 6 и 7 (Зависимые): Уточняют, что user-supplied free-form text может быть названием (title) или заголовком (heading). То, как пользователь называет свою коллекцию или запись, напрямую влияет на релевантность контента внутри нее.

    Где и как применяется

    Изобретение интегрирует данные пользовательской курации в процесс определения релевантности и ранжирования.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе система индексирует данные из Web Notebooks. Ключевая задача — извлечь user-supplied free-form text (аннотации, заголовки), Clipped Content и установить прочную связь между этими данными и исходным URL документа.

    RANKING – Ранжирование (Этап отбора кандидатов / Retrieval)
    Применение Claim 1. На этапе отбора кандидатов система ищет документы, соответствующие запросу не только по их собственному содержанию, но и по связанным с ними аннотациям в Web Notebooks. Это позволяет включать в выдачу документы, которые иначе были бы пропущены из-за отсутствия ключевых слов.

    RANKING – Ранжирование (Этапы L2/L3)
    Как упоминается в описании патента, наличие документа в релевантных блокнотах может использоваться для increasing a ranking (повышения ранга) на более поздних этапах ранжирования.

    METASEARCH / RERANKING – Генерация SERP
    Как упоминается в описании патента, Snippetizer может использовать Clipped Content (ту часть контента, которую пользователи сохранили) для генерации сниппетов в выдаче.

    Входные данные:

    • Поисковый запрос.
    • Индекс веб-документов.
    • Индекс Web Notebooks (включая URL источника, Clipped Content и user-supplied free-form text).

    Выходные данные:

    • Набор результатов поиска, включающий документы, релевантность которых установлена через внешние аннотации, с потенциально улучшенными сниппетами.

    На что влияет

    • Специфические запросы: Наибольшее влияние на запросы, где существует разрыв между терминологией авторов и языком пользователей, или где важна субъективная категоризация (например, «уютное кафе», «легкий рецепт»).
    • Конкретные ниши и типы контента: Влияет на контент, который пользователи склонны собирать и организовывать: путешествия, рецепты, хобби, дизайн, подборки товаров (e-commerce), локальный бизнес.

    Когда применяется

    • Условия применения: Когда существуют доступные системе данные Web Notebooks (публичные коллекции или агрегированные данные), связанные с результатами поиска.
    • Триггер активации (Claim 1): Когда поисковый запрос совпадает с user-supplied free-form text в коллекции, и особенно когда эти термины отсутствуют в исходном документе.
    • Триггер активации (Сниппеты): (Согласно Описанию). Когда для документа существует сохраненный Clipped Content.

    Пошаговый алгоритм

    Процесс установления релевантности (на основе Claim 1)

    1. Предварительная обработка (Офлайн):
      1. Сбор и индексирование Web Notebooks.
      2. Извлечение user-supplied free-form text и ассоциирование их с исходными URL.
    2. Получение запроса: Система получает запрос от Пользователя В.
    3. Анализ индекса блокнотов: Система ищет записи в Web Notebooks, где user-supplied free-form text (созданный Пользователем А) соответствует запросу.
    4. Идентификация связанных документов: Идентифицируются исходные веб-документы, на которые ссылаются найденные записи.
    5. Проверка условий (Claim 1): Система учитывает ситуацию, что исходный документ сам по себе не содержит терминов запроса.
    6. Установление релевантности: Исходные документы признаются релевантными запросу на основе совпадения с аннотациями Пользователя А.
    7. Интеграция и ранжирование: Документы включаются в набор результатов поиска и ранжируются.

    Какие данные и как использует

    Данные на входе

    Система использует данные, сгенерированные пользователями в процессе курации контента.

    • Пользовательский контекст (User-Generated Context):
      • User-supplied free-form text: Аннотации, комментарии, описания. Это критически важный источник сигналов релевантности согласно Claim 1.
    • Структурные факторы (внутри коллекций):
      • Названия (Titles) коллекций или записей (Claim 6).
      • Заголовки (Headings) внутри коллекций (Claim 7).
    • Контентные факторы (внутри коллекций):
      • Clipped Content (используется для генерации сниппетов, согласно описанию).
    • Ссылочные факторы:
      • URL исходного документа, связанного с записью.

    Какие метрики используются и как они считаются

    • Соответствие Запрос-Аннотация: Метрика релевантности между терминами поискового запроса и user-supplied free-form text в коллекции. Это основной механизм для определения релевантности согласно Claim 1.
    • Ranking Boost (Повышение ранга): (Упоминается в Описании). Механизм увеличения оценки ранжирования для результатов, которые упоминаются в релевантных коллекциях.
    • Приоритет Clipped Content: (Упоминается в Описании). Метрика для Snippetizer, определяющая предпочтение сохраненного контента для генерации сниппета.

    Выводы

    1. Внешняя релевантность через человеческую интерпретацию: Патент защищает механизм, при котором релевантность страницы определяется не только ее содержанием, но и тем, как люди ее категоризируют и описывают во внешних коллекциях (Web Notebooks).
    2. Аннотации как аналог анкорного текста (Anchor Text): User-supplied free-form text функционирует аналогично анкорному тексту обратных ссылок, предоставляя мощный внешний контекст. Он сообщает поисковой системе, о чем этот контент с точки зрения пользователя.
    3. Преодоление словарного несоответствия (Vocabulary Mismatch): Ключевая ценность изобретения (Claim 1) — возможность ранжировать страницу по терминам, которых на ней нет. Если пользователи ассоциируют определенные термины с контентом, Google может принять эту ассоциацию как сигнал релевантности.
    4. Сниппеты, отражающие ценность (Из Описания): Система может использовать Clipped Content для генерации сниппетов, предполагая, что сохраненный пользователями контент является наиболее важной частью страницы.
    5. Актуальность концепции: Несмотря на возраст идеи и закрытие Google Notebook, выдача патента в 2023 году подтверждает стратегическую важность сигналов пользовательской курации для Google, которые могут применяться к современным продуктам (например, Google Collections).

    Практика

    Best practices (это мы делаем)

    • Создавайте контент, достойный сохранения (Savable Content): Фокусируйтесь на создании высокополезного, справочного или вдохновляющего контента, который пользователи захотят сохранить для будущего использования (гайды, чек-листы, уникальные данные, рецепты).
    • Изучайте язык и категоризацию пользователей: Анализируйте, как пользователи описывают ваш контент своими словами на внешних платформах. Это дает понимание того, какие термины они ассоциируют с вашим контентом (аналог user-supplied free-form text), что может влиять на релевантность по Claim 1.
    • Оптимизируйте под «копируемость» (Clippability): (На основе Описания патента). Используйте четкую структуру и выделяйте ключевые выводы. Контент, который легко извлечь и сохранить, с большей вероятностью будет использован для генерации сниппетов, если он будет сохранен пользователями.
    • Стимулируйте тематическую ассоциацию: Создавайте контент и бренд так, чтобы пользователи естественным образом категоризировали его с нужными вам темами. Если ваш контент сохраняют в коллекции с четкими названиями, это служит сильным сигналом.

    Worst practices (это делать не надо)

    • Фокус исключительно на On-Page SEO: Полагаться только на наличие ключевых слов на странице недостаточно. Патент показывает, что внешняя пользовательская интерпретация может переопределить отсутствие ключевых слов на странице.
    • Создание тонкого контента (Thin Content): Контент, не представляющий достаточной ценности для сохранения или аннотирования, не получит преимуществ от этого механизма.
    • Игнорирование пользовательского словаря: Использование только профессиональной терминологии, игнорируя то, как пользователи реально ищут и категоризируют информацию в вашей нише.
    • Манипуляции с коллекциями: Попытки создать фейковые сети коллекций для искусственного создания аннотаций будут расценены как спам.

    Стратегическое значение

    Патент подтверждает долгосрочную стратегию Google по интеграции сигналов, основанных на человеческой валидации и поведении. Он демонстрирует, что релевантность — это не только совпадение текста, но и понимание контекста использования контента. Для долгосрочной SEO-стратегии критически важно создавать контент, который не просто отвечает на запрос, но и становится частью пользовательских рабочих процессов (исследования, планирования, покупок), стимулируя его сохранение и курацию.

    Практические примеры

    Сценарий: Установление релевантности по отсутствующим терминам (Claim 1)

    1. Контент: Веб-сайт локального кафе «Уютный уголок». В текстах используются слова «кофе», «выпечка», «атмосфера», но нет термина «коворкинг» или «место для работы».
    2. Действие пользователя (User A): Пользователь сохраняет ссылку на это кафе в своей публичной коллекции (например, Google Collections или Google Maps List) под названием «Лучшие места для работы с ноутбуком».
    3. Поисковый запрос (User B): Другой пользователь ищет «кафе для работы с ноутбуком».
    4. Результат (согласно патенту): Google индексирует название коллекции (user-supplied free-form text) Пользователя А. Несмотря на отсутствие нужных слов на сайте кафе, система использует этот внешний контекст для установления релевантности. Сайт кафе появляется в результатах поиска по этому запросу.

    Вопросы и ответы

    Что такое «Web Notebook» и актуально ли это сегодня?

    Web Notebook в патенте — это общий термин для пользовательских коллекций веб-контента, исторически связанный с Google Notebook. Хотя этот продукт закрыт, концепция актуальна. Google может применять описанные механизмы к современным аналогам: Google Collections (Saves), спискам в Google Maps или закладкам Chrome.

    Может ли страница ранжироваться по словам, которых нет в ее тексте?

    Да, это центральная идея Claim 1 данного патента. Если пользователи сохраняют вашу страницу в коллекцию и добавляют аннотацию или заголовок (user-supplied free-form text), содержащий определенные термины, ваша страница может быть признана релевантной этим терминам, даже если она сама их не содержит.

    Как пользовательские аннотации влияют на ранжирование?

    Они функционируют как мощный внешний контекст, подобно анкорному тексту обратных ссылок. Аннотации сообщают поисковой системе, о чем связанный контент с точки зрения человека. Это позволяет преодолеть разрыв между терминологией автора страницы и поисковым запросом пользователя.

    Как этот патент влияет на генерацию сниппетов?

    В описании патента (хотя это и не включено в Claims этого конкретного патента B2) указано, что система может использовать Clipped Content (ту часть контента, которую пользователи сохранили) для генерации сниппета. Это означает, что наиболее часто сохраняемая часть страницы имеет больше шансов появиться в сниппете в SERP.

    Как SEO-специалисты могут оптимизировать сайт под этот механизм?

    Прямая оптимизация затруднена, так как сигналы зависят от поведения пользователей. Стратегия заключается в создании контента исключительной ценности («Savable Content»), который пользователи захотят сохранить и категоризировать. Также важно изучать, как пользователи описывают ваш контент своими словами на внешних платформах.

    Имеет ли значение авторитетность пользователя, создавшего коллекцию?

    Патент явно не детализирует это, но в описании упоминается возможность ранжирования самих блокнотов. Логично предположить, что сигналы от авторитетных кураторов или из популярных, часто просматриваемых коллекций будут иметь больший вес, чем сигналы из изолированных или новых коллекций.

    Используются ли данные только из публичных коллекций?

    Для влияния на глобальный поиск (как в Claim 1, где действия одного пользователя влияют на результаты другого) данные должны быть либо публичными, либо агрегированными и анонимизированными Google. Личные коллекции могут использоваться для персонализации выдачи конкретного пользователя.

    Что важнее: заголовок коллекции или аннотация к конкретной записи?

    Патент (Claims 6 и 7) указывает, что и названия (titles), и заголовки (headings) рассматриваются как user-supplied free-form text и могут использоваться для установления релевантности. Оба элемента важны как источники контекста.

    На какие типы сайтов это влияет больше всего?

    Наибольшее влияние он оказывает на тематики, где пользователи активно занимаются сбором информации и планированием: рецепты, путешествия, хобби, исследования, e-commerce (списки желаний) и локальный поиск. В этих нишах пользовательская категоризация имеет высокую ценность.

    Почему Google выдал этот патент в 2023 году, если технология старая?

    Это патент-продолжение (continuation). Google решил выделить конкретный механизм (Claim 1) и получить на него защиту. Это подтверждает, что механизм использования пользовательских аннотаций для преодоления словарного несоответствия остается стратегически важным компонентом современного информационного поиска.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.