
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
Патент решает проблему генерации наиболее релевантных и полезных сниппетов и саммари для документов. Стандартные методы могут упускать фрагменты, которые реальные пользователи считают наиболее важными. Патент предлагает масштабируемый метод определения важности элементов контента на основе действий пользователей (выделение текста), что также служит альтернативой дорогостоящим исследованиям (например, eye-tracking) для анализа внимания пользователей.
Запатентована система сбора, агрегации и использования данных о выделении пользователями элементов в документах. Система собирает данные о том, какие фрагменты (elements) выделяют пользователи (явно через highlighting или неявно через marking), и вычисляет веса (Weight Values) для этих элементов на основе их популярности. Эти веса используются для динамического формирования поисковых сниппетов, гарантируя включение элементов, которые превысили определенный порог популярности (threshold quantity of users).
Система работает в несколько этапов:
Marking), информация об этом действии отправляется на сервер.Per-user database), так и в агрегированной базе (Aggregate database) для документа.Weight Value.Weight Value и количество выделений превышают установленные пороги. Эти элементы приоритетно включаются в сниппет.Document Statistics), показывающих популярность разных частей документа.Высокая. Хотя конкретные реализации, описанные в патенте (например, тулбары или интерактивные слайдеры в SERP), могли устареть, концепция использования реальных пользовательских взаимодействий (RUI) для оценки важности контента крайне актуальна. Критически важно, что патент (Claim 2) описывает возможность неявного сбора данных через Marking (простое выделение текста). Современные браузеры (Chrome) и ОС (Android) предоставляют широкие возможности для сбора подобной статистики (например, выделение, копирование текста) без необходимости в специальных инструментах.
Влияние на SEO значительное (8/10). Этот патент напрямую описывает механизм, влияющий на представление контента в SERP (сниппеты), что критично для CTR. Он демонстрирует, что Google может использовать сигналы вовлеченности на уровне отдельных фрагментов текста для определения их ценности. Это подчеркивает важность создания контента, который не просто читают, но с которым активно взаимодействуют (выделяют, копируют).
Weight Values.Weight Values. Может визуализироваться как тепловая карта (hotspots), показывающая наиболее популярные части документа.highlighting.Weight Values.Claim 1 (Независимый пункт): Описывает основной механизм генерации сниппетов на основе агрегированных данных.
search result snippet).threshold quantity of users).Claims 2 и 3 (Зависимые от 1): Уточняют, как система интерпретирует действия пользователя как выделение. Это критически важные пункты.
marked) элемент в документе. Это означает, что простое выделение текста мышью может считаться сигналом.highlighted) элемент (например, используя специальный инструмент).Claim 4 (Зависимый от 1): Подтверждает механизм расчета.
Генерация сниппета включает определение количества пользователей, выделивших элемент, и сравнение этого количества с пороговым значением.
Claims 5, 6 и 7 (Зависимые): Описывают механизм динамической настройки сниппета пользователем.
Claim 8 (Зависимый от 1): Описывает архитектуру хранения данных.
Информация постоянно хранится в двух местах: в первой памяти (Per-user database), ассоциированной с конкретным пользователем, и во второй памяти (Aggregate database), где данные агрегированы для документа.
Claims 9 и 10 (Зависимые от 1): Описывают генерацию статистики (тепловых карт).
Система генерирует и предоставляет Document Statistics на основе данных о выделении. Статистика может быть визуально представлена с использованием цветов или паттернов для отображения разницы в популярности элементов.
Изобретение затрагивает несколько этапов сбора и обработки данных, а также финальный этап формирования выдачи.
CRAWLING & INDEXING (Сбор данных и Извлечение признаков)
Сбор данных о выделении происходит не во время стандартного краулинга, а через взаимодействие пользователя с контентом (браузер, тулбар, ОС). На этапе индексирования (или в параллельном офлайн-процессе) эти поведенческие данные обрабатываются: рассчитываются Weight Values и сохраняются в Aggregate database, ассоциируясь с индексом документа.
METASEARCH / RERANKING (Генерация сниппетов)
Основное применение патента. На этапе формирования финальной SERP.
Weight Values.Threshold quantity of users и порог веса.Входные данные:
Highlighting или Marking).Выходные данные:
Weight Values.Document Statistics (тепловая карта).Threshold quantity of users). В патенте это объясняется необходимостью обеспечения статистической значимости и конфиденциальности.Процесс А: Сбор и Агрегация данных (Фоновый процесс)
Highlighting (через инструмент), либо неявное Marking (выделение мышью, как описано в Claim 2).Annotation Collector).Per-user database.Aggregate database и пересчитывает Weight Value для элемента.Процесс Б: Генерация динамического сниппета (Во время поиска)
Weight Values.Weight Value Threshold) и порог количества пользователей (Threshold quantity of users).Element).Highlighting, Marking). Это ключевой тип данных, используемый как индикатор интереса пользователя к фрагменту.Weight Value (Вес элемента): Основная метрика. Является функцией от количества пользователей, выделивших данный элемент. Может быть нормализована (например, 0-100).Threshold quantity of users (Пороговое количество пользователей): Минимальное число пользователей, необходимое для учета элемента. Используется для статистической значимости и защиты конфиденциальности ("For privacy reasons, an element may need to be highlighted by at least a certain number of users before that element can be considered a candidate element").Weight Value Threshold (Порог веса): Значение, выше которого элементы считаются кандидатами для включения в сниппет. Этот порог может быть системным или настраиваться пользователем динамически (с помощью слайдера).Marking (Claim 2) позволяет системе собирать данные не только через специальные инструменты, но и когда пользователь просто выделяет текст мышью. Это значительно расширяет возможности масштабного сбора данных о внимании пользователя.Document Statistics позволяет Google анализировать "горячие точки" (hotspots) внутри документа в больших масштабах, что является дешевой и эффективной альтернативой eye-tracking.Threshold quantity of users) для влияния на общую выдачу.Marking), которые Google потенциально может использовать для оценки важности контента и генерации сниппетов.Weight Values.Этот патент подтверждает стратегическую важность сигналов реального взаимодействия пользователя (RUI). Ценность контента определяется не только его содержанием и ссылками, но и тем, как именно пользователи его потребляют на уровне отдельных элементов. Учитывая возможность неявного сбора данных (Marking), описанную в Claim 2, этот патент приобретает высокое стратегическое значение в эпоху сбора данных через браузеры и ОС. SEO-стратегия должна включать оптимизацию контента для повышения вовлеченности и интерактивности.
Сценарий: Оптимизация информационной статьи (Руководства)
Marking) и копировать определения, данные из таблицы и пункты списка.Weight Values в Aggregate database. При релевантных поисковых запросах Google сгенерирует сниппет, включающий именно эти популярные фрагменты (например, часть списка характеристик), что повышает информативность сниппета и CTR.Означает ли этот патент, что Google отслеживает все, что я выделяю мышью на странице?
Патент (Claim 2, Marking) описывает такую техническую возможность. Система может интерпретировать простое выделение текста мышью как сигнал интереса, не требуя нажатия специальных кнопок. Реализуется ли это в современных системах (например, через браузер Chrome или ОС Android) и в каком объеме – неизвестно, но техническая основа для такого масштабного сбора данных о внимании пользователей заложена в этом патенте.
Как рассчитывается "Вес элемента" (Weight Value)?
Weight Value является функцией от количества разных пользователей, которые выделили этот конкретный элемент. Чем больше людей выделили фрагмент, тем выше его вес. Патент также упоминает, что эти значения могут быть нормализованы (например, по шкале от 0 до 100) для удобства сравнения популярности разных фрагментов.
Что такое "Пороговое количество пользователей" и зачем оно нужно?
Это минимальное количество людей, которые должны выделить элемент, прежде чем он будет использован системой для генерации сниппета. Это необходимо по двум причинам: для обеспечения статистической значимости (чтобы избежать случайных выделений) и для защиты конфиденциальности (чтобы нельзя было идентифицировать действия одного конкретного пользователя через агрегированный сниппет).
Влияют ли эти данные о выделении текста на ранжирование документа?
Патент напрямую фокусируется на генерации сниппетов, саммари и статистики (тепловых карт), а не на изменении Ranking Score документа. Однако, косвенно, наличие высококачественных сигналов взаимодействия с контентом может положительно влиять на общую оценку качества страницы, а улучшенные сниппеты могут повысить CTR, что также является поведенческим сигналом.
Стоит ли запрещать копирование текста на сайте, чтобы контент не воровали?
С точки зрения этого патента, это плохая практика. Запрет на выделение и копирование текста блокирует возможность сбора сигналов Marking. Если пользователи не могут взаимодействовать с вашим контентом, система не получит данных о том, какие его части наиболее важны, что может привести к формированию менее качественных сниппетов.
Как я могу стимулировать пользователей выделять нужные мне фрагменты?
Используйте четкую структуру, выделяйте ключевые мысли, давайте конкретные данные, определения или инструкции. Контент, который легко цитировать, копировать или сохранять для дальнейшего использования, будет естественным образом собирать больше сигналов выделения. Хорошее юзабилити и читабельность также способствуют этому.
Что такое "Document Statistics", описанные в патенте?
Это аналитические данные, показывающие, какие части документа наиболее популярны у пользователей на основе частоты их выделения. В патенте это описывается как визуализация в виде тепловой карты (hotspots) прямо поверх документа, где разные цвета показывают уровень интереса к разным фрагментам. Это позиционируется как дешевая альтернатива eye-tracking.
Патент описывает слайдер для настройки сниппета. Где он находится в выдаче Google?
Описанный в патенте интерфейс (слайдер для динамического изменения порога популярности и длины сниппета) не был широко реализован в публичном интерфейсе поиска Google. Это пример того, что не все идеи из патентов реализуются в финальном продукте в том виде, в котором они были описаны.
Какова связь этого патента с Passage Ranking?
Концептуально они связаны, так как обе технологии направлены на выявление наиболее значимых фрагментов документа. Разница в методах: этот патент использует явные или неявные сигналы пользователей (выделения) для определения важности, тогда как Passage Ranking использует сложные NLP-модели для определения семантической релевантности фрагмента запросу.
Может ли этот механизм использоваться для генерации Featured Snippets?
Хотя патент фокусируется на стандартных поисковых сниппетах (search result snippet), логично предположить, что данные о наиболее часто выделяемых фрагментах (элементах с высоким Weight Value) могут быть ценным сигналом для систем, отвечающих за выбор контента для Featured Snippets, так как они указывают на наиболее информативные и полезные части документа по мнению пользователей.

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

SERP
Индексация
Техническое SEO

SERP
Семантика и интент

Поведенческие сигналы
Мультимедиа
Семантика и интент

Безопасный поиск
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Local SEO
Персонализация

Техническое SEO
Ссылки

Поведенческие сигналы
Семантика и интент
SERP

EEAT и качество
SERP
Knowledge Graph
