SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента

IN RESPONSE TO A SEARCH RESULT QUERY PROVIDING A SNIPPET OF A DOCUMENT INCLUDING AN ELEMENT PREVIOUSLY HIGHLIGHTED BY A USER (В ответ на поисковый запрос предоставление сниппета документа, включающего элемент, ранее выделенный пользователем)
  • US8595619B1
  • Google LLC
  • 2007-01-31
  • 2013-11-26
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.

Описание

Какую проблему решает

Патент решает проблему генерации наиболее релевантных и полезных сниппетов и саммари для документов. Стандартные методы могут упускать фрагменты, которые реальные пользователи считают наиболее важными. Патент предлагает масштабируемый метод определения важности элементов контента на основе действий пользователей (выделение текста), что также служит альтернативой дорогостоящим исследованиям (например, eye-tracking) для анализа внимания пользователей.

Что запатентовано

Запатентована система сбора, агрегации и использования данных о выделении пользователями элементов в документах. Система собирает данные о том, какие фрагменты (elements) выделяют пользователи (явно через highlighting или неявно через marking), и вычисляет веса (Weight Values) для этих элементов на основе их популярности. Эти веса используются для динамического формирования поисковых сниппетов, гарантируя включение элементов, которые превысили определенный порог популярности (threshold quantity of users).

Как это работает

Система работает в несколько этапов:

  • Сбор данных: Когда пользователь выделяет текст на странице (используя специальный инструмент ИЛИ просто выделяя текст мышью – Marking), информация об этом действии отправляется на сервер.
  • Хранение: Данные сохраняются как в базе для конкретного пользователя (Per-user database), так и в агрегированной базе (Aggregate database) для документа.
  • Агрегация и Взвешивание: Система подсчитывает, сколько разных пользователей выделили один и тот же элемент, и присваивает ему Weight Value.
  • Генерация сниппета: При формировании поисковой выдачи система идентифицирует элементы документа, чей Weight Value и количество выделений превышают установленные пороги. Эти элементы приоритетно включаются в сниппет.
  • Статистика: Данные могут использоваться для генерации тепловых карт (Document Statistics), показывающих популярность разных частей документа.

Актуальность для SEO

Высокая. Хотя конкретные реализации, описанные в патенте (например, тулбары или интерактивные слайдеры в SERP), могли устареть, концепция использования реальных пользовательских взаимодействий (RUI) для оценки важности контента крайне актуальна. Критически важно, что патент (Claim 2) описывает возможность неявного сбора данных через Marking (простое выделение текста). Современные браузеры (Chrome) и ОС (Android) предоставляют широкие возможности для сбора подобной статистики (например, выделение, копирование текста) без необходимости в специальных инструментах.

Важность для SEO

Влияние на SEO значительное (8/10). Этот патент напрямую описывает механизм, влияющий на представление контента в SERP (сниппеты), что критично для CTR. Он демонстрирует, что Google может использовать сигналы вовлеченности на уровне отдельных фрагментов текста для определения их ценности. Это подчеркивает важность создания контента, который не просто читают, но с которым активно взаимодействуют (выделяют, копируют).

Детальный разбор

Термины и определения

Aggregate database (Агрегированная база данных)
Хранилище, содержащее данные о выделениях элементов в документе, собранные от группы пользователей. Используется для расчета Weight Values.
Document Statistics (Статистика документа)
Информация о том, как пользователи взаимодействовали с документом, основанная на Weight Values. Может визуализироваться как тепловая карта (hotspots), показывающая наиболее популярные части документа.
Element (Элемент)
Любая часть документа (символ, слово, фраза, предложение, параграф, изображение).
Highlighting (Выделение - явное)
Действие пользователя по применению визуального эффекта к элементу, часто с помощью специального инструмента (например, нажатие кнопки "Выделить").
Marking (Маркировка - неявное выделение)
Встроенная операция браузера, например, выделение текста мышью (select). Патент (Claim 2 и описание FIG. 6D) предлагает интерпретировать это действие как автоматическое highlighting.
Per-user database (База данных пользователя)
Хранилище, содержащее информацию о том, какие документы и элементы выделил конкретный пользователь.
Snippet / Summary (Сниппет / Саммари)
Краткое описание документа (например, в результатах поиска), которое может динамически генерироваться на основе Weight Values.
Threshold quantity of users (Пороговое количество пользователей)
Минимальное количество пользователей, которые должны выделить элемент, чтобы он был использован в сниппете. Используется для обеспечения статистической значимости и конфиденциальности.
Weight Value (Вес элемента)
Числовая оценка популярности элемента, функция от количества пользователей, которые его выделили. Может быть нормализована (например, 0-100).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной механизм генерации сниппетов на основе агрегированных данных.

  1. Система получает информацию о выделенных элементах документа от двух или более пользователей.
  2. В ответ на определение того, что документ релевантен поисковому запросу, система генерирует поисковый сниппет (search result snippet).
  3. Ключевое условие: сниппет включает как минимум один элемент, который был выделен количеством пользователей, превышающим заданный порог (threshold quantity of users).
  4. Система предоставляет результат поиска, включающий этот сниппет и ссылку на документ.

Claims 2 и 3 (Зависимые от 1): Уточняют, как система интерпретирует действия пользователя как выделение. Это критически важные пункты.

  • Claim 2: Получение информации включает определение того, что пользователь маркировал (marked) элемент в документе. Это означает, что простое выделение текста мышью может считаться сигналом.
  • Claim 3: Получение информации включает определение того, что пользователь явно выделил (highlighted) элемент (например, используя специальный инструмент).

Claim 4 (Зависимый от 1): Подтверждает механизм расчета.

Генерация сниппета включает определение количества пользователей, выделивших элемент, и сравнение этого количества с пороговым значением.

Claims 5, 6 и 7 (Зависимые): Описывают механизм динамической настройки сниппета пользователем.

  1. Система получает новое пороговое значение от пользователя (например, через слайдер).
  2. Сниппет модифицируется на основе этого нового порога путем включения элементов, превышающих новый порог.

Claim 8 (Зависимый от 1): Описывает архитектуру хранения данных.

Информация постоянно хранится в двух местах: в первой памяти (Per-user database), ассоциированной с конкретным пользователем, и во второй памяти (Aggregate database), где данные агрегированы для документа.

Claims 9 и 10 (Зависимые от 1): Описывают генерацию статистики (тепловых карт).

Система генерирует и предоставляет Document Statistics на основе данных о выделении. Статистика может быть визуально представлена с использованием цветов или паттернов для отображения разницы в популярности элементов.

Где и как применяется

Изобретение затрагивает несколько этапов сбора и обработки данных, а также финальный этап формирования выдачи.

CRAWLING & INDEXING (Сбор данных и Извлечение признаков)
Сбор данных о выделении происходит не во время стандартного краулинга, а через взаимодействие пользователя с контентом (браузер, тулбар, ОС). На этапе индексирования (или в параллельном офлайн-процессе) эти поведенческие данные обрабатываются: рассчитываются Weight Values и сохраняются в Aggregate database, ассоциируясь с индексом документа.

METASEARCH / RERANKING (Генерация сниппетов)
Основное применение патента. На этапе формирования финальной SERP.

  1. Получение результатов ранжирования: Система определяет набор релевантных документов.
  2. Запрос агрегированных данных: Для документов в топе система запрашивает Weight Values.
  3. Генерация динамического сниппета: Вместо (или в дополнение к) стандартного сниппета, система генерирует сниппет, используя элементы, превысившие Threshold quantity of users и порог веса.
  4. Интерактивность (Опционально): Система может предоставить пользователю интерфейс (слайдер) для изменения порога и перегенерации сниппета на лету.

Входные данные:

  • Действия пользователя (Highlighting или Marking).
  • Идентификатор документа (URL) и выделенный элемент.
  • Идентификатор пользователя (для агрегации).
  • Поисковый запрос.

Выходные данные:

  • Рассчитанные Weight Values.
  • Динамический сниппет в SERP или Саммари документа.
  • Document Statistics (тепловая карта).

На что влияет

  • Конкретные типы контента: Наибольшее влияние на информационный контент, предполагающий вдумчивое чтение и взаимодействие: лонгриды, руководства, исследования, научные статьи.
  • Отображение в SERP: Напрямую влияет на содержание сниппетов, что может значительно влиять на CTR.

Когда применяется

  • Сбор данных: В реальном времени, когда пользователь взаимодействует с документом (выделяет текст явно или неявно).
  • Использование данных (Генерация сниппета): Во время обработки поискового запроса.
  • Условия и Пороги: Применяется при условии, что для документа накоплено достаточно данных. Элемент используется, только если он был выделен более чем пороговым количеством пользователей (Threshold quantity of users). В патенте это объясняется необходимостью обеспечения статистической значимости и конфиденциальности.

Пошаговый алгоритм

Процесс А: Сбор и Агрегация данных (Фоновый процесс)

  1. Презентация документа: Пользователь открывает документ.
  2. Детекция взаимодействия: Система отслеживает действия пользователя. Фиксируется выделение элемента: либо явное Highlighting (через инструмент), либо неявное Marking (выделение мышью, как описано в Claim 2).
  3. Отправка данных: Информация о выделенном элементе, документе и пользователе отправляется на сервер (Annotation Collector).
  4. Хранение данных: Сервер сохраняет данные в Per-user database.
  5. Агрегация и Расчет весов: Сервер обновляет Aggregate database и пересчитывает Weight Value для элемента.

Процесс Б: Генерация динамического сниппета (Во время поиска)

  1. Обработка запроса: Система определяет набор релевантных документов.
  2. Извлечение весов: Для релевантного документа извлекаются Weight Values.
  3. Определение порогов: Устанавливаются порог популярности (Weight Value Threshold) и порог количества пользователей (Threshold quantity of users).
  4. Фильтрация элементов: Идентифицируются элементы, которые удовлетворяют обоим порогам.
  5. Формирование сниппета: Система генерирует сниппет, используя выбранные элементы (с учетом ограничений по размеру).
  6. Отображение SERP: Результат поиска с динамическим сниппетом предоставляется пользователю.
  7. (Опционально) Динамическая настройка: Пользователь использует интерфейс (слайдер) для изменения порога веса. Система повторяет шаги 4-6 для перегенерации сниппета.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Содержание (текст) выделенных элементов (Element).
  • Поведенческие факторы: Действия пользователя по выделению текста (Highlighting, Marking). Это ключевой тип данных, используемый как индикатор интереса пользователя к фрагменту.
  • Пользовательские факторы: Идентификатор пользователя (используется для хранения персональных данных и для агрегации данных от разных пользователей).

Какие метрики используются и как они считаются

  • Weight Value (Вес элемента): Основная метрика. Является функцией от количества пользователей, выделивших данный элемент. Может быть нормализована (например, 0-100).
  • Threshold quantity of users (Пороговое количество пользователей): Минимальное число пользователей, необходимое для учета элемента. Используется для статистической значимости и защиты конфиденциальности ("For privacy reasons, an element may need to be highlighted by at least a certain number of users before that element can be considered a candidate element").
  • Weight Value Threshold (Порог веса): Значение, выше которого элементы считаются кандидатами для включения в сниппет. Этот порог может быть системным или настраиваться пользователем динамически (с помощью слайдера).

Выводы

  1. Взаимодействие с контентом как сигнал важности: Патент явно демонстрирует, что Google рассматривает прямое взаимодействие пользователя с текстом (выделение, копирование) как сильный сигнал важности или интересности этого фрагмента контента.
  2. Явный и неявный сбор данных (Критически важно): Механизм Marking (Claim 2) позволяет системе собирать данные не только через специальные инструменты, но и когда пользователь просто выделяет текст мышью. Это значительно расширяет возможности масштабного сбора данных о внимании пользователя.
  3. Динамические сниппеты на основе поведения: Сниппеты могут формироваться не только на основе соответствия тексту запроса или мета-тегов, но и динамически, на основе агрегированных данных о том, что предыдущие посетители сочли важным на странице.
  4. "Тепловые карты" контента: Механизм Document Statistics позволяет Google анализировать "горячие точки" (hotspots) внутри документа в больших масштабах, что является дешевой и эффективной альтернативой eye-tracking.
  5. Требования к статистической значимости: Система не реагирует на единичные выделения; требуется консенсус пользователей (Threshold quantity of users) для влияния на общую выдачу.

Практика

Best practices (это мы делаем)

  • Создание "цепляющего" и цитируемого контента: Разрабатывайте контент, который побуждает к взаимодействию. Используйте четкие определения, сильные утверждения, ключевые выводы, статистику и фразы, которые пользователи с большой вероятностью захотят выделить, скопировать или сохранить.
  • Оптимизация под вовлечение: Структурируйте контент так, чтобы наиболее важные моменты были легко идентифицируемы. Хорошее форматирование (абзацы, списки, выделения) помогает пользователям взаимодействовать с ключевыми элементами и направляет их внимание.
  • Анализ поведения на странице (Собственные данные): Используйте скрипты для отслеживания копирования текста на своем сайте. Это позволит понять, какие части контента наиболее востребованы пользователями, и косвенно оптимизировать его под механизмы, описанные в патенте.

Worst practices (это делать не надо)

  • Блокировка взаимодействия с контентом: Использование скриптов, которые запрещают выделение текста, копирование или работу правой кнопки мыши. Это может препятствовать сбору положительных сигналов взаимодействия (Marking), которые Google потенциально может использовать для оценки важности контента и генерации сниппетов.
  • "Водянистый" контент без структуры: Создание длинных текстов без явной ценности в отдельных фрагментах. Если пользователям нечего выделить или скопировать, страница не будет накапливать положительные Weight Values.
  • Игнорирование читабельности: Плохое формативание, затрудняющее чтение и взаимодействие с текстом, снижает вероятность того, что пользователи будут выделять ключевые моменты.

Стратегическое значение

Этот патент подтверждает стратегическую важность сигналов реального взаимодействия пользователя (RUI). Ценность контента определяется не только его содержанием и ссылками, но и тем, как именно пользователи его потребляют на уровне отдельных элементов. Учитывая возможность неявного сбора данных (Marking), описанную в Claim 2, этот патент приобретает высокое стратегическое значение в эпоху сбора данных через браузеры и ОС. SEO-стратегия должна включать оптимизацию контента для повышения вовлеченности и интерактивности.

Практические примеры

Сценарий: Оптимизация информационной статьи (Руководства)

  1. Анализ контента: Имеется длинная статья "Как выбрать палатку".
  2. Выявление ключевых элементов: Определяются критически важные фрагменты: определения типов палаток, таблица сравнения материалов, список необходимых характеристик для зимнего похода.
  3. Оптимизация для взаимодействия: Ключевые определения выделяются визуально. Сравнительная информация оформляется в виде таблицы. Список характеристик оформляется маркированным списком.
  4. Ожидаемое поведение пользователей: Пользователи, изучающие тему, начинают активно выделять (Marking) и копировать определения, данные из таблицы и пункты списка.
  5. Результат (согласно патенту): Система Google фиксирует эти действия. Эти элементы получают высокие Weight Values в Aggregate database. При релевантных поисковых запросах Google сгенерирует сниппет, включающий именно эти популярные фрагменты (например, часть списка характеристик), что повышает информативность сниппета и CTR.

Вопросы и ответы

Означает ли этот патент, что Google отслеживает все, что я выделяю мышью на странице?

Патент (Claim 2, Marking) описывает такую техническую возможность. Система может интерпретировать простое выделение текста мышью как сигнал интереса, не требуя нажатия специальных кнопок. Реализуется ли это в современных системах (например, через браузер Chrome или ОС Android) и в каком объеме – неизвестно, но техническая основа для такого масштабного сбора данных о внимании пользователей заложена в этом патенте.

Как рассчитывается "Вес элемента" (Weight Value)?

Weight Value является функцией от количества разных пользователей, которые выделили этот конкретный элемент. Чем больше людей выделили фрагмент, тем выше его вес. Патент также упоминает, что эти значения могут быть нормализованы (например, по шкале от 0 до 100) для удобства сравнения популярности разных фрагментов.

Что такое "Пороговое количество пользователей" и зачем оно нужно?

Это минимальное количество людей, которые должны выделить элемент, прежде чем он будет использован системой для генерации сниппета. Это необходимо по двум причинам: для обеспечения статистической значимости (чтобы избежать случайных выделений) и для защиты конфиденциальности (чтобы нельзя было идентифицировать действия одного конкретного пользователя через агрегированный сниппет).

Влияют ли эти данные о выделении текста на ранжирование документа?

Патент напрямую фокусируется на генерации сниппетов, саммари и статистики (тепловых карт), а не на изменении Ranking Score документа. Однако, косвенно, наличие высококачественных сигналов взаимодействия с контентом может положительно влиять на общую оценку качества страницы, а улучшенные сниппеты могут повысить CTR, что также является поведенческим сигналом.

Стоит ли запрещать копирование текста на сайте, чтобы контент не воровали?

С точки зрения этого патента, это плохая практика. Запрет на выделение и копирование текста блокирует возможность сбора сигналов Marking. Если пользователи не могут взаимодействовать с вашим контентом, система не получит данных о том, какие его части наиболее важны, что может привести к формированию менее качественных сниппетов.

Как я могу стимулировать пользователей выделять нужные мне фрагменты?

Используйте четкую структуру, выделяйте ключевые мысли, давайте конкретные данные, определения или инструкции. Контент, который легко цитировать, копировать или сохранять для дальнейшего использования, будет естественным образом собирать больше сигналов выделения. Хорошее юзабилити и читабельность также способствуют этому.

Что такое "Document Statistics", описанные в патенте?

Это аналитические данные, показывающие, какие части документа наиболее популярны у пользователей на основе частоты их выделения. В патенте это описывается как визуализация в виде тепловой карты (hotspots) прямо поверх документа, где разные цвета показывают уровень интереса к разным фрагментам. Это позиционируется как дешевая альтернатива eye-tracking.

Патент описывает слайдер для настройки сниппета. Где он находится в выдаче Google?

Описанный в патенте интерфейс (слайдер для динамического изменения порога популярности и длины сниппета) не был широко реализован в публичном интерфейсе поиска Google. Это пример того, что не все идеи из патентов реализуются в финальном продукте в том виде, в котором они были описаны.

Какова связь этого патента с Passage Ranking?

Концептуально они связаны, так как обе технологии направлены на выявление наиболее значимых фрагментов документа. Разница в методах: этот патент использует явные или неявные сигналы пользователей (выделения) для определения важности, тогда как Passage Ranking использует сложные NLP-модели для определения семантической релевантности фрагмента запросу.

Может ли этот механизм использоваться для генерации Featured Snippets?

Хотя патент фокусируется на стандартных поисковых сниппетах (search result snippet), логично предположить, что данные о наиболее часто выделяемых фрагментах (элементах с высоким Weight Value) могут быть ценным сигналом для систем, отвечающих за выбор контента для Featured Snippets, так как они указывают на наиболее информативные и полезные части документа по мнению пользователей.

Похожие патенты

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует персональные выделения контента и поведение чтения для гиперперсонализации поисковой выдачи
Google отслеживает, какой текст пользователи выделяют на веб-страницах и как они читают контент (включая скорость прокрутки и потенциально отслеживание взгляда). Эта информация используется для глубокой персонализации будущих поисковых запросов: система аннотирует знакомые результаты, использует содержание выделенного текста для подбора другого релевантного контента и автоматически возвращает пользователя к последнему просмотренному фрагменту.
  • US11514126B2
  • 2022-11-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует агрегированные поведенческие данные для маркировки результатов поиска и подсказок индикаторами ожидаемых действий
Google анализирует агрегированные данные о том, что пользователи делают после клика по результату поиска или подсказке (например, покупка, сохранение, бронирование). Если определенное действие статистически значимо для конкретного результата, Google добавляет к нему визуальный индикатор (значок или бейдж), чтобы помочь другим пользователям понять вероятный исход клика.
  • US11132406B2
  • 2021-09-28
  • Поведенческие сигналы

  • SERP

Как Google извлекает и может отображать оригинальный дизайн (стили) контента в сниппетах поисковой выдачи
Google разработал систему для отображения текстовых сниппетов в поисковой выдаче с сохранением их оригинального стиля (шрифт, размер, форматирование) из исходного документа. Для этого система создает отдельные индексы для текста и стилей. Это позволяет пользователям оценить визуальный контекст, важность контента и эстетику сайта непосредственно в SERP, влияя на выбор результата.
  • US10311114B2
  • 2019-06-04
  • SERP

  • Индексация

  • Техническое SEO

Как Google динамически выбирает текст для сниппета, основываясь на типе запроса и структуре документа
Google использует адаптивную систему для генерации сниппетов в результатах поиска. Система анализирует тип запроса (например, поиск по автору или по содержанию) и местоположение ключевых слов в документе. На основе этого выбирается алгоритм генерации. Параграфы оцениваются по их длине, позиции в документе, качеству текста и форматированию, чтобы выбрать наиболее информативный фрагмент, часто отдавая предпочтение введению или резюме.
  • US8145617B1
  • 2012-03-27
  • SERP

  • Семантика и интент

Популярные патенты

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).
  • US8972391B1
  • 2015-03-03
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования
Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.
  • US10878048B2
  • 2020-12-29
  • EEAT и качество

  • SERP

  • Knowledge Graph

seohardcore