Как Google отслеживает возраст отдельных фрагментов контента на странице и отличает существенные обновления от незначительных правок

DATE-BASED WEB PAGE ANNOTATION (Аннотирование веб-страниц на основе дат)

US8332408B1
Google LLC
2010-08-23
2012-12-11

Google использует систему для определения даты первой публикации отдельных фрагментов контента (например, предложений или абзацев). Система сегментирует контент и отслеживает его историю в «Карте дат» (Date Map). Используя нечеткое сравнение (Edit Distance) и нормализацию, система игнорирует незначительные правки и точно датирует только существенные обновления контента.

Какую проблему решает

Патент решает проблему определения точной даты первой публикации отдельных частей контента внутри веб-страницы. Стандартные методы фиксируют дату обновления всей страницы, что не отражает возраст её отдельных компонентов. Изобретение позволяет автоматически определять, когда конкретный абзац или предложение было впервые добавлено, и отличать существенные обновления контента от незначительных правок.

Что запатентовано

Запатентована система для гранулярного датирования контента и его визуализации. Система сегментирует веб-страницу на Data Fragments (фрагменты данных) и отслеживает историю их появления в Date Map (карте дат). Ключевой особенностью является использование нечеткого сравнения (Edit Distance) для игнорирования незначительных изменений, гарантируя, что дата публикации не сбрасывается при мелких правках. Также описан метод визуального отображения возраста фрагментов пользователю.

Как это работает

Система работает в два этапа: отслеживание и отображение.

Отслеживание (Индексирование):

После сканирования страницы Date Annotation Engine сегментирует контент на фрагменты.
Фрагменты нормализуются (удаление стоп-слов, пунктуации) и сравниваются с историческими данными в Date Map.
Сравнение использует Edit Distance. Если разница между текущим и историческим фрагментом ниже порога (Threshold Distance), они считаются одинаковыми.
Если фрагмент значительно изменен или является новым, он добавляется в Date Map с текущей датой.

Отображение (Визуализация):

При запросе страницы система извлекает даты из Date Map и отображает страницу с использованием индикаторов (Indicia), таких как цвет или шрифт, показывающих возраст каждого фрагмента.

Актуальность для SEO

Высокая. Хотя аспект визуализации (подсветка возраста контента) не используется в публичном поиске, лежащая в основе технология гранулярного анализа возраста контента крайне актуальна. Определение свежести (Freshness), оригинальности контента и понимание эволюции страницы являются критически важными задачами для оценки качества контента в 2025 году. Механизмы, описанные в патенте, предоставляют необходимую инфраструктуру для этого.

Важность для SEO

Патент имеет важное стратегическое значение для SEO, особенно для стратегий обновления контента (Content Refresh). Он детально раскрывает инфраструктуру, позволяющую Google игнорировать «фейковые» обновления (изменение даты в CMS или незначительные правки текста) благодаря использованию Edit Distance. Это напрямую влияет на то, как система оценивает свежесть страницы и её отдельных частей.

Термины и определения

Date Annotation Engine (Механизм аннотирования дат): Компонент системы, который анализирует контент после сканирования, сегментирует его и управляет обновлением Date Map.
Date Map (Карта дат): Структура данных (база данных), хранящая историю контента страницы. Каждая запись связывает URI, конкретный Data Fragment и дату его первой публикации (обнаружения системой).
Data Fragment (Фрагмент данных): Наименьшая единица контента, для которой отслеживается дата публикации. Гранулярность может варьироваться (абзац, предложение, фраза, n-слов).
Edit Distance (Расстояние редактирования): Метрика схожести между двумя строками текста. Определяется как минимальное количество операций (вставок, удалений, замен), необходимых для преобразования одной строки в другую. Используется для нечеткого сравнения фрагментов.
Indicia (Индикаторы): Визуальные средства (шрифт, цвет фона), используемые для отображения возраста Data Fragment пользователю.
Search Data Fragment (Поисковый фрагмент данных): Фрагмент, извлеченный из текущей версии веб-страницы, который сравнивается с записями в Date Map.
Stop-words (Стоп-слова): Малозначимые слова (артикли, предлоги), которые могут удаляться из фрагментов перед сравнением для фокусировки на семантически важных изменениях.
Threshold Distance (Пороговое расстояние): Максимально допустимое значение Edit Distance, при котором два фрагмента считаются совпадающими. Определяет чувствительность системы к изменениям контента.

Ключевые утверждения (Анализ Claims)

Патент разделен на механизм отслеживания дат (Claims 1-8) и механизм их отображения (Claims 9-20).

Claim 1 (Независимый пункт) - Механизм отслеживания: Описывает процесс обновления истории контента.

Система получает веб-страницу от краулера.
Контент автоматически сегментируется на Search Data Fragments.
Выполняется поиск в Date Map для нахождения соответствующего Target Data Fragment.
Если соответствие НЕ найдено, Search Data Fragment добавляется в Date Map и ему присваивается текущая дата как дата первой публикации.

Claim 4 (Зависимый от 1) - Нечеткое сравнение (Fuzzy Matching): Уточняет механизм сравнения на шаге 3.

Соответствие определяется, если Edit Distance между поисковым и целевым фрагментами меньше определенного порогового значения (Threshold Distance). Это означает, что система использует нечеткое сравнение и игнорирует незначительные изменения (например, исправление опечаток), не сбрасывая возраст контента.

Claim 5 (Зависимый от 1) - Игнорирование порядка слов:

Термины в Search Data Fragment могут быть упорядочены в алфавитно-цифровом порядке перед сравнением. Это позволяет системе считать фрагменты идентичными, даже если порядок слов в них изменился.

Claim 9 (Независимый пункт) - Механизм отображения: Описывает процесс визуализации возраста контента.

Система получает веб-страницу и сегментирует её.
Для каждого фрагмента определяется дата публикации (из Date Map или текущая дата, если фрагмент новый).
Веб-страница отображается с использованием Indicia (например, цвета или шрифта) для визуальной передачи даты публикации каждого фрагмента.

Где и как применяется

Изобретение применяется преимущественно на этапе индексирования для анализа эволюции контента.

CRAWLING – Сканирование и Сбор данных
Web Crawling Engine обнаруживает и загружает контент веб-страницы, инициируя процесс анализа дат.

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Date Annotation Engine анализирует сырой контент, выполняет сегментацию, нормализацию и сравнение с историческими данными в Date Map. Происходит вычисление Edit Distance и обновление Date Map. Дата первой публикации каждого фрагмента извлекается как признак (Feature Extraction).

Примечание: Патент также описывает слой визуализации (через Web Date Server или плагин браузера), который использует данные Date Map для отображения пользователю, но это не является частью стандартной архитектуры ранжирования.

Входные данные:

Текущая версия контента веб-страницы и её URI.
Текущая дата.
Существующая Date Map для данного URI (если есть).
Параметры конфигурации (гранулярность сегментации, список стоп-слов, Threshold Distance).

Выходные данные:

Обновленная Date Map, содержащая все фрагменты с датами их первого обнаружения.

На что влияет

Конкретные типы контента: Влияет на все типы текстового контента. Особенно критично для контента, который часто обновляется или дополняется (новости, статьи, руководства).
Конкретные ниши или тематики: Важно в нишах, где актуальность информации имеет первостепенное значение (YMYL-тематики), так как позволяет оценить свежесть конкретных утверждений, а не всей страницы в целом.

Когда применяется

Условия работы алгоритма: Алгоритм активируется каждый раз, когда страница сканируется или переиндексируется и обрабатывается Date Annotation Engine.
Триггеры обновления: Обновление Date Map происходит, когда обнаруживается новый Data Fragment, который не имеет совпадения в существующей карте.
Пороговые значения: Ключевым порогом является Threshold Distance. Изменение контента считается новым, только если Edit Distance превышает этот порог.

Пошаговый алгоритм

Процесс отслеживания дат (Date Annotation Engine)

Получение данных: Система получает новую версию веб-страницы от краулера.
Поиск истории: Поиск существующей Date Map для данного URI. Если не найдена, создается новая.
Сегментация: Контент страницы разделяется на Data Fragments в соответствии с заданной гранулярностью (например, по предложениям).
Нормализация фрагментов: Из фрагментов удаляются стоп-слова и пунктуация. Опционально, слова внутри фрагмента сортируются в алфавитном порядке.
Итеративное сравнение: Для каждого текущего фрагмента выполняется поиск в Date Map.
Вычисление схожести: Вычисляется Edit Distance между текущим фрагментом и фрагментами в Date Map.
Проверка порога: Фрагмент считается найденным (т.е. старым), если Edit Distance меньше установленного Threshold Distance.
Обновление карты дат:
- Если совпадение НЕ найдено: Фрагмент считается новым. Он добавляется в Date Map с текущей датой.
- Если совпадение найдено: Переход к следующему фрагменту без изменений в Date Map.
Завершение: Процесс завершается после обработки всех фрагментов текущей версии страницы.

Какие данные и как использует

Данные на входе

Контентные факторы: Текст веб-страницы является основным источником данных. Он используется для генерации Data Fragments.
Технические факторы: URI используется как уникальный идентификатор для привязки Date Map к конкретной странице.
Временные факторы: Текущая дата (дата сканирования/обработки) используется для маркировки новых фрагментов.
Структурные факторы: Структура документа (абзацы, предложения) может использоваться для определения границ сегментации.

Какие метрики используются и как они считаются

Edit Distance (Расстояние редактирования): Основная метрика для сравнения текущего фрагмента с историческим. Могут использоваться стандартные алгоритмы, такие как расстояние Левенштейна или Хэмминга.
Threshold Distance (Пороговое расстояние): Конфигурируемое значение. Определяет чувствительность системы к изменениям. Чем выше порог, тем более значительные изменения требуются, чтобы фрагмент был признан новым.
Методы анализа текста (Нормализация):
- Удаление стоп-слов и пунктуации: Используется для фокусировки на значимых терминах и игнорирования несущественных изменений в формулировках.
- Алфавитно-цифровое упорядочивание: Используется в некоторых вариантах для сравнения фрагментов без учета порядка слов.

Гранулярное отслеживание истории контента: Патент подтверждает наличие инфраструктуры (Date Map) для отслеживания дат публикации на уровне отдельных фрагментов (предложений, абзацев), а не только документа в целом.
Устойчивость к незначительным изменениям: Система специально разработана для игнорирования мелких правок. Использование Edit Distance (нечеткое сравнение), удаление стоп-слов и возможность игнорирования порядка слов гарантируют, что дата публикации фрагмента не сбрасывается при исправлении опечаток или легком рерайтинге.
Критерий значимости обновлений: Чтобы фрагмент был признан новым и получил актуальную дату, изменения должны быть существенными и превышать установленный порог Threshold Distance.
Инфраструктурная основа для Freshness и Originality: Существование Date Maps демонстрирует техническую возможность Google точно определять, какая часть контента является свежей, а какая — исторической. Это является необходимой основой для алгоритмов, чувствительных к свежести (QDF), и может использоваться для определения первоисточника контента.
Игнорирование заявленных дат: Система полагается на дату фактического обнаружения контента краулером, что делает манипуляции с датами в CMS или микроразметке неэффективными.

Best practices (это мы делаем)

Фокус на существенных обновлениях контента: При актуализации старых материалов (Content Refresh) необходимо вносить значимые изменения. Добавляйте новые абзацы, актуальные данные или новые разделы. Изменения должны быть достаточно существенными, чтобы превысить потенциальный порог Edit Distance.
Глубокая переработка при рерайтинге: Если цель — полностью обновить возраст существующего фрагмента, его необходимо переписать кардинально, изменив структуру и содержание, а не просто заменить слова синонимами.
Сохранение возраста ключевых фрагментов: Если цель — сохранить авторитет и возраст основного контента, избегайте его существенного переписывания. Дополняйте статью новыми блоками, не затрагивая старые. Система датирует новые блоки отдельно.
Приоритет оригинального контента: Поскольку система фиксирует дату первого обнаружения фрагмента, стратегически важно публиковать уникальный контент как можно раньше и обеспечивать его быструю индексацию.

Worst practices (это делать не надо)

Манипуляции свежестью через незначительные правки: Попытки обмануть систему путем исправления опечаток, изменения порядка слов или замены предлогов неэффективны. Механизмы Edit Distance и нормализации специально разработаны для игнорирования таких изменений.
Изменение дат в CMS без изменения контента: Изменение даты публикации в CMS или Sitemap не повлияет на дату в Date Map, если сам контент не изменился существенно.
Поверхностный рерайтинг: Легкое переписывание контента без добавления новой информации может быть неэффективным, если итоговый текст окажется слишком близок к оригиналу по метрике Edit Distance.
Изменение структуры без изменения содержания: Перестановка абзацев или предложений местами не сделает контент новым, так как система анализирует каждый фрагмент индивидуально.

Стратегическое значение

Патент имеет критическое значение для понимания того, как Google интерпретирует свежесть контента. Он подтверждает, что оценка свежести происходит на гранулярном уровне и устойчива к манипуляциям. Для SEO-специалистов это означает, что стратегия обновления контента должна быть основана на добавлении реальной ценности. Система способна точно определить, какая часть страницы была обновлена и когда, что напрямую влияет на сигналы свежести.

Практические примеры

Сценарий: Обновление статьи "Лучшие практики SEO"

Действие 1: Незначительное обновление (Игнорируется системой)

Оригинальный фрагмент: "Создание качественного контента является важным фактором для хорошего ранжирования в поиске."
Обновленный фрагмент: "Создание высококачественного контента – это важный фактор для отличного ранжирования в поисковых системах."
Анализ системы: Стоп-слова удаляются. Edit Distance минимально (добавление/замена прилагательных, замена "является" на тире). Изменение ниже порога Threshold Distance.
Результат: Фрагмент НЕ считается новым. Дата первой публикации сохраняется.

Действие 2: Существенное обновление (Регистрируется системой)

Оригинальный фрагмент: (Тот же)
Обновленный фрагмент: Добавлен новый абзац: "В 2025 году особое внимание уделяется концепции E-E-A-T, что требует подтверждения опыта и авторитетности автора при создании контента в YMYL-тематиках."
Анализ системы: Новый абзац сегментируется как новый Data Fragment. В Date Map он отсутствует.
Результат: Новый фрагмент добавляется в Date Map с текущей датой. Страница получает сигнал свежести, так как содержит контент с разными датами публикации.

Означает ли этот патент, что Google знает точную дату написания каждого предложения на моем сайте?

Да, патент описывает инфраструктуру именно для этого. Система создает Date Map, где для каждого фрагмента контента (например, предложения) хранится дата, когда этот фрагмент был впервые обнаружен краулером Google. Это позволяет отслеживать эволюцию контента на гранулярном уровне.

Что такое «Edit Distance» и почему это критично для SEO?

Edit Distance (Расстояние редактирования) — это метрика, показывающая, насколько сильно отличаются две строки текста. Это критично для SEO, так как Google использует её для определения, является ли изменение контента существенным. Если Edit Distance ниже определенного порога, Google считает фрагмент неизменным и сохраняет его оригинальную дату публикации, игнорируя мелкие правки.

Сбросит ли исправление опечаток или замена синонимов дату публикации моего контента?

Согласно патенту, это маловероятно. Система использует пороги Edit Distance и нормализацию (удаление стоп-слов), чтобы игнорировать незначительные изменения. Чтобы дата была обновлена, изменения должны быть существенными и затрагивать смысловое содержание фрагмента.

Что произойдет, если я изменю порядок слов в предложении?

В одном из вариантов реализации (Claim 5) система сортирует слова во фрагменте в алфавитно-цифровом порядке перед сравнением. Если этот вариант используется, изменение порядка слов будет полностью проигнорировано, и фрагмент будет считаться неизменным.

Как этот патент влияет на алгоритмы свежести (Freshness)?

Патент не описывает сам алгоритм ранжирования, но предоставляет для него критически важные данные. Вместо того чтобы оценивать свежесть всей страницы по дате последнего обновления, алгоритмы Freshness могут использовать данные из Date Map, чтобы оценить, какой процент контента является действительно новым и насколько актуальна каждая часть документа.

Эффективно ли менять дату публикации в CMS, чтобы «освежить» статью?

Нет, это неэффективно. Описанный механизм полагается исключительно на фактическое изменение контента, обнаруженное краулером, а не на метаданные, предоставляемые CMS. Если контентные фрагменты остались прежними, Google будет знать их реальный возраст.

Поможет ли этот механизм бороться с воровством контента?

Да, это мощный инструмент для определения первоисточника. Поскольку Google фиксирует дату первого обнаружения каждого конкретного фрагмента текста на каждом URI, он может легко определить, где этот текст появился впервые. Это может использоваться для определения канонического источника.

Как лучше всего обновить старую статью, чтобы Google посчитал ее свежей?

Необходимо внести существенные изменения, которые превысят порог Edit Distance. Лучший подход — добавить новые разделы, абзацы с актуальной информацией или значительно переработать существующие фрагменты, изменив их смысл и структуру, а не просто выполнить поверхностный рерайтинг.

Насколько гранулярно Google отслеживает даты публикации?

Патент указывает, что гранулярность (Data Fragment) может быть настроена на разных уровнях: абзац, предложение, фраза или даже отдельные слова. Это позволяет системе очень точно определять возраст различных частей одной и той же страницы.

Используется ли описанная в патенте функция визуализации возраста контента?

Функция визуализации с помощью цветового кодирования или временных слайдеров не наблюдается в основном поиске Google. Однако инфраструктура для отслеживания дат (Date Maps), описанная в патенте, вероятно, используется внутренними системами для оценки свежести контента.

Как Google извлекает даты и локации из контента для отображения результатов на карте и временной шкале

Google извлекает даты и географические локации непосредственно из контента веб-страниц. Это позволяет системе визуализировать результаты поиска на интерактивной временной шкале и на карте, даже если запрос не содержал явных указаний на время или место. Пользователи могут использовать эти визуализации для навигации и уточнения запросов, а сниппеты могут фокусироваться вокруг извлеченных фактов.

US10509817B2
2019-12-17

Индексация
Краулинг
SERP

Как Google использует персональные выделения контента и поведение чтения для гиперперсонализации поисковой выдачи

Google отслеживает, какой текст пользователи выделяют на веб-страницах и как они читают контент (включая скорость прокрутки и потенциально отслеживание взгляда). Эта информация используется для глубокой персонализации будущих поисковых запросов: система аннотирует знакомые результаты, использует содержание выделенного текста для подбора другого релевантного контента и автоматически возвращает пользователя к последнему просмотренному фрагменту.

US11514126B2
2022-11-29

Персонализация
Поведенческие сигналы
SERP

Как Google персонализирует, локализует и ранжирует новостной контент для Google News и Discover

Google использует систему для персонализации новостного контента, анализируя темы (используя Knowledge Graph), местоположения и даты публикации статей. Система создает динамические профили пользователей на основе истории чтения, применяя механизм «затухания» для устаревших интересов. Ранжирование учитывает релевантность, качество источника, популярность (количество просмотров) и свежесть контента.

US9569547B2
2017-02-14

Персонализация
Свежесть контента
Knowledge Graph

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)

Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.

US7797316B2
2010-09-14

Свежесть контента
Ссылки
Техническое SEO

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента

Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.

US8595619B1
2013-11-26

Поведенческие сигналы
SERP

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента

Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.

US9098511B1
2015-08-04

Поведенческие сигналы
Мультимедиа
SERP

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования

Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.

US8862572B2
2014-10-14

Поведенческие сигналы
Ссылки

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов

Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.

US7664734B2
2010-02-16

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования

Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.

US7933890B2
2011-04-26

Структура сайта
Техническое SEO
Индексация

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов

Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.

US20140372873A1
2014-12-18

Структура сайта
Техническое SEO
Ссылки

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории

Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.

US8788490B1
2014-07-22

Local SEO
Ссылки
SERP

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа

Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.

US8307005B1
2012-11-06

Поведенческие сигналы
Ссылки
SERP

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок

Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.

US12353458B2
2025-07-08

Ссылки
Семантика и интент
SERP

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования

Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.

US8005811B2
2011-08-23

Поведенческие сигналы
SERP