SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом

INFORMATION RETRIEVAL BASED ON HISTORICAL DATA (Поиск информации на основе исторических данных)
  • US7346839B2
  • Google LLC
  • 2003-12-31
  • 2008-03-18
  • Свежесть контента
  • Антиспам
  • Ссылки
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.

Описание

Какую проблему решает

Патент решает две ключевые проблемы в поисковых системах:

  • Ранжирование устаревшего контента: Ситуации, когда «устаревшие» (stale) документы, которые давно не обновлялись, ранжируются выше, чем более «свежие» (fresh) и актуальные документы.
  • Манипуляции ранжированием (Спам): Использование спам-технологий для искусственного завышения рейтинга, таких как массовое создание ссылок или использование временных доменов (doorway domains).
Изобретение улучшает качество поиска путем интеграции анализа исторических данных и временных трендов в процесс оценки документов.

Что запатентовано

Запатентована система и метод оценки документов, основанные на анализе исторических данных (historical data), связанных с этими документами. Это обширный (omnibus) патент, охватывающий множество различных типов исторических данных, включая историю изменений самого документа, историю ссылок, указывающих на него, историю запросов, по которым он показывался, и историю взаимодействия пользователей с ним. Цель — использовать анализ временных рядов для определения свежести, актуальности, качества и легитимности документа.

Как это работает

Система собирает и анализирует historical data по множеству направлений:

  • История документа: Определяется дата создания (inception date), отслеживается частота и объем обновлений контента.
  • История ссылок и анкоров: Анализируется скорость появления/исчезновения ссылок (link velocity), возраст ссылок и изменения в анкорном тексте. Неестественные всплески могут сигнализировать о спаме.
  • Анализ запросов и трафика: Отслеживаются тренды запросов (например, «горячие темы») и изменения в трафике документа и поведении пользователей (например, снижение времени на сайте может указывать на устаревание).
  • Данные о домене: Анализируется история регистрации домена (например, долгосрочная регистрация как сигнал легитимности).
На основе этих данных система генерирует оценки (scores), которые влияют на итоговое ранжирование, повышая свежий и качественный контент и понижая устаревший или спамный.

Актуальность для SEO

Критически высокая. Этот патент, поданный в 2003 году ключевыми инженерами Google (включая Мэтта Каттса, Джеффа Дина, Анурага Ачарью и Пола Хаара), заложил основу для целого направления алгоритмов, связанных со свежестью (например, QDF - Query Deserves Freshness) и борьбой со спамом. Принципы, описанные в патенте — скорость получения ссылок, история домена, частота обновления контента, анализ поведения пользователей во времени — являются фундаментальными для работы Google Поиска в 2025 году, хотя конкретные реализации, несомненно, эволюционировали в сторону более сложных ML-моделей.

Важность для SEO

Критическое влияние (95/100). Этот патент затрагивает практически все аспекты SEO-стратегии. Он объясняет, почему важна регулярность обновления контента, почему опасно покупать ссылки в большом объеме за короткий срок (link velocity), почему история и срок регистрации домена имеют значение, и как Google интерпретирует изменения в поведении пользователей. Понимание механизмов, описанных здесь, необходимо для построения долгосрочной и устойчивой стратегии продвижения.

Детальный разбор

Термины и определения

History Data (Исторические данные)
Данные, связанные с документом, собранные во времени. Включают дату создания, историю обновлений, историю ссылок, анализ запросов, данные о трафике, историю ранжирования, данные о домене и т.д.
Inception Date (Дата создания/обнаружения)
Дата, когда документ был впервые обнаружен или создан. Может определяться по дате первого сканирования, первой обнаруженной ссылке, дате регистрации домена или временной метке сервера.
Fresh Document (Свежий документ)
Документ, который недавно был создан или обновлен, или демонстрирует признаки актуальности (рост трафика, новые ссылки).
Stale Document (Устаревший документ)
Документ, который давно не обновлялся и может содержать неактуальную информацию. Признаками могут быть снижение трафика или исчезновение ссылок.
Update Frequency (UF) (Частота обновлений)
Метрика, показывающая, как часто обновляется контент документа.
Update Amount (UA) (Объем обновлений)
Метрика, показывающая, насколько сильно изменился контент документа за определенный период.
Link Velocity (Скорость роста ссылок)
Скорость, с которой появляются новые ссылки на документ. Резкие всплески могут рассматриваться как сигнал спама.
Link Freshness (Свежесть ссылки)
Метрика, определяемая датой появления/изменения ссылки, ее анкора или документа, содержащего ссылку.
Anchor Text Freshness (Свежесть анкорного текста)
Метрика, аналогичная свежести ссылки, но фокусирующаяся на тексте анкора.
Synthetic Web Graph (Синтетический веб-граф)
Структура ссылок, созданная искусственно (например, путем покупки или обмена ссылками) с целью манипулирования ранжированием. Характеризуется скоординированными действиями.
Doorway Domain (Временный/Дорвейный домен)
Домен, часто используемый для спама, с коротким сроком регистрации, предназначенный для быстрого сбора трафика до блокировки.

Ключевые утверждения (Анализ Claims)

Патент содержит большое количество пунктов (Claims), так как описывает множество различных применений исторических данных. Рассмотрим ключевые независимые пункты.

Claim 1 (Независимый пункт): Описывает общий метод оценки документа.

  1. Идентификация документа.
  2. Получение множества (plurality) типов исторических данных, связанных с документом. Перечислены категории: дата создания, изменения документа, анализ запросов, ссылочные критерии, анкорный текст, трафик, поведение пользователей, данные домена, история ранжирования и т.д.
  3. Генерация оценки (score) для документа на основе этого множества типов исторических данных.

Ядром изобретения является использование комбинации различных исторических сигналов для определения итоговой оценки документа в поиске.

Claim 54 (Независимый пункт): Описывает конкретный метод ранжирования на основе устаревания ссылочных данных.

  1. Определение возраста ссылочных данных (linkage data), включающих ранг, основанный на ссылках и анкорном тексте.
  2. Ранжирование документа на основе функции затухания (decaying function) от возраста этих ссылочных данных.
  3. Определение долговечности (longevity) ссылочных данных.
  4. Получение индикатора обновления контента (indication of content update) для ссылающегося документа.
  5. Корректировка ранжирования документа на основе долговечности ссылочных данных и индикатора обновления ссылающегося документа.

Этот пункт описывает механизм, при котором ценность ссылки и анкора снижается со временем (функция затухания), но может поддерживаться, если ссылка существует долго (longevity) и страница, на которой она размещена, регулярно обновляется.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска.

CRAWLING – Сканирование и Сбор данных
На этом этапе система собирает первичные данные, которые станут основой для исторического анализа: временные метки, содержимое документов, ссылки и анкоры при каждом посещении.

INDEXING – Индексирование и извлечение признаков
Основной этап сбора и обработки исторических данных. Система анализирует историю сканирования для:

  • Определения Inception Date.
  • Сравнения версий документа для расчета Update Frequency (UF) и Update Amount (UA).
  • Анализа истории ссылочного графа для определения дат появления/исчезновения ссылок и расчета Link Velocity.
  • Анализа истории DNS и регистрации домена.
Эти исторические признаки сохраняются вместе с документом.

QUNDERSTANDING – Понимание Запросов
Система анализирует исторические логи запросов для выявления трендов, сезонности и определения того, для каких запросов важна свежесть (Query Analysis).

RANKING – Ранжирование
На этапе ранжирования система использует предварительно вычисленные исторические признаки для генерации итогового Ranking Score. Исторические данные могут использоваться как для повышения (например, за свежесть), так и для понижения (например, за спамную ссылочную активность или устаревание контента).

Входные данные:

  • История сканирования документа (содержимое, временные метки).
  • История ссылочного графа (ссылки, анкоры, даты обнаружения).
  • Логи поисковых запросов.
  • Данные о трафике и поведении пользователей (клики, время на сайте).
  • Данные WHOIS и DNS домена.

Выходные данные:

  • Исторические признаки документа (Inception Date, UF, UA, Link Velocity Score, Domain Legitimacy Score и т.д.).
  • Скорректированный Ranking Score документа.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы, где важна свежесть (новости, события, обзоры продуктов) — концепция QDF (Query Deserves Freshness) берет начало здесь. Также влияет на коммерческие запросы, где высока вероятность спама.
  • Конкретные ниши или тематики: Влияет на YMYL-тематики, где важна легитимность домена и актуальность информации (медицина, финансы). Влияет на новостные сайты и блоги.
  • Конкретные типы контента: Влияет на все типы контента, позволяя системе различать «вечнозеленый» контент от контента, требующего регулярного обновления.

Когда применяется

Алгоритмы применяются постоянно. Сбор исторических данных происходит непрерывно в процессе сканирования и индексирования интернета, а также при обработке логов запросов и поведения пользователей. Использование этих данных для ранжирования происходит при каждом запросе.

Пошаговый алгоритм

Патент описывает не единый алгоритм, а набор методов использования исторических данных. Общий процесс выглядит следующим образом:

  1. Идентификация документов: Определение набора документов (например, релевантных поисковому запросу или в процессе индексации).
  2. Сбор исторических данных: Получение связанных с документами исторических данных различных типов. Это включает:
    • Данные о создании: Определение даты создания документа (например, по дате первого сканирования или регистрации домена).
    • Данные об изменениях контента: Анализ истории версий документа для определения частоты и объема обновлений. Игнорирование незначительных изменений (реклама, навигация).
    • Данные о ссылках: Отслеживание дат появления и исчезновения ссылок, скорости их роста, изменений в анкорном тексте. Определение свежести ссылающихся документов.
    • Данные о запросах и поведении: Анализ трендов запросов, истории кликов, трафика и времени, проведенного пользователями на документе.
    • Данные о домене: Проверка истории и срока регистрации домена, данных DNS.
  3. Вычисление исторических метрик: Обработка собранных данных для расчета конкретных метрик:
    • Расчет скорости роста ссылок (Link Velocity).
    • Расчет показателей свежести (Freshness Score) на основе обновлений контента и новых ссылок.
    • Расчет показателей устаревания (Staleness Score) на основе снижения трафика или исчезновения ссылок.
    • Оценка легитимности домена (Domain Legitimacy Score).
    • Выявление аномалий (например, резких всплесков ссылок или изменений тематики).
  4. Оценка документов (Scoring): Генерация итоговой оценки документа, основанной, по крайней мере частично, на вычисленных исторических метриках. Это может включать:
    • Нормализацию базовых оценок (например, нормализация ссылочного веса по возрасту документа).
    • Применение повышающих коэффициентов за свежесть и актуальность.
    • Применение понижающих коэффициентов (затухание) для старых ссылок или устаревшего контента.
    • Пессимизацию документов с признаками спама (синтетический граф ссылок, временные домены).

Какие данные и как использует

Данные на входе

Патент описывает использование широкого спектра исторических данных:

  • Контентные факторы: История изменений видимого контента, заголовков (Title). Отслеживание изменений в важных областях документа по сравнению с незначительными (boilerplate, реклама, комментарии, Javascript).
  • Технические факторы: Временные метки сервера (Time Stamps). Данные DNS (смена name-серверов, хостинга). Данные WHOIS (регистратор, дата регистрации, дата истечения срока домена, адреса нейм-серверов).
  • Ссылочные факторы: Даты появления и исчезновения входящих ссылок. Скорость роста ссылок (Link Velocity). История изменений анкорного текста. Свежесть, авторитетность и надежность (Trust) ссылающихся документов. Структура ссылочного графа (выявление синтетических графов).
  • Поведенческие факторы: История трафика документа. Паттерны трафика (сезонность). История кликов (CTR) в результатах поиска. Время, проведенное пользователем на документе (Dwell Time). Данные, поддерживаемые пользователем (закладки, избранное). Рекламный трафик и клики по рекламе.
  • Временные факторы: Дата создания документа (Inception Date). Возраст ссылок. Возраст анкорного текста.

Какие метрики используются и как они считаются

  • Нормализованный ссылочный вес (History-adjusted link score H): Патент предлагает формулу для нормализации ссылочного веса (L) по времени, прошедшему с момента создания документа (F): H=L/log(F+2)H = L/log(F+2)H=L/log(F+2). Это позволяет оценить скорость набора ссылок относительно возраста.
  • Оценка обновлений контента (U): Рассчитывается как функция частоты (UF) и объема (UA) обновлений: U=f(UF,UA)U = f(UF, UA)U=f(UF,UA). При расчете UA больший вес придается изменениям в важных частях контента.
  • Тренды скорости изменений: Сравнение текущей скорости изменений контента с предыдущими периодами для выявления ускорения или замедления.
  • Распределение возраста ссылок (Age Distribution): Анализ дат создания ссылок. Предполагается, что распределение возраста ссылок у свежего документа сильно отличается от устаревшего.
  • Вес ссылки на основе свежести (Freshness Weighting): Присвоение веса ссылке на основе ее свежести (дата появления/изменения ссылки, анкора или ссылающегося документа). Также используется функция затухания (decaying function) (Claim 54).
  • Оценка легитимности домена: Агрегация сигналов, таких как срок регистрации (более длительный срок = выше легитимность), стабильность DNS и контактной информации.

Выводы

  1. Время — критически важное измерение в ранжировании: Google не просто оценивает текущее состояние документа, но и анализирует его историю и динамику развития. Статичная оценка заменяется анализом временных рядов.
  2. Многовекторная оценка свежести и устаревания: Свежесть (Freshness) и устаревание (Staleness) оцениваются комплексно. Документ может считаться свежим, если обновляется его контент, на него появляются новые ссылки, растет трафик или он соответствует актуальным трендам запросов. И наоборот, снижение активности по любому из этих направлений может привести к признанию документа устаревшим.
  3. Исторические паттерны для обнаружения спама: Анализ исторических данных используется для отличия естественного роста популярности от искусственных манипуляций. Резкие всплески (spikes) ссылочной массы, неестественно согласованные или разрозненные анкоры, внезапные изменения тематики документа или резкие скачки в рейтинге могут сигнализировать о спаме (Synthetic Web Graph).
  4. История домена как сигнал легитимности: Патент явно указывает на использование данных о регистрации домена (WHOIS, DNS) для оценки его надежности. Долгосрочная регистрация и стабильность технических данных являются позитивными сигналами.
  5. Затухание старых сигналов (Link Decay): Ценность исторических сигналов (ссылки, анкорный текст) может снижаться (decay) со временем, как описано в Claim 54, или игнорироваться, если контекст документа значительно изменился. Свежесть ссылающегося документа может поддерживать ценность размещенной на нем ссылки.

Практика

Best practices (это мы делаем)

  • Регулярное и значимое обновление контента: Для контента, требующего актуальности, необходимо поддерживать высокую частоту (UF) и достаточный объем (UA) обновлений. Убедитесь, что обновления затрагивают основное содержимое, а не только меняют дату публикации, так как система умеет игнорировать изменения в незначимых блоках (boilerplate).
  • Стратегия «Вечнозеленого контента»: Для информационных статей, не теряющих актуальность, важно демонстрировать устойчивый интерес пользователей и стабильный ссылочный профиль. Периодический пересмотр и дополнение таких материалов также будут полезны.
  • Естественная скорость наращивания ссылок: Сосредоточьтесь на получении ссылок с постоянной, естественной скоростью. Избегайте резких всплесков (spikes), которые могут быть интерпретированы как попытка спама. Лучше 1 ссылка в день в течение 10 дней, чем 10 ссылок за один день.
  • Качество и свежесть доноров ссылок: Стремитесь получать ссылки с авторитетных и регулярно обновляемых ресурсов. Патент подчеркивает, что свежесть ссылающегося документа влияет на вес (weight) передаваемой ссылки (Claim 54).
  • Долгосрочная регистрация домена: Для важных проектов продлевайте регистрацию домена на несколько лет вперед (до 10 лет). Это используется как сигнал легитимности и отличает качественные сайты от временных (doorway domains).
  • Поддержание актуальности анкорного текста: Убедитесь, что анкорный текст входящих ссылок соответствует текущему содержанию документа. Если тематика страницы изменилась, старые анкоры могут быть дисконтированы.
  • Фокус на устойчивом вовлечении пользователей: Работайте над улучшением поведенческих факторов (время на сайте, глубина просмотра). Снижение интереса пользователей во времени является сильным сигналом устаревания контента.

Worst practices (это делать не надо)

  • Покупка ссылок пакетами: Массовая закупка ссылок приводит к неестественному всплеску Link Velocity и созданию Synthetic Web Graph, что является прямым сигналом для пессимизации согласно патенту.
  • Имитация обновления контента: Изменение временных меток или незначительные правки в футере/сайдбаре не будут засчитаны как значимое обновление (UA), так как система взвешивает изменения в разных частях документа по-разному.
  • Использование временных доменов и частая смена DNS/Хостинга: Короткий срок регистрации домена и нестабильность технических данных (DNS, IP) используются как индикаторы низкого качества или спама.
  • Резкое изменение тематики сайта (Content Drift): Если тематика документа или домена кардинально меняется, система может посчитать предыдущие сигналы (ссылки, анкоры, историю ранжирования) ненадежными и игнорировать их.
  • Стратегия «Создал и забыл» (Set and Forget): Игнорирование необходимости обновлять контент в тематиках, где важна свежесть, приведет к постепенному снижению позиций из-за признания контента устаревшим (stale).

Стратегическое значение

Этот патент имеет фундаментальное стратегическое значение. Он демонстрирует, что Google анализирует не только моментальный снимок интернета, но и его эволюцию во времени. Для SEO это означает, что приоритет отдается долгосрочным стратегиям, устойчивому развитию и поддержанию актуальности. Скорость и история изменений сигналов так же важны, как и их абсолютные значения. Патент подтверждает важность комплексного подхода, где свежесть контента, естественность ссылочного профиля, техническая стабильность и поведение пользователей взаимосвязаны.

Практические примеры

Сценарий 1: Оценка скорости ссылочного профиля (Link Velocity)

  1. Ситуация: Два сайта запущены одновременно. Сайт А получает 100 ссылок в первый месяц и 0 в последующие. Сайт Б получает 10 ссылок каждый месяц в течение 10 месяцев.
  2. Анализ по патенту: Сайт А демонстрирует резкий всплеск (spike), что может быть интерпретировано как спам или временное явление. Сайт Б демонстрирует естественный рост.
  3. Действие системы: Система может применить пессимизацию к Сайту А из-за подозрения на Synthetic Web Graph. Сайт Б получит преимущество за счет стабильного роста. Кроме того, применение формулы нормализации H=L/log(F+2)H = L/log(F+2)H=L/log(F+2) со временем снизит нормализованный вес для обоих сайтов, но для Сайта А падение будет более резким, так как его ссылки стареют и новые не появляются.

Сценарий 2: Актуализация статьи обзора

  1. Ситуация: Статья «Лучшие смартфоны» была написана год назад. SEO-специалист хочет улучшить ее позиции.
  2. Действие А (Плохое): Специалист меняет заголовок на «Лучшие смартфоны 2025» и обновляет дату публикации на сервере.
  3. Действие Б (Хорошее): Специалист переписывает 40% текста, добавляя новые модели, удаляя устаревшие и обновляя характеристики.
  4. Анализ по патенту: В случае А система определит низкий Update Amount (UA), так как основное содержимое не изменилось. В случае Б система зафиксирует высокий UA в важных областях контента.
  5. Результат: Статья Б получит значительный буст за свежесть, в то время как Статья А может быть проигнорирована или даже пессимизирована за попытку манипуляции датой.

Вопросы и ответы

Как Google определяет дату создания документа (Inception Date)?

Патент описывает несколько методов. Основные — это дата, когда поисковая система впервые проиндексировала документ, или дата, когда была впервые обнаружена ссылка на этот документ. Также могут использоваться вспомогательные сигналы: дата регистрации домена, временные метки сервера или первое упоминание документа в новостях или других источниках. Система может использовать комбинацию этих методов.

Что считается «значимым» обновлением контента (Update Amount)?

Значимым обновлением считается изменение существенной части основного содержимого документа. Патент подчеркивает, что система умеет взвешивать изменения в разных частях страницы по-разному. Изменения в навигации, рекламе, комментариях, футере или просто обновление даты публикации имеют низкий вес или игнорируются. Изменения в заголовке и основном тексте имеют больший вес.

Как скорость получения ссылок (Link Velocity) влияет на ранжирование?

Скорость получения ссылок используется для оценки свежести и выявления спама. Естественный, стабильный рост ссылок является позитивным сигналом свежести. Резкий всплеск (spike) ссылочной массы, особенно если он сопровождается подозрительными анкорами, может быть интерпретирован как искусственная накрутка (Synthetic Web Graph) и привести к пессимизации. Исключения могут делаться для авторитетных сайтов или реальных новостных поводов.

Теряют ли старые ссылки свою ценность со временем (Link Decay)?

Да, патент (Claim 54) описывает применение функции затухания (decaying function) к возрасту ссылок. Однако ценность старой ссылки может поддерживаться, если она размещена на авторитетном документе, который регулярно обновляется (Link Freshness). Если же ссылающийся документ сам признан устаревшим (stale), ценность исходящих из него ссылок снижается.

Как данные о регистрации домена влияют на SEO?

Данные WHOIS и DNS используются для оценки легитимности домена. Домены, оплаченные на много лет вперед, считаются более надежными, чем домены с годовой регистрацией (которые часто используются для спама). Частая смена контактной информации, name-серверов или хостинг-провайдеров может рассматриваться как негативный сигнал.

Может ли снижение трафика повлиять на ранжирование документа?

Да. Патент указывает, что значительное снижение трафика или изменение паттернов поведения пользователей (например, резкое сокращение времени, проводимого на странице) может сигнализировать о том, что документ устарел или потерял актуальность. Это может привести к снижению его оценки ранжирования.

Что произойдет, если я полностью изменю тематику своего сайта?

Патент рассматривает это как критическое событие. Значительное изменение набора тем (Document Topics) или ситуации, когда контент начинает сильно отличаться от исторических анкоров, указывает на то, что предыдущие сигналы (ссылки, авторитет, история ранжирования) больше не являются надежными. В этом случае старые сигналы могут быть значительно дисконтированы или полностью проигнорированы.

Влияет ли история ранжирования документа на его текущие позиции?

Да. Система отслеживает изменение позиций документа во времени. Документы, которые демонстрируют стабильно высокий рейтинг в течение длительного времени, могут считаться авторитетными. Резкие скачки в рейтинге по многим запросам могут сигнализировать о попытке спама, но также могут указывать на актуальную тему. Резкое падение рейтинга может указывать на устаревание контента.

Использует ли Google данные из закладок пользователей для ранжирования?

Да, патент упоминает использование данных, поддерживаемых пользователем (User Maintained/Generated Data), таких как закладки (bookmarks) или избранное (favorites). Если большое количество пользователей добавляет документ в закладки или часто обращается к нему через них, это может считаться признаком важности документа. Удаление из закладок может сигнализировать о потере актуальности.

Важнее ли частота обновлений или объем обновлений?

Важна комбинация обоих факторов. Система рассчитывает оценку обновлений как функцию частоты (UF) и объема (UA). Частые, но незначительные обновления могут иметь меньший эффект, чем более редкие, но масштабные обновления контента. Идеальный вариант зависит от тематики и интента пользователя.

Похожие патенты

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google намеренно задерживает или искажает изменения в ранжировании для выявления SEO-манипуляций
Google использует механизм для борьбы со спамом, который вносит временные задержки и неожиданные колебания в ранжирование документа после изменения его факторов. Вместо немедленного применения нового рейтинга система использует "Функцию перехода ранга". Это делается для того, чтобы запутать спамеров и проанализировать их реакцию на неожиданные изменения (например, падение позиций вместо ожидаемого роста), выявляя таким образом манипуляции.
  • US8244722B1
  • 2012-08-14
  • Антиспам

  • SERP

  • Техническое SEO

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

Популярные патенты

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL
Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.
  • US20140280133A1
  • 2014-09-18
  • Семантика и интент

  • Поведенческие сигналы

  • Knowledge Graph

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует машинное обучение для прогнозирования желаемого типа контента (Web, Images, News) и формирования смешанной выдачи (Universal Search)
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
  • US7584177B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

seohardcore