SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента

RESOURCE SCORING ADJUSTMENT BASED ON ENTITY SELECTIONS (Корректировка оценки ресурса на основе выбора сущностей)
  • US10303684B1
  • Google LLC
  • 2013-08-27
  • 2019-05-28
  • Поведенческие сигналы
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.

Описание

Какую проблему решает

Патент решает проблему «холодного старта» (cold start problem) при использовании поведенческих факторов (например, CTR) в ранжировании. Новые, недавно опубликованные или редко посещаемые ресурсы («длинный хвост») не имеют достаточной истории взаимодействий (search and selection data), чтобы система могла надежно оценить их эффективность. Изобретение позволяет применять поведенческие корректировки ранжирования даже при отсутствии индивидуальной статистики у ресурса.

Что запатентовано

Запатентована система, которая переносит оценку поведенческих сигналов с уровня конкретного ресурса (URL) на уровень Сущностей (Entities). Система вычисляет метрику Search Term-Entity Selection Value (STESV), которая отражает, насколько часто ресурсы, содержащие определенную сущность, выбирались пользователями в ответ на определенный поисковый термин. Это позволяет корректировать ранжирование нового ресурса на основе исторической эффективности его составных сущностей.

Как это работает

Система работает в два этапа:

  • Офлайн-вычисление: Система анализирует логи запросов и кликов. Сначала вычисляется Selection Value (кликабельность) для пар [Термин + Ресурс]. Затем эти данные агрегируются для вычисления Search Term-Entity Selection Value для каждой пары [Термин + Сущность], объединяя данные всех ресурсов, упоминающих данную сущность.
  • Онлайн-применение: При поступлении запроса система идентифицирует сущности в ресурсах-кандидатах. Извлекаются предварительно рассчитанные STESV для этих сущностей в контексте текущего запроса. Эти значения агрегируются (с учетом нормализации) и используются для корректировки (повышения или понижения) итогового рейтинга ресурса.

Актуальность для SEO

Высокая. Понимание сущностей (Entity understanding) и использование поведенческих сигналов являются центральными элементами современного поиска. Решение проблемы ранжирования свежего и низкочастотного контента остается критически важным. Этот патент описывает механизм, который связывает семантическое понимание контента с поведенческими данными для быстрой оценки новых документов.

Важность для SEO

Патент имеет высокое значение для SEO (8.5/10). Он демонстрирует механизм, позволяющий новому контенту быстро занимать высокие позиции, если он посвящен сущностям, которые исторически удовлетворяют пользователей по релевантным запросам. Это подчеркивает критическую важность четкой ассоциации контента с конкретными сущностями (Entity Optimization) и создания сфокусированного контента для минимизации эффекта размытия.

Детальный разбор

Термины и определения

Entity (Сущность)
Идентифицируемая вещь или концепция. Экземпляры классов существительных, таких как люди, места или вещи (например, «Кейко Фудзи», «Гора Фудзи», «Яблоки Фудзи»). Ресурсы аннотируются идентификаторами сущностей.
Selection Value (Оценка выбора)
Метрика, основанная на выборе пользователем результатов поиска. Определяется как соотношение (ratio) кликов к показам (impression fraction или CTR) для конкретного ресурса по конкретному поисковому термину.
Search Term-Entity Selection Value (STESV) (Оценка выбора Термин-Сущность)
Ключевая метрика патента. Агрегированное значение Selection Values всех ресурсов, которые ссылаются на определенную Сущность, в ответ на запрос с определенным Поисковым Термином. Отражает историческую эффективность Сущности для данного Термина.
Cardinality of the set of entities (Мощность множества сущностей)
Общее количество уникальных сущностей, на которые ссылается конкретный ресурс. Используется для нормализации (размытия) влияния отдельных сущностей.
Central Tendency (Мера центральной тенденции)
Статистическая мера (например, среднее значение, медиана, максимум, минимум), используемая для агрегации нескольких скорректированных STESV в единую оценку для ресурса.
Weight Score (Весовая оценка сущности)
Упоминается в описании. Оценка, пропорциональная значимости (significance) сущности внутри ресурsa. Может использоваться при расчете STESV.
Confidence Score (Оценка достоверности)
Упоминается в описании. Метрика достоверности Selection Value, основанная на объеме данных (количестве показов).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной офлайн-процесс вычисления Search Term-Entity Selection Values (STESV).

  1. Система получает доступ к данным о ресурсах (идентификаторы и упомянутые сущности).
  2. Система получает доступ к данным поисковых терминов, включающим Selection Value для каждого ресурса по каждому термину.
  3. Selection Value точно определяется как соотношение (ratio): (A) количества кликов на ресурс по термину, к (B) количеству показов ресурса по термину (т.е. CTR).
  4. Система вычисляет STESV для каждой пары [Термин + Сущность] путем агрегации (aggregating) Selection Values всех ресурсов, которые ссылаются на эту сущность и были показаны по этому термину.
  5. Эти значения сохраняются.

Claim 2 (Зависимый от 1): Описывает онлайн-процесс применения STESV для ранжирования.

  1. Система получает запрос и определяет поисковый термин.
  2. Получается начальное ранжирование ресурсов (first order).
  3. Определяется, что ресурс ссылается на сущность.
  4. Извлекается предварительно рассчитанный STESV для этой пары [Термин + Сущность].
  5. Ранжирование ресурсов корректируется на основе этого значения, формируя second order (итоговая выдача).

Claim 4 (Зависимый от 1): Описывает обработку ресурсов с множеством сущностей и механизм размытия (dilution).

  1. Определяется, что ресурс ссылается на набор сущностей (set of entities).
  2. Извлекаются STESV для всех сущностей в наборе.
  3. Каждое значение корректируется обратно пропорционально мощности множества (in inverse proportion to a cardinality of the set of entities).

Если ресурс содержит много сущностей, влияние исторической оценки каждой отдельной сущности уменьшается.

Claim 6 (Зависимый от 5): Описывает агрегацию скорректированных значений.

  1. Определяется мера центральной тенденции (central tendency) скорректированных STESV (например, среднее значение).
  2. Итоговое ранжирование корректируется на основе этой меры центральной тенденции.

Где и как применяется

Изобретение связывает индексирование, офлайн-анализ данных и ранжирование.

INDEXING – Индексирование и извлечение признаков
На этом этапе система идентифицирует сущности в каждом ресурсе и аннотирует ресурс соответствующими идентификаторами сущностей (entity identifiers). Эти данные сохраняются в индексе.

Офлайн-обработка данных (Data Analysis / Log Processing)
Компонент Search Term-Entity Selection Evaluator работает в офлайн-режиме. Он обрабатывает Query Logs и Selection Logs (поведенческие данные) совместно с данными Индекса для вычисления Selection Values и агрегированных STESV. Результаты сохраняются в базе данных (Search Term-Entity Selection Data).

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение. Во время обработки запроса компонент Search Score Adjuster использует предварительно вычисленные STESV для корректировки оценок ресурсов. Это применяется как дополнительный сигнал ранжирования, особенно для ресурсов с недостаточной индивидуальной историей.

Входные данные (Онлайн):

  • Поисковый запрос (и термины).
  • Начальный набор ранжированных ресурсов (first order).
  • Данные об аннотации ресурсов сущностями (из Индекса).
  • Хранилище Search Term-Entity Selection Data (STESV).

Выходные данные (Онлайн):

  • Скорректированный набор результатов поиска (second order).

На что влияет

  • Конкретные типы контента: Наибольшее влияние на новые ресурсы (свежий контент) и ресурсы «длинного хвоста», для которых отсутствует достаточная история прямых поведенческих данных.
  • Конкретные ниши или тематики: Высокое влияние в динамичных нишах (новости, QDF-запросы) и тематиках, богатых сущностями (биографии, обзоры продуктов, ecommerce).

Когда применяется

  • Триггеры активации: Основная цель механизма — корректировка ранжирования, когда для ресурса недостаточно собственных данных о выборе (selection data) для надежного вывода о его эффективности (проблема «холодного старта»). Он может применяться ко всем ресурсам, но наиболее заметен при нехватке данных.

Пошаговый алгоритм

Процесс А: Офлайн-вычисление STESV

  1. Сбор данных: Доступ к индексу (Ресурсы и Сущности) и логам поведения (Запросы, Клики, Показы).
  2. Вычисление Selection Values: Для каждой пары [Термин + Ресурс] вычисляется Selection Value (CTR). Опционально вычисляются Confidence Scores.
  3. Агрегация на уровне сущностей: Для каждой пары [Термин + Сущность] система агрегирует Selection Values всех ресурсов, содержащих эту сущность.
  4. Взвешивание (Опционально): Агрегация может учитывать Weight Scores (значимость сущности в ресурсе) и Confidence Scores.
  5. Сохранение: Полученные STESV сохраняются в базе данных.

Процесс Б: Онлайн-корректировка ранжирования

  1. Получение запроса и начального ранжирования: Система получает запрос, извлекает термины и формирует начальный список ресурсов (first order).
  2. Идентификация сущностей: Для ресурса-кандидата определяется набор содержащихся в нем сущностей.
  3. Извлечение STESV: Извлекаются STESV для каждой сущности в контексте поискового термина.
  4. Корректировка (Размытие): Если сущностей несколько, каждое значение корректируется обратно пропорционально общему количеству сущностей в ресурсе (cardinality).
  5. Вычисление обобщенной оценки: Вычисляется мера центральной тенденции (Central Tendency) скорректированных значений (например, среднее).
  6. Корректировка ранжирования: Начальный рейтинг ресурса изменяется на основе обобщенной оценки. Формируется итоговое ранжирование (second order).

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Являются основой изобретения. Используются Query Logs и Selection Logs для извлечения данных о показах (impressions) и кликах (selections).
  • Контентные/Структурные факторы: Данные об аннотации ресурсов сущностями. Система должна знать, какие Entities упоминаются в каком Resource.

Какие метрики используются и как они считаются

  • Selection Value (Impression Fraction):
    Формула расчета (Claim 1):

Выводы

  1. Перенос поведенческих сигналов через сущности: Ключевой вывод — Google может использовать поведенческие данные косвенно. Эффективность (удовлетворенность пользователей/CTR) может быть перенесена с одних ресурсов на другие, если они разделяют общие сущности.
  2. Решение проблемы «холодного старта»: Патент предоставляет механизм для ранжирования свежего или редко посещаемого контента. Новый контент может немедленно получать бустинг (или пессимизацию) на основе исторической эффективности тем (сущностей), которые он затрагивает.
  3. Оценка удовлетворенности на уровне [Запрос+Сущность]: Система оценивает, насколько хорошо конкретная сущность удовлетворяет пользователя в контексте конкретного запроса, а не популярность сущности в целом.
  4. Размывание влияния при множестве сущностей (Dilution Effect): Механизм корректировки (inverse proportion to a cardinality, Claim 4) критически важен. Он указывает, что влияние одной положительной сущности будет уменьшено, если ресурс охватывает слишком много тем. Сфокусированные ресурсы получают преимущество.
  5. Значимость сущности в документе (Weight Score): В патенте упоминается возможность учета веса (значимости) сущности внутри документа при расчете STESV. Это подчеркивает важность глубокого раскрытия темы, а не простого упоминания.

Практика

Best practices (это мы делаем)

  • Четкая идентификация и фокусировка на сущностях: Убедитесь, что основной фокус контента очевиден. Используйте структурированные данные (Schema.org: about, mentions) и оптимизируйте контент так, чтобы NLP-алгоритмы могли точно определить ключевые сущности и их значимость (salience/Weight Score). Это поможет корректно ассоциировать контент с историческими данными STESV.
  • Создание сфокусированного контента (Анти-Размытие): Поскольку влияние оценок сущностей размывается при наличии большого количества сущностей (inverse proportionality, Claim 4), создавайте страницы, сфокусированные на ограниченном наборе тесно связанных сущностей. Это максимизирует эффект от этого механизма ранжирования.
  • Фокус на эффективных сущностях: При создании нового контента фокусируйтесь на сущностях, которые исторически показывают хорошую вовлеченность по целевым запросам. Если сущность традиционно удовлетворяет интент, новый контент может получить поведенческий буст «авансом».
  • Построение Тематического Авторитета (Topical Authority): Развивайте сайт как авторитетный источник о конкретном наборе сущностей. Создавая качественный контент, который получает клики, вы вносите вклад в повышение общего STESV для этих сущностей в экосистеме Google, что помогает всему вашему контенту по теме.

Worst practices (это делать не надо)

  • Entity Stuffing (Набивка сущностями): Добавление множества популярных, но слабо связанных сущностей в попытке получить бустинг. Механизм корректировки, основанный на cardinality (Claim 4), специально разработан для снижения эффективности этой тактики.
  • Игнорирование семантики: Фокусировка только на ключевых словах без учета сущностей не позволит использовать этот механизм для быстрого ранжирования нового контента.
  • Создание контента о «неэффективных» сущностях: Если контент фокусируется на сущностях, которые исторически не удовлетворяют пользователей по определенным запросам (низкий STESV), новый контент может быть пессимизирован с момента публикации, наследуя негативные сигналы.

Стратегическое значение

Патент подтверждает стратегический переход Google к пониманию сущностей и демонстрирует, как семантическое понимание (Entities) интегрируется с поведенческим анализом (Selection Data). Для SEO это означает, что контент должен быть осмысленным описанием сущностей, релевантных интенту пользователя. Этот механизм позволяет Google обеспечивать качество ранжирования в условиях постоянного появления огромного количества нового контента, минуя необходимость ждать накопления индивидуальной статистики.

Практические примеры

Сценарий: Иллюстрация размывания (Dilution Effect)

Используем пример из патента. Запрос: "восхождение на Фудзи" (climb Fuji).

Предположим, у Google есть следующие STESV для этого запроса:

  • Сущность "Гора Фудзи" (Mount Fuji): 0.28 (Высокий интерес)
  • Сущность "Кейко Фудзи" (Keiko Fuji, певица): 0.10 (Низкий интерес)

Сайт А (Сфокусированный): Публикует новую статью только о восхождении.

  1. Идентифицирована 1 сущность: "Гора Фудзи". Cardinality = 1.
  2. STESV: 0.28.
  3. Корректировка по Cardinality (обратная пропорция, например, деление на количество сущностей): 0.28 / 1 = 0.28.
  4. Результат: Значительный бустинг (0.28).

Сайт Б (Несфокусированный): Публикует новую статью, где упоминается и восхождение, и биография певицы.

  1. Идентифицированы 2 сущности: "Гора Фудзи", "Кейко Фудзи". Cardinality = 2.
  2. STESV: 0.28 и 0.10.
  3. Корректировка по Cardinality: 0.28 / 2 = 0.14; 0.10 / 2 = 0.05.
  4. Central Tendency (например, среднее): (0.14 + 0.05) = 0.19.
  5. Результат: Меньший бустинг (0.19), чем у Сайта А.

Вопросы и ответы

Что такое Search Term-Entity Selection Value (STESV) простыми словами?

Это исторический показатель CTR для конкретной Сущности в контексте конкретного Поискового Термина. Он рассчитывается путем агрегации CTR всех документов в интернете, которые содержат эту сущность и показывались по этому термину. Высокий STESV означает, что пользователи, ищущие этот термин, часто заинтересованы в контенте об этой сущности.

Заменяет ли этот механизм традиционное использование CTR для ранжирования?

Нет, он дополняет его. Традиционные механизмы, основанные на прямых кликах по конкретному URL, по-прежнему используются. Описанный механизм предназначен в первую очередь для ситуаций, когда прямых данных недостаточно (проблема «холодного старта») — для новых или редко посещаемых страниц. Он позволяет сделать предположение об эффективности ресурса на основе эффективности его сущностей.

Как работает механизм «размывания» (dilution), если на странице много сущностей?

В патенте указано (Claim 4), что оценка каждой сущности корректируется обратно пропорционально общему количеству сущностей на странице (cardinality). Если на странице 10 сущностей, влияние исторической оценки каждой из них будет значительно меньше (например, разделено на 10), чем если бы сущность была одна. Это стимулирует создание сфокусированного контента и предотвращает манипуляции.

Как система определяет, какие сущности содержит ресурс и какова их значимость?

Это происходит на этапе индексирования с помощью NLP-моделей и сверки с Knowledge Graph. Патент также упоминает возможность использования Weight Score — веса, пропорционального значимости (significance) сущности в ресурсе. SEO-специалисты могут влиять на это, используя четкую структуру текста, делая ключевые сущности центральной темой и применяя микроразметку Schema.org.

Может ли этот механизм навредить моему сайту?

Да. Если ваш контент посвящен сущностям, которые исторически показывают низкую удовлетворенность пользователей по целевым запросам (низкий STESV), ваша страница может быть понижена в рейтинге сразу после публикации. Она наследует негативные поведенческие сигналы этой сущности для данного контекста запроса.

Что такое «Мера центральной тенденции» (Central Tendency) в этом патенте?

Когда ресурс содержит несколько сущностей, система получает несколько скорректированных STESV (по одному для каждой). Чтобы определить итоговую корректировку для всего ресурса, система вычисляет обобщенное значение. Патент упоминает, что это может быть среднее арифметическое, медиана, максимум или минимум этих значений.

Влияет ли этот патент на ранжирование старых, авторитетных страниц?

В меньшей степени. Старые страницы обычно имеют достаточно собственных прямых поведенческих данных, которые являются более надежным индикатором. Однако механизм, основанный на сущностях, все равно может применяться как один из сигналов, но его влияние будет менее заметным по сравнению с новыми страницами.

Как система обрабатывает неоднозначные термины (например, "Ягуар" – животное или машина)?

Система рассчитывает отдельные STESV для каждой уникальной сущности. Для термина "Ягуар" будут разные оценки для сущности [Ягуар (Животное)] и [Jaguar (Автомобиль)]. При ранжировании конкретного ресурса система использует оценки только тех сущностей, которые распознаны в этом ресурсе, что помогает учитывать контекст.

Что важнее: чтобы сущность часто кликали в целом или по конкретному запросу?

Важно второе. Метрика STESV рассчитывается строго для пары [Поисковый Термин + Сущность]. Сущность может быть очень популярна по одним запросам, но совершенно неэффективна по другим. Система учитывает этот контекст при корректировке ранжирования.

Как использовать этот патент для улучшения позиций нового сайта?

Для нового сайта критически важно с самого начала четко определять тематику и основные сущности. Создавайте высококачественный, сфокусированный контент, который явно нацелен на удовлетворение интента. Обеспечьте техническую возможность для Google распознать эти сущности (структура, разметка). Если вы выберете сущности, по которым уже есть положительная история вовлеченности, ваш новый контент сможет ранжироваться быстрее.

Похожие патенты

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент
Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.
  • US8874558B1
  • 2014-10-28
  • EEAT и качество

  • Свежесть контента

  • Индексация

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
  • US9098551B1
  • 2015-08-04
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Популярные патенты

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
  • US11782998B2
  • 2023-10-10
  • Семантика и интент

  • Индексация

  • Мультимедиа

Как Google в Autocomplete динамически выбирает между показом общих категорий и конкретных подсказок в зависимости от «завершенности запроса»
Google анализирует «меру завершенности запроса» (Measure of Query Completeness) по мере ввода текста пользователем. Если намерение неясно и существует много вариантов продолжения (низкая завершенность, высокая энтропия), система предлагает общие категории (например, «Регионы», «Бизнесы»). Если намерение становится ясным (высокая завершенность, низкая энтропия), система переключается на конкретные подсказки или сущности.
  • US9275147B2
  • 2016-03-01
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует анализ сущностей в результатах поиска для подтверждения интента и продвижения авторитетного контента
Google анализирует сущности (Topics/Entities) и их типы, общие для топовых результатов поиска, чтобы определить истинный интент запроса. Если интент подтверждается этим тематическим консенсусом выдачи, система продвигает "авторитетные кандидаты" (например, полные фильмы). Если консенсуса нет, продвижение блокируется для предотвращения показа нерелевантных результатов.
  • US9213745B1
  • 2015-12-15
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства
Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.
  • US8868592B1
  • 2014-10-21
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
  • US9223897B1
  • 2015-12-29
  • Поведенческие сигналы

  • Индексация

  • Техническое SEO

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

seohardcore