SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика

SITE QUALITY SCORE (Оценка качества сайта)
  • US9031929B1
  • Google LLC
  • 2012-06-27
  • 2015-05-12
  • Поведенческие сигналы
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.

Описание

Какую проблему решает

Патент решает задачу объективной оценки качества и авторитетности сайта на основе анализа поведения пользователей в поиске. Цель — разработать метрику (Site Quality Score), которая измеряет, насколько пользователи целенаправленно ищут конкретный сайт (брендовый или навигационный интерес) по сравнению с тем, насколько часто они попадают на него через общие поисковые запросы (общая видимость). Это позволяет отделить сайты с сильным брендом и высокой репутацией от сайтов (например, контент-ферм), которые могут получать значительный трафик, но не являются авторитетными источниками сами по себе.

Что запатентовано

Запатентован метод вычисления оценки качества сайта (Site Quality Score). Эта оценка рассчитывается как соотношение (ratio) двух ключевых показателей, извлеченных из логов поисковой системы: (1) количества уникальных запросов, которые явно относятся к сайту (брендовые, навигационные), и (2) общего количества уникальных запросов, которые привели к клику на ресурсы этого сайта. Формула расчета включает обязательные механизмы фильтрации шума и демпфирования (сглаживания).

Как это работает

Система анализирует логи запросов и поведение пользователей:

  • Определение брендового интереса (Числитель S): Подсчитывается количество уникальных запросов, которые пользователи вводят для поиска конкретного сайта (например, используя оператор "site:", брендовые названия или навигационные запросы).
  • Определение общей видимости (Знаменатель U): Подсчитывается общее количество уникальных запросов, по которым пользователи кликали на результаты, ведущие на этот сайт.
  • Расчет оценки: Site Quality Score вычисляется по формуле, основанной на соотношении S/U.
  • Модификаторы: Формула включает вычитание порогового значения (T) из числителя для фильтрации шума и/или использование степени (n, меньше 1) для знаменателя, чтобы уменьшить влияние очень большого объема общего трафика (демпфирование).

Актуальность для SEO

Высокая. Оценка качества сайта, авторитетности и роли бренда (связь с E-E-A-T) является центральным элементом современных алгоритмов Google. Использование поведенческих данных для измерения реальной репутации сайта остается критически важным. Учитывая, что одним из изобретателей является Navneet Panda, эта метрика тесно связана с философией алгоритмов качества Google (например, Panda, Helpful Content System).

Важность для SEO

Патент имеет критическое значение (9/10) для формирования долгосрочной SEO-стратегии. Он предоставляет конкретный механизм, как Google может количественно оценивать силу бренда и качество сайта на основе поведения пользователей. Это подчеркивает стратегическую важность построения бренда, стимулирования прямого и брендового интереса, а не только оптимизации под общие ключевые слова. Сайты с низким соотношением брендового интереса к общему трафику рискуют получить низкий Site Quality Score.

Детальный разбор

Термины и определения

Site Quality Score (Оценка качества сайта)
Метрика, рассчитываемая поисковой системой, представляющая меру качества сайта. Основана на соотношении пользовательского интереса к сайту как к бренду и общей поисковой видимости сайта.
Queries referring to a site / Site Queries (Запросы, относящиеся к сайту) (S)
Запросы, которые категоризированы как направленные на конкретный сайт (Числитель). Включают запросы с site label (например, оператор "site:"), запросы, содержащие брендовые термины, или запросы, классифицированные как навигационные к этому сайту.
Queries associated with the site (Запросы, связанные с сайтом) (U)
Запросы, которые привели к выбору пользователем (user selection) результата поиска, идентифицирующего ресурс на данном сайте (Знаменатель).
Navigational query (Навигационный запрос)
Запрос, целью которого является переход на конкретный сайт. Определяется, например, если результат с конкретного сайта получает пороговый процент всех кликов по данному запросу.
Unique queries (Уникальные запросы)
Отдельные запросы. Уникальность может определяться на основе набора терминов и/или на основе уникальности пользователя, отправившего запрос (с использованием анонимизированных данных).
User selection (Выбор пользователя)
Действие пользователя (например, клик, клик определенной длительности), которое приводит к просмотру ресурса.
Threshold value (T) (Пороговое значение)
Значение, которое вычитается из числителя (S) для фильтрации шума или установки минимального порога брендового интереса.
Power (n) (Степень)
Показатель степени (больше 0 и меньше 1), используемый для демпфирования знаменателя (U), уменьшая влияние экстремально высоких значений общего трафика.
Base value (B) и Lower-bound value (L)
Константы, используемые для сглаживания и установления минимального значения числителя (L) или корректировки знаменателя (B).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод расчета Site Quality Score на основе уникальных запросов.

  1. Определение первого числа (S) уникальных запросов, категоризированных как относящиеся к конкретному сайту.
  2. Определение второго числа (U) уникальных запросов, связанных с сайтом (запрос связан, если за ним последовал клик на результат с этого сайта).
  3. Вычисление Site Quality Score путем расчета соотношения (ratio) числителя (на основе S) и знаменателя (на основе U).

Критически важным является то, что Claim 1 требует применения модификаторов к формуле: (i) числитель основан на S минус предопределенное пороговое значение (T), ИЛИ (ii) знаменатель основан на U в степени n (0 < n < 1), ИЛИ (iii) и то, и другое. Это означает, что защищается не просто идея соотношения S/U, а конкретная модифицированная формула для расчета качества.

Claim 9 (Независимый пункт): Описывает альтернативный вариант реализации (embodiment), основанный не на уникальных запросах, а на общем количестве кликов (user selections).

  1. Определение первого числа кликов по результатам, которые были показаны в ответ на запросы, относящиеся к сайту.
  2. Определение второго числа всех кликов по результатам, идентифицирующим ресурсы на этом сайте.
  3. Вычисление Site Quality Score как соотношения с теми же обязательными модификациями (порог T и/или степень n).

Claims 6, 14 (Зависимые): Уточняют расчет числителя. Числитель определяется как максимум из нижнего предела (L, например, 0) и первого числа минус пороговое значение (T). Это гарантирует, что оценка не будет отрицательной: max(L, S-T).

Claims 7, 15 (Зависимые): Уточняют расчет знаменателя. Знаменатель может определяться как сумма базового значения (B) плюс второе число в степени n. Это обеспечивает дополнительное сглаживание и демпфирование: (B + U^n).

Где и как применяется

Изобретение применяется на этапах индексирования (для расчета метрики) и ранжирования (для её применения).

INDEXING – Индексирование и извлечение признаков (Feature Extraction)
Это основной этап для вычисления метрики. Система (Site Scoring Engine) анализирует агрегированные исторические данные (Site Data), включающие логи запросов и данные о поведении пользователей за определенный период (например, день, неделя, месяц). Site Quality Score вычисляется офлайн, периодически, и сохраняется как атрибут сайта. Патент уточняет, что "сайт" может быть определен операционно как домен, поддомен или поддиректория.

RANKING – Ранжирование
Рассчитанный Site Quality Score используется Ranking Engine в качестве одного из сигналов ранжирования. Патент указывает (Claim 8), что оценка может использоваться как "терм при вычислении оценок качества для ресурсов" (a term in a computation of quality scores for resources). Высокий Site Quality Score сайта может повышать Ranking Scores отдельных ресурсов этого сайта.

Входные данные:

  • Логи поисковых запросов (Query Logs).
  • Данные о кликах (User Selection Data).
  • Классификация запросов (для определения навигационных и брендовых запросов).
  • Анонимизированные данные пользователей (для определения уникальности запросов).

Выходные данные:

  • Site Quality Score для конкретного сайта (или его части).

На что влияет

  • Конкретные типы контента: Влияет на все типы контента на сайте, так как является общесайтовой оценкой.
  • Конкретные ниши или тематики: Наибольшее влияние ожидается в тематиках, где важна авторитетность и доверие (например, YMYL, E-commerce), так как метрика напрямую измеряет репутацию источника среди пользователей.

Когда применяется

  • Расчет метрики: Производится периодически в офлайн-режиме на основе исторических данных за определенное временное окно.
  • Применение метрики: Используется в реальном времени в процессе ранжирования, каждый раз, когда ресурсы с данного сайта являются кандидатами на показ в выдаче.

Пошаговый алгоритм

Процесс расчета Site Quality Score (на примере уникальных запросов):

  1. Определение границ сайта: Система определяет границы анализируемого сайта (домен, поддомен, директория).
  2. Сбор данных: Агрегация логов поисковых запросов и данных о кликах за определенный период времени.
  3. Идентификация Referring Queries (S): Анализ запросов на наличие признаков направленного интереса: наличие оператора "site:", наличие брендовых терминов (site label) или классификация запроса как навигационного.
  4. Подсчет S: Вычисление количества уникальных запросов, идентифицированных на шаге 3.
  5. Идентификация Associated Queries (U): Определение всех запросов, которые привели к клику пользователя (user selection) на любой ресурс данного сайта.
  6. Подсчет U: Вычисление количества уникальных запросов, идентифицированных на шаге 5.
  7. Расчет числителя (Нормализация): Применение порогового значения (T) и нижнего предела (L) к S. Вычисление: max(L, S-T).
  8. Расчет знаменателя (Демпфирование): Применение степени (n) и, возможно, базового значения (B) к U. Вычисление: (B + U^n) или U^n.
  9. Вычисление Site Quality Score: Расчет финального соотношения. Например, комплексная формула: max(L,S−T)(B+Un)\frac{max(L, S-T)}{(B+U^n)}(B+Un)max(L,S−T)​.
  10. Сохранение и применение: Сохранение оценки в Site Data для использования Ranking Engine.

Какие данные и как использует

Данные на входе

Патент полностью основан на анализе поведения пользователей.

  • Поведенческие факторы: Являются основными данными. Используются логи запросов (Query Logs) и данные о выборе пользователей (User selections/клики). Упоминается возможность учета длительности клика (просмотр ресурса в течение минимального времени) как критерия засчитывания User selection.
  • Пользовательские факторы: Используются для определения уникальности запросов (Unique queries). Упоминаются данные аккаунта пользователя, IP-адрес, Cookies. Подчеркивается, что эти данные могут быть анонимизированы для защиты приватности.
  • Технические факторы: URL-структура и доменные имена используются для определения границ сайта.

Какие метрики используются и как они считаются

Система вычисляет две основные метрики для расчета Site Quality Score:

  • S (Числитель): Количество уникальных запросов, относящихся к сайту (брендовый/навигационный интерес).
  • U (Знаменатель): Количество уникальных запросов, связанных с сайтом (общая поисковая видимость, приведшая к трафику).

(Альтернативно, используются соответствующие количества кликов вместо уникальных запросов).

Формулы расчета Site Quality Score:

Патент описывает несколько вариантов расчета соотношения (ratio):

Базовая форма (не защищена патентом сама по себе):

SU\frac{S}{U}US​

Формула с порогом (T):

S−TU\frac{S-T}{U}US−T​

Формула с демпфированием (n), где 0 < n < 1:

SUn\frac{S}{U^n}UnS​

Комплексная формула (объединяющая все модификаторы):

max(L,S−T)(B+Un)\frac{max(L, S-T)}{(B+U^n)}(B+Un)max(L,S−T)​

Параметры (примеры из патента):

  • T (Порог): Эмпирическое значение, например, от 1 до 30.
  • n (Степень): Значение между 0.0 и 1.0 (например, 0.5, 0.6, 0.75, 0.9).
  • B (База): Значение больше 0 (например, 1, 10, 100).
  • L (Нижний предел): Например, 0.

Выводы

  1. Качество сайта измеряется через предпочтения пользователей и силу бренда: Патент предлагает конкретную метрику для оценки качества сайта, которая полностью основана на том, как пользователи ищут и взаимодействуют с сайтом. Предпочтение бренда (Brand Preference) напрямую конвертируется в сигнал качества.
  2. Соотношение брендового интереса к общему трафику критично: Ключевой вывод — важен не абсолютный объем трафика, а его структура. Высококачественный сайт (по этой метрике) — это сайт, который привлекает значительную долю своего трафика целенаправленно (высокий S относительно U).
  3. Механизм против контент-ферм: Сайты, которые получают большой объем трафика по широкому спектру общих запросов (высокий U), но имеют слабый брендовый интерес (низкий S), получат низкий Site Quality Score. Это математическая модель для идентификации и потенциальной пессимизации сайтов с низким авторитетом.
  4. Демпфирование (Dampening) общего трафика: Использование степени n (меньше 1) для знаменателя U (U^n) означает, что влияние очень большого объема трафика на метрику снижается. Это позволяет оценить относительную авторитетность и защищает мега-сайты от пессимизации только за их масштаб.
  5. Фильтрация шума и устойчивость: Формула включает механизмы для фильтрации шума (порог T) и сглаживания (база B, предел L), что делает метрику устойчивой к выбросам и предотвращает манипуляции с помощью низкочастотных запросов.
  6. Site Quality Score как фактор ранжирования: Рассчитанная оценка используется как компонент (term) в алгоритме ранжирования для ресурсов этого сайта.

Практика

Best practices (это мы делаем)

  • Комплексное построение бренда и авторитетности (E-E-A-T): Это ключевая стратегия. Необходимо инвестировать в узнаваемость бренда, PR и репутацию. Цель — стимулировать пользователей искать ваш сайт целенаправленно по названию компании или продукта. Это напрямую увеличивает числитель (S) в формуле Site Quality Score.
  • Фокус на качестве контента и пользовательском опыте: Создание выдающегося контента и обеспечение отличного UX стимулирует пользователей запоминать сайт, возвращаться на него и использовать навигационные или брендовые запросы для доступа к нему.
  • Мониторинг структуры трафика: Регулярно анализируйте соотношение брендового и небрендового поискового трафика (например, в Google Search Console). Рост доли брендового трафика является важным KPI в контексте этого патента.
  • Стимулирование брендового интереса вне поиска: Маркетинговые активности (социальные сети, email-рассылки, оффлайн-реклама), которые повышают знание о бренде, косвенно улучшают SEO через увеличение показателя S.

Worst practices (это делать не надо)

  • Фокус исключительно на небрендовых запросах: Стратегии, сфокусированные только на получении максимального объема трафика по общим запросам без работы над брендом. Это увеличивает знаменатель (U), но не числитель (S), что приводит к снижению Site Quality Score.
  • Создание "контент-ферм" или MFA-сайтов: Такие сайты обычно оптимизированы под получение трафика по множеству запросов, но не имеют собственной ценности как бренд. Они будут иметь крайне низкое соотношение S/U и низкий Site Quality Score.
  • Игнорирование репутации и узнаваемости сайта: Фокус только на технических аспектах SEO или ссылочном профиле без учета того, как сайт воспринимается пользователями и насколько его целенаправленно ищут.

Стратегическое значение

Патент имеет высокое стратегическое значение, так как предоставляет математическое обоснование того, почему сильные бренды имеют преимущество в поиске Google. Он подтверждает, что SEO — это не только оптимизация под ключевые слова, но и построение авторитетного ресурса, который пользователи знают и которому доверяют (E-E-A-T). Долгосрочная стратегия должна включать комплексное развитие ресурса, инвестиции в качество и бренд-маркетинг.

Практические примеры

Сценарий: Сравнение авторитетного издания и агрегатора контента

Сравним два сайта с одинаковым общим поисковым охватом (U).

  1. Сайт А (Авторитетное тематическое издание, например, WebMD):
    • U (Уникальные запросы, приведшие к клику) = 2,000,000
    • S (Уникальные брендовые/навигационные запросы) = 500,000
    • Базовое соотношение S/U = 0.25 (25% трафика ищут бренд целенаправленно).
  2. Сайт Б (Агрегатор контента / Контент-ферма):
    • U (Уникальные запросы, приведшие к клику) = 2,000,000
    • S (Уникальные брендовые/навигационные запросы) = 5,000
    • Базовое соотношение S/U = 0.0025 (0.25% трафика ищут бренд).
  3. Результат: Сайт А получит значительно более высокий Site Quality Score по этой метрике по сравнению с Сайтом Б (даже с учетом демпфирования U^n). Это даст Сайту А существенное преимущество в ранжировании по общим запросам, даже если релевантность конкретных страниц будет сопоставима.

Вопросы и ответы

Что важнее согласно этому патенту: количество брендовых запросов или общее количество трафика?

Важнее соотношение между ними. Сайт с меньшим общим трафиком, но высокой долей брендовых запросов может получить более высокий Site Quality Score, чем сайт с огромным трафиком, но низкой долей брендового интереса. Цель — максимизировать количество уникальных запросов, направленных на ваш сайт (S), поддерживая при этом здоровый общий охват (U).

Как именно Google определяет, что запрос является брендовым или навигационным?

Патент предлагает несколько методов. Во-первых, это запросы, содержащие явные идентификаторы сайта (site label) или оператор "site:". Во-вторых, это термины, которые система определила как относящиеся к сайту (например, название бренда). В-третьих, это навигационные запросы, которые определяются по поведению: если по запросу подавляющее большинство кликов (пороговый процент) приходится на один сайт, запрос считается навигационным к этому сайту.

Что означает "демпфирование" знаменателя (U^n) и зачем оно нужно?

Демпфирование (dampening) означает, что влияние общего количества трафика (U) на итоговую оценку снижается по мере его роста. Использование степени n меньше 1 (например, 0.7) приводит к тому, что удвоение общего трафика не приведет к двукратному ухудшению оценки. Это защищает очень крупные сайты (например, Wikipedia) от чрезмерной пессимизации за их размер и позволяет оценить относительную авторитетность.

Как влияют параметры T (порог) и B (база) на расчет?

Параметр T (порог) вычитается из числителя (S-T). Он используется для фильтрации шума и требует, чтобы сайт имел минимальный уровень брендового интереса, прежде чем он начнет влиять на оценку. Параметр B (база) добавляется к знаменателю (например, B+U^n). Он сглаживает оценку, особенно для небольших сайтов с малым количеством общего трафика, предотвращая экстремально высокие значения Site Quality Score.

Как этот патент связан с E-E-A-T?

Этот патент предлагает конкретный механизм для количественного измерения Авторитетности (Authority) и Доверия (Trust) на основе реального поведения пользователей. Высокий Site Quality Score, рассчитанный по этой формуле, является сильным сигналом того, что пользователи воспринимают сайт как авторитетный и надежный источник, который они ищут целенаправленно.

Какова связь этого патента с алгоритмом Google Panda?

Одним из изобретателей является Navneet Panda. Алгоритм Panda был направлен на борьбу с низкокачественным контентом и "контент-фермами". Метрика, описанная в этом патенте, идеально подходит для идентификации таких сайтов, так как они обычно имеют очень низкое соотношение брендового интереса к общему трафику (низкий S, высокий U). Вероятно, этот Site Quality Score является одним из сигналов, используемых системами качества Google.

Как SEO-специалист может отслеживать показатели S и U?

Хотя Google не предоставляет эти метрики напрямую, их можно аппроксимировать с помощью Google Search Console. S можно оценить как количество показов или кликов по брендовым запросам (запросам, содержащим название сайта/бренда). U — это общее количество показов или кликов по всем запросам. Анализ соотношения брендового трафика к общему трафику дает представление о динамике Site Quality Score.

Как я могу увеличить количество уникальных брендовых запросов (S)?

Это достигается за счет комплексной работы над качеством сайта, пользовательским опытом и маркетингом. Инвестируйте в PR, чтобы о вашем бренде говорили. Создавайте уникальный, экспертный контент, ради которого пользователи будут возвращаться. Улучшайте UX, чтобы сайт запоминался. Активность в социальных сетях и оффлайн-реклама также способствуют росту узнаваемости и, как следствие, увеличению S.

Применяется ли этот алгоритм к поддоменам и поддиректориям?

Да. В патенте указано, что "сайт" может быть определен операционно как коллекция ресурсов в домене, поддомене (например, "www.example.com") или поддиректории (например, "example.com/subdirectory/"). Это означает, что Google может рассчитывать отдельные Site Quality Scores для разных разделов крупного портала.

Учитывает ли система уникальность пользователей при подсчете запросов?

Да, в патенте явно упоминается возможность использования информации о пользователе (аккаунт, IP, cookies) для определения уникальности запросов. Это делается для измерения широты интереса к сайту, а не интенсивности использования одним человеком. Подчеркивается, что данные анонимизируются для защиты приватности.

Похожие патенты

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов
Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.
  • US8682892B1
  • 2014-03-25
  • Ссылки

  • EEAT и качество

  • SERP

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2015-11-24
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
  • US8538989B1
  • 2013-09-17
  • Семантика и интент

  • Индексация

  • Структура сайта

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.
  • US8892549B1
  • 2014-11-18
  • EEAT и качество

  • Семантика и интент

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
  • US8583675B1
  • 2013-11-12
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

seohardcore