SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей

SYSTEMS AND METHODS FOR CORRELATING DOCUMENT TOPICALITY AND POPULARITY (Системы и методы корреляции тематичности и популярности документов)
  • US8595225B1
  • Google LLC
  • 2004-09-30
  • 2013-11-26
  • Поведенческие сигналы
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.

Описание

Какую проблему решает

Патент решает проблему ограничений использования общей популярности документа (например, общего трафика) как универсального сигнала качества или авторитетности. Общая популярность не всегда отражает ценность документа в контексте конкретной узкой тематики. Изобретение направлено на выявление документов, которые популярны именно в рамках определенной темы (Topical Authority), позволяя более точно определять авторитетность в конкретной области знаний.

Что запатентовано

Запатентована система для расчета «популярности в рамках темы» (Per-Topic Popularity). Система определяет общую популярность документа (Popularity Score), основываясь на данных о поведении пользователей (посещаемость, навигационные паттерны), и классифицирует документ по одной или нескольким темам. Затем она рассчитывает относительную популярность документа путем сравнения его Popularity Score с оценками других документов строго в рамках той же темы.

Как это работает

Система работает в несколько этапов:

  • Сбор данных: Агрегируются данные о посещениях документов пользователями (идентификаторы URL) и их навигационные паттерны (Navigational Patterns).
  • Расчет общей популярности: Каждому документу присваивается общий Popularity Score на основе собранных поведенческих данных.
  • Тематическая классификация: Документы и поисковые запросы соотносятся с одной или несколькими темами (Topics).
  • Расчет тематической популярности: Документы внутри каждой темы ранжируются относительно друг друга на основе их Popularity Score. Это определяет Per-Topic Popularity.
  • Применение в ранжировании: Когда запрос пользователя относится к определенной теме, Per-Topic Popularity используется как сигнал для ранжирования релевантных документов этой темы.

Актуальность для SEO

Высокая. Несмотря на то что патент был подан в 2004 году, концепция тематического авторитета (Topical Authority) является фундаментальной для современного поиска и E-E-A-T. Использование поведенческих данных для оценки качества также остается критически важным. Изобретатели (Amit Singhal и Urs Hoelzle) — ключевые фигуры в разработке поиска Google. Хотя методы классификации могли эволюционировать, базовый принцип расчета относительной популярности внутри темы крайне актуален.

Важность для SEO

Патент имеет высокое стратегическое значение (8/10). Он демонстрирует конкретный механизм расчета Topical Authority, использующий сигналы, основанные на поведении пользователей. Это подчеркивает, что авторитетность часто является контекстуальной (зависит от темы), а не чисто глобальной. Для SEO это означает стратегическую важность фокусировки на привлечении и удержании релевантного тематического трафика, а не любого трафика вообще.

Детальный разбор

Термины и определения

Location Identifier (Идентификатор местоположения)
Идентификатор, используемый для поиска документа, например, URL.
Navigational Patterns (Навигационные паттерны)
Данные о поведении пользователей при переходе на документ и с него. Включают анализ «перетекания» трафика (funneling traffic), времени пребывания и быстрых уходов со страницы (quick jumps).
Popularity Score (Оценка популярности)
Общая метрика популярности документа, рассчитываемая на основе количества посещений (hits/visits) и/или Navigational Patterns.
Per-Topic Popularity (Популярность в рамках темы)
Метрика, определяющая популярность документа относительно других документов в рамках одной конкретной темы. Является аналогом Topical Authority, основанным на поведении пользователей.
Topic / Topicality (Тема / Тематичность)
Категория или концепция, к которой относится документ или поисковый запрос.
Topic-specific quality score (Оценка качества для конкретной темы)
Метрика качества, которая может быть присвоена документу на основе его Per-Topic Popularity и использована как сигнал ранжирования.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс расчета и применения тематической популярности для ранжирования.

  1. Система определяет первый показатель популярности (общий Popularity Score) для множества документов.
  2. Первая группа документов ассоциируется с Темой 1; Вторая группа — с Темой 2.
  3. Документам в Группе 1 присваивается второй показатель популярности (специфичный для Темы 1). Этот показатель основан на их общем Popularity Score относительно других документов в Группе 1, но не относительно документов в Группе 2.
  4. Аналогично, документам в Группе 2 присваивается третий показатель популярности (специфичный для Темы 2).
  5. Система получает поисковый запрос и определяет, что запрос связан с Темой 1 (например, на основе анализа результатов поиска по этому запросу).
  6. Определяется набор документов, релевантных запросу (включая конкретный документ из Темы 1).
  7. Выполняется первое ранжирование (на основе релевантности).
  8. Выполняется второе ранжирование конкретного документа на основе его показателя популярности, специфичного для Темы 1 (второго показателя).
  9. Результаты предоставляются в порядке, основанном на втором ранжировании.

Ядро изобретения — это расчет авторитетности/популярности строго в контексте темы. Система ранжирует документы внутри темы на основе их популярности и использует этот относительный показатель (Per-Topic Popularity) как сигнал ранжирования, когда запрос соответствует этой теме.

Claim 2 (Зависимый от 1): Уточняет, что первый (общий) Popularity Score может определяться на основе навигационных паттернов пользователей (user navigational patterns) к документу или от него.

Claim 3 (Зависимый от 1): Уточняет метод ассоциации документов с темами: использование каталога документов (directory of documents), организованного по категориям.

Claims 6 и 7 (Зависимые от 1): Уточняют, что первый (общий) Popularity Score может быть основан на количестве обращений к документу (посещений), либо глобально, либо конкретной группой пользователей.

Claim 15 (Независимый пункт): Аналогичен Claim 1, фокусируется на механизме присвоения тематически-специфичного показателя популярности (topic-specific popularity score). Он основан на ранжировании документов относительно друг друга внутри темы (и не относительно документов вне этой темы) и последующем использовании этого показателя для ранжирования по запросу, связанному с этой темой.

Где и как применяется

Изобретение затрагивает этапы индексирования для расчета метрик и этап ранжирования для их применения.

CRAWLING/DATA ACQUISITION – Сбор данных
Система собирает поведенческие данные от пользователей: идентификаторы посещенных документов, поисковые запросы и Navigational Patterns.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит обработка данных и расчет метрик. Документы классифицируются по темам. Данные о поведении пользователей обрабатываются для расчета общих Popularity Scores. Затем система выполняет корреляцию и рассчитывает Per-Topic Popularity для документов в рамках идентифицированных тем. Эти метрики сохраняются в индексе.

QUNDERSTANDING – Понимание Запросов
Входящий поисковый запрос анализируется для определения его тематики. Патент указывает, что ассоциация запроса с темой может основываться на анализе контента результатов поиска, которые этот запрос возвращает.

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента. Система выполняет первое ранжирование на основе релевантности. Если запрос был успешно сопоставлен с конкретной темой, система извлекает показатели Per-Topic Popularity для документов-кандидатов в рамках этой темы и выполняет второе ранжирование (корректировку), используя эти тематические показатели.

Входные данные:

  • Идентификаторы местоположения (URL) посещенных документов.
  • Данные о навигации пользователей (Navigational Patterns) и количестве посещений.
  • Поисковые запросы.
  • Система тематической классификации (например, каталог или результаты анализа контента).

Выходные данные:

  • Показатели Per-Topic Popularity, ассоциированные с документами в индексе.
  • Скорректированный порядок результатов поиска.

На что влияет

  • Конкретные ниши или тематики: Наибольшее влияние в четко определенных нишах, где можно ясно классифицировать контент и где поведение пользователей демонстрирует явных тематических лидеров (Topical Authority).
  • Специфические запросы: Влияет на информационные и коммерческие запросы, которые могут быть однозначно сопоставлены с темами, для которых рассчитаны метрики Per-Topic Popularity.

Когда применяется

  • Условия применения: Алгоритм применяется, когда поисковый запрос может быть надежно сопоставлен с конкретной темой, и когда для этой темы у системы есть рассчитанные данные Per-Topic Popularity для релевантных документов.
  • Триггеры активации: Совпадение темы запроса и темы документа активирует использование Per-Topic Popularity как сигнала ранжирования.

Пошаговый алгоритм

Процесс можно разделить на два основных этапа: расчет метрик (обычно офлайн/при индексации) и применение метрик (онлайн/при ранжировании).

Этап А: Расчет Per-Topic Popularity (Индексирование)

  1. Сбор данных о поведении: Получение идентификаторов (URL) документов, посещенных пользователями. Сбор данных о навигационных паттернах.
  2. Расчет общей популярности: Определение общего Popularity Score для каждого документа. Это включает:
    • Подсчет количества посещений (hits/visits).
    • Анализ Navigational Patterns: выявление документов, с которых пользователи быстро уходят (quick jumps) или которые лишь «перенаправляют» трафик (funneling), и соответствующая корректировка их оценок.
  3. Тематическая классификация: Привязка каждого документа к одной или нескольким темам. Методы могут включать использование категоризированных каталогов или анализ контента.
  4. Расчет тематической популярности (Корреляция): Для каждой Темы:
    • Выбрать все документы, относящиеся к этой теме.
    • Ранжировать эти документы относительно друг друга на основе их общих Popularity Scores.
    • Присвоить Per-Topic Popularity (тематически-специфичную оценку) на основе этого относительного ранжирования.

Этап Б: Применение в ранжировании (Обработка запроса)

  1. Получение запроса: Система получает поисковый запрос.
  2. Понимание запроса и тематизация: Система определяет тему запроса (например, анализируя контент результатов поиска, которые он вызывает).
  3. Первичное ранжирование: Идентификация документов-кандидатов и их ранжирование на основе релевантности.
  4. Второе ранжирование (Корректировка): Для документов-кандидатов, принадлежащих к теме запроса, система извлекает их Per-Topic Popularity баллы.
  5. Применение сигнала: Ранжирование корректируется с использованием Per-Topic Popularity в качестве сигнала. Документы с более высокой популярностью в рамках данной темы получают повышение.
  6. Выдача результатов: Предоставление отсортированного списка пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных для оценки популярности.

  • Поведенческие факторы: Являются ключевыми для этого патента.
    • Количество посещений (visits/hits): сколько раз документ был посещен (глобально или определенной группой пользователей).
    • Navigational Patterns: шаблоны переходов пользователей на документ и с него. Анализ времени, проведенного на странице (упоминается "short period of time"), быстрых уходов (quick jumps), и того, служит ли страница просто для перенаправления трафика (funneling traffic).
  • Технические факторы: Location identifiers (URL) используются для отслеживания посещений.
  • Структурные/Контентные факторы: Используются для определения тематики.
    • Структура внешних каталогов (directory of documents organized by category) явно упоминается как способ определения тематики документа.
    • Контент документов используется для определения тематики запроса (путем анализа результатов поиска).

Какие метрики используются и как они считаются

  • Popularity Score (Общий показатель популярности): Рассчитывается на основе агрегации поведенческих факторов (посещения и навигационные паттерны). Конкретные формулы не приводятся, но указано, что негативные паттерны (например, быстрый уход) могут понижать этот показатель.
  • Per-Topic Popularity Score (Показатель популярности в рамках темы): Это относительная метрика. Она рассчитывается путем ранжирования документов внутри конкретной темы на основе их общего Popularity Score. Документ А сравнивается только с другими документами по этой же теме, а не со всем интернетом.

Выводы

  1. Авторитетность зависит от темы (Topical Authority): Патент четко разграничивает общую популярность и популярность в контексте конкретной темы. Google стремится идентифицировать ресурсы, которые являются авторитетными именно в своей нише.
  2. Поведенческие сигналы как основа авторитетности: В данном патенте в качестве основы для расчета популярности (как общей, так и тематической) используются именно поведенческие сигналы (посещения, навигационные паттерны), а не ссылочные или контентные факторы.
  3. Относительное ранжирование внутри тем: Per-Topic Popularity определяется тем, насколько популярен документ по сравнению с другими документами по той же теме. Это означает, что можно иметь низкий общий трафик, но высокую тематическую популярность в узкой нише.
  4. Важность пользовательского опыта (UX) и удовлетворения интента: Патент явно упоминает анализ Navigational Patterns. Негативные паттерны, такие как быстрый уход со страницы (pogo-sticking или quick jumps), могут снижать оценку популярности, что подчеркивает важность удержания пользователя.
  5. Контекстное ранжирование: Тематический показатель популярности применяется только тогда, когда запрос пользователя соответствует теме документа. Это позволяет системе адаптировать ранжирование к контексту запроса.

Практика

Best practices (это мы делаем)

  • Построение тематического авторитета (Topical Authority): Сфокусируйтесь на всестороннем охвате вашей основной тематики. Это не только помогает системе правильно классифицировать ваш контент, но и увеличивает вероятность того, что пользователи, заинтересованные в этой теме, будут выбирать ваш сайт, повышая его Per-Topic Popularity.
  • Оптимизация под удовлетворение интента и вовлеченность: Поскольку Popularity Score основан на поведенческих данных, критически важно оптимизировать контент для положительных навигационных паттернов. Необходимо минимизировать быстрые уходы (quick jumps) и поощрять длительное взаимодействие (long clicks).
  • Становитесь основным ресурсом в своей нише: Стратегия должна быть направлена на то, чтобы стать наиболее посещаемым и полезным ресурсом в рамках вашей конкретной темы. Это напрямую влияет на показатель Per-Topic Popularity, который рассчитывается относительно конкурентов по теме.
  • Анализ путей пользователя (User Journey): Понимайте, как пользователи перемещаются по вашему сайту. Убедитесь, что внутренняя навигация логична и помогает пользователю решать его задачу, избегая создания страниц, которые просто «перенаправляют» трафик без создания собственной ценности (funneling).

Worst practices (это делать не надо)

  • Погоня за общим трафиком в ущерб релевантности: Привлечение большого количества нерелевантного трафика может увеличить общую посещаемость, но не поможет (и может навредить) Per-Topic Popularity, если навигационные паттерны будут негативными или трафик не будет связан с основной темой сайта.
  • Широкая тематика с поверхностным контентом: Наличие поверхностного контента по множеству разных тем затрудняет достижение высокой Per-Topic Popularity в какой-либо одной области по сравнению со специализированными ресурсами.
  • Использование кликбейта и вводящих в заблуждение заголовков: Эти тактики приводят к негативным навигационным паттернам (быстрые уходы, pogo-sticking). Патент явно указывает, что такие паттерны могут использоваться для снижения оценки популярности документа.

Стратегическое значение

Этот патент подтверждает стратегическую важность Topical Authority и предлагает модель его расчета, основанную на поведении пользователей. Это означает, что стратегии E-E-A-T должны быть сфокусированы не только на формальных признаках экспертности и ссылочном профиле, но и на реальном удовлетворении потребностей пользователей в рамках конкретной области знаний. Популярность в глазах пользователей, интересующихся темой, становится измеримым сигналом ранжирования.

Практические примеры

Сценарий: Ранжирование нишевого сайта по сравнению с крупным порталом

  1. Контекст: Существует нишевый сайт "AquaExpert", посвященный исключительно аквариумистике, и крупный портал "AllAboutPets", у которого есть раздел об аквариумах.
  2. Данные: "AllAboutPets" имеет в 10 раз больше общего трафика. Однако пользователи, интересующиеся аквариумистикой, чаще посещают "AquaExpert" и проводят там больше времени (позитивные Navigational Patterns).
  3. Работа алгоритма:
    • Google рассчитывает общий Popularity Score: у "AllAboutPets" он глобально выше.
    • Google классифицирует оба сайта по теме "Аквариумистика".
    • Расчет Per-Topic Popularity: Система сравнивает Popularity Scores всех сайтов в теме "Аквариумистика". За счет более целевого и вовлеченного трафика Popularity Score "AquaExpert" в этой теме оказывается выше, чем у раздела "AllAboutPets". "AquaExpert" получает высокую Per-Topic Popularity.
  4. Результат в поиске: Пользователь вводит запрос "как настроить морской аквариум". Google определяет тему запроса как "Аквариумистика". При ранжировании система использует высокую Per-Topic Popularity сайта "AquaExpert" как сильный сигнал, повышая его в выдаче выше статей с портала "AllAboutPets".

Вопросы и ответы

Чем отличается «Popularity Score» от «Per-Topic Popularity» в этом патенте?

Popularity Score — это общая мера популярности документа, основанная на количестве посещений и навигационных паттернах пользователей. Per-Topic Popularity — это относительная мера, которая показывает, насколько популярен документ по сравнению с другими документами строго в рамках одной конкретной темы. Документ может иметь высокий общий Popularity Score, но низкий Per-Topic Popularity в определенной нише, и наоборот.

Использует ли этот патент ссылочные данные (PageRank) для расчета популярности?

Нет. В тексте патента ссылочные данные не упоминаются. Описанный механизм расчета популярности полностью основан на поведенческих факторах: количестве посещений (visits/hits) и навигационных паттернах пользователей (Navigational Patterns). Это предлагает альтернативный способ измерения авторитетности, не зависящий от ссылок.

Что такое «Навигационные паттерны» (Navigational Patterns) и как они влияют на ранжирование?

Это данные о том, как пользователи перемещаются на документ и с него. Патент упоминает негативные примеры: «funneling» (когда страница просто перенаправляет трафик на другую без собственной ценности) и «quick jumps» (когда пользователи быстро покидают страницу, проведя на ней мало времени). Наличие таких негативных шаблонов может снижать Popularity Score документа.

Как система определяет тему документа согласно патенту?

Патент предлагает несколько методов. Один из основных упомянутых методов — использование заранее определенного каталога документов (directory of documents), организованного по категориям (например, если документ находится в разделе «Путешествия» каталога, ему присваивается эта тема). Также упоминается возможность использования других техник анализа контента для определения тем или концепций.

Как система определяет тему поискового запроса?

Патент описывает метод, при котором тема запроса определяется на основе анализа контента документов, которые возвращаются в качестве результатов поиска по этому запросу. Если большинство топовых результатов относятся к определенной теме, запрос также сопоставляется с этой темой.

Может ли документ быть популярным в нескольких темах?

Да. Патент указывает, что документы могут быть сопоставлены с одной или несколькими темами. В этом случае для документа будет рассчитан отдельный показатель Per-Topic Popularity для каждой темы, к которой он относится, и эти показатели могут отличаться друг от друга.

Какое значение этот патент имеет для E-E-A-T и Topical Authority?

Патент имеет критическое значение, так как он описывает конкретный механизм расчета Topical Authority (тематического авторитета). Он показывает, что Google может измерять авторитетность в контексте темы, используя поведенческие данные. Это подтверждает необходимость фокусироваться на глубокой проработке тем и удовлетворении интента пользователей для укрепления E-E-A-T.

Что важнее для SEO согласно этому патенту: привлечение трафика или удержание пользователей?

Оба фактора важны, но удержание имеет решающее значение для качества популярности. Привлечение большого количества трафика (высокое число visits) полезно, но если этот трафик демонстрирует негативные навигационные паттерны (quick jumps), итоговый Popularity Score может быть снижен. Качественное удержание пользователей (положительные навигационные паттерны) более ценно.

Как этот механизм влияет на сайты в узких нишах?

Этот механизм очень выгоден для нишевых сайтов. Он позволяет им конкурировать с крупными порталами, даже если у них меньше общего трафика. Если нишевый сайт является лучшим и наиболее посещаемым ресурсом в своей узкой теме, он получит высокий Per-Topic Popularity и соответствующий бустинг в ранжировании по тематическим запросам.

Актуальны ли методы определения тем по каталогам (директориям) в 2025 году?

Хотя патент (поданный в 2004 году) упоминает каталоги, маловероятно, что Google полагается на них сегодня как на основной источник. Современные системы используют сложные NLP и ML модели (Knowledge Graph, векторы) для классификации контента. Однако базовая идея – классифицировать контент по темам для расчета контекстной авторитетности – остается критически важной.

Похожие патенты

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

Как Google анализирует мнения и общественное восприятие тем в интернете путем кластеризации контента и измерения тональности
Патент описывает систему для анализа общественного мнения по заданной теме. Google собирает релевантные интернет-ресурсы (статьи, блоги, отзывы), группирует их по подтемам, определяет важность каждой подтемы (используя просмотры страниц и ранг релевантности) и вычисляет оценку тональности (Sentiment Score). На основе этих данных создается аналитический отчет о восприятии продукта, услуги или события.
  • US8423551B1
  • 2013-04-16
  • Семантика и интент

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google ранжирует персональные документы (письма, файлы), используя обобщенные данные о взаимодействии на уровне признаков
Google решает проблему ранжирования личных документов (например, электронных писем), для которых нет истории кликов. Вместо анализа кликов по конкретному документу система анализирует взаимодействие на уровне признаков. Она агрегирует данные о том, как миллионы пользователей взаимодействуют с документами, имеющими схожие признаки (например, структуру темы письма или отправителя), и использует эти данные для ранжирования похожих документов в вашем личном поиске.
  • US10394832B2
  • 2019-08-27
  • Поведенческие сигналы

  • Персонализация

Как Google использует тематические векторы, косинусное сходство и анализ когезии кластеров для автоматической классификации контента
Патент Google, описывающий технологию автоматической организации документов. Система создает тематическую сигнатуру документа (вектор тем и их весов) и сравнивает её с существующими наборами документов, используя Cosine Similarity. Затем вычисляется Оценка Уверенности на основе среднего сходства и однородности набора. Патент раскрывает фундаментальные механизмы Information Retrieval, которые Google использует для понимания семантики и оценки тематической когезии контента.
  • US8458194B1
  • 2013-06-04
  • Семантика и интент

Популярные патенты

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google динамически регулирует влияние фактора близости в локальном поиске в зависимости от тематики запроса и региона
Google использует систему для определения того, насколько важна близость (расстояние) для конкретного поискового запроса и региона. Анализируя исторические данные о кликах и запросах маршрутов, система вычисляет «Фактор важности расстояния». Для запросов типа «Кофе» близость критична, и удаленные результаты пессимизируются. Для запросов типа «Аэропорт» близость менее важна, и качественные результаты могут ранжироваться высоко. Система также учитывает плотность региона (город или село), адаптируя ожидания пользователей по расстоянию.
  • US8463772B1
  • 2013-06-11
  • Local SEO

  • Поведенческие сигналы

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
  • US9098551B1
  • 2015-08-04
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

seohardcore