SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками

LANGUAGE-SPECIFIC SEARCH RESULTS (Результаты поиска с учетом языка)
  • US8375025B1
  • Google LLC
  • 2010-12-30
  • 2013-02-12
  • Мультиязычность
  • Поведенческие сигналы
  • Персонализация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.

Описание

Какую проблему решает

Патент решает проблему ограниченности стандартных подходов к ранжированию, которые часто слишком строго фильтруют результаты по языку предпочтений пользователя. Это не учитывает поведение многоязычных пользователей, которые часто потребляют контент на языках, отличных от их основного предпочтения (например, носители хинди, читающие на английском, или разработчики, ищущие документацию). Изобретение улучшает релевантность выдачи, предлагая контент на альтернативных языках, если он статистически популярен среди пользователей с аналогичными языковыми настройками.

Что запатентовано

Запатентована система корректировки ранжирования на основе анализа исторических данных о взаимодействии пользователей с контентом в привязке к их языковым предпочтениям (user language preferences). Суть изобретения заключается в генерации language statistics для документов и вычислении специфического веса (Language Selection Weight). Этот вес используется для повышения в выдаче тех документов, которые демонстрируют высокую привлекательность (высокий CTR) для пользователей с определенным языковым предпочтением, даже если язык документа отличается.

Как это работает

Система работает в несколько этапов:

  • Сбор данных: Система фиксирует взаимодействия пользователей с результатами поиска (клики и показы), сохраняя их в selection data repository. Каждое взаимодействие ассоциируется с языковым предпочтением пользователя (явным или неявным).
  • Генерация статистики: Данные агрегируются для вычисления language statistics для конкретных документов. Это включает подсчет кликов (selection count) и показов (presentation count) для каждой пары "документ + языковое предпочтение".
  • Обработка запроса: При получении запроса система определяет query language preference.
  • Расчет веса: Для документов-кандидатов вычисляется Language Selection Weight. Этот вес основан на двух ключевых метриках: (A) популярности документа среди пользователей с данным языковым предпочтением и (B) CTR документа среди этой же группы.
  • Корректировка ранжирования: Language Selection Weight применяется для модификации базового ranking score документа, повышая позиции контента, релевантного для данной языковой группы.

Актуальность для SEO

Высокая. Понимание поведения многоязычных пользователей и персонализация выдачи на основе поведенческих сигналов (включая CTR) являются ключевыми направлениями развития поиска Google. В условиях глобализации способность точно ранжировать контент для пользователей с разными основными языками (например, англоязычный контент для неанглоязычной аудитории) остается критически важной задачей.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO, особенно в контексте международной стратегии. Он демонстрирует, что релевантность не ограничивается совпадением языка контента и языка пользователя. Ключевым фактором становится поведенческая привлекательность (CTR) контента для конкретного языкового сегмента аудитории. Это означает, что оптимизация сниппетов и контента для повышения CTR среди целевых языковых групп может напрямую влиять на ранжирование, даже если контент представлен на другом языке.

Детальный разбор

Термины и определения

Content Item Selection Records (Записи о выборе элементов контента)
Данные, фиксирующие выбор пользователем конкретного результата поиска (клик). Хранятся в selection data repository (например, click log).
Language-Content Correspondence Data (Данные о соответствии языка и контента)
Данные, связывающие языковые предпочтения пользователей с их выбором контента. Включают Selection Count и Presentation Count.
Language Preference (Языковое предпочтение)
Предпочитаемый пользователем язык. Может быть указан явно (настройки профиля, браузера, cookie) или неявно (язык запросов, история поведения).
Language Selection Weight (Вес выбора языка)
Вычисляемый коэффициент, используемый для корректировки ranking score документа. Основан на статистике взаимодействия пользователей с определенным языковым предпочтением с этим документом.
Language Statistics (Языковая статистика)
Агрегированные данные о том, как часто пользователи с разными языковыми предпочтениями выбирают определенный элемент контента.
Presentation Count (Счетчик показов)
Количество раз, когда пользователям с определенным языковым предпочтением была предоставлена возможность выбрать конкретный документ (показ в результатах поиска).
Query Language Preference (Языковое предпочтение запроса)
Языковое предпочтение, ассоциированное с текущим поисковым запросом.
Selection Count (Счетчик выборов/кликов)
Количество раз, когда пользователи с определенным языковым предпочтением выбрали конкретный документ.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы.

  1. Система хранит language-content correspondence data, связывающие языковые предпочтения пользователей и их выбор контента.
  2. Эти данные включают selection count (клики) и presentation count (показы) для каждой комбинации контента и языка. Определения критически важны:
    • Selection count: сколько раз пользователи с предпочтением языка X кликнули на документ Y.
    • Presentation count: сколько раз пользователям с предпочтением языка X был показан документ Y.
  3. Генерация language statistics на основе этих данных.
  4. Получение запроса и определение query language preference.
  5. Использование language statistics и query language preference для генерации ранжирования.

Claim 6 (Зависимый от 1): Детализирует процесс ранжирования.

Генерация ранжирования включает вычисление Language Selection Weight для документов. Итоговый ranking score документа зависит от этого веса.

Claim 8 (Зависимый от 6): Определяет конкретную формулу для Language Selection Weight.

Вес вычисляется по формуле: Language Selection Weight=bias1+(A−bias2)+(B−bias3)\text{Language Selection Weight} = bias1 + (A - bias2) + (B - bias3)

Где:

  • A – процент от общего числа пользователей, кликнувших на документ, которые имеют языковое предпочтение, соответствующее запросу. (Относительная популярность документа внутри языковой группы).
  • B – процент кликов (CTR) на документ среди пользователей, имеющих языковое предпочтение, соответствующее запросу. (Привлекательность документа для языковой группы).
  • bias1, bias2, bias3 – калибровочные (смещающие) коэффициенты.

Формула явно интегрирует поведенческие факторы (популярность и CTR), сегментированные по языку пользователя, в расчет ранжирования.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, используя данные, собираемые офлайн, и применяя их в реальном времени.

INDEXING – Индексирование и извлечение признаков (Офлайн-процессы)

  1. Сбор поведенческих данных: Система собирает и хранит Content Item Selection Records в selection data repository (логи кликов).
  2. Агрегация и Индексирование: Система (например, компонент Language classifier) агрегирует эти данные для генерации language statistics (включая метрики A и B). Эти статистики затем используются для обновления индекса (content item index) (Claim 3).

RANKING / RERANKING – Ранжирование и Переранжирование (Онлайн-процессы)
Основное применение патента.

  1. Получение данных: Ranking Engine получает query language preference и извлекает из индекса предварительный набор результатов с их базовыми оценками и language statistics.
  2. Вычисление веса: Система вычисляет Language Selection Weight для каждого документа, используя формулу из Claim 8, подставляя значения A и B, релевантные для текущего query language preference.
  3. Корректировка оценок: Базовые ranking scores корректируются с помощью вычисленного веса (например, путем умножения).

Входные данные:

  • Исходный запрос и Query Language Preference.
  • Предварительный набор результатов поиска.
  • Language Statistics для каждого результата (агрегированные Selection Counts и Presentation Counts).

Выходные данные:

  • Отсортированный набор результатов поиска с скорректированными Ranking Scores.

На что влияет

  • Конкретные типы контента: Наибольшее влияние на контент, который может быть интересен пользователям независимо от языка изложения. Примеры в патенте: сайты с программным обеспечением, изображениями, аудио, видео. Также актуально для технической документации и научных статей.
  • Специфические запросы: Влияет на запросы, которые могут иметь релевантные ответы на разных языках (названия брендов, технические термины, имена собственные). Пример в патенте: запрос [software downloads].
  • Языковые и географические ограничения: Особенно актуально для регионов с высоким уровнем многоязычия (например, Индия, где пользователи с предпочтением хинди часто потребляют контент на английском) или там, где английский широко используется как второй язык.

Когда применяется

  • При каких условиях работает алгоритм: Алгоритм применяется при обработке поискового запроса, когда система может определить query language preference (явно или неявно).
  • Триггеры активации: Для активации механизма корректировки необходимо наличие достаточного объема накопленных language statistics (данных о кликах и показах) для документов-кандидатов по данному языковому предпочтению.

Пошаговый алгоритм

Процесс А: Офлайн-подготовка данных

  1. Сбор данных о взаимодействии: Система непрерывно собирает данные о кликах и показах результатов поиска.
  2. Ассоциация с языком: Каждое взаимодействие ассоциируется с Language Preference пользователя.
  3. Хранение записей: Данные сохраняются в selection data repository.
  4. Агрегация статистики: Система периодически обрабатывает собранные данные и агрегирует language statistics для каждого документа (или домена, согласно Claim 2). Рассчитываются Selection Counts и Presentation Counts для всех языков.
  5. Индексирование статистики: Агрегированные статистики сохраняются в content item index.

Процесс Б: Обработка запроса в реальном времени

  1. Получение запроса и языкового предпочтения: Система получает запрос и определяет Query Language Preference (например, Немецкий).
  2. Поиск и первичное ранжирование: Генерируется список релевантных документов с базовыми ranking scores.
  3. Расчет метрик A и B: Для каждого документа-кандидата система извлекает метрики A (популярность) и B (CTR), специфичные для Query Language Preference (Немецкий).
  4. Вычисление веса: Рассчитывается Language Selection Weight по формуле bias1+(A−bias2)+(B−bias3)bias1 + (A - bias2) + (B - bias3).
  5. Корректировка оценок: Базовые ranking scores документов корректируются (например, умножаются) на Language Selection Weight. Документы на других языках (например, Английском), популярные у немецкоговорящих пользователей, получат повышение.
  6. Финальное ранжирование и выдача: Результаты сортируются по скорректированным оценкам и предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на использовании поведенческих и пользовательских данных в рамках этого механизма.

  • Поведенческие факторы: Являются основой изобретения.
    • Selection Count (Клики): Количество выборов документа пользователями, сегментированное по языковому предпочтению.
    • Presentation Count (Показы): Количество показов документа пользователям, сегментированное по языковому предпочтению.
  • Пользовательские факторы:
    • User Language Preference: Языковые настройки пользователя, полученные из профиля, настроек браузера, cookies или определенные неявно по поведению.

Другие факторы (контентные, ссылочные и т.д.) используются для расчета базового ranking score, но не являются частью данного изобретения.

Какие метрики используются и как они считаются

Система вычисляет следующие ключевые метрики:

  • Метрика A (Популярность в языковой группе):
    A = (Число пользователей с языком X, кликнувших на документ Y) / (Общее число пользователей, кликнувших на документ Y).
    Эта метрика показывает, насколько значительную долю аудитории документа составляют пользователи с языком X.
  • Метрика B (CTR в языковой группе):
    B = (Число пользователей с языком X, кликнувших на документ Y) / (Общее число показов документа Y пользователям с языком X).
    Эта метрика является стандартным CTR, но сегментированным по языковому предпочтению пользователя.
  • Language Selection Weight (Итоговый вес):
    Вычисляется как сумма метрик A и B с применением калибровочных коэффициентов (biases): bias1+(A−bias2)+(B−bias3)bias1 + (A - bias2) + (B - bias3).
  • Калибровочные коэффициенты (Biases): Патент упоминает, что эти значения определяются экспериментально или с помощью машинного обучения. В одном из вариантов реализации указаны примерные значения: bias1=0.05, bias2=5, bias3=2.

Выводы

  1. Сегментированный CTR как фактор ранжирования: Патент явно описывает механизм использования CTR (Метрика B), сегментированного по языковым предпочтениям пользователей, в качестве фактора ранжирования.
  2. Релевантность определяется поведением аудитории, а не только языком контента: Ключевой вывод заключается в том, что Google может считать документ релевантным для пользователя, даже если язык документа не совпадает с предпочтениями пользователя. Основанием служит статистика поведения других пользователей с такими же языковыми предпочтениями.
  3. Фокус на многоязычных пользователях: Система специально разработана для улучшения поиска для многоязычных пользователей. Она позволяет контенту на одном языке (например, английском) высоко ранжироваться для пользователей с другим предпочтением (например, хинди), если этот контент популярен у этой группы.
  4. Зависимость от исторических данных: Эффективность механизма напрямую зависит от объема и качества собранных language statistics. Для новых сайтов этот механизм может не активироваться из-за недостатка данных.
  5. Комплексная оценка привлекательности: Формула учитывает не только CTR (Метрика B), но и относительную популярность документа среди данной языковой группы (Метрика A), что дает более взвешенную оценку интереса.

Практика

Best practices (это мы делаем)

  • Оптимизация CTR для целевых языковых аудиторий: Необходимо фокусироваться на повышении CTR (Метрика B) среди ключевых языковых сегментов, даже если контент представлен на другом языке (например, английском). Это включает создание привлекательных и релевантных Title и Description, которые резонируют с интентом пользователей из этих сегментов.
  • Анализ международной аудитории и ее поведения: Важно понимать, пользователи с какими языковыми предпочтениями посещают сайт и как они взаимодействуют с контентом (используя GSC и аналитику). Если сайт на английском популярен среди носителей испанского, необходимо поддерживать этот интерес для сохранения высокого Language Selection Weight.
  • Создание контента с международной ценностью: Разрабатывать контент, который имеет глобальную привлекательность (технические руководства, обзоры ПО, медиаконтент). Такой контент имеет больше шансов получить высокий Language Selection Weight от разных языковых групп.
  • Отказ от принудительных редиректов по языку/IP: Не используйте автоматические редиректы без возможности выбора. Позволяя пользователям потреблять контент на языке оригинала, вы помогаете системе собрать точные Language Selection Statistics и улучшаете видимость для многоязычной аудитории.

Worst practices (это делать не надо)

  • Предполагать универсальность ранжирования: Ошибочно считать, что контент на английском языке будет ранжироваться одинаково для всех пользователей по всему миру. Ранжирование будет зависеть от того, насколько хорошо этот контент принимается каждой конкретной языковой группой (Метрики A и B).
  • Игнорирование оптимизации сниппетов для разных рынков: Использование одного и того же сниппета для всех рынков может привести к низкому CTR в определенных языковых сегментах, что снизит Language Selection Weight и ухудшит ранжирование для этих пользователей.
  • Фокус исключительно на переводе контента: Перевод контента не всегда необходим или достаточен. Если оригинальный контент уже имеет высокий CTR среди целевой языковой группы, он может ранжироваться лучше, чем некачественный или плохо оптимизированный перевод.

Стратегическое значение

Патент подтверждает стратегическую важность поведенческих факторов (в частности, сегментированного CTR) в алгоритмах ранжирования Google. Он подчеркивает, что Google рассматривает релевантность как функцию от предпочтений и поведения целевой аудитории, а не просто как свойство контента. Для долгосрочной международной SEO-стратегии критически важно не просто переводить контент, а понимать и оптимизировать пользовательский опыт и привлекательность сниппетов для каждого ключевого языкового сегмента.

Практические примеры

Сценарий: Продвижение англоязычного сайта с ПО в Германии

  1. Ситуация: Компания предлагает специализированное ПО. Сайт и документация только на английском языке. Целевой рынок включает Германию.
  2. Анализ (на основе патента): Чтобы сайт хорошо ранжировался у пользователей с немецким языковым предпочтением, он должен демонстрировать высокие показатели Метрики A (популярность) и Метрики B (CTR) среди немецких пользователей.
  3. Действия SEO:
    • Оптимизация сниппетов: Адаптировать Title и Description, чтобы они лучше резонировали с немецкой аудиторией (даже оставаясь на английском, но используя привычную для них терминологию или подчеркивая релевантные для них преимущества).
    • Повышение релевантности контента: Убедиться, что страница отвечает на интент немецких пользователей (например, содержит информацию о соответствии европейским стандартам GDPR).
  4. Ожидаемый результат: Повышение CTR (Метрика B) среди пользователей с немецким предпочтением приведет к увеличению Language Selection Weight. Это позволит англоязычной странице эффективно конкурировать с локализованными результатами в немецкой выдаче.

Вопросы и ответы

Как Google определяет языковые предпочтения пользователя (Language Preference)?

Патент указывает, что предпочтение может быть определено явно или неявно. Явные индикаторы включают настройки языка в аккаунте пользователя, настройки браузера, cookies или параметры запроса. Неявные индикаторы могут включать язык, используемый в предыдущих запросах пользователя, или паттерны выбора контента на определенном языке в истории поиска.

Что важнее в формуле Language Selection Weight: Метрика A (популярность) или Метрика B (CTR)?

Патент не указывает относительную важность A и B. Формула складывает оба компонента: (A−bias2)+(B−bias3)(A-bias2) + (B-bias3). Это означает, что для достижения высокого веса документ должен быть одновременно популярен среди данной языковой группы (высокий A) и иметь высокую кликабельность при показе этой группе (высокий B). Оба фактора критичны.

Влияет ли язык самого контента на работу этого алгоритма?

Напрямую – нет. Алгоритм оперирует статистикой кликов и языковыми предпочтениями пользователей, а не анализом языка текста на странице. Цель патента как раз и состоит в том, чтобы позволить контенту на языке Y ранжироваться для пользователей с предпочтением языка X, если статистика показывает, что этот контент им интересен.

Как этот патент влияет на стратегию использования hreflang?

Патент не упоминает hreflang. Hreflang помогает Google показать правильную версию страницы. Однако этот патент подчеркивает, что Google также использует поведение для определения релевантности. Если, например, английская версия имеет значительно более высокий CTR у немецких пользователей, чем немецкая версия, этот механизм может предпочесть английскую версию, основываясь на высоком Language Selection Weight.

Что делать, если мой сайт на английском языке плохо ранжируется в неанглоязычных странах?

В контексте этого патента, это может означать, что ваш сайт имеет низкие показатели Метрики A и B среди пользователей с соответствующими языковыми предпочтениями. Необходимо проанализировать CTR вашего сайта в этих регионах и работать над оптимизацией сниппетов и контента, чтобы повысить их привлекательность для этих языковых групп.

Применяется ли этот механизм только к многоязычным странам, таким как Индия или Швейцария?

Нет. Хотя патент приводит примеры, актуальные для многоязычных регионов (хинди/английский), механизм универсален. Он применяется везде, где пользователи потребляют контент на языках, отличных от их основного предпочтения. Например, он актуален для ранжирования англоязычного контента в Скандинавии, Германии или России.

Может ли этот механизм понизить мой сайт в выдаче?

Да. Language Selection Weight является модификатором ранжирования. Если ваши конкуренты имеют высокие показатели A и B для определенной языковой группы, а ваш сайт имеет низкие, вы будете ранжироваться ниже. Низкий CTR среди целевой языковой аудитории приведет к низкому весу и, соответственно, к более низким позициям для этой аудитории.

Как система обрабатывает новые сайты без истории кликов?

Для новых сайтов language statistics будут отсутствовать. В этом случае Language Selection Weight, вероятно, будет нейтральным. Ранжирование будет основываться на стандартных факторах, пока не накопится достаточный объем данных о поведении пользователей.

Агрегируются ли эти данные на уровне документа или домена?

Патент (Claim 2) указывает, что language statistics могут быть агрегированы как для отдельных элементов контента (документов), так и на основе доменов (domains corresponding to the content items). Это позволяет применять обобщенные статистики домена к отдельным страницам.

Является ли это подтверждением того, что Google использует CTR как фактор ранжирования?

Да, в рамках описанной системы. Патент явно определяет Метрику B как "click through percentage" (процент кликов) для пользователей с определенным языковым предпочтением и включает ее в формулу расчета Language Selection Weight, который напрямую влияет на ranking score.

Похожие патенты

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
  • US9208231B1
  • 2015-12-08
  • Мультиязычность

  • Поведенческие сигналы

  • SERP

Как Google определяет многоязычных пользователей и показывает им результаты на языке, отличном от языка запроса
Google использует механизм для идентификации пользователей, владеющих несколькими языками, анализируя язык текущего запроса, местоположение пользователя и историю его активности. Если пользователь находится в регионе с доминирующим языком (L2), но ищет на другом языке (L1), и система подтверждает владение обоими, Google переводит запрос на L2 и ищет контент на обоих языках. Это позволяет показывать наиболее релевантные результаты, даже если их язык отличается от языка запроса.
  • US20230325421A1
  • 2023-10-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google динамически определяет язык и страну пользователя для переранжирования поисковой выдачи
Google использует систему для динамического определения предпочтительного языка и страны пользователя, анализируя характеристики запроса, интерфейса (например, google.de) и IP-адрес. На основе этих данных система агрессивно повышает в выдаче результаты, соответствующие этим предпочтениям, используя либо физическое смещение позиций (Shifting Factor), либо формулу для увеличения оценки ранжирования (Weighting Factor).
  • US8306972B2
  • 2012-11-06
  • Персонализация

  • Мультиязычность

  • SERP

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Популярные патенты

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию
Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.
  • US8321463B2
  • 2012-11-27
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках
Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.
  • US8417692B2
  • 2013-04-09
  • Семантика и интент

  • Поведенческие сигналы

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
  • US8719276B1
  • 2014-05-06
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

seohardcore