SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет многоязычных пользователей и показывает им результаты на языке, отличном от языка запроса

SELECTING FROM ARRAYS OF MULTILINGUAL CONTENT (Выборка из массивов многоязычного контента)
  • US20230325421A1
  • Google LLC
  • 2021-07-21
  • 2023-10-12
  • Мультиязычность
  • Поведенческие сигналы
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для идентификации пользователей, владеющих несколькими языками, анализируя язык текущего запроса, местоположение пользователя и историю его активности. Если пользователь находится в регионе с доминирующим языком (L2), но ищет на другом языке (L1), и система подтверждает владение обоими, Google переводит запрос на L2 и ищет контент на обоих языках. Это позволяет показывать наиболее релевантные результаты, даже если их язык отличается от языка запроса.

Описание

Какую проблему решает

Патент решает проблему ограничения выборки контента только языком текущего запроса или явными настройками профиля пользователя. Традиционные системы часто упускают релевантный контент на других языках, которыми владеет пользователь, особенно если он использует не доминирующий язык в своем текущем географическом регионе. Это снижает качество взаимодействия (HCI) и может приводить к необходимости дополнительных запросов, увеличивая нагрузку на сеть и вычислительные ресурсы.

Что запатентовано

Запатентована система для динамического расширения пула контента-кандидатов за счет включения результатов на нескольких языках, которыми, по объективной оценке системы, владеет пользователь. Система определяет языковые компетенции, анализируя расхождение между языком запроса (L1) и доминирующим языком местоположения (L2), и верифицируя владение L2 через историю поисковой активности пользователя (Log Record). Цель — предоставить наилучший контент, независимо от языка исходного запроса.

Как это работает

Ключевой механизм включает несколько этапов:

  • Идентификация контекста: Определяется язык запроса (L1) и местоположение устройства. Затем определяется доминирующий язык этого региона (L2), часто путем анализа агрегированных запросов других пользователей в этой локации.
  • Триггер: Если L1 отличается от L2, активируется проверка многоязычности.
  • Верификация пользователя: Анализируется история запросов (Log Record) данного пользователя. Если история подтверждает использование L2, пользователь признается многоязычным.
  • Расширение запроса: Для многоязычных пользователей система переводит запрос с L1 на L2 с помощью Translation Model.
  • Агрегация и Выбор: Система ищет контент по исходному запросу (L1) и переведенному запросу (L2). Из объединенного пула выбирается лучший результат на основе Selection Values, которые могут учитывать исторические предпочтения пользователя (Interaction Rates).

Актуальность для SEO

Высокая. Патент опубликован в 2023 году и затрагивает ключевые аспекты современного поиска: обработку естественного языка (NLP), контекстуализацию (местоположение) и персонализацию. Способность Google эффективно обслуживать многоязычных пользователей является критически важной функцией, соответствующей актуальным направлениям развития (например, MUM).

Важность для SEO

Патент имеет высокое значение (85/100) для международного и многоязычного SEO. Он демонстрирует конкретный механизм, позволяющий Google предпочесть контент на языке, отличном от языка запроса. Это означает, что оптимизация только под один язык в многоязычном регионе может быть недостаточной. Необходимо обеспечивать видимость на доминирующем языке региона, так как он может быть показан многоязычной аудитории даже при запросах на альтернативных языках.

Детальный разбор

Термины и определения

Content Item (Единица контента)
Контент (текст, изображение, видео, реклама), предназначенный для предоставления пользователю. Может быть вставлен в Content Slot информационного ресурса.
Content Selection Protocol (Протокол выбора контента)
Механизм выбора финальной единицы контента из наборов кандидатов. Может включать ранжирование на основе Selection Values или аукционные механики.
First Language (L1) (Первый язык)
Язык ключевых слов текущего входящего запроса.
Interaction Rate (Показатель взаимодействия)
Метрика, отражающая историческую вероятность взаимодействия пользователя с контентом. Рассчитывается отдельно для контента на L1 и L2 на основе Log Record.
Language Recognition Model (Модель распознавания языка)
ML-модель (например, нейронная сеть, n-gram модель), используемая для определения языка входного текста (ключевых слов).
Location Identifier (Идентификатор местоположения)
Данные, идентифицирующие местоположение клиентского устройства (например, IP-адрес, GPS или распознанная сущность из запроса).
Log Record (Журнал записей)
Хранилище предыдущих запросов и взаимодействий пользователя или группы пользователей. Используется для определения доминирующего языка региона и верификации многоязычности пользователя.
Second Language (L2) (Второй язык)
Язык, ассоциированный с Location Identifier. Обычно это доминирующий язык географического региона, определяемый агрегированным анализом.
Selection Value (Оценка выбора)
Числовое значение, используемое для ранжирования и выбора контента. Может основываться на Interaction Rate, сравнении языков и других факторах.
Translation Model (Модель перевода)
ML-модель (например, NMT, SMT), используемая для перевода ключевых слов запроса с L1 на L2.

Ключевые утверждения (Анализ Claims)

Анализ основан на формуле изобретения (Claims), представленной в конце документа.

Claim 1 (Независимый пункт): Описывает основной метод выбора контента в многоязычной среде.

  1. Система получает запрос на контент (включая ключевые слова на L1) от клиентского устройства.
  2. Определяется Первый язык (L1) на основе текущего и предыдущих запросов.
  3. Определяется Location Identifier устройства.
  4. Идентифицируется Второй язык (L2), связанный с этим местоположением (L2 отличается от L1).
  5. Ключевой этап верификации: Система определяет, что клиентское устройство использует ОБА языка (L1 и L2).
  6. Ключевое действие (Расширение): В ответ на это определение (использование обоих языков), система идентифицирует первый набор контента на L1 И второй набор контента на L2.
  7. Выбирается единица контента из любого из этих наборов с использованием Content Selection Protocol.
  8. Выбранный контент предоставляется устройству для вставки в content slot.

Claim 2 (Зависимый от 1): Уточняет метод верификации многоязычности.

Система подтверждает использование обоих языков путем идентификации предыдущего запроса от этого же устройства, который содержал ключевые слова на Втором языке (L2).

Claim 3 (Зависимый от 1): Уточняет механизм поиска на втором языке.

Если верификация пройдена, система генерирует ключевые слова на L2 путем перевода исходных ключевых слов с L1. Поиск контента на L2 осуществляется по этим переведенным ключевым словам.

Claim 4 (Зависимый от 1): Уточняет метод определения Второго языка (L2).

L2 определяется путем анализа множества запросов из Log Record от множества ДРУГИХ устройств, находящихся в том же местоположении. Это определяет доминирующий язык региона.

Claim 6 и 7 (Зависимые от 1): Уточняют факторы ранжирования (расчет Selection Value).

  • Claim 6: Оценка основана на сравнении языка контента и языка запроса (L1). (Предполагается бустинг за совпадение).
  • Claim 7: Оценка основана на исторических Interaction Rates пользователя с контентом на L1 и L2. (Учитываются персональные предпочтения пользователя).

Где и как применяется

Изобретение глубоко интегрировано в процесс обработки запроса, затрагивая этапы понимания контекста и ранжирования.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения. Система выполняет комплексный анализ контекста:

  • Лингвистический анализ: Определение L1 с помощью Language Recognition Model.
  • Геоконтекстный анализ: Определение Location Identifier и связанного с ним L2.
  • Поведенческий анализ (Профилирование): Анализ Log Record для верификации владения L2 конкретным пользователем.
  • Расширение запроса: Если пользователь многоязычен, активируется Translation Model для перевода запроса с L1 на L2.

RANKING – Ранжирование (Этап Retrieval)
Система запускает параллельный поиск: извлечение кандидатов на L1 по исходному запросу и кандидатов на L2 по переведенному запросу.

RERANKING – Переранжирование / METASEARCH – Смешивание
На финальном этапе происходит объединение и выбор:

  • Агрегация: Сбор кандидатов из обоих языковых наборов.
  • Скорринг: Вычисление Selection Values. Применяются факторы ранжирования, специфичные для многоязычного контекста: сравнение с языком запроса (Claim 6) и учет исторических Interaction Rates (Claim 7).
  • Выбор: Применение Content Selection Protocol для выбора финального результата.

Входные данные:

  • Запрос (Input/Query) с ключевыми словами на L1.
  • Идентификатор местоположения (Location Identifier).
  • История запросов пользователя (Log Record).
  • Глобальные данные о доминирующих языках регионов.

Выходные данные:

  • Выбранная единица контента (Content Item), которая может быть как на L1, так и на L2.

На что влияет

  • Географические регионы: Наибольшее влияние в регионах с высоким уровнем многоязычия (например, Канада, Швейцария, Индия, Бельгия) или в регионах со значительными сообществами экспатов/иммигрантов.
  • Специфические запросы: Влияет на запросы, сделанные на не доминирующем языке региона. Также влияет на запросы, где качество или доступность контента сильно различается между языками.
  • Типы контента: Патент явно упоминает контент для вставки в content slots (что часто означает рекламу), но также упоминает применение к результатам поиска (Claim 8). Механизм универсален и может применяться к органической выдаче и другим вертикалям.

Когда применяется

Алгоритм активируется при выполнении строгой последовательности условий:

  1. Язык запроса (L1) определен.
  2. Местоположение и связанный с ним язык (L2) определены.
  3. Триггер активации: L1 отличается от L2 (Claim 5).
  4. Условие применения: История запросов пользователя (Log Record) подтверждает, что он использует (понимает) L2 (Claim 2).

Исключения: Если пользователь использует только L1 и не использует L2 (например, турист), система НЕ активирует мультиязычный поиск и ищет контент только на L1 (Claim 9).

Пошаговый алгоритм

Этап 1: Первичный анализ запроса и контекста

  1. Получение ввода: Система получает запрос с ключевыми словами.
  2. Определение L1: Language Recognition Model определяет Первый язык (L1) ключевых слов.
  3. Определение местоположения: Извлекается Location Identifier.
  4. Определение L2: Идентифицируется Второй язык (L2), связанный с местоположением (путем анализа агрегированных запросов региона).

Этап 2: Проверка многоязычности (Триггеры)

  1. Сравнение языков (Триггер 1): Проверяется, отличается ли L1 от L2.
    • Если НЕТ: Перейти к Этапу 4 (Стандартный поиск).
    • Если ДА: Перейти к Шагу 6.
  2. Анализ истории пользователя: Система обращается к Log Record пользователя.
  3. Верификация многоязычности (Триггер 2): Проверяется, есть ли в истории запросы на L2.
    • Если НЕТ (только L1): Перейти к Этапу 4 (Стандартный поиск).
    • Если ДА (L1 и L2): Перейти к Этапу 3 (Многоязычный режим).

Этап 3: Многоязычный режим

  1. Перевод запроса: Translation Model переводит ключевые слова с L1 на L2.
  2. Поиск на L2: Система ищет контент на L2, используя переведенные ключевые слова. Формируется Candidate Set L2.
  3. Перейти к Этапу 4.

Этап 4: Финальная агрегация и выбор

  1. Поиск на L1: Система ищет контент на L1, используя исходные ключевые слова. Формируется Candidate Set L1.
  2. Генерация оценок: Рассчитываются Selection Values для всех кандидатов. Учитываются: релевантность, сравнение языка контента с L1, исторические Interaction Rates пользователя для L1 и L2.
  3. Выбор контента: Применяется Content Selection Protocol для выбора лучшего результата из объединенных наборов.
  4. Предоставление контента: Выбранный контент (на L1 или L2) отправляется пользователю.

Какие данные и как использует

Данные на входе

Система использует комбинацию контекстуальных, исторических и контентных данных.

  • Контентные факторы: Ключевые слова из текущего запроса (для определения L1, поиска и перевода). Язык индексируемого контента (Content Items).
  • Географические факторы: Location Identifier (IP, GPS, сущность из запроса). Критически важен для определения потенциального Второго языка (L2).
  • Поведенческие факторы (Пользовательские): История запросов пользователя (Log Record). Используется для: 1) Подтверждения владения L2; 2) Расчета исторических Interaction Rates с контентом на разных языках.
  • Системные данные (Агрегированные): Агрегированные данные о запросах других пользователей в том же регионе. Используются для определения доминирующего языка (L2) этого региона (Claim 4).

Какие метрики используются и как они считаются

  • Язык Запроса (L1) / Контента: Определяется применением Language Recognition Model.
  • Доминирующий Язык Региона (L2): Определяется статистическим анализом агрегированных данных о языке запросов в определенном местоположении.
  • Многоязычность пользователя: Бинарная классификация (Да/Нет). Определяется наличием в истории пользователя запросов на L2 (Claim 2). Может использоваться порог количества запросов.
  • Interaction Rate (L1/L2): Историческая частота взаимодействий (например, CTR) пользователя с контентом на Первом и Втором языках, рассчитанная на основе Log Record (Claim 7).
  • Selection Value: Итоговая оценка для ранжирования. Рассчитывается с учетом:
    • Стандартных факторов релевантности (не описаны в патенте).
    • Сравнения языка контента и языка запроса L1 (Claim 6).
    • Interaction Rate для соответствующего языка (Claim 7).

Выводы

  1. Объективная оценка многоязычности: Google не полагается на заявленные пользователем настройки. Система активно выводит языковые компетенции на основе поведения (история запросов) и контекста (местоположение и его доминирующий язык).
  2. Язык запроса не диктует язык выдачи: Ключевой вывод — система может сознательно предоставить результат на языке L2, даже если запрос был сделан на языке L1, при условии подтвержденной многоязычности пользователя.
  3. Местоположение как сильный языковой сигнал: Текущая локация используется не только для локализации, но и как сигнал о вероятном владении доминирующим языком этого региона (L2).
  4. Автоматический перевод запроса для расширения охвата: Если пользователь многоязычен, система автоматически переводит запрос (Claim 3) для поиска контента на альтернативном языке, расширяя пул кандидатов (Query Expansion).
  5. Персонализация в ранжировании языков: Финальный выбор между контентом на L1 и L2 персонализирован. Система учитывает исторические предпочтения пользователя (Interaction Rates) при взаимодействии с контентом на разных языках (Claim 7).
  6. Строгие условия активации: Механизм активируется только тогда, когда L1 ≠ L2 И только если история поиска подтверждает владение обоими языками. Это защищает одноязычных пользователей (например, туристов) от получения контента на непонятном языке.

Практика

Best practices (это мы делаем)

  • Комплексное покрытие языков в целевых регионах: В многоязычных регионах (например, Канада, Швейцария, Индия) критически важно иметь качественный контент как на языке меньшинства (потенциальный L1), так и на доминирующем языке региона (потенциальный L2). Если ваш контент на L2 качественнее, чем у конкурентов на L1, этот механизм позволит вам ранжироваться по запросам на L1.
  • Оптимизация под локальный язык (L2): Убедитесь, что контент на доминирующем языке региона хорошо оптимизирован и авторитетен. Это увеличивает вероятность его выбора системой, когда она ищет альтернативы для запросов на L1.
  • Оптимизация под переведенный интент: Поскольку система использует машинный перевод запроса для поиска контента на L2, важно, чтобы ваш контент на L2 использовал терминологию, которая соответствует результатам автоматического перевода релевантных запросов с L1. Анализируйте семантику, которая сохраняется при переводе.
  • Улучшение Interaction Rates: Работайте над повышением вовлеченности для всех языковых версий. Если система видит высокие Interaction Rates с вашим контентом на L2, она будет чаще отдавать ему предпочтение при расчете Selection Value.

Worst practices (это делать не надо)

  • Игнорирование доминирующего языка региона: Фокусироваться только на одном языке в многоязычном регионе (например, только на английском в Германии). Это ограничивает потенциальный охват, так как система не сможет найти ваш контент при расширении запроса на доминирующий язык (немецкий).
  • Создание низкокачественного контента на L2: Попытка охватить L2 с помощью автоперевода или поверхностного контента не будет эффективной. Низкие Interaction Rates и общее качество приведут к низким Selection Values.
  • Агрессивные Гео-IP редиректы: Принудительное перенаправление пользователя на доминирующий язык региона (L2) на основе IP может быть контрпродуктивным. Если пользователь намеренно ищет и предпочитает контент на L1, редирект ухудшит опыт и может снизить его персональный Interaction Rate для вашего сайта.

Стратегическое значение

Патент подтверждает стратегию Google, направленную на понимание пользователя и его контекста за пределами явного текста запроса. Для SEO это означает переход от статического сопоставления "язык запроса = язык результата" к динамической модели "контекст пользователя + намерение = лучший доступный результат". Долгосрочная стратегия международного SEO должна учитывать реальное языковое поведение пользователей в конкретных регионах, обеспечивая максимальное качество на всех релевантных языках.

Практические примеры

Сценарий: Поиск услуг в Монреале (Канада)

  1. Контекст: Пользователь находится в Монреале. Доминирующий язык (L2) — Французский. История пользователя показывает активное использование как Английского, так и Французского.
  2. Запрос (L1): Пользователь вводит запрос на Английском: "best plumber near me".
  3. Анализ и Активация: Google определяет L1=Английский, L2=Французский. L1 ≠ L2. История подтверждает многоязычность. Механизм активирован.
  4. Перевод: Система переводит запрос на L2: "meilleur plombier près de moi".
  5. Поиск и Ранжирование: Система ищет по обоим запросам. Находит отличный сайт сантехника на французском и средний сайт на английском.
  6. Результат: Несмотря на английский запрос, французский сайт получает более высокий Selection Value и показывается выше, так как система уверена, что пользователь его поймет и он более релевантен.

Вопросы и ответы

Как именно Google определяет, что я владею несколькими языками, если я не указал это в настройках?

Система использует объективный подход, основанный на поведении и контексте (Claim 1, 2). Если вы находитесь в регионе с доминирующим языком (L2) и ищете на другом языке (L1), Google проверит вашу историю поиска (Log Record). Если в истории есть достаточное количество запросов на L2, система делает вывод, что вы владеете обоими языками.

Как определяется доминирующий язык региона (L2)?

Google анализирует агрегированные данные запросов от множества разных пользователей в этом географическом регионе (Claim 4). Язык, который используется чаще всего в запросах из этого региона, идентифицируется как доминирующий (L2). Это динамический показатель, основанный на реальном поведении пользователей.

Означает ли это, что Google автоматически переводит мой запрос?

Да, но только при определенных условиях. Если система идентифицировала вас как многоязычного пользователя (на основе локации и истории), она переведет ваш запрос с помощью Translation Model (Claim 3) и будет искать контент как по оригинальному, так и по переведенному варианту, чтобы расширить охват.

Что произойдет, если я турист и не говорю на местном языке?

Патент предусматривает защиту от этого (Claim 9). Если система проверит вашу историю поиска и не найдет доказательств использования местного языка (L2), она определит вас как одноязычного пользователя. В этом случае механизм мультиязычного поиска не будет активирован, и результаты будут ограничены языком вашего запроса (L1).

Как поведенческие факторы (Interaction Rates) влияют на выбор языка результата?

Они играют важную роль в финальном ранжировании (Claim 7). Система рассчитывает отдельные исторические Interaction Rates для L1 и L2. Если пользователь, будучи многоязычным, исторически чаще и успешнее взаимодействует с контентом на L2, система может отдать предпочтение контенту на L2 при расчете Selection Value.

Применяется ли этот механизм только к рекламе (PPC) или к органическому поиску (SEO) тоже?

Патент часто использует термины Content Slot и Content Selection Protocol, что характерно для рекламных систем. Однако Claim 8 упоминает получение запроса через поисковую систему. Логика определения многоязычности и расширения запроса универсальна и может применяться как к органическому поиску, так и к рекламе или другим вертикалям.

Как этот патент влияет на стратегию использования ключевых слов и локализацию?

Необходимо учитывать возможность машинного перевода запроса. Ваш контент на L2 должен быть релевантен не только прямым запросам на L2, но и терминам, которые являются результатом автоматического перевода связанных запросов с L1. Это требует качественной локализации, учитывающей семантику и интент.

Стоит ли создавать контент на доминирующем языке региона, если моя основная аудитория говорит на другом языке?

Да, если эта аудитория проживает в данном регионе. Поскольку Google может считать их многоязычными, наличие качественного контента на доминирующем языке (L2) создает дополнительную возможность для ранжирования. Если ваш контент на L2 окажется лучшим в нише, он может быть показан даже по запросам на L1.

Влияет ли этот механизм на работу атрибута hreflang?

Патент напрямую не упоминает hreflang. Hreflang помогает системе понять связь между страницами, но данный патент описывает механизм выбора контента на лету, основанный на выведенных предпочтениях пользователя и местоположения. Корректный hreflang полезен, но поведенческие сигналы могут иметь больший вес в этом механизме.

Как отслеживать эффективность этой стратегии в SEO?

Необходимо сегментировать трафик по языку запроса, языку целевой страницы и географическому положению пользователя. Если вы наблюдаете трафик на страницы на языке L2 по запросам на языке L1 из конкретного региона, это может быть индикатором работы данного механизма. Анализ в Google Search Console с детальной фильтрацией поможет выявить такие паттерны.

Похожие патенты

Как Google идентифицирует и отображает контент на предпочтительном языке пользователя, даже если поиск ведется на другом языке
Google улучшает результаты поиска для мультиязычных пользователей, идентифицируя «параллельные ресурсы» — высококачественные переводы или оригинальные статьи на ту же тему — на предпочтительном языке пользователя (L2), даже если запрос был сделан на другом языке (L1). Эти L2 ресурсы отображаются рядом с результатами L1, улучшая доступ к релевантной информации.
  • US7984034B1
  • 2011-07-19
  • Мультиязычность

  • Персонализация

  • SERP

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google использует машинный перевод для поиска контента на иностранных языках (Cross-Language Information Retrieval)
Google использует механизмы Cross-Language Information Retrieval (CLIR) для поиска релевантного контента независимо от языка запроса. Система может перевести запрос пользователя на другие языки и искать в индексах этих языков (Query Translation), либо заранее перевести контент сайтов на язык пользователя (Document Translation). Это позволяет предоставлять пользователю лучшие результаты, даже если они изначально опубликованы на иностранном языке.
  • US7890493B2
  • 2011-02-15
  • Мультиязычность

  • Индексация

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google решает, когда переводить запрос пользователя на другие языки, а когда уважать его языковой выбор
Google использует систему фильтрации для управления межъязыковым поиском (CLIR). Система анализирует язык запроса, язык интерфейса пользователя и его местоположение. Если пользователь вводит запрос на языке, отличном от языка интерфейса, Google предполагает мультиязычность и не переводит запрос, экономя ресурсы. Перевод активируется, если язык запроса совпадает с языком интерфейса, особенно если локальных результатов мало.
  • US9824147B1
  • 2017-11-21
  • Мультиязычность

  • Персонализация

  • Семантика и интент

Популярные патенты

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
  • US20150261858A1
  • 2015-09-17
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore