SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google динамически определяет язык и страну пользователя для переранжирования поисковой выдачи

ORDERING OF SEARCH RESULTS BASED ON LANGUAGE AND/OR COUNTRY OF THE SEARCH RESULTS (Упорядочивание результатов поиска на основе языка и/или страны результатов поиска)
  • US8306972B2
  • Google LLC
  • 2008-10-21
  • 2012-11-06
  • Персонализация
  • Мультиязычность
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для динамического определения предпочтительного языка и страны пользователя, анализируя характеристики запроса, интерфейса (например, google.de) и IP-адрес. На основе этих данных система агрессивно повышает в выдаче результаты, соответствующие этим предпочтениям, используя либо физическое смещение позиций (Shifting Factor), либо формулу для увеличения оценки ранжирования (Weighting Factor).

Описание

Какую проблему решает

Патент решает проблему повышения качества и релевантности поисковой выдачи для глобальной аудитории путем предоставления результатов на языке и из страны, которые предпочтительны для пользователя. Система стремится определить эти предпочтения динамически, даже если они не указаны явно в запросе или настройках пользователя. Это улучшает релевантность выдачи, отдавая приоритет локализованному и лингвистически подходящему контенту.

Что запатентовано

Запатентована система и метод для автоматического определения предпочтительного языка (Preferred Language) и/или страны (Preferred Country) пользователя и последующего использования этой информации для изменения порядка результатов поиска. Система анализирует множество сигналов, включая характеристики самого запроса, характеристики пользовательского интерфейса (например, версию Google, настройки браузера) и IP-адрес клиента. Для корректировки ранжирования применяются механизмы повышения (boosting) предпочтительных результатов.

Как это работает

Система работает в несколько этапов:

  • Получение и ранжирование: Поисковая система получает запрос, выполняет поиск и генерирует начальный набор результатов с оценками (Scores).
  • Определение предпочтений: Система динамически определяет предпочтительный язык и/или страну, анализируя и взвешивая различные характеристики:
    • Язык и кодировка запроса.
    • Настройки интерфейса (язык браузера, версия домена Google).
    • IP-адрес клиента.
    • Язык/страна большинства найденных результатов (только для языка).
  • Переранжирование: Результаты, соответствующие предпочтительному языку/стране, повышаются в выдаче. Это достигается одним из двух методов:
    • Shifting Factor: Физическое понижение непредпочтительных результатов на определенное количество позиций (например, на 2 позиции).
    • Weighting Factor: Увеличение числовой оценки ранжирования (Score) предпочтительных результатов по определенной формуле.

Актуальность для SEO

Высокая. Локализация и языковая адаптация выдачи являются фундаментальными аспектами современного поиска. Механизмы, описанные в патенте, лежат в основе того, как Google обрабатывает международные и многоязычные запросы. Учитывая постоянное развитие международного SEO и важность точного геотаргетинга, понимание этих процессов критически важно.

Важность для SEO

Патент имеет критическое значение для стратегий международного SEO (8.5/10). Он описывает конкретные механизмы, с помощью которых Google отдает предпочтение контенту, соответствующему предполагаемому языку и местоположению пользователя. Это напрямую влияет на то, как сайты должны сигнализировать о своем языке и целевой стране (ccTLD, hreflang, язык контента), чтобы воспользоваться этим повышением (boosting) в целевых регионах.

Детальный разбор

Термины и определения

Accept_Language / Accept_Charset (Заголовки HTTP)
Указывают языки и наборы символов (кодировки), которые приемлемы или предпочтительны для браузера пользователя.
Country Biaser (Модуль смещения по стране)
Компонент поисковой системы, который определяет предпочтительные страны пользователя и изменяет порядок результатов поиска в их пользу.
IF Chars (Interface Characteristics / Характеристики интерфейса)
Данные, используемые для определения предпочтений пользователя, полученные из метаданных запроса и интерфейса поисковой системы (например, использование google.de).
IP Chars (IP Characteristics / Характеристики IP)
Данные, основанные на IP-адресе клиента, используемые для определения его географического местоположения (страны).
Language Promoter (Модуль продвижения языка)
Компонент поисковой системы, который определяет предпочтительные языки пользователя и изменяет порядок результатов поиска в их пользу.
Less Preferred Language (Менее предпочтительный язык)
Язык, который приемлем для пользователя, но менее важен, чем основной предпочтительный язык. Результаты на этом языке также могут получать повышение, но меньшее.
Preferred Country/Language (Предпочтительная страна/язык)
Страна или язык, определенные системой как основной целевой для данного поиска.
Shifting Factor (Фактор смещения)
Метод упорядочивания результатов путем физического изменения их позиций (повышения или понижения) в списке, а не изменения их числовых оценок.
SQ Chars (Search Query Characteristics / Характеристики поискового запроса)
Данные о языке и кодировке самого текста запроса, часто получаемые из заголовков Content_Language и Content_Type.
SR Chars (Search Result Characteristics / Характеристики результатов поиска)
Данные о языках самих найденных документов. Могут использоваться для уточнения языковых предпочтений пользователя.
UI Chars (User Interface Characteristics / Характеристики пользовательского интерфейса)
Данные, указывающие на языковые предпочтения пользователя, полученные из настроек браузера (Accept-Language), сохраненных настроек (cookies) или интерфейса, через который отправлен запрос.
Weighting Factor (Весовой фактор)
Множитель или формула, применяемая к числовой оценке (Score) результата поиска для его повышения или понижения.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт - Язык): Описывает метод упорядочивания результатов поиска на основе языка.

  1. Система получает поисковый запрос.
  2. Выполняется поиск, идентифицирующий результаты на разных языках.
  3. Система идентифицирует «определенный язык» (particular language, т.е. предпочтительный язык). Это делается на основе взвешивания (weighing) трех типов характеристик: (i) характеристик поискового запроса (SQ Chars), (ii) характеристик пользовательского интерфейса (UI Chars), и (iii) характеристик самих результатов поиска (SR Chars).
  4. Результаты упорядочиваются в список.
  5. Система определяет, соответствуют ли результаты в списке этому «определенному языку».
  6. Порядок одного из результатов корректируется (adjusting the ordering), если он соответствует «определенному языку».
  7. Скорректированный список предоставляется пользователю.

Claim 9 (Независимый пункт - Страна): Описывает метод упорядочивания результатов поиска на основе страны.

  1. Система получает поисковый запрос.
  2. Выполняется поиск, идентифицирующий результаты из разных стран.
  3. Система идентифицирует «определенную страну» (particular country, т.е. предпочтительную страну). Это делается на основе взвешивания (weighing) двух типов характеристик: (i) характеристик интерфейса (IF Chars) и (ii) характеристик IP (IP Chars).
  4. Результаты упорядочиваются в список.
  5. Система определяет, происходят ли результаты из этой «определенной страны».
  6. Порядок одного из результатов корректируется, если он происходит из «определенной страны».
  7. Скорректированный список предоставляется пользователю.

Claim 7 и 10 (Зависимые): Детализируют механизм корректировки порядка (связанный с Shifting Factor).

Описывается два варианта: (1) Понижение (demoting) результатов, не соответствующих предпочтительному языку/стране, и повышение (promoting) соответствующих результатов. (2) Обратный вариант.

Claim 11 и 16 (Зависимые): Детализируют механизм корректировки с использованием числовых оценок (связанный с Weighting Factor).

Каждому результату присваивается числовая оценка (numerical score). Оценка результата, соответствующего предпочтительному языку/стране, корректируется (adjusting).

Claim 19 (Зависимый от 16): Определяет конкретную формулу для корректировки числовой оценки.

Числовая оценка (Si) корректируется в соответствии с формулой: Si=Si+12S_i = \frac{S_i+1}{2}Si​=2Si​+1​. (Эта формула предполагает, что оценки находятся в диапазоне от 0 до 1, и значительно приближает их к 1).

Где и как применяется

Изобретение затрагивает несколько этапов поиска, интегрируя данные, собранные на этапе индексирования, и влияя на финальное ранжирование.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна определить язык и страну происхождения (или целевую страну) для каждого документа. В патенте упоминаются методы определения страны документа: по расширению URL (ccTLD), по адресу регистратора домена, по IP-адресу веб-сервера, по контенту документа или по анкорному тексту и странам ссылающихся страниц.

QUNDERSTANDING – Понимание Запросов / RANKING – Ранжирование
На этих этапах система анализирует входящий запрос и контекст пользователя для определения его предпочтений. Анализируются SQ Chars (язык запроса), UI Chars (интерфейс, настройки браузера) и IP Chars (геолокация IP). На этапе RANKING также могут быть проанализированы SR Chars (язык топовых результатов) для уточнения языковых предпочтений.

RERANKING – Переранжирование
Это основной этап применения патента. Модули Language Promoter и Country Biaser активируются после основного ранжирования.

  1. Определение предпочтений: Система финализирует определение Preferred Language и Preferred Country на основе взвешивания всех доступных сигналов.
  2. Корректировка порядка: Система применяет Shifting Factor или Weighting Factor к начальному набору результатов.
  3. Финальная сортировка: Результаты пересортировываются с учетом примененных корректировок.

Входные данные:

  • Исходный запрос пользователя и его метаданные (HTTP-заголовки).
  • IP-адрес клиента.
  • Характеристики интерфейса (домен Google, cookies).
  • Начальный набор результатов поиска с их оценками (Scores).
  • Данные о языке и стране для каждого результата (из индекса).

Выходные данные:

  • Упорядоченный набор результатов поиска (Ordered Search Results) с повышенными позициями для документов, соответствующих предпочтительному языку и стране.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы, где интент может иметь локальный или языковой аспект, даже если он не выражен явно (например, поиск услуги или информации общего характера).
  • Конкретные ниши или тематики: Влияет на все ниши, где существует контент на разных языках или из разных стран, релевантный одному и тому же запросу. Особенно важно для e-commerce, локальных услуг и новостей.
  • Языковые и географические ограничения: Система активно использует эти ограничения для формирования выдачи, отдавая предпочтение локальному и лингвистически подходящему контенту.

Когда применяется

Алгоритм применяется динамически при обработке поисковых запросов, когда система может определить предпочтительный язык или страну пользователя.

  • Триггеры активации: Наличие сигналов, позволяющих сделать вывод о предпочтениях (например, IP-адрес из Германии, заголовок Accept-Language: fr, или запрос на французском языке).
  • Условия применения: Система взвешивает сигналы. Если сигналы противоречивы (например, IP из Германии, а интерфейс на английском), система применяет логику приоритетов (описанную в алгоритмах определения предпочтений) для выбора доминирующего языка/страны. Патент также упоминает, что факторы смещения и веса могут быть скорректированы в зависимости от надежности определения предпочтений (например, ослаблены при коротких запросах).

Пошаговый алгоритм

Процесс можно разделить на определение предпочтений и применение переранжирования.

Процесс А: Определение предпочтительного языка (FIG. 8)

  1. Оценка характеристик запроса (SQ Chars): Анализ языка и кодировки самого запроса. Если язык определен, выбрать его как предпочтительный.
  2. Оценка характеристик интерфейса (UI Chars): Если язык не определен на шаге 1, анализируются настройки пользователя, заголовки браузера (Accept-Language), домен Google, IP-адрес клиента.
  3. Логика обработки английского языка: Если интерфейс не на английском, выбрать языки интерфейса как предпочтительные (Preferred), а английский как менее предпочтительный (Less Preferred).
  4. Оценка характеристик результатов (SR Chars): Если интерфейс на английском, анализируется язык большинства результатов поиска. Если большинство на английском, выбрать его как предпочтительный. Иначе предпочтения могут не устанавливаться.
  5. (Опционально): Добавить связанные языки (например, португальский, если предпочтителен испанский).

Процесс Б: Определение предпочтительной страны (FIG. 17)

  1. Оценка характеристик интерфейса (IF Chars): Анализ интерфейса поисковой системы (например, google.co.uk). Если страна определена, выбрать ее.
  2. Оценка характеристик IP (IP Chars): Если страна не определена на шаге 1, определить страну по IP-адресу клиента. Если определена, выбрать ее.
  3. Оценка предпочтений пользователя: Если страна не определена на шаге 2, проверить сохраненные настройки пользователя (cookies/login).
  4. (Опционально): Добавить связанные страны (например, США, если предпочтительна Канада).

Процесс В: Упорядочивание результатов (FIG. 11/20)

  1. Определение метода упорядочивания: Система определяет, поддаются ли оценки результатов числовой корректировке (Numerically adjustable).
    • Если ДА: Использовать Weighting Factor (Процесс В1).
    • Если НЕТ: Использовать Shifting Factor (Процесс В2).

Процесс В1: Упорядочивание по Weighting Factor (FIG. 13/22)

  1. Итерация по всем результатам поиска (в определенном диапазоне).
  2. Проверка предпочтения: Если результат соответствует Preferred Language/Country.
  3. Применение формулы (Preferred): Скорректировать оценку: Score=Score+12Score = \frac{Score+1}{2}Score=2Score+1​.
  4. Проверка менее предпочтительного (только для языка): Если результат соответствует Less Preferred Language.
  5. Применение формулы (Less Preferred): Скорректировать оценку: Score=(Score×2)+13Score = \frac{(Score \times 2)+1}{3}Score=3(Score×2)+1​.
  6. Пересортировка: Пересортировать все результаты на основе новых оценок.

Процесс В2: Упорядочивание по Shifting Factor (FIG. 12/21)

  1. Итерация по результатам поиска (обычно сверху вниз).
  2. Проверка предпочтения: Если результат НЕ соответствует Preferred Language/Country.
  3. Применение смещения: Понизить позицию результата на определенный фактор. В патенте приведен пример расчета целевой позиции (target_pos) как удвоенной текущей позиции (например, с 3 на 6).
  4. Сдвиг других результатов: Поднять результаты, которые находились между старой и новой позицией, чтобы заполнить освободившееся место.
  5. Обработка менее предпочтительного (только для языка): Если результат соответствует Less Preferred Language, понизить его на меньший фактор (например, в 1.5 раза).

Какие данные и как использует

Данные на входе

Система использует широкий спектр данных для определения предпочтений пользователя и характеристик контента.

Данные для определения предпочтений пользователя:

  • Географические факторы: IP-адрес клиента (IP Chars).
  • Пользовательские факторы:
    • Явные настройки языка и страны, сохраненные пользователем (cookies или данные входа в систему).
    • Интерфейс поисковой системы (например, использование google.fr) (IF Chars).
  • Технические факторы (Метаданные запроса):
    • HTTP-заголовки: Accept_Language, Accept_Charset (UI Chars).
    • HTTP-заголовки: Content_Language, Content_Type (SQ Chars).
  • Системные данные: Распределение языков в топе выдачи (SR Chars).

Данные для определения страны документа (упомянуто в описании патента):

  • Технические факторы: URL-структура (наличие ccTLD). IP-адрес веб-сервера. Адрес регистратора домена.
  • Контентные факторы: Анализ контента документа или других страниц на сайте.
  • Ссылочные факторы: Анкорный текст входящих ссылок, текст рядом со ссылками, страны веб-страниц, ссылающихся на документ.

Какие метрики используются и как они считаются

  • Score (Оценка ранжирования): Базовая числовая оценка релевантности документа запросу. В патенте предполагается, что эти оценки могут быть в диапазоне от 0.0 до 1.0 для применения Weighting Factor.
  • Weighting Factor (WLP): Фактор для повышения оценки результатов на предпочтительном языке/стране. Формула: WLP=Score+12W_{LP} = \frac{Score+1}{2}WLP​=2Score+1​.
  • Weighting Factor (WLPL): Фактор для повышения оценки результатов на менее предпочтительном языке. Формула: WLPL=

    Выводы

    1. Приоритет локализации и языка: Google активно стремится определить язык и страну пользователя, используя все доступные сигналы, и агрессивно использует эту информацию для переранжирования выдачи. Это не просто фильтр, а механизм повышения (boosting).
    2. Многофакторное определение предпочтений: Предпочтения определяются путем взвешивания множества сигналов: языка запроса, настроек интерфейса, IP-адреса и даже языка самих результатов поиска. Система имеет четкую иерархию и логику для разрешения конфликтов между этими сигналами.
    3. Агрессивное повышение (Boosting): Механизмы повышения (Weighting Factor и Shifting Factor) значительно влияют на финальный порядок. Описанная формула Score+12\frac{Score+1}{2}2Score+1​ (при оценках 0-1) гарантирует значительное улучшение позиций для предпочтительного контента.
    4. Важность сигналов таргетинга документа: Система полагается на способность определить язык и страну документа на этапе индексирования. Использование ccTLD, IP-адреса сервера, языка контента и даже входящих ссылок критично для правильной классификации документа.
    5. Обработка связанных предпочтений: Система может учитывать не только основные, но и «менее предпочтительные» или «связанные» языки/страны (например, английский для пользователя из Франции или США для пользователя из Канады), предоставляя им меньшее повышение.

    Практика

    Best practices (это мы делаем)

    • Четкое сигнализирование о языке и стране: Необходимо использовать все доступные методы для указания целевого языка и страны документа. Это включает корректное использование атрибутов hreflang, использование ccTLD для странового таргетинга или четкую структуру подпапок/субдоменов для gTLD с настройкой в GSC.
    • Локализация контента и технических сигналов: Убедитесь, что язык контента четкий и последовательный на всей странице. Для геотаргетинга учитывайте, что IP-адрес сервера может использоваться как сигнал для определения страны документа. Также работайте над получением локальных обратных ссылок, так как патент упоминает, что страны ссылающихся страниц могут использоваться для определения страны целевого документа.
    • Анализ выдачи в целевых регионах: При анализе SERP необходимо учитывать, что пользователи в разных странах или с разными языковыми настройками видят разную выдачу из-за работы этого механизма. Используйте VPN и чистые профили браузера с соответствующими настройками Accept-Language для мониторинга реальных позиций.

    Worst practices (это делать не надо)

    • Смешивание языков на одной странице: Это может затруднить определение основного языка документа, что приведет к тому, что страница не получит повышения от Language Promoter.
    • Игнорирование геотаргетинга для gTLD: Использование домена .com без четкой структуры и настроек таргетинга может привести к тому, что система не сможет четко определить целевую страну документа, и он проиграет локальным конкурентам (например, .de в Германии).
    • Предоставление противоречивых сигналов: Например, использование ccTLD одной страны при хостинге в другой стране и контенте, ориентированном на третью страну. Это создает путаницу для системы при определении страны документа.

    Стратегическое значение

    Патент подтверждает фундаментальную важность интернационализации и локализации в SEO. Google не просто ищет релевантный контент глобально, а активно модифицирует выдачу, чтобы соответствовать локальному и языковому контексту пользователя. Стратегия продвижения должна строиться вокруг создания наилучшего ответа для конкретного целевого сегмента пользователей в конкретном регионе. Не существует "глобального" ранжирования в вакууме; выдача всегда в той или иной степени локализована.

    Практические примеры

    Сценарий: Повышение локализованной версии сайта в Германии

    1. Контекст: Пользователь находится в Германии (IP Германии), использует немецкую версию Google (google.de) и браузер с немецким языком (Accept-Language: de). Он вводит общий запрос, например, "running shoes".
    2. Определение предпочтений: Система анализирует IP Chars, IF Chars и UI Chars. Все сигналы указывают на Германию и немецкий язык. Preferred Country = DE, Preferred Language = DE.
    3. Начальное ранжирование: В топе есть глобальные сайты (Nike.com, Amazon.com) и локальные (Zalando.de). Допустим, страница Nike.com имеет базовый Score 0.8, а Zalando.de – 0.75.
    4. Активация Country Biaser и Language Promoter: Система определяет, что Zalando.de соответствует и стране (DE), и языку (DE). Nike.com может быть на немецком, но система может не считать его сайтом из Германии (если это глобальная версия).
    5. Применение Weighting Factor: К оценке Zalando.de применяется формула 0.75+12\frac{0.75+1}{2}20.75+1​. Новый Score = 0.875.
    6. Результат: Zalando.de (0.875) ранжируется выше, чем Nike.com (0.8), благодаря локальному повышению.

    Вопросы и ответы

    Насколько агрессивно Google повышает результаты, соответствующие предпочтительному языку или стране?

    Повышение может быть очень агрессивным. Если используется метод Weighting Factor и оценки ранжирования находятся в диапазоне 0-1, применяется формула Score+12\frac{Score+1}{2}2Score+1​. Например, результат с оценкой 0.6 получит новую оценку 0.8. Если используется Shifting Factor, непредпочтительные результаты могут быть понижены на несколько позиций (например, в 2 раза от текущей позиции).

    Как Google определяет страну документа?

    Патент описывает несколько методов, которые используются на этапе индексирования. К ним относятся: анализ расширения URL (ccTLD, например, .de), проверка адреса регистратора домена, определение страны по IP-адресу веб-сервера, анализ контента документа, а также анализ анкорного текста входящих ссылок и стран происхождения этих ссылок.

    Какие сигналы использует Google для определения предпочтительной страны пользователя?

    Система использует иерархию сигналов. В первую очередь анализируются характеристики интерфейса (IF Chars), например, если пользователь зашел на google.fr. Если это не дает ответа, анализируются характеристики IP (IP Chars) для определения местоположения пользователя. В последнюю очередь проверяются явные настройки пользователя (cookies).

    Какие сигналы используются для определения предпочтительного языка пользователя?

    Это более сложный процесс, включающий взвешивание трех групп сигналов. Сначала проверяются характеристики запроса (SQ Chars) – язык, на котором он написан. Затем характеристики интерфейса (UI Chars) – настройки браузера (Accept-Language), IP, домен Google. Наконец, при определенных условиях (например, если интерфейс на английском) могут учитываться характеристики результатов (SR Chars) – доминирующий язык в выдаче.

    Что происходит, если сигналы противоречат друг другу (например, IP в Испании, а язык браузера – английский)?

    Патент описывает логику разрешения таких конфликтов. Система взвешивает сигналы согласно установленной иерархии. В данном случае, система, вероятно, определит Испанию как предпочтительную страну (по IP), а английский как предпочтительный язык (по браузеру, если он явно указан как приоритетный). Результаты, соответствующие обоим критериям, получат наибольшее преимущество.

    Влияет ли этот патент на сайты с доменом .com (gTLD)?

    Да, влияет. Если сайт на .com таргетирован на определенную страну (например, через контент, IP сервера, входящие ссылки), он будет классифицирован как относящийся к этой стране и получит повышение у пользователей из этой страны. Однако, если сигналы слабые, он может проиграть сайтам на локальных ccTLD, которые по умолчанию имеют сильный сигнал привязки к стране.

    Что такое «менее предпочтительный язык» (Less Preferred Language)?

    Это язык, который система считает приемлемым для пользователя, но не основным. Например, для пользователя во Франции основным может быть французский, а менее предпочтительным – английский. Результаты на менее предпочтительном языке также получают повышение, но по другой, менее агрессивной формуле:

    Похожие патенты

    Как Google динамически определяет страну пользователя и агрессивно повышает локальные результаты в выдаче
    Google динамически определяет предпочитаемую страну пользователя, используя интерфейс поиска (например, google.de) и IP-адрес. Затем система смещает результаты поиска, повышая оценки (Weighting Factor) или позиции (Shifting Factor) контента, связанного с этой страной. Патент раскрывает сигналы, используемые для определения местоположения сайта (ccTLD, IP сервера, география ссылок) и методы агрессивного повышения локальных результатов.
    • US7451130B2
    • 2008-11-11
    • Local SEO

    • Персонализация

    • Индексация

    Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
    Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
    • US8375025B1
    • 2013-02-12
    • Мультиязычность

    • Поведенческие сигналы

    • Персонализация

    Как Google помогает пользователям найти правильную языковую версию страницы, исправляя ошибки маршрутизации
    Система определяет языковые предпочтения пользователя и сравнивает их с языком посещаемой веб-страницы. Если страница отображается не на предпочтительном языке из-за ошибки маршрутизации (например, из-за геолокации), и существует альтернативная версия на нужном языке, система предлагает пользователю перейти на нее или автоматически перенаправляет его.
    • US9251223B2
    • 2016-02-02
    • Мультиязычность

    • Персонализация

    • Индексация

    Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
    Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
    • US9208231B1
    • 2015-12-08
    • Мультиязычность

    • Поведенческие сигналы

    • SERP

    Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
    Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
    • US9623119B1
    • 2017-04-18
    • EEAT и качество

    • Поведенческие сигналы

    • SERP

    Популярные патенты

    Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR
    Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.
    • US10922326B2
    • 2021-02-16
    • Knowledge Graph

    • SERP

    • Семантика и интент

    Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
    Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
    • US9208232B1
    • 2015-12-08
    • Ссылки

    • Структура сайта

    • Семантика и интент

    Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
    Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
    • US7260573B1
    • 2007-08-21
    • Персонализация

    • Ссылки

    Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
    Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
    • US8065611B1
    • 2011-11-22
    • Поведенческие сигналы

    • Семантика и интент

    • Мультимедиа

    Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
    Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
    • US9396263B1
    • 2016-07-19
    • Семантика и интент

    • EEAT и качество

    Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
    Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
    • US9436742B1
    • 2016-09-06
    • Персонализация

    • Поведенческие сигналы

    • SERP

    Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
    Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
    • US10650066B2
    • 2020-05-12
    • Ссылки

    • SERP

    Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
    Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
    • US20200159765A1
    • 2020-05-21
    • Семантика и интент

    • Мультимедиа

    • Персонализация

    Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
    Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
    • US10180965B2
    • 2019-01-15
    • Персонализация

    • Семантика и интент

    • Local SEO

    Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)
    Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
    • US8065316B1
    • 2011-11-22
    • Семантика и интент

    • SERP

    • Поведенческие сигналы

    seohardcore