SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует логи запросов, чтобы выбирать лучшие переводы для межъязыковых подсказок в Autocomplete

EVALUATING QUERY TRANSLATIONS FOR CROSS-LANGUAGE QUERY SUGGESTION (Оценка переводов запросов для межъязыковых поисковых подсказок)
  • US20120330990A1
  • Google LLC
  • 2011-09-29
  • 2012-12-27
  • Мультиязычность
  • Семантика и интент
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google разработал систему для улучшения качества межъязыковых поисковых подсказок (Autocomplete). Вместо буквального перевода система оценивает различные варианты перевода, отдавая предпочтение тем фразам, которые чаще всего используются носителями целевого языка в качестве реальных поисковых запросов. Это гарантирует, что предложенная подсказка является не только точным переводом, но и эффективным поисковым запросом.

Описание

Какую проблему решает

Патент решает проблему низкой эффективности буквальных или машинных переводов при использовании их в качестве поисковых запросов. Пользователям, пытающимся найти информацию на неродном языке, сложно сформулировать эффективный запрос. Система призвана предлагать cross-language query suggestions (межъязыковые поисковые подсказки), которые являются не просто переводом исходной подсказки, но и эффективными запросами, соответствующими тому, как формулируют запросы носители целевого языка.

Что запатентовано

Запатентован метод оценки и выбора переводов для использования в качестве межъязыковых поисковых подсказок. Система генерирует множество вариантов сегментации исходного запроса и множество вариантов перевода для каждой сегментации. Затем она оценивает эти варианты, используя данные из логов поисковых запросов как исходного, так и целевого языка. Цель – выбрать перевод, который имеет высокое качество сегментации и высокую частоту использования в качестве реального запроса на целевом языке.

Как это работает

Механизм работает следующим образом:

  • Сегментация: Исходная подсказка (например, на китайском) разделяется на сегменты (слова) разными способами (candidate segmentations).
  • Оценка сегментации: Каждая сегментация оценивается по качеству (segmentation quality). Качество выше, если сегментация часто встречается в логах исходного языка и если из нее было удалено мало стоп-слов.
  • Перевод: Сегменты переводятся на целевой язык (например, английский), создавая candidate translations.
  • Оценка перевода: Каждый вариант перевода проверяется по логам целевого языка (target language query log). Чем чаще этот перевод используется как реальный поисковый запрос, тем выше его оценка.
  • Финальный скоринг: Итоговая оценка кандидата зависит как от качества сегментации, так и от частоты перевода в целевых логах. Выбирается лучший вариант.

Актуальность для SEO

Высокая. Принципы, заложенные в патенте, остаются фундаментальными для Google: использование реальных пользовательских данных (логов запросов) для валидации лингвистических моделей и понимание разницы между разговорным языком и «языком поисковых запросов». В эпоху ИИ и моделей вроде MUM, межъязыковое понимание информации критически важно, и обеспечение качества перевода запросов остается актуальной задачей.

Важность для SEO

Патент имеет умеренное (6/10) влияние на SEO. Он не описывает алгоритмы ранжирования, но критически важен для международного SEO и стратегии подбора ключевых слов. Он объясняет, почему нельзя полагаться на буквальный перевод ключевых слов из одного языка в другой. SEO-специалисты должны фокусироваться на тех формулировках, которые Google валидировал как эффективные запросы в целевом регионе.

Детальный разбор

Термины и определения

Candidate Segmentation (Кандидатская сегментация)
Один из возможных вариантов разделения исходного запроса на последовательность сегментов (слов). Особенно актуально для языков без пробелов (например, китайский).
Candidate Translation (Кандидатский перевод)
Один из вариантов перевода Candidate Segmentation на второй язык.
CLS Dictionary (Словарь межъязыковых подсказок)
Специализированный словарь, используемый для перевода сегментов. Может содержать данные из онлайн-словарей и веб-страниц с парами переводов.
Cross-language query suggestion (Межъязыковая поисковая подсказка)
Поисковая подсказка на втором (целевом) языке, предлагаемая в ответ на ввод запроса на первом языке. Является результатом работы описанной системы.
Partition (Разбиение)
Тип сегментации, которая включает все элементы исходного запроса (т.е. стоп-слова не удалены). Считается более качественной при прочих равных.
Primary-language query suggestion (Подсказка на основном языке)
Стандартная поисковая подсказка на том же языке, на котором пользователь начал ввод запроса. Является входными данными для системы перевода.
Segmentation Quality (Качество сегментации)
Метрика, оценивающая корректность разделения запроса на слова. Зависит от частоты сегментации в Source Language Query Log и количества удаленных стоп-слов.
Source Language Query Log (Лог запросов исходного языка)
База данных ранее введенных запросов на первом (исходном) языке. Используется для оценки Segmentation Quality.
Stop Words (Стоп-слова)
Слова, которые могут быть удалены из сегментации (например, артикли, предлоги).
Target Language Query Log (Лог запросов целевого языка)
База данных ранее введенных запросов на втором (целевом) языке. Используется для оценки эффективности Candidate Translation.

Ключевые утверждения (Анализ Claims)

Патент содержит два основных независимых пункта (Claim 1 и Claim 2), которые описывают процесс оценки переводов. Claim 1 более детализирован в части расчета качества сегментации.

Claim 1 и 2 (Независимые пункты): Описывают метод генерации межъязыковой подсказки.

  1. Система получает запрос на первом языке (L1) (Primary-language query suggestion).
  2. Генерируются уникальные Candidate Segmentations (варианты разделения на слова) для этого запроса.
  3. Для каждой сегментации:
    • Определяется мера Segmentation Quality (в Claim 1 уточняется, что она основана на количестве удаленных стоп-слов И частоте в L1 Query Log).
    • Генерируется набор Candidate Translations на втором языке (L2).
  4. Для каждого перевода:
    • Определяется частота его использования как полного запроса в L2 Query Log (Target Language Query Log).
    • Вычисляется итоговая оценка (Score) для перевода. Эта оценка базируется на Segmentation Quality И частоте использования в L2 Query Log.
  5. Система предоставляет по крайней мере один перевод с наивысшей оценкой как Cross-language query suggestion.

Claim 3 и 4 (Зависимые от 2): Уточняют типы сегментаций. Система рассматривает как полные разбиения (Partitions) (Claim 3), так и сегментации с удаленными стоп-словами (Claim 4).

Claim 5 (Зависимый от 4): Определяет, что Segmentation Quality зависит от того, сколько стоп-слов было удалено из сегментации. (Меньше удалено – выше качество).

Claim 6 (Зависимый от 2): Определяет, что Segmentation Quality зависит от частоты встречаемости этой сегментации как полного запроса в Source Language Query Log. (Выше частота – выше качество).

Где и как применяется

Изобретение применяется в рамках системы поисковых подсказок (Google Suggest / Autocomplete) и относится к этапу понимания запросов.

QUNDERSTANDING – Понимание Запросов

Основное место применения. Система работает в составе Suggestion Service, который генерирует подсказки в реальном времени по мере ввода запроса пользователем. Когда Suggestion Service генерирует стандартные подсказки (Primary-language query suggestions), он может передать их в Translation Service (описанный в патенте) для генерации межъязыковых альтернатив.

Система использует данные, которые собираются и обрабатываются на постоянной основе (аналогично этапам CRAWLING/INDEXING, но применительно к логам запросов):

  • Сбор и анализ логов: Система полагается на постоянно обновляемые Source Language Query Log и Target Language Query Log с данными о частоте запросов.
  • Индексирование словарей: Используется предварительно подготовленный CLS Dictionary.

Входные данные:

  • Primary-language query suggestion на языке L1.
  • Source Language Query Log (L1).
  • Target Language Query Log (L2).
  • CLS Dictionary и списки стоп-слов.

Выходные данные:

  • Cross-language query suggestion на языке L2, которая является наиболее эффективным переводом для использования в качестве поискового запроса.

На что влияет

  • Специфические запросы: Влияет на любые запросы, для которых существуют эквиваленты в других языках. Особенно важно для информационных и транзакционных запросов, где точная формулировка критична.
  • Языковые и географические ограничения: Наибольшее влияние оказывается на языки, требующие сегментации (Китайский, Японский, Корейский – CJK), и на пользователей, которые ищут информацию на нескольких языках. Механизм активируется, если система настроена на показ межъязыковых подсказок (например, на основе настроек пользователя или его локации).

Когда применяется

Алгоритм применяется в момент генерации поисковых подсказок, если выполняются следующие условия:

  • Триггер активации: Пользователь вводит запрос, и система поисковых подсказок активирует модуль генерации межъязыковых подсказок (Translation Service).
  • Условия работы: Для исходной подсказки удалось сгенерировать валидные сегментации и переводы.
  • Пороговые значения: В некоторых реализациях система может предоставлять межъязыковую подсказку, только если ее итоговая оценка превышает определенный порог качества/уверенности. Если ни один перевод не набирает нужного балла, подсказка не показывается.

Пошаговый алгоритм

Процесс генерации межъязыковой поисковой подсказки.

  1. Получение ввода: Система получает Primary-language query suggestion на языке L1.
  2. Генерация сегментаций: Segmentation Module генерирует все возможные уникальные Candidate Segmentations. Это может включать проверку сегментов по CLS Dictionary и Source Language Query Log для отсева некорректных вариантов.
  3. Обработка стоп-слов: Для каждой сегментации идентифицируются и могут быть удалены стоп-слова. Фиксируется количество удаленных слов.
  4. Оценка качества сегментации: Для каждой сегментации вычисляется Segmentation Quality.
    • Определяется частота встречаемости сегментации как полного запроса в Source Language Query Log.
    • Учитывается количество удаленных стоп-слов (штраф за удаление).
  5. Генерация переводов: Translation Module переводит сегменты каждой Candidate Segmentation на язык L2, используя CLS Dictionary, формируя наборы Candidate Translations.
  6. Оценка эффективности перевода: Для каждого Candidate Translation определяется частота его использования как полного запроса в Target Language Query Log.
  7. Расчет итоговой оценки: Scoring Submodule вычисляет финальную оценку для каждого Candidate Translation. Оценка комбинирует Segmentation Quality (шаг 4) и эффективность перевода (шаг 6). Могут использоваться разные весовые коэффициенты для этих двух метрик.
  8. Выбор и предоставление результата: Выбирается Candidate Translation с наивысшей итоговой оценкой. Он предоставляется пользователю как Cross-language query suggestion.

Какие данные и как использует

Данные на входе

Патент фокусируется на лингвистических и поведенческих данных для оценки качества перевода запросов.

  • Поведенческие факторы (Ключевые данные):
    • Source Language Query Log: Логи запросов на исходном языке. Используются для валидации корректности сегментации.
    • Target Language Query Log: Логи запросов на целевом языке. Используются для валидации эффективности перевода как поискового запроса.
  • Лингвистические данные:
    • CLS Dictionary: Двуязычный словарь для перевода сегментов.
    • Stop Word Lists: Списки стоп-слов для исходного и, возможно, целевого языка.

Какие метрики используются и как они считаются

Система использует две основные метрики, которые затем комбинируются в итоговую оценку.

  1. Segmentation Quality (Качество сегментации):

    Оценка базируется на двух факторах:

    • Частота в Source Language Query Log: Насколько часто данная конкретная сегментация встречается в логах L1 как полный запрос. Высокая частота повышает оценку.
    • Количество удаленных стоп-слов: Чем меньше стоп-слов удалено, тем выше оценка. Сегментация без удаления стоп-слов (Partition) получает максимальный балл по этому критерию.
  2. Translation Effectiveness (Эффективность перевода):

    Оценка базируется на одном основном факторе:

    • Частота в Target Language Query Log: Насколько часто данный перевод встречается в логах L2 как полный запрос. Высокая частота указывает на то, что носители языка используют эту фразу для поиска, что повышает оценку.
  3. Combined Score (Итоговая оценка):

    Агрегирует Segmentation Quality и Translation Effectiveness. Конкретная формула комбинирования в патенте не приводится, но указывается, что оценка зависит от обоих факторов.

Выводы

  1. Приоритет «языка поиска» над буквальным переводом: Ключевой вывод патента в том, что Google не ищет самый грамматически правильный или буквальный перевод. Система ищет перевод, который наиболее соответствует тому, как носители целевого языка формулируют свои поисковые запросы (search language).
  2. Валидация через поведение пользователей: Логи запросов (Query Logs) являются главным источником истины для оценки как корректности сегментации на исходном языке, так и эффективности перевода на целевом. Это подтверждает важность поведенческих данных в системах Google.
  3. Качество сегментации критично для перевода: Для языков без пробелов (например, CJK) правильное разделение текста на слова (сегментация) является основой. Google использует логи запросов исходного языка, чтобы определить наиболее вероятную и корректную сегментацию.
  4. Эффективность запроса важнее грамматики: Система может предпочесть перевод, который выглядит не совсем естественно в разговорной речи, но часто используется в поиске (например, без артиклей или с измененным порядком слов), если он доказал свою эффективность в Target Language Query Log.
  5. Фокус на Autocomplete: Важно понимать, что патент описывает работу системы поисковых подсказок (Autocomplete), а не основного алгоритма ранжирования.

Практика

Best practices (это мы делаем)

  • Локализация, а не перевод ключевых слов: При выходе на международные рынки необходимо проводить полноценное исследование ключевых слов на целевом языке, а не просто переводить семантическое ядро исходного языка. Фокусируйтесь на том, как ищут носители языка.
  • Использование Google Suggest как валидатора: Активно используйте Google Suggest в целевом регионе и на целевом языке для поиска ключевых фраз. Этот патент показывает, что предлагаемые подсказки прошли валидацию через логи запросов и являются эффективными формулировками.
  • Анализ интента и формулировок в целевом регионе: Изучайте, как формулируются запросы в вашей нише на целевом языке. Обращайте внимание на порядок слов, использование предлогов и специфичные термины, которые могут отличаться от буквального перевода.
  • Для CJK языков – внимание к сегментации: При оптимизации под языки, требующие сегментации (китайский, японский), убедитесь, что используемые вами ключевые фразы соответствуют наиболее частым и естественным вариантам сегментации, используемым пользователями.

Worst practices (это делать не надо)

  • Слепое доверие инструментам перевода: Использование Google Translate или других автоматических переводчиков для генерации списка ключевых слов для SEO на другом языке. Эти инструменты часто дают буквальный или грамматически корректный перевод, который, согласно патенту, может быть неэффективным поисковым запросом.
  • Игнорирование культурных и лингвистических особенностей поиска: Предположение, что пользователи во всех странах ищут одинаково, просто используя разные слова. Формулировка запроса может сильно отличаться.
  • Оптимизация под «правильные», но неиспользуемые термины: Попытки продвигать страницы под терминами, которые являются технически корректным переводом, но редко используются носителями языка в поиске.

Стратегическое значение

Патент подчеркивает стратегическую важность локализации в международном SEO. Он демонстрирует, что Google рассматривает языки не просто как наборы слов, а как отражение поведения и намерений пользователей. Для успешного продвижения на зарубежных рынках необходимо глубокое понимание того, как именно формулируют запросы носители целевого языка, и адаптация контент-стратегии под эти реальные формулировки (search language), а не под теоретически правильные переводы.

Практические примеры

Сценарий: Выбор ключевой фразы для международного E-commerce сайта

Компания продает чехлы для телефонов и хочет выйти на рынок Германии. Исходный запрос на английском: "iPhone 15 protective case".

  1. Неправильный подход (Буквальный перевод): Переводчик может выдать "iPhone 15 Schützende Hülle" (буквально: защитный чехол).
  2. Анализ по патенту (Как работает Google): Система Google анализирует Target Language Query Log (немецкий). Она обнаруживает, что запросы "iPhone 15 Schützende Hülle" имеют низкую частоту. Однако запросы "iPhone 15 Hülle" (чехол) или "iPhone 15 Schutzhülle" (защитный чехол, написанный слитно) имеют высокую частоту.
  3. Результат: Google Suggest предложит более частотные и эффективные варианты ("iPhone 15 Schutzhülle").
  4. Действия SEO-специалиста: Необходимо оптимизировать листинги и категории под те варианты, которые предлагает Google Suggest в Германии, так как они валидированы как эффективные поисковые запросы носителями языка.

Сценарий: Сегментация и перевод с Китайского

  1. Исходный запрос (Chinese): 旅游目的地 (означает "Travel Destination").
  2. Сегментация 1: 旅游 (Travel), 目的 (Purpose), 地 (Ground). Удалено стоп-слово 的. Качество сегментации низкое.
    • Перевод: "Travel Purpose Ground". Частота в английских логах: близка к 0.
  3. Сегментация 2: 旅游 (Travel), 目的地 (Destination). Стоп-слова не удалены (Partition). Эта сегментация часто встречается в китайских логах. Качество сегментации высокое.
    • Перевод: "Travel Destination". Частота в английских логах: высокая.
  4. Результат: Система выберет "Travel Destination" как межъязыковую подсказку.

Вопросы и ответы

Влияет ли этот патент на алгоритмы ранжирования?

Нет, напрямую не влияет. Патент описывает исключительно работу системы поисковых подсказок (Google Suggest / Autocomplete), а именно механизм выбора наиболее качественного и эффективного перевода для межъязыковых подсказок. Он не описывает, как ранжируются документы в основном поиске.

Какое значение этот патент имеет для международного SEO?

Значение критическое для этапа подбора ключевых слов. Он доказывает, что нельзя просто переводить семантическое ядро. Необходимо исследовать, как именно носители целевого языка формулируют запросы, так как Google отдает приоритет именно этим формулировкам (search language), а не буквальным переводам.

Как Google определяет, какой перевод запроса лучше?

Система использует два основных критерия. Первый – качество сегментации исходного запроса (насколько правильно он разделен на слова, основываясь на логах исходного языка). Второй и самый важный – частота использования варианта перевода в качестве реального поискового запроса носителями целевого языка (Target Language Query Log).

Что такое «Качество сегментации» (Segmentation Quality) и почему это важно?

Это метрика, определяющая корректность разделения текста на слова, что особенно важно для языков без пробелов (например, китайского). Качество выше, если такая сегментация часто встречается в логах запросов и если из нее не были удалены стоп-слова. Правильная сегментация необходима для генерации корректного перевода.

Значит ли это, что Google Translate плохо подходит для подбора ключевых слов?

Да, именно так. Google Translate стремится дать грамматически правильный или наиболее близкий по смыслу перевод. Описанная в патенте система ищет наиболее эффективный поисковый запрос. Эти две цели часто не совпадают, поэтому для SEO нужно использовать инструменты анализа реальных поисковых запросов в целевом регионе, а не только переводчики.

Как на практике применить знания из этого патента?

При работе с международными проектами всегда используйте Google Suggest на целевом языке и в целевом регионе для валидации ключевых слов. Если Suggest предлагает формулировку, отличную от вашего перевода, следует использовать вариант из Suggest, так как он подтвержден данными из логов запросов носителей языка.

Применяется ли этот механизм ко всем языкам?

Механизм универсален, но этап сегментации и ее оценки наиболее критичен для языков, где слова не разделяются пробелами (CJK – китайский, японский, корейский). Однако оценка эффективности перевода через логи запросов целевого языка актуальна для любых языковых пар.

Может ли система выбрать грамматически некорректный перевод?

Да, может. Если пользователи целевого языка массово используют грамматически некорректную фразу (например, без артиклей или с нарушением порядка слов) в качестве поискового запроса, система может предпочесть именно ее, так как ее частота в Target Language Query Log будет высокой.

Что такое CLS Dictionary?

Это специализированный словарь (Cross-Language Suggestion Dictionary), который используется системой для перевода отдельных сегментов (слов). Он компилируется из различных источников, включая онлайн-словари и веб-страницы, содержащие пары переводов.

Как система обрабатывает стоп-слова?

Система пытается сохранить стоп-слова, если это возможно. При оценке качества сегментации (Segmentation Quality) варианты, из которых было удалено меньше стоп-слов, получают более высокую оценку. Это делается для того, чтобы перевод был максимально полным и точным.

Похожие патенты

Как Google определяет язык смешанных запросов с помощью посимвольного анализа на стороне клиента
Google использует легковесный механизм для определения языка поисковых подсказок, который может выполняться на стороне клиента. Система анализирует каждый символ подсказки и оценивает, насколько он уникален для разных языков, используя локальную базу данных. Это позволяет точно определить исходный язык даже для смешанных запросов (например, Английский + Китайский) и обеспечить качественный машинный перевод кросс-язычных подсказок.
  • US20120330989A1
  • 2012-12-27
  • Мультиязычность

Как Google выбирает лучший перевод для межъязыковых подсказок в автокомплите, сравнивая N-граммы
Google использует этот механизм для улучшения качества межъязыковых поисковых подсказок (автокомплита), особенно для смешанных запросов. Если автоматическое определение языка затруднено, система генерирует два перевода в разных направлениях (Язык A -> Язык B и Язык B -> Язык A). Затем она сравнивает их с оригиналом с помощью N-грамм. Перевод, который максимально отличается от оригинала, выбирается как наилучшая межъязыковая подсказка.
  • US20120330919A1
  • 2012-12-27
  • Мультиязычность

  • Семантика и интент

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google генерирует поисковые подсказки, анализируя метаданные (Title и Description) авторитетных сайтов и проверяя их грамматику
Google расширяет поисковые подсказки (Autocomplete) за пределы исторических логов, анализируя метаданные документов, такие как заголовки (Title). Система извлекает фразы, проверяет их грамматическую корректность с помощью NLP (POS-tagging) и добавляет в базу подсказок. Приоритет отдается фразам, полученным с авторитетных страниц (высокий Document Score), что позволяет предлагать качественные запросы, даже если их еще никто не искал.
  • US9195706B1
  • 2015-11-24
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно
Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.
  • US9235654B1
  • 2016-01-12
  • Семантика и интент

Популярные патенты

Как Google динамически фильтрует выдачу, уточняя интент пользователя после клика по результату
Google использует механизм для обработки неоднозначных запросов. Если выдача содержит результаты, относящиеся к разным сущностям (например, «Ягуар» как животное и как автомобиль), клик пользователя по одному из результатов сигнализирует о его интересе к конкретной сущности. При возврате на страницу выдачи система модифицирует SERP, скрывая или понижая результаты, связанные с нерелевантными сущностями, и фокусируя выдачу на выбранном интенте.
  • US9355158B2
  • 2016-05-31
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
  • US9268880B2
  • 2016-02-23
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента
Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.
  • US8145636B1
  • 2012-03-27
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

seohardcore