SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google идентифицирует и отображает контент на предпочтительном языке пользователя, даже если поиск ведется на другом языке

PROVIDING PARALLEL RESOURCES IN SEARCH RESULTS (Предоставление параллельных ресурсов в результатах поиска)
  • US7984034B1
  • Google LLC
  • 2007-12-21
  • 2011-07-19
  • Мультиязычность
  • Персонализация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google улучшает результаты поиска для мультиязычных пользователей, идентифицируя «параллельные ресурсы» — высококачественные переводы или оригинальные статьи на ту же тему — на предпочтительном языке пользователя (L2), даже если запрос был сделан на другом языке (L1). Эти L2 ресурсы отображаются рядом с результатами L1, улучшая доступ к релевантной информации.

Описание

Какую проблему решает

Патент решает проблему доступа к информации для мультиязычных пользователей. Пользователи часто ищут на одном языке (L1, например, английском), полагая, что найдут больше информации, но предпочитают потреблять контент на другом языке (L2, например, родном). Они могут упустить существующий высококачественный контент на L2 или вынуждены полагаться на низкокачественный машинный перевод результатов L1. Система направлена на выявление и представление релевантного контента на предпочтительном языке пользователя.

Что запатентовано

Запатентована система для идентификации, сопоставления и отображения Параллельных ресурсов (Parallel Resources) в результатах поиска. Если пользователь ищет на языке L1, но предпочитает L2, система находит ресурсы на L2, которые являются либо высококачественным переводом результатов L1, либо оригинальным контентом на L2 по той же теме. Эти ресурсы отображаются с помощью Визуальных оповещений (Visual Alerts) рядом с результатами L1.

Как это работает

Система работает в двух режимах:

  • Офлайн: Система идентифицирует ресурсы на разных языках, которые являются параллельными (качественный перевод или та же тема), и строит Карту параллельных ресурсов (Parallel Resource Map), связывающую их.
  • Онлайн: При получении запроса на L1 система определяет предпочтительный язык пользователя L2 (используя настройки, историю поиска или IP-адрес). Генерируются результаты L1. Система проверяет Parallel Resource Map на наличие ресурсов L2. Если они найдены, генерируется Visual Alert. Для создания релевантного сниппета L2 система переводит исходный запрос на L2 и ищет соответствующие фрагменты в контенте L2.

Актуальность для SEO

Высокая. Кросс-языковой информационный поиск (Cross-Lingual Information Retrieval) и обеспечение наилучшего пользовательского опыта для глобальной аудитории остаются ключевыми задачами Google. Этот патент описывает фундаментальные механизмы для улучшения поиска для мультиязычных пользователей, что критически важно в современном интернете.

Важность для SEO

Патент имеет значительное влияние (7/10) на стратегии международного SEO. Он подчеркивает важность создания высококачественных переводов и оригинального контента на разных языках. Система может обеспечить видимость локализованного контента, даже если пользователь ищет на другом языке. Кроме того, в описании патента упоминается возможность повышения в ранжировании (ranking boost) для ресурсов L1, если для них существуют параллельные ресурсы L2.

Детальный разбор

Термины и определения

L1 (First Language)
Первый язык. Язык, на котором пользователь вводит поисковый запрос.
L2 (Second Language / Preferred Language)
Второй язык. Предпочтительный язык пользователя, который отличается от языка запроса L1.
Parallel Resource (Параллельный ресурс)
Ресурс на языке L2, связанный с ресурсом на языке L1. Имеет строгое определение: (1) Высококачественный перевод (High-Quality Translation) ресурса L1, ИЛИ (2) Оригинальный ресурс на L2, освещающий ту же тему (similar topic), что и ресурс L1. Стандартный машинный перевод низкого качества исключается.
High-Quality Translation (Высококачественный перевод)
Включает человеческий перевод (Human Translation) или высококачественный автоматический перевод (HQ Automatic Translation). Отличается от стандартного машинного перевода.
Parallel Resource Map (Карта параллельных ресурсов)
Индекс или база данных, которая хранит связи между идентифицированными параллельными ресурсами на разных языках (L1 и L2). Строится офлайн.
Visual Alert (Визуальное оповещение)
Представление параллельного ресурса L2 в результатах поиска. Включает заголовок, URL и сниппет ресурса L2, отображаемые рядом с соответствующим результатом L1.
Source Reliability (Надежность источника)
Фактор, который может использоваться для ранжирования нескольких параллельных ресурсов между собой, отдавая предпочтение более авторитетным публикациям.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы.

  1. Система получает поисковый запрос на первом языке (L1).
  2. Генерируется результат поиска, включающий ссылку на идентифицированный ресурс на L1.
  3. Идентифицируется Parallel Resource на втором языке (L2). (Ресурс должен соответствовать определению: высококачественный перевод ИЛИ оригинал на схожую тему).
  4. Генерируется Visual Alert для параллельного ресурса. Ключевое требование: оповещение включает сниппет, взятый из релевантного раздела параллельного ресурса.
  5. Результаты поиска (включающие результат L1 и Visual Alert L2) предоставляются инициатору запроса.

Claim 4 (Зависимый от 1): Детализирует процесс генерации сниппета для Visual Alert (описанный в шаге 4 Claim 1).

  1. Поисковый запрос переводится с L1 на L2.
  2. Выполняется поиск в параллельном ресурсе L2 на основе этого переведенного запроса.
  3. Извлекается релевантный раздел параллельного ресурса на основе переведенного запроса.

Этот механизм обеспечивает высокую релевантность сниппета L2 исходному запросу L1.

Claim 6 (Зависимый от 1): Описывает метод определения языка L2.

  1. Получается языковое предпочтение инициатора запроса.
  2. Второй язык (L2) определяется на основе этого предпочтения.

Claim 8 (Зависимый от 6): Уточняет неявные методы определения предпочтений.

Языковое предпочтение может быть выведено (inferred) из истории поиска инициатора запроса или его IP-адреса.

Claim 10 (Зависимый от 1): Указывает на инфраструктурный компонент.

Метод включает построение Parallel Resource Map, связывающей ресурс на L1 с параллельным ресурсом на L2.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, связывая процессы индексирования с пониманием запросов и финальным представлением результатов.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная офлайн-работа. Система идентифицирует языки ресурсов и выполняет анализ для обнаружения параллельных ресурсов (используя методы идентификации параллельных документов и оценки качества перевода). Результаты сохраняются в Parallel Resource Map.

QUNDERSTANDING – Понимание Запросов
Система анализирует сигналы пользователя (история, IP, настройки), чтобы определить его предпочтительный язык (L2), даже если запрос введен на L1. Также на этом этапе (или позже, при генерации сниппета) происходит перевод запроса с L1 на L2.

RANKING – Ранжирование
Генерируются стандартные результаты поиска на языке L1. В патенте упоминается возможность корректировки ранжирования: система может включать scoring factor, который дает дополнительный вес (boost) документам L1, для которых существует хотя бы один параллельный документ L2.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента. Система использует Parallel Resource Map для поиска ресурсов L2, соответствующих топовым результатам L1. Затем активируется процесс генерации Visual Alert (перевод запроса и извлечение сниппета). Финальная выдача смешивает (blending) результаты L1 и оповещения L2.

Входные данные:

  • Поисковый запрос на L1.
  • Сигналы пользователя (IP-адрес, история поиска, настройки).
  • Parallel Resource Map.
  • Контент индексированных ресурсов L2.

Выходные данные:

  • Страница результатов поиска (SERP), содержащая результаты L1, дополненные Visual Alerts для параллельных ресурсов L2.

На что влияет

  • Географические и языковые факторы: Наибольшее влияние оказывается на мультиязычных пользователей и на рынках, где часто используются несколько языков (например, поиск на английском в неанглоязычных странах).
  • Типы сайтов: Влияет на сайты, которые инвестируют в качественную локализацию контента (международные СМИ, базы знаний, такие как Wikipedia, мультиязычные корпоративные сайты, техническая документация).
  • Специфические запросы: Актуально для информационных и исследовательских запросов, где пользователь ищет наиболее полные данные (часто на L1), но предпочтет изучить материал на родном языке (L2).

Когда применяется

Алгоритм применяется при выполнении совокупности условий:

  • Триггер 1 (Язык запроса): Пользователь вводит запрос на языке L1.
  • Триггер 2 (Языковые предпочтения): Система обнаруживает (явно или неявно), что пользователь предпочитает язык L2, отличный от L1.
  • Триггер 3 (Наличие данных): Для топовых результатов поиска на языке L1 существуют записи в Parallel Resource Map, указывающие на высококачественные ресурсы L2.

Пошаговый алгоритм

Процесс делится на предварительную подготовку (Офлайн) и обработку запроса (Онлайн).

Процесс А: Офлайн-подготовка (Построение карты)

  1. Идентификация параллельных ресурсов: Система анализирует корпус документов на разных языках для выявления пар L1-L2.
  2. Оценка качества и фильтрация: Оценивается качество перевода или степень тематического сходства. Стандартные машинные переводы низкого качества отфильтровываются. Ресурсы также могут оцениваться по надежности источника (source reliability).
  3. Построение Parallel Resource Map: Для подтвержденных пар создаются связи в карте, где идентификатор ресурса L1 ассоциируется с идентификатором ресурса L2.

Процесс Б: Обработка запроса в реальном времени

  1. Определение предпочтений L2: Система анализирует сигналы пользователя для определения предпочтительного языка L2.
  2. Получение запроса L1 и генерация результатов: Resource Index Module генерирует результаты поиска L1. Ранжирование может учитывать наличие параллельных ресурсов как положительный фактор.
  3. Получение параллельных ресурсов: Для топовых результатов L1 система запрашивает Parallel Resource Map для поиска ресурсов L2.
  4. Генерация Visual Alert (для каждого найденного ресурса L2):
    1. Перевод запроса: Исходный запрос переводится с L1 на L2.
    2. Поиск в контенте L2: Система ищет переведенный запрос в контенте параллельного ресурса L2.
    3. Извлечение релевантных разделов: Идентифицируются и извлекаются фрагменты текста для формирования сниппета.
    4. Формирование оповещения: Создается Visual Alert с заголовком, URL и сгенерированным сниппетом на языке L2.
  5. Представление результатов: Результаты L1 и Visual Alerts L2 объединяются и представляются пользователю.

Какие данные и как использует

Данные на входе

Система использует данные для определения языковых предпочтений и для построения карты параллельных ресурсов.

  • Пользовательские факторы:
    • Явные настройки языковых предпочтений (в браузере или аккаунте).
    • История поиска пользователя (для неявного определения L2).
  • Географические факторы:
    • IP-адрес пользователя (используется для геолокации и неявного определения L2).
  • Контентные факторы:
    • Язык и содержание ресурсов (используется офлайн для анализа сходства, идентификации переводов и оценки качества; онлайн для извлечения сниппетов).

Какие метрики используются и как они считаются

Патент не детализирует формулы, но упоминает следующие ключевые метрики и факторы:

  • Качество перевода (Translation Quality): Ключевая метрика для включения в Parallel Resource Map. Система должна отличать High-Quality Translation (человеческий или HQ автоматический) от низкокачественного машинного перевода.
  • Степень параллелизма/сходства (Degree of Parallelism/Similarity): Метрика, используемая офлайн для определения того, являются ли два документа параллельными (особенно для оригиналов на ту же тему).
  • Надежность источника (Source Reliability): Фактор, используемый при оценке и ранжировании потенциальных параллельных ресурсов L2. Ресурсы из авторитетных источников получают преимущество.
  • Scoring Factor (Фактор ранжирования): Упоминается возможность предоставления дополнительного веса (ranking boost) результатам L1, если для них существуют параллельные ресурсы L2.

Выводы

  1. Приоритет качественной локализации: Google четко разграничивает высококачественный перевод и стандартный машинный перевод. Только высококачественный контент квалифицируется как Parallel Resource. Инвестиции в низкокачественный перевод не дают преимуществ в рамках этого механизма.
  2. Активное сопоставление мультиязычного контента: Google поддерживает инфраструктуру (Parallel Resource Map) для систематического связывания версий контента на разных языках. Это выходит за рамки простого перевода и включает оригинальный контент на ту же тему.
  3. Неявное определение языка пользователя: Система активно пытается определить предпочтительный язык пользователя (L2), используя неявные сигналы (история поиска, IP-адрес), чтобы предоставить лучший результат, даже если запрос сделан на L1.
  4. Динамическая генерация кросс-языковых сниппетов: Сниппет для L2 ресурса генерируется сложным путем: запрос переводится на L2, и этот перевод используется для поиска релевантных фрагментов в контенте L2. Это требует оптимизации контента L2 под локальную семантику.
  5. Потенциальное влияние на ранжирование L1: Наличие высококачественных параллельных версий документа может служить положительным сигналом ранжирования для исходного документа (L1).

Практика

Best practices (это мы делаем)

  • Инвестиции в высококачественный перевод: При локализации используйте человеческий перевод или высококачественные автоматизированные решения (HQ MT). Это увеличивает вероятность того, что локализованный контент будет распознан как Parallel Resource.
  • Обеспечение четкой связи между языковыми версиями: Необходимо помогать Google строить Parallel Resource Map. Хотя патент не упоминает hreflang (появился позже), на практике корректное использование hreflang критически важно для установления этих связей и активации данного механизма.
  • Создание оригинального качественного контента на L2: Не ограничивайтесь переводом. Создание высококачественного оригинального контента на целевом языке (L2) по темам, актуальным для глобальной аудитории (L1), также позволяет ему квалифицироваться как Parallel Resource.
  • Оптимизация L2 под локальную семантику: Поскольку сниппет L2 генерируется динамически на основе переведенного запроса, контент L2 должен быть хорошо оптимизирован под релевантные ключевые слова и интенты на своем языке, чтобы система могла извлечь качественный сниппет.

Worst practices (это делать не надо)

  • Использование низкокачественного машинного перевода для локализации: Патент явно исключает стандартный машинный перевод из определения Parallel Resource. Создание автоматически сгенерированных страниц низкого качества не принесет пользы в рамках этого механизма и может навредить общему качеству сайта.
  • Отсутствие связей между языковыми версиями: Публикация контента на разных языках без четкой структуры и связей (например, без hreflang или перекрестных ссылок) затрудняет построение Parallel Resource Map.
  • Игнорирование авторитетности локальных версий: Пренебрежение работой над E-E-A-T и ссылочным профилем локализованных версий. Source Reliability упоминается как фактор ранжирования параллельных ресурсов.

Стратегическое значение

Патент подтверждает стратегическую важность качественной международной SEO-стратегии. Google стремится преодолеть языковые барьеры, рассматривая интернет как единое информационное пространство. Система вознаграждает качественную локализацию дополнительной видимостью для мультиязычной аудитории и потенциально небольшим повышением в ранжировании. Это подчеркивает, что для глобальных компаний критически важно обеспечивать высокое качество контента на всех целевых языках.

Практические примеры

Сценарий: Поиск технической документации мультиязычным пользователем

  1. Контекст: Разработчик из Германии (предпочтительный язык L2 = Немецкий) ищет информацию о функции Python. Зная, что самая актуальная документация на английском, он ищет на английском.
  2. Запрос (L1=Английский): "Python pattern matching tutorial".
  3. Определение предпочтений: Google определяет предпочтение немецкого языка на основе истории поиска и IP-адреса.
  4. Генерация результатов L1: В топе находится официальная документация Python на английском.
  5. Поиск параллельных ресурсов: Система проверяет Parallel Resource Map и обнаруживает, что для этой страницы существует высококачественный перевод на немецкий (L2).
  6. Генерация Visual Alert: Система переводит запрос на немецкий ("Python pattern matching Anleitung"), находит релевантные фрагменты в немецкой версии документа и формирует Visual Alert.
  7. Результат: Разработчик видит английский результат, а рядом с ним — Visual Alert с заголовком и сниппетом немецкой версии, и переходит на нее.

Вопросы и ответы

Что именно считается «параллельным ресурсом» (Parallel Resource) и что им не является?

Parallel Resource — это строго определенный термин. Он включает высококачественный перевод (человеческий или продвинутый автоматический) или оригинальный ресурс на другом языке, освещающий ту же тему. Критически важно, что стандартный машинный перевод низкого качества НЕ считается параллельным ресурсом согласно этому патенту.

Влияет ли этот патент на ранжирование основного контента (L1)?

Да, в описании патента упоминается такая возможность. Система может использовать scoring factor, который дает дополнительный вес (boost) результатам на языке L1, если для них идентифицировано существование одного или нескольких параллельных ресурсов на языке L2. Это стимулирует создание качественного мультиязычного контента.

Как Google определяет предпочтительный язык пользователя (L2), если он ищет на другом языке (L1)?

Система использует комбинацию явных и неявных сигналов. Явные сигналы — это настройки языка в аккаунте Google или браузере. Неявные сигналы включают анализ истории поиска пользователя (на каких языках он искал ранее) и геолокацию по IP-адресу для определения основного языка региона.

Как генерируется сниппет для параллельного ресурса L2?

Сниппет генерируется динамически для обеспечения максимальной релевантности. Система переводит исходный запрос с L1 на L2. Затем она ищет этот переведенный запрос в контенте параллельного ресурса L2 и извлекает наиболее релевантные фрагменты текста. Это не просто мета-описание или начало документа.

Как этот патент связан с атрибутом hreflang?

Патент (подан в 2007) не упоминает hreflang напрямую. Однако hreflang является современным стандартом, который помогает поисковым системам решать именно ту задачу, которая описана в патенте, — построение Parallel Resource Map. Использование hreflang помогает Google точно связать языковые версии и корректно идентифицировать параллельные ресурсы.

Стоит ли использовать машинный перевод для локализации сайта в свете этого патента?

Только если это высококачественный автоматический перевод (HQ Automatic Translation). Стандартный, низкокачественный машинный перевод не рекомендуется, так как он не считается Parallel Resource. Приоритетом должен быть человеческий перевод или профессиональная локализация.

Что такое Карта параллельных ресурсов (Parallel Resource Map)?

Это инфраструктурный компонент (индекс или база данных), который создается и обновляется в офлайн-режиме. Он хранит связи между уникальными идентификаторами ресурсов на разных языках, которые были идентифицированы как параллельные. Это позволяет системе быстро находить соответствующие ресурсы L2 во время обработки запроса.

Может ли оригинальная статья на языке L2 считаться параллельной статье на языке L1?

Да. Если две статьи на разных языках независимо друг от друга освещают одну и ту же тему (например, одно и то же новостное событие) и обе являются высококачественными, они могут быть классифицированы как параллельные ресурсы. Это подчеркивает важность создания качественного оригинального контента на целевых языках.

Как система определяет надежность источника (Source Reliability)?

Патент упоминает Source Reliability как фактор для ранжирования параллельных ресурсов, если их найдено несколько. Хотя методы расчета не детализированы, на практике это соответствует общим сигналам авторитетности и качества сайта (E-E-A-T). Контент из авторитетных источников получит приоритет.

Применяется ли этот механизм ко всем запросам и пользователям?

Нет. Механизм активируется только тогда, когда система обнаруживает несоответствие между языком запроса (L1) и предпочтительным языком пользователя (L2), и только если для результатов L1 существуют предварительно идентифицированные высококачественные параллельные ресурсы L2.

Похожие патенты

Как Google определяет многоязычных пользователей и показывает им результаты на языке, отличном от языка запроса
Google использует механизм для идентификации пользователей, владеющих несколькими языками, анализируя язык текущего запроса, местоположение пользователя и историю его активности. Если пользователь находится в регионе с доминирующим языком (L2), но ищет на другом языке (L1), и система подтверждает владение обоими, Google переводит запрос на L2 и ищет контент на обоих языках. Это позволяет показывать наиболее релевантные результаты, даже если их язык отличается от языка запроса.
  • US20230325421A1
  • 2023-10-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google использует машинный перевод для поиска контента на иностранных языках (Cross-Language Information Retrieval)
Google использует механизмы Cross-Language Information Retrieval (CLIR) для поиска релевантного контента независимо от языка запроса. Система может перевести запрос пользователя на другие языки и искать в индексах этих языков (Query Translation), либо заранее перевести контент сайтов на язык пользователя (Document Translation). Это позволяет предоставлять пользователю лучшие результаты, даже если они изначально опубликованы на иностранном языке.
  • US7890493B2
  • 2011-02-15
  • Мультиязычность

  • Индексация

Как Google помогает пользователям найти правильную языковую версию страницы, исправляя ошибки маршрутизации
Система определяет языковые предпочтения пользователя и сравнивает их с языком посещаемой веб-страницы. Если страница отображается не на предпочтительном языке из-за ошибки маршрутизации (например, из-за геолокации), и существует альтернативная версия на нужном языке, система предлагает пользователю перейти на нее или автоматически перенаправляет его.
  • US9251223B2
  • 2016-02-02
  • Мультиязычность

  • Персонализация

  • Индексация

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Популярные патенты

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства
Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.
  • US8868592B1
  • 2014-10-21
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Как Google интерпретирует последовательные запросы для автоматического уточнения поискового намерения пользователя
Google использует механизм для понимания контекста сессии, анализируя последовательные запросы (например, Q1: [рестораны в Москве], затем Q2: [итальянские]). Система автоматически объединяет их в уточненный запрос (Q3: [итальянские рестораны в Москве]), основываясь на исторических данных о том, как пользователи обычно уточняют запросы. Это позволяет системе лучше понимать намерение пользователя в диалоговом режиме.
  • US9116952B1
  • 2015-08-25
  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей
Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.
  • US11379527B2
  • 2022-07-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

seohardcore