SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует машинный перевод для поиска контента на иностранных языках (Cross-Language Information Retrieval)

TRANSLATING A SEARCH QUERY INTO MULTIPLE LANGUAGES (Перевод поискового запроса на несколько языков)
  • US7890493B2
  • Google LLC
  • 2007-07-20
  • 2011-02-15
  • Мультиязычность
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизмы Cross-Language Information Retrieval (CLIR) для поиска релевантного контента независимо от языка запроса. Система может перевести запрос пользователя на другие языки и искать в индексах этих языков (Query Translation), либо заранее перевести контент сайтов на язык пользователя (Document Translation). Это позволяет предоставлять пользователю лучшие результаты, даже если они изначально опубликованы на иностранном языке.

Описание

Какую проблему решает

Патент решает проблему ограничения поиска контентом, написанным только на языке пользователя. Это создает барьер для доступа к информации, которая может существовать только на других языках. Цель изобретения — расширить объем доступного для поиска контента (volume of searched content), включив в него мультиязычные корпуса документов, и тем самым повысить полноту и качество поисковой выдачи.

Что запатентовано

Запатентована система (Expanded Language Search Engine, ELSE) и методы для осуществления кросс-языкового информационного поиска (Cross-Language Information Retrieval, CLIR). Изобретение описывает два основных архитектурных подхода: (1) Перевод запроса (Query Translation) — перевод исходного запроса на иностранные языки для поиска в соответствующих индексах; и (2) Перевод документа (Document Translation) — предварительный перевод иностранного контента на язык пользователя для поиска по унифицированному индексу.

Как это работает

Система реализует два ключевых механизма:

  • Механизм 1 (Перевод запроса): Запрос на языке L1 переводится на язык L2. Этот переведенный запрос используется для поиска в индексе контента на L2. Найденные релевантные результаты на L2 затем переводятся обратно на L1 (включая сниппеты и, возможно, целевую страницу) и представляются пользователю.
  • Механизм 2 (Перевод документа): Контент на языке L2 заранее (на этапе индексирования) переводится на язык L1 и сохраняется. Поисковый запрос на L1 сравнивается непосредственно с этим переведенным контентом (который теперь также на L1).

Система может определять языки для перевода на основе настроек пользователя, популярности языка или анализа содержания самого запроса.

Актуальность для SEO

Высокая. Кросс-языковой поиск является фундаментальной функцией глобальных поисковых систем. Хотя конкретные технологии машинного перевода значительно эволюционировали с момента подачи патента (например, переход на нейронный машинный перевод, NMT), описанные базовые стратегии (Query Translation и Document Translation) остаются центральными в архитектуре обработки мультиязычного контента Google.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO, особенно для международного продвижения. Он описывает механизмы, которые позволяют контенту ранжироваться по запросам на языках, отличных от языка оригинала. Это означает, что высококачественный и авторитетный контент может преодолевать языковые барьеры. Понимание этих механизмов критически важно для планирования глобального охвата и оптимизации контента под машинный перевод.

Детальный разбор

Термины и определения

CLIR (Cross-Language Information Retrieval)
Кросс-языковой информационный поиск. Процесс получения информации, написанной на одном языке, в ответ на запрос, сформулированный на другом языке.
Document Translation (Перевод документа/контента)
Подход CLIR, при котором иностранный контент переводится на язык пользователя (обычно заранее, на этапе индексации).
ELSE (Expanded Language Search Engine)
Поисковая система с расширенными языковыми возможностями. Система, реализующая описанные в патенте методы.
Foreign Language (Иностранный язык, L2)
Язык, отличный от родного. Целевой язык для перевода запроса или исходный язык для перевода документа.
Intermediate Language (Промежуточный язык)
Язык-посредник. Запрос или документ может быть переведен с L1 на промежуточный язык, а затем на L2.
Native Language (Родной язык, L1)
Язык, на котором пользователь вводит исходный поисковый запрос.
Query Translation (Перевод запроса)
Подход CLIR, при котором запрос пользователя переводится на иностранные языки для поиска в соответствующих индексах.
Translator (Переводчик)
Компонент системы, отвечающий за машинный перевод.

Ключевые утверждения (Анализ Claims)

Патент содержит две основные группы независимых пунктов, описывающих два разных метода реализации CLIR.

Группа 1: Перевод запроса (Query Translation)

Claim 1 (Независимый пункт): Описывает основной метод перевода запроса.

  1. Система получает поисковый запрос на первом языке (L1).
  2. Система определяет второй язык (L2) для перевода на основе содержания самого запроса (based on the content included in the search query).
  3. Запрос переводится на L2 (translated search query).
  4. Переведенный запрос сравнивается с контентом на L2 в сети.
  5. Идентифицируется релевантный контент на L2.
  6. Ключевой шаг: Идентифицированный контент на L2 переводится обратно на L1.
  7. Переведенный контент (теперь на L1) предоставляется в ответ на исходный запрос.

Claim 3 (Зависимый от 1): Уточняет, что перевод может осуществляться через промежуточный язык (intermediate spoken language).

Группа 2: Перевод контента (Document Translation)

Claim 28 (Независимый пункт): Описывает метод перевода контента.

  1. Система получает поисковый запрос на первом языке (L1).
  2. Контент, находящийся в сети на втором языке (L2), переводится на первый язык (L1) (translated content). (Этот шаг может выполняться заранее).
  3. Исходный запрос на L1 сравнивается с переведенным контентом (который теперь также на L1).
  4. Из переведенного контента идентифицируется контент, удовлетворяющий запросу.
  5. Идентифицированный (уже переведенный) контент предоставляется в ответ на запрос.

Claim 39 (Зависимый от 28): Уточняет, что первый язык (L1) может быть определен на основе типа символов (character type), используемых в запросе.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, в зависимости от выбранного механизма.

INDEXING – Индексирование и извлечение признаков

  • Общее: Crawler собирает мультиязычный контент. Система идентифицирует язык контента (используя домен, набор символов, словарь).
  • Механизм 2 (Document Translation): На этом этапе Translator может переводить контент с иностранных языков (L2) на целевые языки (L1) и сохранять переведенные версии в Index DB.

QUNDERSTANDING – Понимание Запросов

  • Общее: Определение языка запроса (L1).
  • Механизм 1 (Query Translation): Система определяет целевые языки для перевода (L2, L3...). Согласно Claim 1, выбор может основываться на содержании запроса. Translator выполняет перевод запроса в реальном времени.

RANKING – Ранжирование

  • Механизм 1: Компонент Matcher сравнивает переведенный запрос (L2) с индексом контента на L2.
  • Механизм 2: Matcher сравнивает исходный запрос (L1) с индексом, который содержит переведенный контент (L2->L1).

METASEARCH / RERANKING – Метапоиск и Переранжирование

  • Система объединяет и ранжирует результаты, полученные из разных языковых корпусов.
  • Механизм 1: Найденные результаты на L2 должны быть переведены обратно на L1 (сниппеты, заголовки и, возможно, целевая страница по клику) перед показом пользователю.

На что влияет

  • Специфические запросы: Наибольшее влияние на запросы, где основная масса качественной информации находится на другом языке (например, научные исследования, локальные новости другой страны, аутентичные рецепты, узкоспециализированная техническая информация).
  • Конкретные ниши: Ниши, где экспертиза сосредоточена в определенных языковых группах или регионах.
  • Международное SEO: Влияет на стратегии локализации и глобального охвата контента.

Когда применяется

  • Условия работы: Алгоритмы CLIR могут применяться постоянно для расширения охвата поиска.
  • Триггеры активации: Могут активироваться более агрессивно, если:
    • Система определяет дефицит качественной информации на языке пользователя.
    • Анализ запроса показывает, что релевантная информация вероятнее всего существует на другом языке (Claim 1).
    • Пользователь явно указал языковые предпочтения.

Пошаговый алгоритм

Алгоритм А: Перевод запроса (Query Translation)

  1. Получение запроса: Система получает запрос на родном языке (L1).
  2. Определение языков: Определяется список иностранных языков (L2, L3...). Выбор основывается на содержании запроса, настройках или других факторах.
  3. Перевод запроса: Запрос переводится на выбранные языки (возможно, через Intermediate language).
  4. Сравнение и поиск (Параллельный или последовательный):
    • Переведенные запросы (L2, L3...) сравниваются с контентом в соответствующих индексах.
    • (Опционально) Исходный запрос (L1) сравнивается с контентом в индексе L1.
  5. Идентификация и объединение: Определяются релевантные документы из всех корпусов, результаты объединяются и ранжируются.
  6. Обратный перевод результатов: Сниппеты и заголовки результатов, найденных на иностранных языках, переводятся на L1.
  7. Представление выдачи: Пользователю предоставляется список результатов на L1.
  8. Обработка клика (Опционально): При клике на иностранный результат система может перевести содержимое целевой страницы на L1.

Алгоритм Б: Перевод контента (Document Translation)

Офлайн-процесс (Индексирование):

  1. Сбор и идентификация: Краулер собирает контент и определяет его язык (L2).
  2. Перевод контента: Контент на L2 переводится на целевой язык (L1).
  3. Хранение: Переведенный контент (L2->L1) сохраняется в Index DB.

Онлайн-процесс (Обработка запроса):

  1. Получение запроса: Система получает запрос на языке L1.
  2. Сравнение и поиск: Запрос (L1) сравнивается с содержимым Index DB, включающим переведенный контент (L2->L1).
  3. Идентификация и представление: Определяются релевантные документы (которые уже на L1) и предоставляются пользователю.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст документов. Словарь (vocabulary) контента используется для определения языка. Содержание запроса используется для определения целевых языков перевода (Claim 1).
  • Технические факторы: Доменное имя (domain name, например, .cn) и набор символов (character set) используются для идентификации языка контента. Тип символов в запросе также может использоваться для определения языка запроса (Claim 39).
  • Пользовательские факторы: Языковые настройки браузера (browser's language settings), домен поисковой системы (например, google.fr), пользовательский ввод (user input), история поиска (search history) и профиль пользователя могут использоваться для определения родного языка и выбора языков для перевода.

Какие метрики используются и как они считаются

Патент не детализирует конкретные метрики ранжирования, но упоминает ключевые методы обработки:

  • Методы перевода: Используется Translator. Упоминается возможность как буквального (literal translation), так и контекстуального (contextual translation) перевода слов и фраз.
  • Ранжирование: Упоминается, что результаты ранжируются на основе порядка релевантности (order of relevance) исходному запросу (Claim 9). Патент также ссылается на стандартные методы ранжирования, такие как PageRank (упоминая US Pat. No. 6,285,999).
  • Statistical Associations: Система может использовать статистические ассоциации между ключевыми словами (например, синонимы) для улучшения поиска.

Выводы

  1. Google активно устраняет языковые барьеры: Поисковая система спроектирована так, чтобы находить релевантную информацию независимо от языка её публикации. Язык не является непреодолимым барьером.
  2. Два архитектурных подхода к CLIR: Патент четко определяет Query Translation (перевод запроса под индекс) и Document Translation (перевод индекса под запрос). Это дает Google гибкость в реализации в зависимости от языковой пары и доступных ресурсов.
  3. Автоматизация выбора языка на основе интента: Система может автоматически определять, на какие языки переводить запрос, основываясь на его содержании (Claim 1). Это предполагает семантический анализ для определения релевантных языковых корпусов.
  4. Приоритет пользовательского опыта: Независимо от языка оригинала, система стремится представить результат на родном языке пользователя, включая перевод сниппетов и целевых страниц.
  5. Глобальная конкуренция за качество: Контент на любом языке потенциально конкурирует глобально. Если контент является лучшим ответом, механизмы CLIR позволяют ему ранжироваться выше локальных, но менее качественных результатов.

Практика

Best practices (это мы делаем)

  • Оптимизация под машинный перевод (MTO - Machine Translation Optimization): Пишите контент ясно, структурированно и недвусмысленно. Используйте стандартную грамматику и общепринятую терминологию в своей нише. Это повышает качество автоматического перевода (как при Document Translation, так и при обратном переводе результатов), что улучшает шансы на ранжирование в CLIR-сценариях.
  • Создание глобально авторитетного контента: Фокусируйтесь на создании лучшего контента по теме. Если ваш контент является наиболее полным и авторитетным ответом, Google найдет способ доставить его пользователям на других языках через CLIR.
  • Фокус на сущностях и интентах: Оптимизируйте контент вокруг сущностей (Entities) и намерений (Intents), которые являются универсальными. Контент, хорошо отвечающий на интент, сохранит свою ценность при переводе.
  • Техническая ясность языка: Убедитесь, что язык вашего контента четко определен технически (например, через атрибуты lang в HTML), чтобы помочь системе корректно обработать контент.

Worst practices (это делать не надо)

  • Использование идиом, сленга и сложных метафор: Избегайте выражений, которые могут быть некорректно интерпретированы системами машинного перевода. Это может привести к потере релевантности после перевода.
  • Публикация сырого машинного перевода: Не следует путать внутреннее использование Google машинного перевода для CLIR с публикацией автопереведенного контента на вашем сайте. Низкокачественный перевод без редактуры вредит пользовательскому опыту и сигналам качества сайта.
  • Игнорирование качества в пользу локализации: Предположение, что локализованный контент всегда будет ранжироваться выше. Если локальный контент низкого качества, система может предпочесть переведенный высококачественный иностранный контент.

Стратегическое значение

Патент подтверждает глобальный характер поиска. Языковые границы стираются. Для SEO-стратегии это означает, что рынок не ограничивается одним языком, и конкуренция происходит на глобальном уровне. Долгосрочная стратегия должна включать создание контента, который обладает глобальной ценностью и оптимизирован для корректной интерпретации системами машинного перевода. Качество и ясность оригинала становятся факторами ранжирования в многоязычной среде.

Практические примеры

Сценарий 1: Поиск узкоспециализированной информации (Query Translation)

  1. Ситуация: Англоговорящий исследователь ищет информацию о специфическом техническом стандарте, принятом только в Германии и описанном в немецкоязычной документации.
  2. Запрос (L1, Английский): "[Standard Name] implementation details".
  3. Действие системы (Механизм 1): Google определяет (на основе сущности в запросе), что тема связана с Германией, и переводит запрос на немецкий язык (L2).
  4. Поиск: Система ищет в немецкоязычном индексе.
  5. Результат: Находится официальная документация на немецком языке.
  6. Представление: Google переводит заголовок и сниппет на английский и показывает в выдаче. При клике пользователю предлагается полный перевод страницы.

Сценарий 2: Глобальный охват авторитетного контента (Document Translation)

  1. Ситуация: Авторитетный медицинский портал на английском языке (L2) публикует статью о новом методе лечения.
  2. Действие системы (Механизм 2): Google индексирует статью и, учитывая авторитетность сайта и важность темы (YMYL), заранее переводит ее на несколько основных языков, включая испанский (L1).
  3. Запрос (L1, Испанский): Испаноговорящий пользователь ищет информацию об этом методе лечения.
  4. Поиск: Google сравнивает испанский запрос с испанским индексом, который включает автоматически переведенную версию английской статьи.
  5. Результат: Переведенная статья появляется в выдаче испанского пользователя, так как она признана наиболее авторитетным источником.

Вопросы и ответы

Какие два основных метода кросс-языкового поиска (CLIR) описаны в патенте?

В патенте описаны два ключевых метода. Первый — Query Translation (Перевод запроса): запрос пользователя переводится на иностранные языки, и поиск ведется в индексах этих языков. Второй — Document Translation (Перевод документа): контент сайтов заранее переводится на разные языки, и поиск ведется по унифицированному или переведенному индексу на языке пользователя.

Означает ли этот патент, что мне не нужно переводить свой сайт вручную?

Не совсем. Хотя Google может автоматически переводить ваш контент или запросы пользователей для обеспечения видимости, качество автоматического перевода варьируется. Профессиональная локализация почти всегда обеспечивает лучший пользовательский опыт, более точную передачу смысла и лучшие конверсии. Механизмы CLIR скорее обеспечивают базовую видимость там, где локализация отсутствует или нерентабельна.

Как оптимизировать контент для машинного перевода Google (MTO)?

Используйте ясный, грамматически правильный и структурированный язык. Избегайте сложных конструкций, двусмысленностей, сленга и идиом. Сосредоточьтесь на четком изложении фактов и сущностей. Чем проще и понятнее текст для человека, тем точнее будет машинный перевод, что повысит шансы на корректное сопоставление в рамках CLIR.

Как Google решает, на какие языки переводить запрос?

Согласно патенту (Claim 1), система может определять целевой язык для перевода на основе содержания самого поискового запроса (based on the content included in the search query). Это означает, что система анализирует тематику, сущности или интент запроса, чтобы определить, в каких языковых корпусах может находиться лучшая информация. Также могут использоваться настройки пользователя и история поиска.

Что такое промежуточный язык (Intermediate Language) и как он используется?

Промежуточный язык — это язык-посредник в процессе перевода (Claim 3), часто английский. Вместо прямого перевода с Языка А на Язык Б, система переводит А на Английский, а затем с Английского на Б. Это может использоваться для упрощения архитектуры перевода или когда модель прямого перевода между А и Б отсутствует или имеет низкое качество.

Влияет ли этот патент на работу с hreflang?

Патент напрямую не упоминает hreflang. Hreflang помогает Google показать пользователю предпочитаемую локализованную версию сайта. Механизмы CLIR, описанные в патенте, скорее являются дополнением или запасным вариантом, который позволяет найти контент, когда предпочитаемая языковая версия отсутствует, нерелевантна или hreflang не настроен.

Может ли мой англоязычный сайт ранжироваться в Google.de по немецким запросам?

Да, это возможно благодаря описанным механизмам. Если Google определит, что ваш англоязычный контент является высокорелевантным ответу на немецкий запрос (после применения Query Translation или Document Translation), он может показать ваш сайт в выдаче Google.de. При этом заголовок и сниппет будут автоматически переведены на немецкий язык.

Актуален ли этот патент, учитывая развитие нейронного машинного перевода (NMT)?

Да, стратегии, описанные в патенте (Query Translation и Document Translation), абсолютно актуальны и лежат в основе современного кросс-языкового поиска. Развитие NMT значительно повысило качество и эффективность этих методов, сделав их еще более важными в архитектуре Google.

Как система идентифицирует язык документа или запроса?

Патент упоминает несколько сигналов для идентификации языка контента: доменное имя (например, .de), набор используемых символов (character set) и словарь (vocabulary) текста. Для запросов также может использоваться тип символов, языковые настройки браузера пользователя или домен поисковой системы.

Применяется ли этот механизм к поиску по картинкам или видео?

Хотя патент фокусируется на тексте, в описании упоминается, что система и методы могут быть использованы для поиска других форм контента (аудио, видео) на основе их переводов в текст или контент того же типа на другом языке. Это означает, что метаданные и текстовое сопровождение медиафайлов также участвуют в кросс-языковом поиске.

Похожие патенты

Как Google реализует кросс-языковой поиск (CLIR) с интерактивным уточнением переведенного запроса
Google использует систему кросс-языкового поиска (CLIR), которая переводит запрос пользователя на целевой язык, выполняет поиск и переводит результаты обратно. Ключевая особенность — интерактивный интерфейс, позволяющий пользователю отредактировать машинный перевод запроса или выбрать альтернативные варианты для повышения точности выдачи.
  • US8799307B2
  • 2014-08-05
  • Мультиязычность

  • Семантика и интент

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google решает, когда переводить запрос пользователя на другие языки, а когда уважать его языковой выбор
Google использует систему фильтрации для управления межъязыковым поиском (CLIR). Система анализирует язык запроса, язык интерфейса пользователя и его местоположение. Если пользователь вводит запрос на языке, отличном от языка интерфейса, Google предполагает мультиязычность и не переводит запрос, экономя ресурсы. Перевод активируется, если язык запроса совпадает с языком интерфейса, особенно если локальных результатов мало.
  • US9824147B1
  • 2017-11-21
  • Мультиязычность

  • Персонализация

  • Семантика и интент

Как Google автоматически определяет, на каких языках искать ответ на запрос пользователя (CLIR)
Google использует механизм для автоматического определения наиболее релевантных языков для поиска по запросу пользователя. Система анализирует термины, связанные с запросом, и их привязку к различным языкам на основе структурированных данных (например, Википедии). Если система определяет, что ценный контент существует на других языках, она переводит запрос, выполняет поиск и подмешивает переведенные результаты в выдачу.
  • US8862595B1
  • 2014-10-14
  • Мультиязычность

Как Google определяет многоязычных пользователей и показывает им результаты на языке, отличном от языка запроса
Google использует механизм для идентификации пользователей, владеющих несколькими языками, анализируя язык текущего запроса, местоположение пользователя и историю его активности. Если пользователь находится в регионе с доминирующим языком (L2), но ищет на другом языке (L1), и система подтверждает владение обоими, Google переводит запрос на L2 и ищет контент на обоих языках. Это позволяет показывать наиболее релевантные результаты, даже если их язык отличается от языка запроса.
  • US20230325421A1
  • 2023-10-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Популярные патенты

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске
Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").
  • US8782030B1
  • 2014-07-15
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует машинное обучение для прогнозирования желаемого типа контента (Web, Images, News) и формирования смешанной выдачи (Universal Search)
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
  • US7584177B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
  • US9165040B1
  • 2015-10-20
  • Ссылки

  • EEAT и качество

  • Антиспам

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
  • US20140108445A1
  • 2014-04-17
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

seohardcore