SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает лучший перевод для межъязыковых подсказок в автокомплите, сравнивая N-граммы

DETERMINING CROSS-LANGUAGE QUERY SUGGESTION BASED ON QUERY TRANSLATIONS (Определение межъязыковых вариантов запроса на основе переводов запроса)
  • US20120330919A1
  • Google LLC
  • 2011-09-29
  • 2012-12-27
  • Мультиязычность
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует этот механизм для улучшения качества межъязыковых поисковых подсказок (автокомплита), особенно для смешанных запросов. Если автоматическое определение языка затруднено, система генерирует два перевода в разных направлениях (Язык A -> Язык B и Язык B -> Язык A). Затем она сравнивает их с оригиналом с помощью N-грамм. Перевод, который максимально отличается от оригинала, выбирается как наилучшая межъязыковая подсказка.

Описание

Какую проблему решает

Патент решает проблему низкого качества автоматического перевода для межъязыковых поисковых подсказок (cross-language query suggestions), возникающую из-за ошибок в автоматическом определении исходного языка. Это особенно актуально для смешанных запросов (mixed language queries), содержащих слова из разных языков, или терминов, существующих в нескольких языках. Если система неверно определяет исходный язык, машинный перевод часто возвращает исходный запрос без изменений, делая межъязыковую подсказку бесполезной.

Что запатентовано

Запатентован метод выбора наилучшего варианта машинного перевода для использования в качестве межъязыковой поисковой подсказки. Система генерирует пару переводов в противоположных направлениях между двумя языками (например, предпочитаемыми языками пользователя). Затем она использует анализ N-грамм для определения степени различия между оригинальной подсказкой и каждым из переводов. Изобретение основано на предположении, что перевод, который меньше всего похож на оригинал (имеет наименьшее количество общих N-грамм), является более качественным и эффективным межъязыковым запросом.

Как это работает

Система работает следующим образом:

  • Получение подсказки: Система получает исходную поисковую подсказку (primary-language query suggestion, Q).
  • Двунаправленный перевод: Запрашивается два перевода: из Языка A в Язык B (QABQ_{AB}QAB​) и из Языка B в Язык A (QBAQ_{BA}QBA​).
  • Генерация N-грамм: Для оригинала и обоих переводов генерируются наборы N-грамм (например, биграмм, n=2).
  • Сравнение: Подсчитывается количество общих N-грамм между оригиналом и QABQ_{AB}QAB​, а также между оригиналом и QBAQ_{BA}QBA​.
  • Выбор: В качестве межъязыковой подсказки выбирается тот перевод, который имеет наименьшее количество общих N-грамм с оригиналом.
  • Разрешение ничьи: Если количество общих N-грамм одинаково, выбирается более короткий перевод.

Актуальность для SEO

Средняя. Технологии машинного перевода (NMT) и понимания языка (например, MUM) значительно продвинулись с 2011 года и могут лучше справляться с определением языка и переводом смешанных запросов. Однако описанный механизм сравнения на основе N-грамм для валидации качества перевода в условиях неопределенности исходного языка остается логичным и вычислительно эффективным подходом. Он может по-прежнему использоваться как часть систем автокомплита для быстрой фильтрации очевидно неверных переводов.

Важность для SEO

Влияние на SEO минимальное (3/10). Патент описывает инфраструктурный механизм для улучшения пользовательского опыта в системе поисковых подсказок (Автокомплит), а не алгоритм ранжирования. Он не влияет на то, как индексируются или ранжируются веб-страницы. Однако он косвенно влияет на SEO, определяя, какие именно межъязыковые запросы будут предложены пользователям, что может изменить структуру трафика для мультиязычных сайтов и сайтов, таргетирующихся на регионы со смешанным языковым использованием.

Детальный разбор

Термины и определения

Cross-language query suggestion (Межъязыковая подсказка запроса, QXYQ_{XY}QXY​)
Поисковая подсказка, предложенная пользователю, которая является переводом исходной подсказки на другой язык. Цель — помочь пользователю найти контент на этом другом языке.
Machine-generated translation (Машинный перевод)
Текст, полученный в результате автоматического перевода с одного языка на другой с помощью Translation Service.
Mixed language query (Смешанный запрос)
Запрос, содержащий слова или символы из разных языков или систем письма (например, "Autobot 玩具").
N-gram (N-грамма)
Последовательность из N элементов (в данном патенте — символов) из заданной текстовой строки. Используется как мера текстуального сходства или различия.
Primary-language query suggestion (Исходная подсказка запроса, Q)
Поисковая подсказка, сгенерированная на основе ввода пользователя, обычно на том же языке, что и ввод, или на предпочитаемом пользователем основном языке.
Suggestion Service (Служба подсказок)
Компонент поисковой системы, отвечающий за генерацию поисковых подсказок (автокомплита) в ответ на ввод пользователя.
Translation Comparator (Компаратор переводов)
Ключевой модуль изобретения, который запрашивает несколько вариантов перевода, сравнивает их с оригиналом с помощью N-грамм и выбирает наиболее подходящий (наименее похожий на оригинал).
Translation Service (Служба перевода)
Система машинного перевода, которая принимает текст, исходный язык и целевой язык, и возвращает перевод.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора межъязыковой подсказки с учетом предпочтений пользователя.

  1. Система получает исходную подсказку (Q).
  2. Получаются два машинных перевода: первый (T1) из Языка A в Язык B, и второй (T2) из Языка B в Язык A. Языки A и B определены как предпочитаемые языки пользователя для исходных и межъязыковых подсказок соответственно.
  3. Для T1 и T2 определяется количество (count) общих N-грамм с Q.
  4. В качестве межъязыковой подсказки выбирается тот перевод (T1 или T2), который имеет меньшее (smaller) количество общих N-грамм с Q.

Claim 2 (Независимый пункт): Более общая формулировка метода.

  1. Система получает подсказку (Q).
  2. Получаются два перевода (T1: A->B, T2: B->A).
  3. Межъязыковая подсказка определяется на основе сравнения последовательностей N-грамм Q с T1 и Q с T2.

Claim 9 (Зависимый от 2): Уточняет критерий выбора из Claim 2.

Выбирается перевод, для которого было идентифицировано меньшее количество общих N-грамм с оригиналом.

Claim 10 (Зависимый от 9): Описывает механизм разрешения ничьих (tie-breaker).

Если количество общих N-грамм для T1 и T2 одинаково, выбирается тот перевод, который имеет меньшую длину в символах (smaller character length).

Где и как применяется

Изобретение применяется исключительно в рамках системы генерации поисковых подсказок (Автокомплит).

QUNDERSTANDING – Понимание Запросов

На этом этапе система обрабатывает ввод пользователя в реальном времени для генерации подсказок.

  • Suggestion Service: Генерирует список исходных подсказок (Primary-language query suggestions).
  • Translation Comparator: Активируется для генерации межъязыковых вариантов. Этот модуль (который может находиться на сервере или клиенте) взаимодействует с Translation Service.
  • Translation Service: Выполняет машинный перевод по запросу.

Входные данные:

  • Исходная поисковая подсказка (Q).
  • Предпочитаемый основной язык пользователя (Язык A).
  • Предпочитаемый второй язык пользователя (Язык B).

Выходные данные:

  • Выбранная межъязыковая поисковая подсказка (QXYQ_{XY}QXY​).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на mixed language queries (например, бренд на английском + категория на русском) и запросы, содержащие термины, которые трудно однозначно идентифицировать по языку (имена собственные, интернационализмы). Пример в патенте: "Mousse au Chocolat", который может быть ошибочно принят за английский вместо французского.
  • Географические ограничения: Механизм особенно важен в регионах с высоким уровнем мультиязычности (например, Индия, Сингапур, Гонконг, страны Европы), где пользователи часто смешивают языки в запросах.

Когда применяется

  • Условия работы алгоритма: Алгоритм применяется в процессе генерации поисковых подсказок в реальном времени, когда пользователь вводит запрос в строку поиска.
  • Триггеры активации: Активируется, когда система настроена на предоставление межъязыковых подсказок. В патенте также упоминается, что этот процесс сравнения может быть активирован, если автоматическое определение языка исходной подсказки является неопределенным (например, обнаружены слова из разных языков).

Пошаговый алгоритм

Процесс работы Translation Comparator:

  1. Получение входных данных: Система получает исходную подсказку (Q) и пару языков (A и B, основанных на предпочтениях пользователя).
  2. Запрос переводов: Модуль Translation Requesting Module отправляет два запроса в Translation Service:
    • Запрос 1: Перевести Q с Языка A на Язык B.
    • Запрос 2: Перевести Q с Языка B на Язык A.
  3. Получение результатов перевода: Система получает два варианта перевода: QABQ_{AB}QAB​ и QBAQ_{BA}QBA​.
  4. Генерация N-грамм: n-Gram Generator обрабатывает Q, QABQ_{AB}QAB​ и QBAQ_{BA}QBA​, создавая наборы последовательностей символов длины N (часто N=2).
  5. Сравнение N-грамм: n-Gram Comparator подсчитывает:
    • Count 1: Количество общих N-грамм между Q и QABQ_{AB}QAB​.
    • Count 2: Количество общих N-грамм между Q и QBAQ_{BA}QBA​.
  6. Выбор перевода: Translation Selection Module сравнивает Count 1 и Count 2.
    • Выбирается перевод с наименьшим значением Count (наименее похожий на оригинал).
    • Если Count 1 = Count 2, выбирается перевод с наименьшей длиной в символах (smaller character length).
  7. Вывод результата: Выбранный перевод возвращается как межъязыковая подсказка (QXYQ_{XY}QXY​).

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке текстовых строк и пользовательских настроек. Факторы ранжирования не упоминаются.

  • Контентные факторы: Текст исходной поисковой подсказки (последовательность символов, например, в Unicode). Тексты полученных машинных переводов.
  • Пользовательские факторы (Настройки): Предпочитаемый язык для исходных подсказок (preferred language for primary-language query suggestions). Предпочитаемый язык для межъязыковых подсказок (preferred language for cross-language query suggestions).
  • Системные данные: Автоматически определенный язык подсказки (automatically detected language) может использоваться как дополнительный вариант для выбора языков перевода.

Какие метрики используются и как они считаются

  • Count of common N-grams (Количество общих N-грамм): Основная метрика для оценки сходства. Подсчитывается путем сравнения наборов N-грамм, сгенерированных из двух сравниваемых строк.
  • N (Размер N-граммы): Целочисленная константа. В патенте часто используется N=2 (биграммы). Упоминается, что N может выбираться на основе длин запросов или характеристик задействованных языков (например, сходство языков, средняя длина слов).
  • Character length (Длина в символах): Используется как вторичная метрика (tie-breaker). Предпочтение отдается более коротким переводам при равном количестве общих N-грамм.

Выводы

  1. Различие как индикатор качества перевода: Ключевая идея патента заключается в том, что в контексте автокомплита успешный перевод должен значительно отличаться от оригинала на уровне символов (N-грамм). Если перевод слишком похож на оригинал, это считается признаком того, что система перевода не смогла корректно обработать запрос, часто из-за неверного определения исходного языка.
  2. Решение проблемы смешанных запросов: Механизм специально разработан для обработки mixed language queries. Вместо того чтобы полагаться на ненадежное автоматическое определение языка, система тестирует оба возможных направления перевода между предпочтительными языками пользователя и выбирает лучший результат.
  3. Фокус на UX в автокомплите: Изобретение направлено на улучшение пользовательского опыта путем предотвращения показа бесполезных межъязыковых подсказок, которые идентичны исходным.
  4. Предпочтение краткости: При одинаковом количестве общих N-грамм предпочтение отдается более короткому переводу (smaller character length), что указывает на стремление к лаконичности подсказок.
  5. Техническая эффективность: Использование N-грамм является вычислительно эффективным методом для быстрой оценки качества перевода в реальном времени, что критично для систем автокомплита.

Практика

Best practices (это мы делаем)

Хотя патент описывает внутренние механизмы автокомплита и не дает прямых рекомендаций по ранжированию, он дает понимание того, как Google обрабатывает мультиязычные и смешанные запросы в подсказках.

  • Анализ автокомплита для смешанных запросов: При работе в мультиязычных регионах (Индия, ЮВА, Европа) обращайте внимание на то, как Google Suggest обрабатывает смешанные запросы, связанные с вашим брендом или продуктом (например, "Бренд + категория на другом языке"). Понимание того, какие переводы предлагает Google, поможет лучше понять интент пользователей и оптимизировать контент под эти формулировки.
  • Оптимизация под смешанные запросы: Если ваша аудитория часто использует смешанные запросы (например, в технической сфере или гейминге), убедитесь, что ваш контент релевантен для таких формулировок. Это повышает вероятность того, что ваш сайт будет соответствовать запросам, сгенерированным через автокомплит.
  • Четкое указание языка контента: Используйте корректные технические сигналы (HTML lang атрибут, hreflang для мультиязычных сайтов), чтобы помочь поисковым системам правильно ассоциировать ваш контент с языком запроса, который пользователь в итоге выберет из подсказок.

Worst practices (это делать не надо)

  • Игнорирование мультиязычного поиска: Недооценка сложности обработки смешанных запросов. Если вы работаете на международном рынке, нельзя предполагать, что пользователи ищут только на одном языке или что Google всегда идеально переводит их намерения.
  • Смешивание языков в контенте одной страницы: Создание контента, который хаотично смешивает несколько языков на одной странице без четкой структуры, может затруднить его обработку. Хотя Google имеет механизмы для обработки смешанных запросов (как показано в патенте), смешанный контент может быть сложнее классифицировать.

Стратегическое значение

Патент подчеркивает технические вызовы при обработке мультиязычного контента и важность межъязыкового поиска (Cross-Language Information Retrieval). Он демонстрирует, что даже для автокомплита требуются механизмы валидации для обеспечения качества. Для SEO-специалистов это напоминание о том, что язык является критически важным аспектом поиска и что необходимо уделять внимание точности языкового и регионального таргетинга, особенно при работе со смешанными языковыми средами.

Практические примеры

Сценарий: Обработка смешанного запроса в автокомплите (Пример из патента)

  1. Контекст: Пользователь предпочитает A=Китайский, B=Английский.
  2. Исходная подсказка (Q): "Autobot 玩具" (Autobot + "игрушка" на китайском). Это mixed language query.
  3. Проблема: Автоматическое определение языка ошибочно определяет Q как Немецкий.
  4. Применение механизма: Система использует предпочитаемые языки A и B.
    • Перевод 1 (QABQ_{AB}QAB​): Китайский -> Английский = "Autobot toys".
    • Перевод 2 (QBAQ_{BA}QBA​): Английский -> Китайский = "汽车人玩具" (Полностью китайский перевод).
  5. Сравнение N-грамм (N=2):
    • Q и QABQ_{AB}QAB​ ("Autobot toys"): Много общих биграмм (например, au, ut, to, ob, ot). В патенте указано 4 общих биграммы.
    • Q и QBAQ_{BA}QBA​ ("汽车人玩具"): Мало общих биграмм. В патенте указана 1 общая биграмма (или 0, в зависимости от метода подсчета).
  6. Результат: Система выбирает QBAQ_{BA}QBA​ ("汽车人玩具") как межъязыковую подсказку, так как он сильнее отличается от оригинала Q.

Вопросы и ответы

Влияет ли этот патент на алгоритмы ранжирования?

Нет, этот патент не описывает механизмы ранжирования веб-страниц. Он касается исключительно работы системы поисковых подсказок (Suggestion Service или Автокомплит). Его цель — улучшить качество предлагаемых переводов запросов в выпадающем списке подсказок, а не изменить порядок результатов в поисковой выдаче.

Что такое N-граммы и почему они используются здесь?

N-граммы — это последовательности из N символов в тексте (например, при N=2 для слова "Google" биграммы будут Go, oo, og, gl, le). Они используются как быстрый и вычислительно эффективный способ оценить текстуальное сходство между двумя строками. В контексте патента, если перевод имеет много общих N-грамм с оригиналом, система считает, что перевод не удался (текст остался прежним).

Почему система выбирает перевод, который наименее похож на оригинал?

Логика заключается в валидации перевода. Если система пытается перевести запрос, но из-за ошибки в определении исходного языка возвращает тот же самый текст, то этот "перевод" будет максимально похож на оригинал. Выбирая наименее похожий вариант из нескольких попыток перевода в разных направлениях, система максимизирует вероятность того, что был выбран действительно успешный перевод на другой язык.

Что такое смешанные запросы (mixed language queries) и почему они важны?

Смешанные запросы содержат элементы разных языков (например, "iPhone 15 обзор"). Они очень распространены в мультиязычных регионах и в тематиках с большим количеством заимствованных слов или брендов. Они представляют сложность для поисковых систем, так как трудно определить основной язык и интент. Этот патент предлагает решение для корректной обработки таких запросов в автокомплите.

Как система определяет, какие языки использовать для перевода (Язык A и Язык B)?

В патенте указано, что Язык A и Язык B обычно соответствуют предпочитаемым языкам пользователя (user-specified preferred language), указанным в настройках аккаунта или определенным на основе истории поиска. Также система может использовать автоматически определенный язык запроса в комбинации с предпочитаемыми языками.

Что произойдет, если оба перевода одинаково (не)похожи на оригинал?

В патенте предусмотрен механизм разрешения ничьих (tie-breaker). Если количество общих N-грамм одинаково для обоих переводов, система выберет тот перевод, который короче по количеству символов (smaller character length). Предполагается, что более короткий перевод является более лаконичным и лучшим запросом.

Актуален ли этот метод, учитывая развитие нейронных сетей для перевода (NMT)?

Современные системы перевода (NMT) более совершенны, чем те, что были доступны в 2011 году. Они лучше справляются с определением языка и переводом смешанных запросов. Однако описанный в патенте подход к валидации (сравнение результатов разных направлений перевода) остается актуальным как быстрый способ контроля качества в системах реального времени.

Как этот патент влияет на мою стратегию мультиязычного SEO?

Прямое влияние минимально, но он подчеркивает важность понимания того, как ваша аудитория ищет информацию на разных языках. Стоит анализировать автокомплит в целевых регионах, чтобы увидеть, предлагает ли Google переводы для ваших ключевых запросов и насколько они корректны. Это может дать инсайты для оптимизации контента под смешанные и переведенные запросы.

Может ли этот механизм привести к показу неправильного перевода?

Да, это возможно. Метод основан на эвристике (различие = качество), которая не всегда гарантирует семантическую точность перевода. Система выбирает наиболее отличающийся текст, предполагая, что он является лучшим переводом, но не анализирует его смысл глубоко. Однако цель здесь — предоставить полезную альтернативу, а не идеальный перевод.

Применяется ли этот механизм только для языков с разными алфавитами (например, Английский и Китайский)?

Нет, механизм универсален и работает на уровне символов (например, Unicode). Он может применяться и для близкородственных языков (например, Испанский и Португальский), если автоматическое определение языка затруднено. Однако эффективность метода (разница в количестве общих N-грамм) может быть выше для языков с разными системами письма.

Похожие патенты

Как Google использует логи запросов, чтобы выбирать лучшие переводы для межъязыковых подсказок в Autocomplete
Google разработал систему для улучшения качества межъязыковых поисковых подсказок (Autocomplete). Вместо буквального перевода система оценивает различные варианты перевода, отдавая предпочтение тем фразам, которые чаще всего используются носителями целевого языка в качестве реальных поисковых запросов. Это гарантирует, что предложенная подсказка является не только точным переводом, но и эффективным поисковым запросом.
  • US20120330990A1
  • 2012-12-27
  • Мультиязычность

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет язык смешанных запросов с помощью посимвольного анализа на стороне клиента
Google использует легковесный механизм для определения языка поисковых подсказок, который может выполняться на стороне клиента. Система анализирует каждый символ подсказки и оценивает, насколько он уникален для разных языков, используя локальную базу данных. Это позволяет точно определить исходный язык даже для смешанных запросов (например, Английский + Китайский) и обеспечить качественный машинный перевод кросс-язычных подсказок.
  • US20120330989A1
  • 2012-12-27
  • Мультиязычность

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google Autocomplete обрабатывает запросы, смешивающие разные языки и форматы ввода (например, иероглифы, пиньинь и английский)
Google использует механизм для генерации поисковых подсказок (Autocomplete), когда пользователь вводит запрос, смешивая разные языки или системы письма. Система создает альтернативные, "неоднозначные" представления ввода, запрашивает подсказки и фильтрует их. Это позволяет корректно интерпретировать сложный ввод (например, сочетание китайских иероглифов, пиньиня и английских слов) и предлагать релевантные варианты.
  • US20120203541A1
  • 2012-08-09
  • Мультиязычность

  • Семантика и интент

Как Google переписывает запросы на естественном языке для поиска более качественных результатов
Google использует систему для улучшения результатов поиска по запросам на естественном языке. Если первоначальная выдача не удовлетворяет требованиям качества (например, отсутствуют прямые ответы или релевантность низкая), система генерирует и тестирует альтернативные, переписанные версии запроса. Если альтернативная версия дает лучшие результаты, они заменяют или дополняют исходную выдачу.
  • US20170270159A1
  • 2017-09-21
  • Семантика и интент

  • SERP

Популярные патенты

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
  • US10073911B2
  • 2018-09-11
  • Индексация

  • Краулинг

  • Ссылки

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)
Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.
  • US9128993B2
  • 2015-09-08
  • Ссылки

  • SERP

  • Индексация

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

seohardcore