
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
Патент решает проблему кросс-язычного информационного поиска (Cross-Lingual Information Retrieval, CLIR). Основная задача — позволить пользователю искать контент на одном языке (или в одном наборе символов, например, Кандзи), используя запрос на другом языке (или наборе символов, например, Ромадзи). Система направлена на автоматическое обнаружение переводов и синонимов, включая сленг и имена собственные, для которых может не быть записей в стандартных словарях, и преодоление ограничений традиционных словарей.
Второстепенная задача — обработка неоднозначных запросов (ambiguous search queries), например, введенных с цифровой клавиатуры телефона.
Запатентована система перевода запросов с использованием Probabilistic Dictionary (вероятностного словаря). Ключевая особенность изобретения заключается в методах автоматического создания и уточнения этого словаря. Словарь генерируется путем анализа aligned text (выровненного/параллельного текста), в частности anchor text (анкорных текстов) на разных языках, указывающих на одну и ту же страницу. Вероятности перевода в словаре уточняются с использованием обратной связи от пользователей (click data).
Система работает в двух основных режимах:
aligned anchor text). Анализируя частоту терминов в этих параллельных анкорах, система вычисляет вероятность того, что Термин А на Языке 1 является переводом Термина Б на Языке 2.Probabilistic Dictionary для генерации одного или нескольких вероятных переводов на Язык 2 (часто через расширение запроса). Поиск выполняется по этим переводам. Система отслеживает, на какие результаты кликает пользователь (click data). Если пользователи предпочитают результаты, соответствующие определенному варианту перевода, вероятность этого перевода в словаре увеличивается.Высокая. Кросс-язычный поиск (CLIR) и автоматическое понимание синонимов и переводов являются фундаментальными аспектами современного глобального поиска. Использование анкорного текста как источника семантических данных остается критически важным механизмом. Кроме того, использование поведенческих данных (кликов) для валидации и уточнения алгоритмических моделей является стандартом в поиске, основанном на машинном обучении.
Патент имеет высокое значение для SEO (8/10), особенно в международном продвижении. Он раскрывает конкретный механизм, с помощью которого Google использует анкорный текст не только для оценки авторитетности, но и для глубокого семантического анализа и автоматического обнаружения переводов. Это подчеркивает критическую важность глобальной ссылочной стратегии: качество и точность анкор-текстов на целевом языке напрямую влияют на способность сайта ранжироваться в международном поиске.
Aligned Text. Это анкорные тексты на разных языках, которые указывают на одну и ту же целевую страницу.Анализ сфокусирован на механизме кросс-язычного поиска (CLIR), описанном в Claims 1-18.
Claim 1 (Независимый пункт): Описывает процесс использования и уточнения вероятностного словаря через взаимодействие с пользователем.
Probabilistic Dictionary в группу переведенных запросов во втором формате. Словарь содержит сопоставления терминов с расчетными вероятностями (calculated probability).click data, указывающие на выбор пользователем одного или нескольких результатов.Probabilistic Dictionary модифицируется на основе полученных click data, и происходит корректировка как минимум одной вероятности, связанной с сопоставлениями в словаре.Ядром изобретения является механизм обратной связи. Google алгоритмически проверяет точность своих автоматических переводов, используя реальное поведение пользователей. Если система не уверена в переводе, она тестирует варианты в выдаче и корректирует модель на основе того, какой вариант пользователи выбирают чаще.
Claims 2-6 (Зависимые пункты): Уточняют механизм перевода (Шаг 2 в Claim 1).
expanding the search query) для создания расширенного запроса (expanded search query).alternative encodings), альтернативные языковые переводы (alternative language translations) и синонимы (synonyms) терминов запроса.Изобретение затрагивает несколько ключевых этапов поиска, связывая данные индексирования с пониманием запросов и используя поведенческие данные для улучшения моделей.
CRAWLING и INDEXING – Сканирование и Индексирование
На этих этапах собираются и индексируются данные, необходимые для работы системы: веб-страницы и, что критически важно, anchor text ссылок, ведущих на них, с указанием языка/набора символов анкоров.
(Офлайн/Фоновые процессы)
Происходит построение и обновление Probabilistic Dictionary. Это включает анализ параллельных анкоров (aligned anchor text) для расчета исходных вероятностей перевода. Также анализируются логи click data для уточнения этих вероятностей в соответствии с Claim 1.
QUNDERSTANDING – Понимание Запросов
Основное применение патента в реальном времени. При получении запроса система использует Probabilistic Dictionary для его перевода в потенциальные запросы на целевом языке. Также происходит расширение запроса (Query Expansion) с добавлением высоковероятных переводов и синонимов.
RANKING – Ранжирование
Поисковая система выполняет поиск по расширенным и/или переведенным запросам.
RERANKING / Feedback Loop (Обратная связь)
После показа результатов система собирает click data для валидации качества перевода и последующего обновления Probabilistic Dictionary.
Входные данные:
Probabilistic Dictionary (для перевода).Click Data) (для уточнения словаря).Выходные данные:
Probabilistic Dictionary с уточненными вероятностями.Probabilistic Dictionary.Процесс А: Построение Вероятностного Словаря (Офлайн)
aligned anchor text).Probabilistic Dictionary.Процесс Б: Обработка запроса и обратная связь (Онлайн)
Probabilistic Dictionary для генерации одного или нескольких вариантов перевода запроса на Язык B. Запрос расширяется (Query Expansion).click data – какие результаты выбирает пользователь.click data система корректирует вероятности в Probabilistic Dictionary. Если пользователи часто кликают на результаты, соответствующие переводу X, и редко на результаты, соответствующие переводу Y, вероятность перевода X увеличивается.Патент фокусируется на использовании ссылочных и поведенческих данных для понимания языка.
Anchor text является критически важным. Система анализирует текст анкоров и URL, на которые они указывают. Ключевым элементом является обнаружение aligned anchor text — сравнение анкоров на разных языках, ведущих на один и тот же URL.Click data используется для уточнения и валидации автоматических переводов. Также упоминается использование истории поисковой сессии пользователя (query session history) для разрешения неоднозначности запросов.aligned text, например, параллельные корпусы текстов (статьи, переведенные на несколько языков).aligned text. Если термин TB встречается N раз в анкорах на языке B, которые ссылаются на те же страницы, что и анкоры с термином TA на языке A, а общее количество терминов в этих анкорах на языке B равно M, то базовая вероятность P(TA=TB) может быть рассчитана как N/M.anchor text не только как сигнал ранжирования (авторитетности), но и как ключевой источник данных для семантического понимания, обнаружения синонимов и автоматического перевода. Анализ параллельных анкоров позволяет строить языковые модели без ручного создания словарей.click data) в качестве механизма обратной связи для валидации и корректировки своих алгоритмических предположений. Это позволяет словарю адаптироваться к изменениям в языке и поведении пользователей.Probabilistic Dictionary и часто реализует перевод через расширение запроса (Query Expansion) путем добавления вероятных переводов и синонимов для увеличения полноты выдачи (Recall).Probabilistic Dictionary.click data используется для уточнения вероятностей перевода, крайне важно, чтобы ваш контент и сниппеты точно соответствовали интенту. Удовлетворенность пользователя валидирует правильность перевода для Google.Probabilistic Dictionary и привести к неверным ассоциациям терминов.Этот патент подтверждает стратегическую важность анкор-текста как одного из самых сильных сигналов для понимания контента поисковой системой. Он демонстрирует, что линкбилдинг — это не только передача авторитета, но и обучение Google терминологии вашей ниши. Для успешного международного SEO необходимо интегрировать сайт в лингвистическую экосистему целевого региона. Локализованный линкбилдинг является необходимым условием для того, чтобы Google смог точно интерпретировать и "перевести" ключевые концепции вашего бизнеса.
Сценарий: Обучение Google переводу названия продукта через международный линкбилдинг
aligned anchor text. Он видит, что анкоры "AquaGlove review" и "GuanteAcuatico revision" часто указывают на один и тот же контент.Probabilistic Dictionary запись о том, что "AquaGlove" с высокой вероятностью переводится как "GuanteAcuatico". Теперь, если пользователь ищет "AquaGlove" в Испании, Google может расширить запрос, включив "GuanteAcuatico", улучшая качество поиска.Что такое "параллельные анкорные тексты" (Aligned/Parallel Anchor Text) и почему они важны?
Параллельные анкорные тексты — это анкоры на разных языках (или в разных наборах символов), которые указывают на одну и ту же целевую страницу. Они критически важны, так как Google использует их для автоматического построения словаря переводов. Анализируя частоту терминов в этих параллельных анкорах, система может определить, как слова переводятся с одного языка на другой, не прибегая к ручному труду.
Как именно Google использует клики пользователей (Click Data) для уточнения переводов?
Патент описывает механизм обратной связи. Если система не уверена в переводе (например, есть два варианта с вероятностью 50/50), она может показать результаты для обоих вариантов. Если пользователи систематически кликают на результаты, соответствующие Варианту А, и игнорируют Вариант Б, система увеличивает вероятность Варианта А в своем Probabilistic Dictionary. Клики служат механизмом валидации алгоритмических предположений.
Насколько важен анкор-текст для международного SEO в свете этого патента?
Его важность критически высока. Патент показывает, что анкор-текст является основным источником данных для понимания и перевода терминов между языками. Для успешного продвижения на международном рынке необходимо иметь качественные обратные ссылки с точными и релевантными анкор-текстами на целевом языке.
Может ли мой сайт ранжироваться по запросам на языке, на котором у меня нет контента?
Да, это возможно благодаря механизму CLIR, описанному в патенте. Если Google с высокой вероятностью определил перевод ключевых терминов вашего контента на другой язык (через анализ анкоров), он может перевести запрос пользователя на ваш язык, найти релевантный контент на вашем сайте и показать его в выдаче. Однако для стабильного ранжирования рекомендуется иметь локализованный контент.
Может ли эта система переводить сленг, идиомы или новые слова?
Да, это одно из ключевых преимуществ. Поскольку система строит словарь автоматически на основе анализа реального использования терминов в анкорных текстах в интернете, она может обнаруживать переводы для сленга, новых терминов или имен собственных, которых нет в стандартных словарях. Если термин начинает активно использоваться в анкорах, система его изучит.
Использует ли Google этот механизм для перевода внутри одного языка (например, синонимы)?
Да, патент упоминает, что механизм может использоваться не только для перевода между языками или наборами символов, но и для идентификации синонимов (Claim 4). Если два разных анкора на одном языке часто указывают на одну и ту же страницу, система может сделать вывод, что термины в этих анкорах являются синонимами, и использовать это для расширения запроса.
Что делать, если Google неправильно переводит ключевые термины моего бизнеса?
Это указывает на недостаток или неточность данных в Probabilistic Dictionary для вашей ниши. Необходимо активизировать работу по получению качественных обратных ссылок с авторитетных сайтов на целевом языке, используя в анкорах правильную терминологию. Консистентность и частота правильных анкоров помогут системе скорректировать вероятности перевода.
Учитывает ли система длину анкора при переводе?
Да, патент упоминает возможность взвешивания анкоров. Система может отдавать предпочтение (больший вес) тем анкорам, длина которых (количество слов) схожа с длиной исходного термина или других параллельных анкоров. Это помогает отсеивать шум и повышать точность перевода.
Заменяет ли этот патент необходимость в hreflang?
Нет, не заменяет. Hreflang предоставляет явные сигналы о языковых и региональных версиях страниц. Механизм, описанный в патенте, работает на уровне перевода терминов и запросов, используя статистический анализ ссылок. Hreflang помогает системе лучше понять структуру многоязычного сайта, что может улучшить качество идентификации aligned text.
Актуален ли этот патент, учитывая современные технологии нейронного машинного перевода (NMT)?
Патент актуален концептуально. Хотя современные системы NMT используют более сложные модели, идея использования параллельных данных (включая анкор-тексты) для обучения и механизм обратной связи через поведение пользователей остаются фундаментальными принципами работы поисковых систем в многоязычной среде.

Мультиязычность

Мультиязычность
Ссылки
SERP

Мультиязычность
Персонализация
Семантика и интент

Мультиязычность
Семантика и интент
SERP

Мультиязычность
Индексация

Поведенческие сигналы
SERP
Мультимедиа

Семантика и интент
Ссылки
SERP

Семантика и интент
Структура сайта
Ссылки

EEAT и качество
SERP
Поведенческие сигналы

Антиспам
SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
EEAT и качество
SERP

Ссылки
Семантика и интент
SERP

Поведенческие сигналы
SERP

Ссылки
SERP
Поведенческие сигналы
