
Google улучшает поиск по визуальному контенту (картинки, видео), анализируя, как пользователи переформулируют запросы на других языках в рамках одной сессии. Если пользователь ввел запрос на одном языке, а затем его перевод на другом, система запоминает эту связь («двуязычное уточнение»). В дальнейшем система автоматически добавляет самый популярный перевод к исходному запросу, чтобы показать больше релевантных результатов на разных языках.
Патент решает проблему ограниченного количества результатов в поиске по визуальным медиа (visual media search), когда язык запроса пользователя не совпадает с основным языком, на котором обсуждается искомый концепт. Например, при поиске «Golden Gate Bridge» на голландском языке результатов будет меньше, чем на английском. Изобретение направлено на увеличение полноты (recall) поисковой выдачи за счет включения релевантных результатов на других языках, учитывая, что визуальный контент часто не зависит от языка.
Запатентована система для автоматического расширения запросов в поиске по визуальным медиа с помощью перевода, основанного на анализе поведения пользователей. Система идентифицирует «двуязычные уточнения» (bilingual refinements) — ситуации, когда пользователь в рамках одной сессии вводит запрос на одном языке, а затем его перевод на другом. Система агрегирует эту информацию и использует наиболее частый перевод для автоматического дополнения исходного запроса пользователя, чтобы найти результаты на обоих языках.
Механизм работает в два этапа: анализ данных и обработка запроса.
initial query) на Языке 1 следует последующий запрос (subsequent query) на Языке 2 в пределах определенного порога (threshold), и при этом второй запрос является переводом первого. Эта пара сохраняется как bilingual refinement.bilingual refinements.Высокая. Кросс-язычный информационный поиск (CLIR) критически важен для глобальных поисковых систем. Использование поведенческих данных (wisdom of the crowds) для понимания и переписывания запросов является стандартной практикой Google. Этот патент описывает конкретное применение этой стратегии для улучшения поиска по картинкам и видео, где язык контента менее критичен, чем его визуальное содержание.
Патент имеет значительное влияние (7.5/10) на стратегии в области поиска по картинкам и видео (Visual Search SEO). Он объясняет, как визуальный контент, оптимизированный на одном (доминирующем для темы) языке, может ранжироваться по запросам на других языках без специальной оптимизации под них. Это снижает необходимость в многоязычной оптимизации визуальных активов, если поведенческие данные подтверждают релевантность основного языка.
bilingual refinement.initial query на другой язык.initial query и subsequent query в рамках одной сессии. Может измеряться количеством промежуточных запросов (например, не более 5) или временем (например, в течение 5 минут).bilingual refinement.Bilingual Refinements.Claim 1 (Независимый пункт): Описывает полный цикл идентификации, хранения и использования двуязычных уточнений.
predetermined threshold) от Query 1.bilingual refinement для Query 1.Claim 2 и 3 (Зависимые): Уточняют, что метод применяется к поиску по визуальным медиа (visual media search query), и что дополнение (augmenting) включает генерацию комбинированного поискового запроса (combined visual media search query).
Claim 4 (Зависимый): Определяет критерий выбора уточнения. Дополнение запроса включает выбор bilingual refinement, который является наиболее часто встречающимся (most frequently appearing) уточнением для данного запроса, и генерацию комбинированного запроса.
Claim 5 и 6 (Зависимые): Определяют природу порога (threshold). Порог может быть задан как период времени (predetermined time period) или как количество запросов (predetermined number of queries).
Изобретение применяется на нескольких этапах поисковой архитектуры, затрагивая как офлайн-процессы анализа данных, так и онлайн-обработку запросов.
CRAWLING & Data Acquisition (Сбор данных)
На этом этапе собираются данные, необходимые для работы алгоритма, а именно — журналы поисковых запросов пользователей (user search histories), включая последовательность запросов и метки сессий.
QUNDERSTANDING – Понимание Запросов (Офлайн-процесс)
Основной этап для идентификации Bilingual Refinements. Система анализирует собранные журналы запросов, применяет лингвистический анализ (перевод) для валидации и фильтрует их по критериям сессии и порогов. Результаты сохраняются в базу данных (Bilingual Refinement Database).
QUNDERSTANDING – Понимание Запросов (Онлайн-процесс)
Во время получения запроса по визуальным медиа система обращается к базе данных Bilingual Refinements. Происходит выбор наиболее подходящего (наиболее частотного) уточнения и переписывание (расширение) исходного запроса в Combined Query.
RANKING – Ранжирование
Поисковый движок (Search Engine Backend) выполняет поиск на основе расширенного Combined Query. Система ранжирует результаты, которые могут быть на разных языках.
Входные данные (Офлайн):
User Search Histories).Входные данные (Онлайн):
Visual Media Search Query.Bilingual Refinements.Выходные данные:
Visual Media) — изображениям и видео. Патент подчеркивает, что этот тип контента хорошо подходит для кросс-язычного поиска, так как визуальная информация часто не зависит от языка.Bilingual Refinement в базе данных.Процесс А: Идентификация двуязычных уточнений (Офлайн или в реальном времени)
Initial Query.Initial Query в той же сессии и в пределах заданного порога (Threshold) по времени или количеству запросов.Initial Query. Это включает перевод последующего запроса обратно на Язык 1 и сравнение с Initial Query. Могут учитываться приблизительные переводы, сленг, синонимы.Bilingual Refinement.Bilingual Refinement в базе данных для последующего использования.Процесс Б: Обработка запроса по визуальным медиа (Онлайн)
Visual Media Search Query на Языке 1.Bilingual Refinements, где Initial Query эквивалентен входящему запросу.Bilingual Refinement на основе заданного критерия. Основной критерий — выбор наиболее часто встречающегося (most frequently appearing) уточнения.Subsequent Query (перевод на Языке 2) из выбранного уточнения.Combined Query (например, Язык 1 OR Язык 2) с равными или разными весами.Патент фокусируется на использовании поведенческих и лингвистических данных для переписывания запросов.
user search histories) или потоки запросов в реальном времени. Анализируется последовательность запросов, границы сессий (session) и близость запросов друг к другу.Bilingual Refinement. Подсчитывается, сколько раз конкретная пара {Query A, Query B} была идентифицирована в журналах поиска. Выбирается наиболее частотная пара.Bilingual Refinement. Измеряет расстояние между исходным и последующим запросом в сессии. Определяется как максимальное время или максимальное количество промежуточных запросов.most frequently appearing), является наиболее релевантным и полезным для расширения поиска.Threshold), что гарантирует связь запросов одной информационной потребностью.Bilingual Refinements.Патент подтверждает важность поведенческих сигналов в интерпретации запросов и демонстрирует конкретный механизм кросс-язычного поиска (CLIR) в Google Images и Video. Для SEO-стратегии это означает, что в поиске по визуальным медиа границы между языками размыты. Авторитетность и релевантность контента на доминирующем языке могут обеспечить глобальную видимость, так как система самостоятельно «переводит» запросы пользователей, опираясь на их же поведение.
Сценарий: Оптимизация изображений достопримечательности
Задача: Оптимизировать фотографии Эйфелевой башни на сайте туристического агентства.
Bilingual Refinement.Применяется ли этот патент к обычному веб-поиску (синие ссылки)?
Нет. Патент явно указывает, что описанный метод предназначен для поиска по визуальным медиа (Visual Media Search), таким как изображения и видео. Это связано с тем, что визуальный контент часто понятен без знания языка, что делает кросс-язычный поиск более приемлемым для пользователя, чем в веб-поиске, где язык документа критичен.
Как система определяет, какой перевод использовать, если их несколько?
Система выбирает перевод на основе частотности. Она анализирует, на какой язык пользователи чаще всего переключаются после ввода исходного запроса в рамках одной сессии. Тот перевод (Bilingual Refinement), который встречается наиболее часто (most frequently appearing), и будет использован для автоматического расширения запроса.
Откуда система берет переводы? Используется ли Google Translate?
Основной источник переводов в этом патенте — это поведение самих пользователей. Система идентифицирует перевод, когда пользователь вводит его самостоятельно в рамках той же сессии. Однако патент (Claim 1) указывает, что системе необходим механизм для валидации того, что второй запрос действительно является переводом первого (путем перевода обратно на первый язык и сравнения). Для этой валидации могут использоваться инструменты перевода.
Что такое «порог» (Threshold) в контексте этого патента?
Порог определяет максимальное расстояние между исходным запросом и его переводом в рамках одной сессии, чтобы они считались связанными. Если пользователь ввел запрос А, затем 10 других запросов, и только потом перевод запроса А, они могут не быть засчитаны как Bilingual Refinement. Порог может измеряться временем (например, 5 минут) или количеством промежуточных запросов (например, 3 запроса).
Значит ли это, что мне не нужно оптимизировать изображения на разных языках?
Это снижает необходимость в многоязычной оптимизации, но не устраняет её полностью. Рекомендуется сосредоточиться на оптимизации визуального контента на доминирующем языке для данной темы. Если тема глобальна (например, «Mona Lisa»), оптимизация на английском или итальянском позволит охватить многие другие языки автоматически. Если тема строго локальна, следует использовать местный язык.
Как этот механизм влияет на вес запросов? Перевод важнее оригинала?
Патент описывает несколько вариантов реализации. Система может объединить исходный запрос и перевод в один комбинированный запрос (Combined Query) с равным весом (например, через оператор OR). Также упоминается возможность присвоения разных весов, например, с учетом статистики качества перевода.
Учитывает ли система приблизительные переводы или сленг?
Да. В патенте указано, что перевод не обязательно должен быть идентичным. Могут учитываться приблизительные переводы (approximate translations), которые используют сленг, синонимы или отличаются наличием стоп-слов. Главное условие — система должна распознать семантическую эквивалентность.
Может ли система выбрать более одного перевода для расширения запроса?
Да, такая возможность предусмотрена. Хотя основной механизм описывает выбор одного (наиболее частотного) уточнения, система может выбрать дополнительные Bilingual Refinements по тем же или другим критериям (например, второй по частотности перевод) и использовать их для дальнейшего расширения запроса.
Идентифицируются ли Bilingual Refinements заранее или в момент запроса?
Патент описывает оба варианта. Уточнения могут быть идентифицированы заранее (офлайн) путем анализа логов и сохранены в базе данных для быстрого доступа. Также они могут быть идентифицированы и выбраны "на лету" (on-the-fly) в ответ на запрос пользователя, хотя это более ресурсоемкий процесс.
Что произойдет, если в выдаче будут результаты на языке, который я не знаю?
В поиске по визуальным медиа это считается приемлемым. Пользователь увидит изображение или превью видео, которое релевантно запросу, даже если окружающий текст или ссылка ведут на страницу на другом языке. Патент предполагает, что визуальное содержание важнее языка в этом контексте.

Мультиязычность
Поведенческие сигналы
Мультимедиа

Мультимедиа
Семантика и интент

Мультиязычность
Семантика и интент
SERP

Мультиязычность
Поведенческие сигналы
Персонализация

Мультимедиа
Индексация
Семантика и интент

Поведенческие сигналы
Мультимедиа
SERP

Ссылки
EEAT и качество
Антиспам

Персонализация
EEAT и качество
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Персонализация
EEAT и качество

Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Local SEO

Поведенческие сигналы
Индексация
SERP

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
Индексация
Поведенческие сигналы
