Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует краудсорсинг переводов, встраивает дополнительный контент и перехватывает трафик локализованных страниц

    TECHNIQUES FOR CROWD SOURCING HUMAN TRANSLATIONS TO PROVIDE TRANSLATED VERSIONS OF WEB PAGES WITH ADDITIONAL CONTENT (Техники краудсорсинга человеческих переводов для предоставления переведенных версий веб-страниц с дополнительным контентом)
    • US10049109B2
    • Google LLC
    • 2018-08-14
    • 2015-08-26
    2015 Мультиязычность Патенты Google

    Патент описывает систему, позволяющую владельцам сайтов согласиться (opt-in) на краудсорсинг высококачественных человеческих переводов своих страниц. Google создает и хранит переведенные копии, встраивает в них дополнительный контент (например, рекламу) и показывает их иностранным пользователям, перехватывая запросы к оригиналу, потенциально делясь доходом с владельцем.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему высокой стоимости и технической сложности получения качественных человеческих переводов веб-страниц. Владельцы сайтов часто не имеют стимула, ресурсов или технических навыков (например, для сложной интеграции JavaScript, управления поставщиками переводов) для локализации контента, особенно на менее распространенные языки. Изобретение призвано упростить этот процесс до «одного клика» и создать стимул в виде потенциального дохода.

    Что запатентовано

    Запатентована система для упрощенной локализации контента через краудсорсинг человеческих переводов, управляемая сторонним сервером (Google). Владельцы сайтов (Developers) могут дать согласие (opt-in) на участие в функции перевода (Translation Feature). Это позволяет серверу создать копию страницы, организовать ее перевод силами пользователей (Human Translators), хранить переведенную версию и встраивать в нее дополнительный контент (Additional Content) для монетизации.

    Как это работает

    Система работает в несколько этапов:

    • Идентификация: Система определяет подходящие страницы (например, high-traffic или часто запрашиваемые для машинного перевода).
    • Согласие (Opt-in): Владельцу предлагается активировать функцию.
    • Генерация перевода: После согласия создается копия страницы. Краудсорс-переводчики предоставляют переводы.
    • Модификация: Сервер модифицирует копию, внедряя переведенный текст. Критически важно, что сервер также может модифицировать DOM копии для вставки Additional Content (например, рекламы).
    • Доставка: Когда пользователь из целевой языковой группы запрашивает оригинальную страницу, сервер может перехватить запрос (intercepting the request) и предоставить переведенную копию с дополнительным контентом.
    • Монетизация: Доход от этого контента может распределяться с владельцем сайта (Monetary Compensation).

    Актуальность для SEO

    Средняя. Хотя машинный перевод значительно улучшился, ценность качественного человеческого перевода сохраняется. Концепция краудсорсинга переводов использовалась Google. Однако конкретная реализация, описанная в патенте — включающая перехват запросов, хостинг третьей стороной и автоматическую вставку рекламы для монетизации — не является широко известным или доминирующим продуктом Google по состоянию на 2025 год.

    Важность для SEO

    Влияние на SEO среднее (5/10). Патент описывает не алгоритм ранжирования, а инфраструктурный механизм доставки, трансформации и монетизации контента. Он имеет значительное влияние на стратегию международного SEO, поскольку описывает сценарий, при котором Google хостит переведенную версию контента, потенциально изменяя пользовательский опыт и структуру монетизации международного трафика путем вставки внешнего контента.

    Детальный разбор

    Термины и определения

    Additional Content (Дополнительный контент)
    Контент, который встраивается сервером в переведенную версию страницы. Может включать рекламу (advertisement), ссылки, изображения или статьи, релевантные пользователю, основанные на его профиле или истории поиска.
    Developer (Разработчик/Владелец)
    Пользователь, контролирующий веб-страницу (разработчик, издатель, владелец), которому предлагается активировать функцию перевода.
    DOM (Document Object Model)
    Объектная модель документа. Система модифицирует DOM копии страницы для вставки кода (например, JavaScript), обеспечивающего показ Additional Content.
    High-traffic web page (Веб-страница с высоким трафиком)
    Страница, получающая количество посещений за период времени (rate of user visits) выше определенного порога. Является кандидатом для активации функции.
    Highly-requested web page for machine translation (Веб-страница с частыми запросами на машинный перевод)
    Страница, для которой количество запросов на машинный перевод (rate of user machine translation requests) превышает определенный порог. Также является кандидатом.
    Human Translators / Other Users (Люди-переводчики / Другие пользователи)
    Пользователи (не владелец сайта), которые предоставляют переводы контента (краудсорсинг).
    Intercepting the request (Перехват запроса)
    Механизм, при котором сервер обнаруживает запрос к оригинальной веб-странице и вмешивается в процесс, чтобы отдать переведенную копию вместо оригинала, потенциально без обращения к серверу-источнику.
    Monetary Compensation (Денежная компенсация)
    Выплаты владельцу сайта, основанные на взаимодействии пользователей с Additional Content (например, клики по рекламе).
    Opt-in (Активация/Согласие)
    Явное согласие владельца сайта на использование Translation Feature.
    Translated Web Page (Переведенная веб-страница)
    Модифицированная копия оригинальной страницы, содержащая человеческий перевод и Additional Content, хранящаяся на сервере системы.
    Web Page Copy (Копия веб-страницы)
    Отдельная копия оригинальной страницы, создаваемая и хранимая сервером для последующего перевода и модификации.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс работы системы.

    1. Система определяет, что веб-страница на исходном языке была подключена (opted in) к функции перевода (Translation Feature), которая позволяет другим пользователям переводить ее на целевой язык.
    2. Система получает от этих пользователей переводы части веб-страницы.
    3. Система генерирует Translated Web Page на основе полученных переводов.
    4. Система обнаруживает запрос на веб-страницу с устройства, ассоциированного с целевым языком.
    5. Система отправляет на это устройство Translated Web Page.

    Claim 2 (Зависимый): Детализирует критерии проактивного отбора страниц для участия в программе.

    Система определяет, что страница является либо high-traffic (превышает порог по частоте посещений), либо highly-requested for machine translation (превышает порог по частоте запросов на перевод). В ответ на это определение система отправляет владельцу предложение подключиться к функции перевода.

    Claim 3 (Зависимый): Описывает критический механизм доставки контента.

    Отправка Translated Web Page выполняется в ответ на перехват (intercepting) запроса на веб-страницу от устройства. Это подразумевает, что сервер действует как посредник и обслуживает кэшированную/переведенную копию вместо оригинала.

    Claim 6 (Зависимый): Описывает механизм инъекции контента.

    В ответ на подключение к функции перевода система модифицирует DOM переведенной веб-страницы, чтобы включить JavaScript для предоставления Additional Content.

    Claim 7 (Зависимый от 6): Уточняет природу дополнительного контента.

    Additional Content может включать ссылки, изображения или статьи на целевом языке, основанные на профиле или истории поиска пользователя устройства.

    Где и как применяется

    Изобретение описывает инфраструктуру для создания, управления и доставки контента, затрагивая несколько этапов.

    CRAWLING & INDEXING – Сканирование и Индексирование

    • Анализ данных: Система использует индексированные данные и журналы трафика/использования для идентификации страниц-кандидатов (на основе rate of user visits и rate of user machine translation requests).
    • Генерация и хранение: После получения согласия (opt-in) система генерирует и сохраняет Web Page Copy и последующую Translated Web Page, фактически создавая и индексируя новую версию контента на своей инфраструктуре.

    Доставка Контента (Content Delivery — Неявный этап)
    Основное применение патента происходит в момент доставки контента пользователю (пересекается с этапами RANKING/RERANKING). Система определяет языковой контекст пользователя (ассоциацию с Target Language). Она перехватывает (intercepts) запрос к оригинальной странице и подменяет его на Translated Web Page. Также выполняется внедренный JavaScript для отображения Additional Content.

    Входные данные:

    • Оригинальная веб-страница и ее DOM.
    • Статистика трафика и запросов на машинный перевод.
    • Статус согласия (Opt-in status) владельца.
    • Краудсорсинговые переводы от пользователей.
    • Данные запроса пользователя (включая языковую ассоциацию).
    • Профиль пользователя или история поиска (для подбора Additional Content).

    Выходные данные:

    • Translated Web Page с внедренным Additional Content, предоставляемая пользователю.
    • (Опционально) Monetary Compensation для владельца сайта.

    На что влияет

    • Конкретные типы контента и ниши: Наибольшее влияние в нишах с высоким международным спросом, где владельцы контента еще не провели локализацию (например, популярные блоги, техническая документация, новостные ресурсы). В описании также упоминается возможность применения к мобильным приложениям через SDK для перевода строк интерфейса.
    • Языковые и географические ограничения: В первую очередь влияет на межъязыковой поиск информации (Cross-language information retrieval) и доступность контента на разных языках.

    Когда применяется

    Алгоритм доставки применяется при выполнении всех следующих условий:

    • Условие 1: Владелец сайта предварительно дал согласие (opted-in) на участие в Translation Feature.
    • Условие 2: Существует готовая Translated Web Page для определенного Target Language, созданная с помощью краудсорсинга.
    • Условие 3 (Триггер): Обнаружен запрос на оригинальную веб-страницу с устройства, которое ассоциировано с этим Target Language.

    Пошаговый алгоритм

    Фаза 1: Идентификация и Согласие

    1. Идентификация веб-страницы: Мониторинг трафика и запросов на машинный перевод для выявления страниц-кандидатов (high-traffic или highly-requested).
    2. Предложение Opt-In: Представление владельцу сайта предложения включить функцию перевода, возможно, с оценкой потенциального дохода.
    3. Обработка запроса на Opt-In: Получение подтверждения от владельца.

    Фаза 2: Генерация перевода и модификация

    1. Создание и хранение копии: Создание отдельной Web Page Copy.
    2. Модификация DOM (Опционально): Модификация DOM копии для включения кода (например, JavaScript), обеспечивающего показ Additional Content.
    3. Получение переводов: Сбор переводов от краудсорс-переводчиков.
    4. Создание переведенной версии: Замена контента на исходном языке проверенными переводами для получения Translated Web Page.

    Фаза 3: Доставка и Монетизация

    1. Обнаружение запроса веб-страницы: Мониторинг входящих запросов к оригинальной веб-странице.
    2. Проверка контекста: Определение, ассоциировано ли запрашивающее устройство с Target Language, для которого существует перевод.
    3. Перехват и доставка: Если контекст совпадает, система перехватывает запрос и предоставляет Translated Web Page с Additional Content.
    4. Мониторинг взаимодействия (Опционально): Отслеживание взаимодействий с дополнительным контентом (например, клики по рекламе).
    5. Координация компенсации (Опционально): Предоставление Monetary Compensation владельцу сайта на основе взаимодействий.

    Какие данные и как использует

    Данные на входе

    • Технические факторы: Структура DOM (используется для модификации и внедрения JavaScript для Additional Content).
    • Поведенческие факторы / Аналитика: «Частота посещений пользователями» (rate of user visits) и «Частота запросов на машинный перевод» (rate of user machine translation requests) используются для идентификации подходящих страниц. Данные о взаимодействии с Additional Content используются для монетизации.
    • Пользовательские факторы: Настройки языковых предпочтений пользователя (для ассоциации устройства с Target Language); Профиль пользователя или история поиска (используются для выбора релевантного Additional Content).
    • Контентные факторы: Текстовое содержимое оригинальной веб-страницы (используется для перевода).

    Какие метрики используются и как они считаются

    • Пороговые значения для идентификации: Система использует определенные пороги для rate of user visits и rate of user machine translation requests, чтобы классифицировать страницу как high-traffic или highly-requested.
    • Monetary Compensation (Денежная компенсация): Рассчитывается на основе взаимодействия пользователя с Additional Content (например, клик по рекламному объявлению).

    Выводы

    1. Google как инфраструктурный посредник в локализации: Патент описывает механизм, позволяющий Google активно управлять переводом, хостингом и доставкой контента сторонних сайтов. Это инфраструктурное решение, а не алгоритм ранжирования.
    2. Компромисс: Охват и Качество против Контроля: Владельцы сайтов могут получить качественный человеческий перевод и международный охват с минимальными усилиями («в один клик»). Компромиссом является потеря контроля над отображением (Google внедряет Additional Content) и хостингом локализованных версий.
    3. Перехват запросов (Interception) как ключевой механизм доставки: Система способна перехватывать запрос к оригинальной странице и обслуживать переведенную копию, размещенную на серверах Google, потенциально без того, чтобы запрос достиг сервера-источника.
    4. Инъекция контента через модификацию DOM: Google явно резервирует возможность модифицировать DOM переведенной копии для вставки JavaScript, обслуживающего внешний контент (рекламу, ссылки и т.д.), что является основой для монетизации.
    5. Проактивное выявление спроса: Система идентифицирует потребность в переводе на основе анализа поведения пользователей (трафик и запросы на перевод), фокусируясь на высокоценных страницах для максимизации эффекта и дохода.

    Практика

    Best practices (это мы делаем)

    Патент носит инфраструктурный характер и описывает потенциальный сервис, требующий явного согласия (Opt-in). Он дает важный контекст для стратегии интернационализации.

    • Анализ международного спроса: Отслеживайте метрики, упомянутые в патенте как триггеры: трафик из других стран и косвенные признаки использования машинного перевода. Высокие показатели указывают на потенциал для локализации (собственной или через подобные программы).
    • Принятие информированного решения об участии (Opt-In): Если подобная функция будет предложена, Senior SEO-специалисты должны тщательно оценить компромисс. Если у сайта нет ресурсов для локализации, это может быть полезно. Однако, если сайт полагается на специфическую монетизацию или строгий брендинг, внедрение Additional Content со стороны Google может нанести ущерб.
    • Поддержание чистой структуры DOM: Патент упоминает модификацию DOM для вставки контента. Чистый, семантически верный код облегчает автоматизированную обработку страницы системами Google (для перевода, анализа или вставки контента).
    • Надежная реализация Hreflang (Защитная стратегия): Для сайтов с активными стратегиями локализации критически важной остается надежная реализация hreflang. Это стандартный сигнал для указания официальных локализованных версий, что может помочь гарантировать предпочтение официальной версии перед копией, сгенерированной по этому патенту.

    Worst practices (это делать не надо)

    • Слепое подключение премиум-контента: Разрешать Google управлять переводом и внедрять контент на высокоценных, брендированных страницах без понимания последствий для пользовательского опыта, монетизации и аналитики (так как трафик может быть перехвачен).
    • Игнорирование собственной стратегии интернационализации: Полагаться исключительно на эту функцию вместо разработки полноценной стратегии интернационализации, если международные рынки являются стратегически важными для бизнеса.
    • Сложная генерация контента на клиенте: Использование нестандартных способов генерации DOM динамически может помешать системе корректно скопировать страницу и внедрить переводы или Additional Content.

    Стратегическое значение

    Патент подчеркивает интерес Google к преодолению языковых барьеров и одновременному созданию новых путей для монетизации контента. Он акцентирует важность понимания инфраструктуры доставки контента, а не только ранжирования. Для SEO-стратегий это указывает на потенциальное будущее, где локализованный контент может все чаще обслуживаться через посредников, которые контролируют хостинг и модифицируют этот контент.

    Практические примеры

    Сценарий: Локализация популярного технического блога

    Ситуация: Популярный англоязычный технический блог имеет высокий трафик из Бразилии, но не имеет португальской версии.

    1. Триггер: Google идентифицирует блог как Highly-requested for machine translation в Бразилии.
    2. Предложение: Владелец получает предложение подключиться к краудсорсинговому переводу на португальский язык с разделением доходов от рекламы. Владелец соглашается (Opt-in).
    3. Исполнение: Google копирует страницы, сообщество переводит их. Google модифицирует DOM, чтобы вставить блоки Google Ads.
    4. Доставка: Когда пользователь в Бразилии кликает на результат, ведущий на блог, Google перехватывает запрос и обслуживает португальскую копию, размещенную у себя, с рекламой Google.
    5. Результат: Пользователь получает качественный перевод. Владелец получает часть дохода от рекламы и более широкий охват. Google контролирует размещение рекламы и доставку контента.

    Вопросы и ответы

    Означает ли этот патент, что Google может переводить мой контент и показывать на нем рекламу без моего разрешения?

    Нет. Патент четко указывает, что система основана на добровольном согласии (opt-in). Владельцу сайта отправляется предложение (offer), и процесс запускается только после получения запроса на подключение (request to opt-in) от владельца.

    Что такое «Additional Content», который Google будет встраивать?

    В первую очередь, это механизм монетизации, чаще всего реклама. Доход от нее может делиться с владельцем сайта. Патент также определяет Additional Content шире: это могут быть ссылки, изображения или статьи, подобранные так, чтобы быть релевантными для конечного пользователя, основываясь на его профиле или истории поиска.

    Как технически встраивается этот дополнительный контент?

    После получения согласия система создает копию страницы и модифицирует ее Document Object Model (DOM). В DOM встраивается код (например, JavaScript), который отвечает за отображение Additional Content при загрузке страницы у пользователя.

    Что означает «перехват запроса» (intercepting the request) и как это влияет на мою аналитику?

    Это ключевой механизм доставки. Когда иностранный пользователь пытается загрузить оригинальную страницу, сервер Google может обнаружить этот запрос и вмешаться. Вместо того чтобы позволить запросу дойти до вашего сервера-источника, Google отвечает, отправляя свою переведенную копию. Это означает, что этот трафик может не отображаться в стандартных логах вашего сервера или аналитике.

    Как Google определяет, какие сайты достойны этой функции?

    Система нацелена на максимизацию пользы и дохода. Она идентифицирует страницы, которые являются либо high-traffic (имеют высокую частоту посещений), либо highly-requested for machine translation (пользователи часто запрашивают их перевод). Это гарантирует, что усилия по краудсорсингу будут приложены к востребованному контенту.

    В чем разница между этим механизмом и стандартным машинным переводом в браузере?

    Разница существенная. Машинный перевод в браузере переводит контент на лету и не меняет исходный код. Описанный механизм использует высококачественные человеческие переводы, создает отдельную переведенную копию страницы, модифицирует ее DOM для вставки дополнительного контента и хранит эту версию для последующей доставки.

    Как это влияет на мою стратегию международного SEO и использование hreflang?

    Этот механизм является альтернативой собственной локализации. Если у вас уже есть качественные локализованные версии и корректно настроен hreflang, они должны иметь приоритет. Однако, если вы участвуете в этой программе для языков, которые вы не поддерживаете, вы должны понимать, что Google будет контролировать доставку, хостинг и содержание этих страниц.

    Кто выполняет переводы и каково их качество?

    Переводы выполняются с помощью краудсорсинга силами Human Translators или Other Users (волонтеров). Патент утверждает, что это обеспечивает более высокое качество, чем машинный перевод, и упоминает, что модификация страницы может происходить после некоторой проверки точности перевода, хотя детали контроля качества не раскрываются.

    Влияет ли участие в этой программе на ранжирование моего сайта?

    Патент не описывает изменений в алгоритмах ранжирования. Он фокусируется на генерации и доставке контента. Однако наличие высококачественной переведенной версии может улучшить удовлетворенность пользователей в целевом регионе, что косвенно может положительно повлиять на видимость контента в этом регионе.

    Применяется ли эта технология только к веб-страницам?

    В основном да, но в описании патента также упоминается возможность расширения этой техники на веб-приложения и нативные мобильные приложения. Разработчики приложений могли бы использовать SDK (Software Development Kit) для краудсорсингового перевода строк пользовательского интерфейса.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.