SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE

Мультиязычность в Google: разборы патентов

Детальные разборы патентов Google, связанные с многоязычными и мультирегиональным ранжированием
  • Ссылки
  • Поведенческие сигналы
  • Антиспам
  • Семантика и интент
  • EEAT и качество
  • SERP
  • Персонализация
  • Индексация
  • Мультимедиа
  • Local SEO
  • Техническое SEO
  • Knowledge Graph
  • Свежесть контента
  • Краулинг
  • Структура сайта
  • Мультиязычность
  • Безопасный поиск
  • Google Shopping
Как Google помогает пользователям найти правильную языковую версию страницы, исправляя ошибки маршрутизации
Система определяет языковые предпочтения пользователя и сравнивает их с языком посещаемой веб-страницы. Если страница отображается не на предпочтительном языке из-за ошибки маршрутизации (например, из-за геолокации), и существует альтернативная версия на нужном языке, система предлагает пользователю перейти на нее или автоматически перенаправляет его.
  • US9251223B2
  • 2013-02-26
  • Мультиязычность

  • Персонализация

  • Индексация

Как Google исправляет запросы, введенные с неправильной раскладкой клавиатуры, используя контекст пользователя
Google использует механизм для автоматического определения и исправления запросов, введенных с ошибочной раскладкой клавиатуры. Если исходный запрос возвращает неудовлетворительные результаты, система анализирует контекст пользователя (язык интерфейса, местоположение, историю поиска), чтобы определить предполагаемый язык. Затем запрос перекодируется в правильный скрипт, и пользователю показываются релевантные результаты.
  • US8676824B2
  • 2007-12-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google исправляет грамматически некорректные запросы пользователей, изучающих язык, предлагая альтернативы
Патент описывает систему, преимущественно для голосовых ассистентов, которая определяет, что пользователь сформулировал запрос грамматически некорректно («плохо сформированная фраза») на неродном для него языке. Вместо выполнения команды система предлагает корректный вариант («хорошо сформированную фразу»), используя для этого предварительно рассчитанные векторные представления (embeddings) и анализ языковой компетентности пользователя.
  • US12019999B2
  • 2021-06-18
  • Семантика и интент

  • Мультиязычность

Как Google автоматически определяет, на каких языках искать ответ на запрос пользователя (CLIR)
Google использует механизм для автоматического определения наиболее релевантных языков для поиска по запросу пользователя. Система анализирует термины, связанные с запросом, и их привязку к различным языкам на основе структурированных данных (например, Википедии). Если система определяет, что ценный контент существует на других языках, она переводит запрос, выполняет поиск и подмешивает переведенные результаты в выдачу.
  • US8862595B1
  • 2011-11-18
  • Мультиязычность

Как Google сегментирует глобальный индекс на региональные части для повышения эффективности и локальной релевантности
Google оптимизирует поисковую инфраструктуру, разделяя индекс на две части. Основной индекс («Replicated Content») содержит глобально важные документы и копируется во все дата-центры. Дополнительно каждый дата-центр получает уникальный «Regional Content» — документы, соответствующие локальному языку и шаблонам запросов. Это повышает эффективность и релевантность для международных пользователей.
  • US8131712B1
  • 2007-10-15
  • Индексация

  • Local SEO

  • Мультиязычность

Как Google Autocomplete обрабатывает запросы, смешивающие разные языки и форматы ввода (например, иероглифы, пиньинь и английский)
Google использует механизм для генерации поисковых подсказок (Autocomplete), когда пользователь вводит запрос, смешивая разные языки или системы письма. Система создает альтернативные, "неоднозначные" представления ввода, запрашивает подсказки и фильтрует их. Это позволяет корректно интерпретировать сложный ввод (например, сочетание китайских иероглифов, пиньиня и английских слов) и предлагать релевантные варианты.
  • US20120203541A1
  • 2009-11-25
  • Мультиязычность

  • Семантика и интент

Как Google генерирует синонимы во время индексации, извлекая числа из токенов и нормализуя слова с префиксами-стоп-словами
Google может генерировать синонимы для слов непосредственно во время индексации документа, чтобы ускорить обработку запросов. Это включает извлечение числовых значений из буквенно-числовых токенов (например, «42» из «e42PC») и нормализацию слов путем удаления префиксов, являющихся стоп-словами (например, артиклей в арабском языке), используя статистические черные списки для предотвращения ошибок. Оба варианта сохраняются в индексе.
  • US8375042B1
  • 2010-11-09
  • Индексация

  • Мультиязычность

Как Google объединяет автодополнение и перевод для показа подсказок с определениями на разных языках
Google использует механизм для улучшения работы словарных и переводческих сервисов. Когда пользователь вводит частичный запрос на одном языке, система предсказывает полные варианты запроса на основе исторических данных поиска. Одновременно система получает переводы этих предсказаний на другой язык и показывает пользователю список автодополнения, где рядом с каждым вариантом сразу отображается его перевод или краткое определение.
  • US8312032B2
  • 2008-07-10
  • Мультиязычность

Как Google решает проблему «холодного старта» при запуске специализированного поиска (например, Google Shopping) на новых рынках
Google решает проблему отсутствия статистики при запуске специализированного поиска (Товары, Новости и т.д.) в новой стране. Система переводит локальные запросы на язык зрелого рынка (например, английский), оценивает их с помощью существующих моделей и использует эти оценки для обучения новых локальных моделей. Это позволяет быстро определять интент пользователя без исторических данных.
  • US8538946B1
  • 2012-07-18
  • Мультиязычность

  • Семантика и интент

  • Google Shopping

Как Google Autocomplete использует статистические модели для нормализации разных фонетических написаний одного запроса
Google решает проблему неоднозначности ввода в языках без стандартной романизации (например, кантонский диалект). Система строит статистические языковые модели на основе предпочтений пользователей, чтобы распознавать разные фонетические варианты ввода латиницей (например, "lauta" и "lauda") как один и тот же иероглифический запрос, обеспечивая унифицированные подсказки автозаполнения.
  • US8996550B2
  • 2010-06-03
  • Мультиязычность

  • 1
  • 2
seohardcore