Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google исправляет запросы, введенные с неправильной раскладкой клавиатуры, используя контекст пользователя

    AUTOMATIC SEARCH QUERY CORRECTION (Автоматическая коррекция поискового запроса)
    • US8676824B2
    • Google LLC
    • 2014-03-18
    • 2007-04-16
    2007 Мультиязычность Патенты Google Семантика и интент

    Google использует механизм для автоматического определения и исправления запросов, введенных с ошибочной раскладкой клавиатуры. Если исходный запрос возвращает неудовлетворительные результаты, система анализирует контекст пользователя (язык интерфейса, местоположение, историю поиска), чтобы определить предполагаемый язык. Затем запрос перекодируется в правильный скрипт, и пользователю показываются релевантные результаты.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает распространенную проблему среди многоязычных пользователей: ввод поискового запроса с использованием неправильной раскладки клавиатуры. Это особенно актуально в регионах с нелатинскими системами письма (например, кириллица, иврит), где пользователи часто переключаются между локальным языком и английским. Ошибка приводит к вводу бессмысленной строки символов (например, ввод ‘yjdjcnb’ вместо ‘новости’) и плохим результатам поиска.

    Что запатентовано

    Запатентована система автоматического обнаружения и исправления запросов с неверным отображением ввода (Incorrect Input Mapping). Система использует низкое качество или малое количество первоначальных результатов поиска как триггер. Затем она идентифицирует фактическую исходную раскладку (Source Keyboard Layout) и определяет наиболее вероятную целевую раскладку (Target Keyboard Layout), используя контекстные сигналы пользователя. Запрос корректируется путем переназначения (remapping) символов между этими раскладками.

    Как это работает

    Механизм работает в несколько этапов:

    • Триггер: Если поиск по исходному запросу возвращает результаты ниже определенного порога (по количеству или качеству), активируется коррекция.
    • Анализ контекста: Система анализирует сигналы пользователя — язык интерфейса, настройки ОС/браузера, геолокацию (IP-адрес) и историю поиска — для определения предполагаемого языка.
    • Определение раскладок: Идентифицируются исходная и наиболее вероятная целевая раскладки.
    • Переназначение: Символы запроса преобразуются так, как если бы те же клавиши были нажаты на целевой раскладке.
    • Повторный поиск: Поиск выполняется по скорректированному запросу, и его результаты предоставляются пользователю.

    Актуальность для SEO

    Высокая. Автоматическое исправление раскладки клавиатуры является стандартной и критически важной функцией в современных поисковых системах, особенно в регионах, где используются нелатинские алфавиты. Фундаментальный подход к использованию контекста пользователя для исправления ошибок ввода остается актуальным.

    Важность для SEO

    Влияние на SEO минимальное (1/10). Это инфраструктурный патент, относящийся к этапу понимания запросов (Query Understanding) и улучшению пользовательского опыта (UX). Он не описывает механизмы ранжирования или оценки качества контента. Патент важен для понимания того, как Google обрабатывает пользовательский ввод и определяет контекст пользователя, но не дает прямых рекомендаций для SEO-оптимизации сайтов.

    Детальный разбор

    Термины и определения

    Incorrect Input Mapping (Неверное отображение ввода)
    Ситуация, когда пользователь вводит запрос, используя раскладку клавиатуры, отличную от той, которую он намеревался использовать.
    Script (Скрипт / Система письма)
    Система письма, используемая в запросе (например, латиница, кириллица, иврит).
    Source Keyboard Layout (Исходная раскладка клавиатуры)
    Раскладка, которая была фактически активна у пользователя при вводе запроса (ошибочная).
    Target Keyboard Layout (Целевая раскладка клавиатуры)
    Раскладка, которую пользователь, предположительно, намеревался использовать.
    Suggestion-set (Набор подсказок)
    Набор предлагаемых вариантов запросов. В патенте используется как альтернативный метод оценки качества ввода.
    User Language Preference (Языковые предпочтения пользователя)
    Агрегированные данные о предпочитаемых языках пользователя, основанные на его контексте (настройки, местоположение, история).
    User Search History (История поиска пользователя)
    Данные о предыдущих запросах и взаимодействиях с результатами (клики), используемые для определения языковых предпочтений.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс автоматической коррекции.

    1. Система получает первый поисковый запрос в первом скрипте.
    2. Получает первый результат поиска.
    3. Система определяет, что первый результат содержит количество элементов меньше порогового значения (less than a threshold number). Это является триггером.
    4. Как следствие этого:
      • Идентифицируется первая (исходная) раскладка клавиатуры.
      • Определяется вторая (целевая) раскладка клавиатуры, соответствующая второму скрипту.
      • Генерируется второй (скорректированный) запрос путем переназначения (mapping) символов из первой раскладки во вторую.
      • Получает второй результат поиска.
    5. Передает второй результат поиска на устройство пользователя в ответ на первый запрос.

    Ядро изобретения — использование низкого количества результатов как индикатора ошибки ввода и триггера для активации механизма переназначения раскладки.

    Claim 5 (Зависимый от 1): Детализирует, как определяется вторая (целевая) раскладка.

    Определение основано на идентификации User Language Preference. Эта идентификация использует один или несколько из следующих контекстных факторов: языковые настройки пользователя (user languages settings), язык пользовательского интерфейса (user interface language), географическое местоположение (geographic location) или история поиска пользователя (user search history).

    Claim 17 (Независимый пункт): Описывает метод, фокусирующийся на использовании истории поиска для определения раскладки.

    1. Получается запрос и история поиска пользователя.
    2. Получаются результаты поиска.
    3. Определяется, что количество элементов в результатах меньше порога.
    4. Как следствие, идентифицируется вторая раскладка клавиатуры на основе *части* результатов в истории поиска (a portion of search results in the search query history).

    Это подчеркивает, что для определения языка могут использоваться не все данные истории, а, например (как указано в зависимых пунктах, таких как 16), только те результаты, которые были посещены пользователем (accessed by the user). Это означает использование данных о кликах для определения языковых предпочтений.

    Где и как применяется

    Изобретение применяется на ранних этапах обработки запроса.

    QUNDERSTANDING – Понимание Запросов
    Это основной этап применения патента. Система функционирует как модуль коррекции ввода и переписывания запроса (Query Rewriting).

    1. Предварительная оценка: Быстро оценивается качество/количество результатов для исходного запроса.
    2. Обнаружение ошибки: Если результаты не соответствуют порогу, предполагается Incorrect Input Mapping.
    3. Контекстуализация: Система анализирует контекстные сигналы пользователя для определения его языкового намерения.
    4. Переписывание запроса: Запрос переписывается с использованием предполагаемой целевой раскладки.

    RANKING – Ранжирование
    Этап ранжирования используется для генерации первоначальных результатов (для оценки триггера) и затем для генерации финальных результатов по скорректированному запросу.

    Входные данные:

    • Исходный поисковый запрос.
    • Контекстные данные пользователя (IP, история поиска, язык интерфейса, настройки браузера/ОС).
    • Результаты предварительного поиска (количество или оценка).

    Выходные данные:

    • Скорректированный поисковый запрос (если механизм активирован) или исходный запрос.

    На что влияет

    • Языковые и географические ограничения: Наибольшее влияние оказывается на регионы и языки, где пользователи часто переключаются между латинским и нелатинским скриптами (кириллица, иврит, арабский, греческий и т.д.).
    • Специфические запросы: Влияет на запросы, которые являются бессмысленными в одном языке, но приобретают смысл при переназначении раскладки.

    Когда применяется

    • Триггеры активации: Ключевой триггер — неудовлетворительное качество результатов исходного запроса.
    • Пороговые значения: Активация происходит, когда:
      1. Количество результатов поиска меньше определенного порога (Threshold Number).
      2. ИЛИ (как описано в патенте) оценка набора подсказок (Suggestion-set score) низкая.

    Пошаговый алгоритм

    1. Получение запроса и контекста: Система получает запрос и собирает контекстные данные пользователя (User Language Preference сигналы).
    2. Первичный поиск/Оценка: Определяются первоначальные результаты поиска или набор подсказок (Suggestion-set).
    3. Оценка качества ввода: Система определяет, был ли запрос сгенерирован с использованием корректной раскладки. Это делается путем проверки порога количества результатов или расчета Suggestion-set score.
    4. Принятие решения о коррекции: Если качество низкое, перейти к шагу 5. Иначе — предоставить исходные результаты.
    5. Идентификация скрипта: Определяется скрипт запроса (например, Латиница).
    6. Определение раскладок:
      • Определяется исходная раскладка (Source Keyboard Layout).
      • Определяется наиболее вероятная целевая раскладка (Target Keyboard Layout) с помощью контекстных данных. При неоднозначности (например, русская или болгарская кириллица) может использоваться язык интерфейса для разрешения конфликта или генерация нескольких вариантов.
    7. Генерация исправленного запроса: Символы исходного запроса переназначаются с использованием карт соответствия между раскладками.
    8. Вторичный поиск: Выполняется поиск по исправленному запросу.
    9. Финальное представление: Пользователю предоставляется лучший набор результатов (обычно скорректированный).

    Какие данные и как использует

    Данные на входе

    Патент явно указывает на использование следующих данных для определения целевой раскладки:

    • Контентные факторы: Символы введенного запроса и их принадлежность к определенному скрипту.
    • Географические факторы:
      • Geographic Location: Местоположение пользователя (определяемое по IP-адресу) используется для вывода наиболее вероятного языка.
    • Пользовательские факторы:
      • User Search History: История поиска. Анализируются языки предыдущих запросов и, в частности, языки результатов, на которые кликал пользователь (accessed by the user).
      • User Languages Settings: Языковые настройки ОС или браузера (например, передаваемые через HTTP-заголовки).
      • User Interface Language: Язык интерфейса поисковой системы (например, google.ru).
      • Явные предпочтения пользователя (если заданы в профиле).

    Какие метрики используются и как они считаются

    • Threshold Number (Пороговое число): Минимальное количество результатов поиска. Если исходный запрос возвращает меньше этого числа, активируется коррекция.
    • Suggestion-Set Score (Оценка набора подсказок): Альтернативный метод оценки качества запроса, основанный на связанных поисковых предложениях (suggestions).
    • Формула расчета Score: В описании патента приводится формула для расчета оценки набора предложений (qsj):

    Выводы

    1. Инфраструктурный характер (Query Understanding): Патент описывает механизм улучшения пользовательского опыта и точности понимания запросов, а не алгоритм ранжирования. Он исправляет технические ошибки ввода до основного поиска.
    2. Глубокое использование контекста пользователя: Система активно использует пассивные сигналы пользователя (геолокацию, историю поиска, язык интерфейса, настройки ОС/браузера) для интерпретации его истинного намерения, выходя за рамки буквального ввода.
    3. Качество результатов как триггер для переписывания: Низкое количество результатов или низкая оценка Suggestion-Set Score являются триггерами для поиска альтернативных интерпретаций запроса, включая коррекцию раскладки.
    4. История кликов как индикатор языка: Патент явно указывает на использование истории поиска, в частности языков результатов, на которые пользователь кликал ранее (accessed by the user), как надежного индикатора языковых предпочтений.
    5. Важность для международного SEO: Подтверждает необходимость понимания лингвистического и технического контекста пользователей в разных регионах.

    Практика

    Best practices (это мы делаем)

    Патент носит инфраструктурный характер и не дает прямых рекомендаций для SEO-оптимизации контента. Однако он подчеркивает важность правильной технической настройки для международного SEO:

    • Корректная международная настройка (Hreflang и Локализация): Убедитесь, что сигналы интернационализации сайта настроены правильно. Поскольку Google точно определяет язык и контекст пользователя (используя методы, описанные в патенте), важно, чтобы ваш сайт предоставлял контент, соответствующий этому контексту.
    • Анализ поведения многоязычной аудитории: Понимайте лингвистический ландшафт целевых рынков. В регионах, где пользователи часто переключаются между скриптами, учитывайте, как система интерпретирует их языковые сигналы для доставки релевантного контента.
    • Фокус на целевых запросах: Сосредоточьтесь на оптимизации под запросы, которые пользователи намереваются ввести. Не нужно беспокоиться о потере трафика из-за ошибок раскладки, так как система Google спроектирована так, чтобы исправлять их.

    Worst practices (это делать не надо)

    • Оптимизация под «абракадабру»: Попытки ранжироваться по запросам, которые являются результатом ошибок раскладки (например, оптимизация под «vfiby» вместо «машина»). Этот патент делает такие стратегии бессмысленными, так как Google исправит запрос пользователя.
    • Игнорирование языковых сигналов пользователя: Предоставление контента на языке, который не соответствует контексту пользователя (например, игнорирование настроек браузера в пользу только геолокации). Google использует комбинацию сигналов для определения намерения, и сайт должен уважать эти предпочтения.

    Стратегическое значение

    Патент подтверждает стратегическую важность контекстных сигналов пользователя на самых ранних этапах обработки запроса. Для Google намерение пользователя важнее, чем точный текст, который он ввел. В контексте международного SEO это подчеркивает, что система стремится понять истинное намерение пользователя и его контекст (язык, местоположение), что является фундаментом для достижения релевантности в глобальном поиске.

    Практические примеры

    Сценарий: Исправление запроса русскоязычного пользователя

    1. Контекст пользователя: Пользователь находится в России (определено по IP), язык интерфейса Google — русский, история поиска преимущественно на русском языке. Активная раскладка клавиатуры — английская (US English QWERTY).
    2. Ввод пользователя: Пользователь хочет найти «погода в москве», но вводит запрос без переключения раскладки. Исходный запрос: «gjuSlf d vjcrdt».
    3. Первичный анализ: Система выполняет поиск по «gjuSlf d vjcrdt». Количество результатов близко к нулю, Suggestion-set score очень низкий. Активируется триггер коррекции.
    4. Определение раскладок: Исходный скрипт — Латиница. Система анализирует контекст пользователя и определяет, что наиболее вероятный целевой язык — русский. Source Keyboard Layout — US English. Target Keyboard Layout — Russian.
    5. Коррекция: Система выполняет перевод: g->п, j->о, u->г, S->о, l->д, f->а, и так далее. Исправленный запрос: «погода в москве».
    6. Результат: Система выполняет поиск по исправленному запросу и показывает пользователю релевантную выдачу о погоде.

    Вопросы и ответы

    Является ли этот патент алгоритмом ранжирования?

    Нет, это не алгоритм ранжирования. Патент описывает механизм понимания и переписывания запросов (Query Understanding). Он определяет, *что* пользователь ищет, исправляя технические ошибки ввода, прежде чем система решит, *какие* результаты показать и в каком порядке. Он влияет на то, какой запрос будет обработан системой ранжирования.

    Какие сигналы Google использует, чтобы понять, какой язык имел в виду пользователь?

    Патент перечисляет несколько ключевых сигналов: географическое местоположение (по IP-адресу), языковые настройки операционной системы или браузера пользователя, язык используемого интерфейса поисковой системы, а также историю поиска пользователя.

    Как система решает, нужно ли исправлять запрос?

    Триггером для активации механизма исправления является неудовлетворительное качество первоначальных результатов поиска. Это определяется либо когда количество результатов меньше определенного порога, либо когда оценка качества связанных поисковых подсказок (Suggestion-Set Score) слишком низкая.

    Стоит ли пытаться оптимизировать страницы под запросы с ошибками раскладки (например, под «ghbdtn» вместо «привет»)?

    Категорически нет. Цель этого патента — сделать так, чтобы такие запросы автоматически исправлялись до того, как произойдет основное ранжирование. Оптимизация под «абракадабру» бессмысленна, так как система покажет пользователю результаты по исправленному, правильному запросу.

    Использует ли Google историю кликов для определения языка пользователя?

    Да, патент явно указывает на это (в контексте Claims 16/17). Анализ языков результатов, на которые пользователь кликал в прошлом (часть User Search History, accessed by the user), является сильным сигналом для определения User Language Preference. Это помогает системе понять, на каком языке пользователь предпочитает потреблять контент.

    Что такое «Suggestion-Set Score» и как он рассчитывается?

    Это метрика для оценки качества набора поисковых подсказок. В патенте приводится формула [n(qsj)] / S, где n(qsj) — сумма ожидаемых результатов для всех подсказок, а S — ожидаемое количество подсказок. Эта оценка используется как альтернативный триггер: если она низкая, система может активировать механизм коррекции раскладки.

    Как этот патент влияет на международное SEO?

    Он подчеркивает важность понимания лингвистического контекста аудитории. Google стремится обслуживать пользователей на том языке, который они намеревались использовать. Для SEO это подтверждает необходимость предоставления четких сигналов о языке и регионе (например, через hreflang), чтобы соответствовать контексту пользователя, который Google вычисляет с помощью описанных методов.

    Что произойдет, если система не сможет однозначно определить целевую раскладку?

    Если существует несколько вероятных целевых раскладок (например, русская и болгарская кириллица), патент упоминает возможность генерации нескольких скорректированных запросов. Система может выбрать лучший вариант на основе того, какой из них возвращает больше результатов или имеет лучшую оценку качества, или использовать контекст (например, язык интерфейса) для разрешения неоднозначности.

    Может ли система ошибочно «исправить» правильный запрос?

    Теоретически это возможно, если правильный запрос (например, редкий термин) дает очень мало результатов и при этом случайно совпадает с перекодировкой популярного запроса на другом языке. Однако система использует контекст пользователя и пороги уверенности для минимизации таких ошибок.

    Работает ли этот механизм для всех языков?

    Он применяется в первую очередь там, где существует вероятность путаницы между раскладками с разными скриптами. Это наиболее актуально для стран, где используется нелатинский алфавит и пользователи часто переключаются между локальной раскладкой и стандартной латинской (QWERTY).

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.