SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google создавал "неоднозначные индексы" для обработки запросов с кнопочных телефонов и устройств с ограниченным вводом

METHODS AND APPARATUS FOR USING A MODIFIED INDEX TO PROVIDE SEARCH RESULTS IN RESPONSE TO AN AMBIGUOUS SEARCH QUERY (Методы и аппаратура для использования модифицированного индекса для предоставления результатов поиска в ответ на неоднозначный поисковый запрос)
  • US6865575B1
  • Google LLC
  • 2003-01-27
  • 2005-03-08
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google разработал метод обработки запросов с устройств, где ввод текста затруднен (например, кнопочные телефоны). Система создает вторичный, намеренно "неоднозначный" индекс (например, числовой), транслируя стандартный алфавитный индекс. Неоднозначный запрос пользователя (строка цифр) сопоставляется напрямую с этим вторичным индексом для поиска результатов.

Описание

Какую проблему решает

Патент решает проблему сложности и низкой эффективности ввода точных текстовых запросов на устройствах с ограниченными интерфейсами, таких как ранние мобильные (WAP) телефоны с цифровой клавиатурой. На таких устройствах одно нажатие клавиши соответствует нескольким символам (например, клавиша «2» — это A, B или C). Традиционный ввод (мультитап) требовал многократных нажатий для выбора нужного символа. Изобретение улучшает пользовательский опыт, позволяя вводить неоднозначный запрос (например, строку цифр) напрямую, без точного выбора букв.

Что запатентовано

Запатентован метод создания вторичного, намеренно «неоднозначного» индекса (ambiguated index или second index), который является производным от первичного, точного индекса (first index). Неоднозначность во вторичном индексе точно соответствует неоднозначности метода ввода на устройстве пользователя (например, раскладке телефонной клавиатуры). Это позволяет системе сопоставлять Ambiguous Search Query пользователя непосредственно с этим предварительно обработанным неоднозначным индексом.

Как это работает

Система работает в два этапа:

  • Офлайн (Индексирование): Система берет стандартный алфавитно-цифровой индекс и транслирует каждый термин в его неоднозначный эквивалент, используя информацию о сопоставлении (mapping information). Например, по раскладке телефонной клавиатуры слова «car» и «bar» транслируются в числовую строку «227». Создается вторичный индекс, где эти числовые строки связаны со всеми документами, содержащими исходные слова.
  • Онлайн (Обработка запроса): Пользователь вводит неоднозначный запрос (например, «227»). Система ищет этот запрос непосредственно во вторичном (числовом) индексе и возвращает все связанные документы (в данном примере, содержащие как «car», так и «bar»).

Актуальность для SEO

Низкая. Патент описывает решение проблемы, актуальной для эпохи WAP-телефонов и устройств без QWERTY-клавиатур (приоритетная заявка датируется 2000 годом). В 2025 году подавляющее большинство пользователей используют смартфоны с полноценными виртуальными клавиатурами, предиктивным вводом и голосовым поиском. Описанная проблема неоднозначного ввода с цифровой клавиатуры практически неактуальна.

Важность для SEO

Минимальное влияние (1/10). Патент описывает чисто технические, инфраструктурные процессы Google, связанные с индексированием и поиском для специфических, ныне устаревших устройств ввода. Он не содержит информации о сигналах ранжирования, оценке качества контента, релевантности или поведении пользователей. Прямых практических рекомендаций для современных SEO-стратегий из этого патента извлечь невозможно.

Детальный разбор

Термины и определения

Ambiguous Search Query (Неоднозначный поисковый запрос)
Запрос, введенный пользователем с использованием метода ввода, где одно действие (например, нажатие клавиши) может соответствовать нескольким символам. Пример: ввод «227» на телефонной клавиатуре.
First Index (Первичный индекс)
Стандартный индекс поисковой системы, связывающий информацию первого типа (например, точные алфавитно-цифровые термины) с документами.
First Type Information (Информация первого типа)
Точная, однозначная информация, такая как алфавитно-цифровые строки (слова).
Mapping Information (Информация о сопоставлении)
Правила трансляции информации первого типа в информацию второго типа. Отражает раскладку устройства ввода пользователя (например, соответствие букв цифрам на телефонной клавиатуре).
Second Index (Вторичный индекс / Модифицированный индекс)
Индекс, созданный путем трансляции первичного индекса. Он связывает информацию второго типа (например, числовые строки) с документами. Является намеренно неоднозначным (ambiguated).
Second Type Information (Информация второго типа)
Неоднозначная информация, полученная в результате трансляции. В патенте упоминаются числовые, фонетические или аудиовизуальные данные.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод генерации модифицированного индекса.

  1. Система принимает первичный индекс (first index), который связывает информацию первого типа с документами.
  2. Информация первого типа транслируется в информацию второго типа.
  3. Создается вторичный индекс (second index) путем связывания информации второго типа с теми же документами.

Ядро изобретения — создание предварительно обработанного, неоднозначного индекса, а не попытка разрешить неоднозначность запроса пользователя в реальном времени.

Claim 3 (Зависимый от 2): Уточняет природу трансляции (Mapping).

Сопоставление (mapping) транслирует множество элементов информации первого типа в один элемент информации второго типа. Это математическое определение неоднозначности, используемой в патенте (например, буквы A, B, C транслируются в цифру 2).

Claim 11 и 12 (Зависимые): Определяют характеристики типов информации.

Информация второго типа является более неоднозначной (more ambiguous), чем информация первого типа. Информация первого типа может быть точно сопоставлена со вторым типом, но обратное сопоставление (из второго в первый) является неоднозначным.

Claim 13 (Независимый пункт): Описывает метод обработки поискового запроса с использованием двух индексов.

  1. Система принимает запрос.
  2. Если запрос содержит информацию первого типа (например, алфавитный текст): результаты генерируются путем сравнения с первичным индексом.
  3. Если запрос содержит информацию второго типа (например, цифры с телефона): результаты генерируются путем сравнения со вторичным индексом.
  4. Между информацией первого и второго типа существует определенное сопоставление (mapping).

Это описывает логику выбора нужного индекса в зависимости от формата входящего запроса.

Где и как применяется

Изобретение затрагивает этапы индексирования и базового поиска (Retrieval).

INDEXING – Индексирование и извлечение признаков
Основное применение патента. На этом этапе система выполняет стандартное индексирование для создания First Index. Затем запускается дополнительный офлайн-процесс трансляции, который использует Mapping Information для генерации Second Index.

RANKING – Ранжирование (L1 - Retrieval / Отбор кандидатов)
На этапе отбора кандидатов система должна определить тип входящего запроса. Если запрос однозначный (Type 1), он направляется для поиска по First Index. Если запрос неоднозначный (Type 2), он направляется для поиска по Second Index. Патент не описывает сам процесс ранжирования (скоринга), а только механизм извлечения документов из соответствующего индекса.

Входные данные (Генерация индекса):

  • Первичный индекс (First Index).
  • Информация о сопоставлении (Mapping Information), например, раскладка телефонной клавиатуры.

Выходные данные (Генерация индекса):

  • Вторичный индекс (Second Index).

Входные данные (Обработка запроса):

  • Поисковый запрос (однозначный или неоднозначный).

Выходные данные (Обработка запроса):

  • Набор результатов поиска, извлеченный из соответствующего индекса.

На что влияет

Патент имеет крайне ограниченную область влияния:

  • Пользовательские факторы (Устройства): Влияет исключительно на пользователей, использующих устройства с ограниченными возможностями ввода, такими как старые кнопочные телефоны.
  • Типы запросов: Влияет на обработку запросов, поступающих в неоднозначном формате (например, числовом).

Патент не влияет на конкретные типы контента, тематики, форматы или географические регионы. Он не связан с качеством или релевантностью контента.

Когда применяется

  • Условия работы алгоритма: Алгоритм генерации вторичного индекса применяется офлайн, как часть общего процесса индексирования.
  • Триггеры активации: Использование вторичного индекса активируется в реальном времени, когда система получает запрос в соответствующем неоднозначном формате (например, числовая строка, поступившая с мобильного устройства).

Пошаговый алгоритм

Процесс А: Генерация неоднозначного индекса (Офлайн)

  1. Генерация первичного индекса: Создается стандартный алфавитно-цифровой индекс (First Index) на основе корпуса документов.
  2. Получение информации о сопоставлении: Загружаются правила трансляции (Mapping Information), например, стандартная телефонная раскладка (2=ABC, 3=DEF и т.д.).
  3. Трансляция терминов: Каждый термин в первичном индексе транслируется в его неоднозначный эквивалент. Например, «car» -> «227», «bar» -> «227».
  4. Генерация вторичного индекса: Создается Second Index, который связывает транслированные термины (например, «227») со всеми документами, которые содержали исходные термины (документы с «car» и документы с «bar»).

Процесс Б: Обработка запроса (Онлайн)

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Определение типа запроса: Система определяет, является ли запрос однозначным (Type 1) или неоднозначным (Type 2).
  3. Выбор индекса:
    • Если Type 1: Используется First Index.
    • Если Type 2: Используется Second Index.
  4. Поиск по индексу: Запрос сравнивается с терминами в выбранном индексе.
  5. Генерация результатов: Идентифицируются документы, соответствующие запросу. Патент отмечает, что результаты из Second Index будут менее точными, чем из First Index, так как включают все возможные интерпретации неоднозначного термина.
  6. Предоставление результатов: Результаты поиска предоставляются пользователю.

Какие данные и как использует

Патент чисто технический и фокусируется исключительно на механизме индексирования и поиска. Он не описывает использование каких-либо факторов ранжирования.

Данные на входе

  • Контентные факторы: Используются только сами термины (слова), извлеченные из документов. Патент не упоминает заголовки, мета-теги или структуру контента.

Другие факторы (технические, ссылочные, поведенческие, временные и т.д.) в патенте не упоминаются и не используются описанной системой.

Какие метрики используются и как они считаются

В патенте не упоминаются никакие метрики для оценки качества, релевантности или ранжирования. Описанная система решает задачу бинарного сопоставления — соответствует ли термин в индексе запросу пользователя.

Выводы

Патент описывает внутренние процессы Google без прямых рекомендаций для SEO. Он дает следующее понимание работы системы:

  1. Инфраструктурное решение устаревшей проблемы: Патент предлагает техническое решение для проблемы ввода текста на устройствах, которые были распространены в начале 2000-х годов (кнопочные телефоны). Для современного поиска и SEO он не актуален.
  2. Предварительное вычисление неоднозначности: Ключевая идея патента — перенести сложность обработки неоднозначности с этапа выполнения запроса на этап индексирования. Вместо того чтобы пытаться угадать, что имел в виду пользователь, вводя «227», система заранее индексирует все слова, соответствующие «227».
  3. Принятие неточности результатов: Система признает, что результаты поиска по неоднозначному индексу будут менее точными (содержать больше шума), чем по стандартному индексу. Это компромисс ради удобства ввода.
  4. Отсутствие SEO-значимости: Патент не содержит информации о факторах ранжирования, качестве сайтов или контента. Он посвящен исключительно механике индексирования и извлечения данных для специфических устройств ввода.

Практика

Патент является инфраструктурным и не дает практических выводов для SEO.

Best practices (это мы делаем)

На основе этого патента нет рекомендаций для современных SEO-практик. Он не подтверждает и не опровергает важность каких-либо стратегий оптимизации контента, технических аспектов или ссылочного профиля.

Worst practices (это делать не надо)

Патент не указывает на какие-либо SEO-тактики, которые становятся неэффективными или опасными. Он не направлен против манипуляций выдачей.

Стратегическое значение

Стратегическое значение патента для современного SEO минимально. Он представляет исторический интерес как пример ранних усилий Google по адаптации поисковой системы к мобильным устройствам и различным модальностям ввода. Патент демонстрирует готовность Google модифицировать базовую архитектуру индекса для решения конкретных пользовательских задач, но не влияет на долгосрочную SEO-стратегию в 2025 году.

Практические примеры

Практических примеров для SEO нет. Патент не описывает механизмы, на которые может повлиять SEO-специалист.

Вопросы и ответы

Означает ли этот патент, что Google хранит несколько версий индекса?

Да, патент прямо описывает создание как минимум двух индексов: первичного (First Index), содержащего точные данные (например, алфавитно-цифровые), и вторичного (Second Index), содержащего транслированные, неоднозначные данные (например, числовые). Система выбирает индекс в зависимости от типа входящего запроса.

Актуален ли этот патент в эпоху смартфонов и голосового поиска?

Нет, актуальность крайне низкая. Патент решает проблему ввода на устройствах с цифровой клавиатурой (WAP-телефоны), которые практически вышли из употребления. Современные смартфоны используют полноценные QWERTY-клавиатуры или голосовой ввод, устраняя проблему неоднозначности, описанную в патенте.

Влияет ли описанный механизм на ранжирование сайтов?

Нет, патент не описывает никаких механизмов ранжирования или оценки релевантности. Он посвящен исключительно процессу индексирования (созданию модифицированного индекса) и извлечению (Retrieval) документов, соответствующих неоднозначному запросу.

Как система справляется с тем, что результаты по неоднозначному индексу менее точны?

Патент признает, что результаты будут менее точными. Например, поиск по «227» вернет документы и про «car», и про «bar». Система просто возвращает все совпадения из неоднозначного индекса. Это компромисс, на который идет система ради упрощения ввода для пользователя.

Нужно ли оптимизировать контент сайта под числовые запросы?

Нет, это не имеет смысла. Числовой индекс создается автоматически путем трансляции стандартного текстового контента. SEO-специалистам следует сосредоточиться на создании качественного контента, релевантного стандартным текстовым запросам пользователей.

Может ли этот механизм применяться для других типов неоднозначности, кроме телефонной клавиатуры?

Теоретически да. В патенте упоминается, что информация второго типа может быть не только числовой, но и фонетической или аудиовизуальной. Концепция создания специализированного индекса, отражающего определенный тип неоднозначности ввода, является универсальной.

Чем этот подход отличается от предиктивного ввода текста (например, T9)?

T9 и аналогичные системы пытаются разрешить неоднозначность на стороне клиента, предлагая пользователю варианты слов на основе словаря. Описанный в патенте подход не пытается разрешить неоднозначность запроса. Вместо этого он делает сам индекс неоднозначным и ищет совпадения напрямую в нем.

Есть ли в патенте информация о E-E-A-T или качестве контента?

Нет. Патент подан задолго до появления концепции E-E-A-T и фокусируется исключительно на инфраструктурных аспектах индексирования и поиска для устройств с ограниченным вводом. Вопросы качества контента в нем не рассматриваются.

Кто является изобретателями и что это говорит о патенте?

Среди изобретателей Сергей Брин (сооснователь Google), Санджай Гемават (один из ключевых архитекторов инфраструктуры Google) и Кристофер Мэннинг (известный эксперт в области NLP). Это указывает на то, что патент описывает фундаментальное инфраструктурное и алгоритмическое решение, разработанное на ранних этапах развития компании.

Какую практическую пользу SEO-специалист может извлечь из этого патента?

Практическая польза для повседневной работы по SEO продвижению сайтов отсутствует. Патент полезен только для глубокого понимания истории развития поисковых систем и того, как Google адаптировал свою инфраструктуру для решения проблем совместимости с различными устройствами.

Похожие патенты

Как Google адаптировал поисковый индекс для обработки неоднозначных запросов с кнопочных телефонов (WAP/T9)
Google разработал метод для обработки поисковых запросов с устройств с ограниченным вводом, таких как кнопочные телефоны. Система создает вторичный "неоднозначный" индекс (например, числовой), который отражает раскладку клавиатуры устройства. Это позволяет напрямую сопоставлять неоднозначный ввод пользователя (например, последовательность цифр) с терминами в индексе, не требуя уточнения каждой буквы.
  • US6529903B2
  • 2003-03-04
  • Индексация

Как Google обрабатывает неоднозначные запросы с устройств с ограниченным вводом, используя логическое "ИЛИ" и логи прошлых поисковых запросов
Система обрабатывает неоднозначные входные данные, например, цифровую последовательность с телефонной клавиатуры, преобразуя их во все возможные буквенные комбинации. Эти комбинации проверяются по лексикону (включая словарь и журнал прошлых запросов) и отправляются в поисковую систему как единый запрос с оператором «ИЛИ». Это позволяет поисковой системе вернуть релевантные результаты, отфильтровав неправдоподобные интерпретации.
  • US7136854B2
  • 2006-11-14
  • Семантика и интент

  • SERP

Как Google определяет язык запроса, используя язык интерфейса и статистику по словам для добавления правильных диакритических знаков
Google использует механизм для точного определения языка, на котором пользователь вводит запрос, особенно когда слова неоднозначны или не содержат диакритических знаков. Система анализирует язык интерфейса пользователя и статистику использования слов в разных языках. Это позволяет Google понять, какие диакритические знаки (например, акценты) следует добавить к запросу, чтобы найти наиболее релевантные документы на правильном языке.
  • US8762358B2
  • 2014-06-24
  • Мультиязычность

  • Семантика и интент

Как Google оптимизирует локальный поиск на мобильных устройствах с помощью числового индексирования
Патент описывает метод повышения эффективности поиска локальных данных (например, контактов) на мобильных устройствах. Система заранее преобразует алфавитно-цифровые данные в числовой индекс, основываясь на раскладке клавиатуры (аналогично T9). Это позволяет устройству быстро находить совпадения при вводе запроса, экономя вычислительные ресурсы и заряд батареи. Патент фокусируется на производительности устройства, а не на алгоритмах веб-поиска.
  • US8775407B1
  • 2014-07-08
  • Local SEO

  • Индексация

Как Google исправляет запросы, введенные с неправильной раскладкой клавиатуры, используя контекст пользователя
Google использует механизм для автоматического определения и исправления запросов, введенных с ошибочной раскладкой клавиатуры. Если исходный запрос возвращает неудовлетворительные результаты, система анализирует контекст пользователя (язык интерфейса, местоположение, историю поиска), чтобы определить предполагаемый язык. Затем запрос перекодируется в правильный скрипт, и пользователю показываются релевантные результаты.
  • US8676824B2
  • 2014-03-18
  • Мультиязычность

  • Поведенческие сигналы

Популярные патенты

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы
Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.
  • US20120278171A1
  • 2012-11-01
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента
Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.
  • US9098511B1
  • 2015-08-04
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

seohardcore