SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google обрабатывает неоднозначные запросы с устройств с ограниченным вводом, используя логическое "ИЛИ" и логи прошлых поисковых запросов

METHODS AND APPARATUS FOR PROVIDING SEARCH RESULTS IN RESPONSE TO AN AMBIGUOUS SEARCH QUERY (Методы и аппаратура для предоставления результатов поиска в ответ на неоднозначный поисковый запрос)
  • US7136854B2
  • Google LLC
  • 2000-12-26
  • 2006-11-14
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Система обрабатывает неоднозначные входные данные, например, цифровую последовательность с телефонной клавиатуры, преобразуя их во все возможные буквенные комбинации. Эти комбинации проверяются по лексикону (включая словарь и журнал прошлых запросов) и отправляются в поисковую систему как единый запрос с оператором «ИЛИ». Это позволяет поисковой системе вернуть релевантные результаты, отфильтровав неправдоподобные интерпретации.

Описание

Какую проблему решает

Патент решает проблему неэффективности и сложности ввода текста на устройствах с ограниченными возможностями ввода, таких как стандартная телефонная клавиатура (актуально для эпохи WAP-телефонов). На таких устройствах одна клавиша соответствует нескольким символам (например, клавиша «2» соответствует «A», «B», «C»). Традиционный ввод требовал многократных нажатий. Изобретение позволяет пользователю нажимать каждую клавишу только один раз, создавая неоднозначную последовательность (например, «227» для «CAR» или «BAR»), и использует поисковую систему для устранения этой неоднозначности.

Что запатентовано

Запатентован метод обработки неоднозначного поискового запроса (ambiguous search query). Система получает последовательность неоднозначных компонентов (например, цифр) и преобразует её в набор потенциальных менее неоднозначных последовательностей (например, буквенных слов). Для этого используется информация о маппинге (соответствии клавиш символам) и lexicon (лексикон, включающий словарь и/или журнал предыдущих запросов). Эти потенциальные последовательности объединяются с помощью логического оператора «ИЛИ» (logical "OR") и отправляются в стандартную поисковую систему.

Как это работает

Механизм работает следующим образом:

  • Получение ввода: Пользователь вводит неоднозначную последовательность (например, «227»).
  • Генерация интерпретаций: Система определяет все возможные буквенные эквиваленты на основе маппинга устройства (например, «AAP», «BAP», «CAR», «BAR» и т.д.).
  • Фильтрация: Сгенерированные комбинации фильтруются с использованием lexicon (включая search query log), чтобы оставить только правдоподобные или ранее встречавшиеся слова.
  • Расширение запроса: Отобранные интерпретации формируются в один запрос с использованием логического «ИЛИ» («CAR» OR «BAR»).
  • Выполнение поиска и Дисамбигуация: Расширенный запрос отправляется в поисковую систему. Интерпретации, которых нет в индексе, игнорируются. При поиске фраз система полагается на стандартное ранжирование, которое отдает предпочтение документам с точным совпадением (exact match) одной из возможных фраз.

Актуальность для SEO

Низкая. Патент подан в 2000 году. Технология ввода, которую он описывает (ввод с цифровой клавиатуры телефона), устарела с появлением смартфонов с полноценными QWERTY-клавиатурами и голосовым поиском. Конкретная проблема, которую решал патент, в значительной степени неактуальна. Однако базовые принципы обработки неоднозначности и использования логов запросов для валидации интерпретаций остаются фундаментальными для этапа Понимания Запросов (Query Understanding).

Важность для SEO

Влияние на современные SEO-стратегии минимальное (2/10). Патент описывает инфраструктурное решение для устаревшей проблемы пользовательского интерфейса, а не алгоритмы ранжирования или оценки качества контента. Единственный значимый инсайт для SEO заключается в подтверждении того, что Google использует журналы прошлых поисковых запросов (search query log) в качестве lexicon для валидации и понимания возможных интерпретаций запросов пользователей.

Детальный разбор

Термины и определения

Ambiguous information components (Неоднозначные информационные компоненты)
Элементы входной последовательности, которые могут соответствовать более чем одному значению. Например, цифры с телефонной клавиатуры («2»), фонемы или визуальная информация.
Less ambiguous information components (Менее неоднозначные информационные компоненты)
Элементы, в которые преобразуются неоднозначные компоненты. Обычно это буквы или алфавитно-цифровые последовательности (например, «A», «B» или «C» для цифры «2»).
Lexicon (Лексикон)
Набор данных, используемый для валидации возможных интерпретаций неоднозначного запроса. В Claims 1, 12 и 24 патент явно определяет его как включающий данные, которые «ранее обрабатывались поисковой системой как поисковые запросы» (т.е. search query log). Также может включать словари.
Logical "OR" (Логическое «ИЛИ»)
Булев оператор, используемый для объединения всех валидных интерпретаций неоднозначного запроса в один запрос для поисковой системы.
Mapping information (Информация о маппинге)
Правила, определяющие соответствие между неоднозначными и менее неоднозначными компонентами (например, стандартная раскладка телефонной клавиатуры).
Number Word / Letter Word (Числовое слово / Буквенное слово)
Отдельное слово в запросе, представленное в виде последовательности цифр или букв соответственно.
Number Phrase / Letter Phrase (Числовая фраза / Буквенная фраза)
Последовательность из нескольких числовых или буквенных слов, составляющая запрос.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления результатов поиска в ответ на неоднозначный запрос.

  1. Система получает последовательность неоднозначных информационных компонентов от пользователя.
  2. Получает информацию о маппинге.
  3. Использует маппинг И lexicon для преобразования неоднозначной последовательности в как минимум две соответствующие менее неоднозначные последовательности. Критически важно: lexicon определяется как набор компонентов, которые ранее обрабатывались поисковой системой как поисковые запросы.
  4. Предоставляет эти (как минимум две) последовательности в качестве входных данных для поисковой системы, причем каждая последовательность эффективно соединена оператором логического «ИЛИ» (logical "OR" operation request).
  5. Получает результаты поиска и представляет их пользователю.

Claim 12 (Независимый пункт): Описывает метод обработки запроса, состоящего из нескольких слов (фразы).

  1. Получение как минимум двух числовых слов (number words), составляющих числовую фразу (number phrase).
  2. Преобразование каждого числового слова в одно или несколько буквенных слов (letter words) на основе маппинга и lexicon для генерации множества буквенных фраз (letter phrases). Лексикон снова определяется как список буквенных фраз, которые ранее обрабатывались поисковой системой как запросы.
  3. Формирование поискового запроса, включающего как минимум одну из этих буквенных фраз.
  4. Получение результатов и предоставление их пользователю.

Claim 15 (Зависимый от 12): Уточняет ранжирование результатов для фраз. Результаты ранжируются таким образом, что документы, содержащие точное совпадение (exact match) хотя бы одной из сгенерированных буквенных фраз, ранжируются выше, чем документы, которые не содержат точного совпадения ни одной из фраз.

Claim 24 (Независимый пункт): Описывает метод с акцентом на использовании логов запросов для фильтрации.

  1. Получение неоднозначной последовательности и перевод её во множество менее неоднозначных последовательностей.
  2. Определение подмножества этих последовательностей путем сравнения их с терминами, использованными в прошлых поисковых запросах, хранящимися в журнале поисковых запросов (search query log).
  3. Предоставление этого подмножества в качестве входных данных для поисковой системы.

Где и как применяется

Изобретение применяется на этапе понимания запроса и взаимодействует с этапом ранжирования для дисамбигуации.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система функционирует как препроцессор ввода.

  1. Интерпретация и Расширение: Преобразует неоднозначный ввод (например, цифры) в расширенный запрос, содержащий возможные интерпретации (буквы), соединенные через «ИЛИ».
  2. Валидация по Лексикону: Использует внешние данные — lexicon (словарь или search query log) — для фильтрации и определения правдоподобных интерпретаций.

RANKING – Ранжирование
Этап ранжирования используется для косвенной дисамбигуации.

  1. Фильтрация через Индекс: Интерпретации, отсутствующие в индексе, эффективно игнорируются.
  2. Ранжирование Фраз (Claim 15): При обработке многословных запросов система ранжирования отдает предпочтение документам с точным совпадением (exact match) одной из возможных фраз. Это помогает выбрать правильную интерпретацию (например, предпочтет «BAR ITEMS» вместо документа, содержащего только «CAR»).

Входные данные:

  • Неоднозначный поисковый запрос (например, последовательность цифр).
  • Информация о маппинге (раскладка клавиатуры устройства).
  • Lexicon (словарь и/или журнал предыдущих поисковых запросов).

Выходные данные:

  • Расширенный поисковый запрос (набор буквенных последовательностей, соединенных оператором «ИЛИ»), передаваемый в поисковую систему.

На что влияет

Патент описывает универсальный механизм обработки ввода и не делает различий по типам контента, тематикам или географии. Он влияет исключительно на:

  • Специфические запросы и устройства: Запросы, вводимые с устройств, генерирующих неоднозначный ввод (например, цифровые клавиатуры).

Когда применяется

  • Условия работы алгоритма: Алгоритм применяется, когда система получает ввод, классифицированный как неоднозначный (ambiguous information components). Это зависит от типа устройства ввода, используемого пользователем.
  • Триггеры активации: Получение запроса от устройства с известным неоднозначным маппингом (например, стандартная телефонная клавиатура).

Пошаговый алгоритм

Обработка неоднозначного запроса (на примере однословного запроса «227»)

  1. Получение ввода: Система получает последовательность неоднозначных компонентов («227»).
  2. Получение маппинга: Система загружает информацию о соответствии (например, 2={A,B,C}, 7={P,Q,R,S}).
  3. Генерация кандидатов: Система генерирует все возможные комбинации (3x3x4 = 36 комбинаций: AAP, BAP, CAR, BAR, CCS и т.д.).
  4. Фильтрация по Лексикону: Система сравнивает комбинации с lexicon (словарем или журналом прошлых запросов). Комбинации, отсутствующие в лексиконе (например, «AAP», «CCS»), отбрасываются. Остаются валидные интерпретации (например, «CAR», «BAR»).
  5. Формирование запроса: Валидные интерпретации объединяются с помощью логического «ИЛИ» («CAR» OR «BAR»).
  6. Выполнение поиска: Расширенный запрос отправляется в поисковую систему.
  7. Получение и представление результатов: Система получает результаты, соответствующие любой из интерпретаций, и представляет их пользователю.

Обработка неоднозначного фразового запроса (на примере «227 48367»)

  1. Получение ввода: Система получает числовую фразу («227 48367»).
  2. Генерация и фильтрация слов: Для каждого числового слова генерируются и фильтруются буквенные слова (например, «227» -> {CAR, BAR}; «48367» -> {ITEMS, ...}).
  3. Генерация фраз: Система генерирует возможные буквенные фразы, комбинируя отфильтрованные слова (например, «CAR ITEMS», «BAR ITEMS», ...).
  4. Формирование запроса: Буквенные фразы объединяются с помощью логического «ИЛИ».
  5. Выполнение поиска и Ранжирование: Запрос отправляется в поисковую систему. Система ранжирования отдает предпочтение документам с exact match одной из фраз. Документ с «BAR ITEMS» будет ранжироваться выше, чем документ, содержащий только «CAR».

Какие данные и как использует

Данные на входе

Патент сосредоточен исключительно на обработке ввода и не использует стандартные SEO-факторы (контентные, ссылочные и т.д.) для ранжирования. Он использует следующие данные:

  • Пользовательские факторы (Устройство): Тип устройства ввода и соответствующий ему маппинг (mapping information) критически важны для генерации возможных интерпретаций.
  • Поведенческие факторы (Системные данные):
    • Журнал поисковых запросов (Search Query Log): Явно используется как lexicon для определения того, какие интерпретации являются правдоподобными запросами, которые пользователи вводили ранее (Claim 1, 12, 24).
  • Системные данные (Словари): Словари также могут использоваться как lexicon для валидации того, являются ли сгенерированные буквенные комбинации существующими словами.

Какие метрики используются и как они считаются

В патенте не вводятся новые метрики ранжирования. Процесс основан на булевой логике и использовании внешних лексиконов:

  • Соответствие маппингу: Бинарная проверка соответствия неоднозначного компонента его возможным менее неоднозначным эквивалентам.
  • Присутствие в Лексиконе: Бинарная проверка наличия сгенерированной последовательности в словаре или журнале запросов.
  • Точное совпадение фразы (Exact Match): Используется стандартной поисковой системой на этапе ранжирования для приоритизации документов, которые точно содержат одну из возможных сгенерированных фраз (Claim 15). Это ключевой механизм дисамбигуации.

Выводы

Этот патент описывает внутренние процессы Google, связанные с обработкой специфического типа пользовательского ввода, и имеет ограниченную практическую ценность для современных SEO-стратегий.

  1. Инфраструктурное решение для устаревшей проблемы: Механизмы, описанные в патенте, были разработаны для решения проблем ввода на кнопочных телефонах. Эта технология ввода больше не актуальна в связи с развитием смартфонов.
  2. Стратегия обработки неоднозначности через расширение запроса: Патент демонстрирует подход к дисамбигуации путем расширения запроса (используя «ИЛИ») для охвата всех возможных интерпретаций. Задача выбора наилучшего результата перекладывается на существующие механизмы индексации и ранжирования.
  3. Критическая важность Журналов Поисковых Запросов (Search Query Logs): Ключевым элементом патента (Claims 1, 12, 24) является использование search query log в качестве lexicon для валидации интерпретаций. Это подтверждает, что данные о том, что пользователи искали в прошлом, активно используются для понимания и обработки текущих запросов.
  4. Дисамбигуация через Ранжирование Фраз: При обработке многословных запросов система полагается на то, что стандартные алгоритмы ранжирования предпочитают точные совпадения фраз (exact match). Это позволяет выбрать правильную интерпретацию неоднозначного ввода.

Практика

Патент является инфраструктурным и описывает обработку устаревшего метода ввода. Прямых практических рекомендаций для улучшения SEO в 2025 году на его основе сделать нельзя. Однако он дает контекст для понимания того, как Google использует данные о поведении пользователей.

Best practices (это мы делаем)

  • Создание контента, соответствующего реальным запросам: Поскольку Google использует search query logs для валидации интерпретаций языка (как показано в этом патенте), крайне важно использовать в контенте те формулировки, термины и фразы, которые реально используются пользователями для поиска. Это повышает вероятность того, что контент будет соответствовать валидированным интерпретациям запросов.
  • Использование четких и естественных фраз: Патент подчеркивает, что предпочтение отдается точному совпадению фраз при дисамбигуации. Использование естественных, полных фраз в тексте и заголовках помогает поисковой системе точно сопоставить контент с намерением пользователя.

Worst practices (это делать не надо)

  • Ориентация на несуществующие или крайне редкие запросы: Попытки оптимизации под запросы, которые никогда не вводились пользователями (отсутствуют в search query log), могут быть менее эффективными. Как показывает патент, Google может использовать логи запросов для фильтрации неправдоподобных интерпретаций языка.

Стратегическое значение

Стратегическое значение патента для современного SEO низкое. Он интересен с исторической точки зрения (подан в 2000 году, среди авторов Сергей Брин) и как пример того, как Google решает проблемы UX/UI с помощью своей поисковой инфраструктуры. Он подтверждает долгосрочную стратегию Google по сбору и использованию данных о поведении пользователей (в частности, логов запросов) для улучшения понимания языка и намерений.

Практические примеры

Практических примеров применения данного патента в современной SEO-практике нет, так как он решает проблему, связанную с устаревшими устройствами ввода.

Вопросы и ответы

Использует ли Google этот патент сегодня?

Вероятнее всего, конкретная реализация для обработки ввода с цифровых клавиатур используется крайне редко, поскольку такие устройства устарели. Современные смартфоны используют гораздо более совершенные методы ввода. Однако базовый принцип использования лексиконов (включая логи запросов) для интерпретации неоднозначного ввода может сохраняться в других системах (например, при обработке голосовых запросов или опечаток).

Что такое «Lexicon» в контексте этого патента?

Lexicon — это база данных для проверки того, являются ли сгенерированные интерпретации неоднозначного ввода правдоподобными. Патент явно указывает (в Claims 1, 12, 24), что это может быть стандартный словарь или журнал предыдущих поисковых запросов (search query log). Использование лога запросов означает, что интерпретация считается валидной, если кто-то уже искал это ранее.

Что означает использование логического «ИЛИ» (Logical OR)?

Это означает, что система не пытается угадать единственно верную интерпретацию до начала поиска. Вместо этого она генерирует все валидные варианты (например, «CAR» и «BAR») и просит поисковую систему найти документы, соответствующие любому из них («CAR» OR «BAR»). Это перекладывает задачу финальной дисамбигуации на поисковый индекс и алгоритмы ранжирования.

Как система определяет, какая интерпретация лучше, если их несколько?

Для однословных запросов система полагается на стандартное ранжирование. Для многословных запросов (фраз) патент указывает (Claim 15), что предпочтение отдается документам, содержащим точное совпадение (exact match) одной из возможных фраз. Например, если ввод может означать «CAR ITEMS» или «BAR ITEMS», документ с точной фразой «BAR ITEMS» будет ранжироваться выше.

Влияет ли этот патент на SEO моего сайта?

Напрямую нет. Патент описывает инфраструктурное решение для устаревшей проблемы пользовательского интерфейса и не вводит новых факторов ранжирования или методов оценки качества контента. Он относится к этапу обработки ввода, а не к ранжированию.

Есть ли практическая польза для SEO от понимания этого патента?

Польза минимальна и концептуальна. Основной вывод для SEO-специалистов — это подтверждение того, что Google активно использует данные прошлых поисковых запросов (search query logs) для понимания и валидации языка. Это подчеркивает важность использования в контенте тех формулировок и фраз, которые реально используются целевой аудиторией.

Как этот патент связан с обработкой опечаток?

Концептуально связь есть. Как при обработке опечаток, так и здесь система генерирует альтернативные интерпретации ввода и использует lexicon или логи запросов для выбора наиболее вероятной интерпретации. Однако техническая реализация в этом патенте специфична для маппинга клавиатуры, а не для близости написания слов.

Может ли этот механизм применяться к другим типам ввода, кроме цифр?

Да, патент описывает механизм в общих терминах. Он упоминает, что может применяться к фонетическому вводу (Claim 5) или визуальной информации (Claim 7). Главное условие — наличие маппинга между неоднозначным вводом и менее неоднозначными интерпретациями.

Учитывает ли система контекст пользователя при дисамбигуации?

В патенте не упоминается использование контекста пользователя (например, местоположения или истории поиска) для выбора между возможными интерпретациями на этапе генерации. Однако упоминается возможность переупорядочивания финальных результатов поиска с учетом языка пользователя (Claim 17).

Нужно ли оптимизировать сайт под числовые последовательности (T9-ввод)?

Нет. Система преобразует числовые последовательности в буквенные слова перед выполнением поиска. Оптимизация должна проводиться под релевантные ключевые слова и интенты, а не под артефакты устаревшего метода ввода.

Похожие патенты

Как Google создавал "неоднозначные индексы" для обработки запросов с кнопочных телефонов и устройств с ограниченным вводом
Google разработал метод обработки запросов с устройств, где ввод текста затруднен (например, кнопочные телефоны). Система создает вторичный, намеренно "неоднозначный" индекс (например, числовой), транслируя стандартный алфавитный индекс. Неоднозначный запрос пользователя (строка цифр) сопоставляется напрямую с этим вторичным индексом для поиска результатов.
  • US6865575B1
  • 2005-03-08
  • Индексация

Как Google адаптировал поисковый индекс для обработки неоднозначных запросов с кнопочных телефонов (WAP/T9)
Google разработал метод для обработки поисковых запросов с устройств с ограниченным вводом, таких как кнопочные телефоны. Система создает вторичный "неоднозначный" индекс (например, числовой), который отражает раскладку клавиатуры устройства. Это позволяет напрямую сопоставлять неоднозначный ввод пользователя (например, последовательность цифр) с терминами в индексе, не требуя уточнения каждой буквы.
  • US6529903B2
  • 2003-03-04
  • Индексация

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google определяет язык запроса, используя язык интерфейса и статистику по словам для добавления правильных диакритических знаков
Google использует механизм для точного определения языка, на котором пользователь вводит запрос, особенно когда слова неоднозначны или не содержат диакритических знаков. Система анализирует язык интерфейса пользователя и статистику использования слов в разных языках. Это позволяет Google понять, какие диакритические знаки (например, акценты) следует добавить к запросу, чтобы найти наиболее релевантные документы на правильном языке.
  • US8762358B2
  • 2014-06-24
  • Мультиязычность

  • Семантика и интент

Популярные патенты

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google использует реальные данные о скорости загрузки страниц (RUM) для повышения быстрых и понижения медленных сайтов в выдаче
Google собирает данные о времени загрузки страниц у реальных пользователей (RUM) и использует их для корректировки ранжирования. Система сравнивает скорость сайта с глобальными порогами, основанными на процентилях. Если сайт медленнее большинства других (например, медленнее 85% или 96%), его рейтинг понижается. Очень быстрые сайты могут получать повышение. Оценка скорости учитывает географию и тип устройства пользователя.
  • US8645362B1
  • 2014-02-04
  • Техническое SEO

  • Поведенческие сигналы

  • SERP

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
  • US8719276B1
  • 2014-05-06
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

seohardcore