SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google Autocomplete обрабатывает запросы, смешивающие разные языки и форматы ввода (например, иероглифы, пиньинь и английский)

GENERATING INPUT SUGGESTIONS (Генерирование вариантов ввода)
  • US20120203541A1
  • Google LLC
  • 2009-11-25
  • 2012-08-09
  • Мультиязычность
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для генерации поисковых подсказок (Autocomplete), когда пользователь вводит запрос, смешивая разные языки или системы письма. Система создает альтернативные, "неоднозначные" представления ввода, запрашивает подсказки и фильтрует их. Это позволяет корректно интерпретировать сложный ввод (например, сочетание китайских иероглифов, пиньиня и английских слов) и предлагать релевантные варианты.

Описание

Какую проблему решает

Патент решает проблему генерации релевантных поисковых подсказок (Input Suggestions, Autocomplete), когда пользователь вводит текст в смешанных форматах (mixed input). Это особенно актуально для языков с несколькими системами письма, например, китайского, где ввод может одновременно содержать иероглифы (Hanzi), полную фонетическую транскрипцию (Pinyin syllables), сокращенную транскрипцию (Pinyin abbreviations) и слова на другом языке (например, английском). Система улучшает пользовательский опыт, позволяя получать корректные подсказки без необходимости переключать раскладку или использовать редакторы метода ввода (IME).

Что запатентовано

Запатентован метод обработки смешанного текстового ввода для генерации поисковых подсказок. Суть изобретения заключается в преобразовании исходного смешанного ввода в одну или несколько Alternative Representations (альтернативных представлений) в Ambiguous Form (неоднозначной форме). Эти представления затем отправляются в службу подсказок (Suggestion Service), а полученные результаты фильтруются путем сравнения с исходным вводом, чтобы предоставить пользователю релевантные варианты (Selectable Alternatives).

Как это работает

Механизм работает в несколько этапов:

  • Получение и Сегментация: Система получает смешанный ввод и разбивает его на последовательные сегменты (слова или запросы), часто используя метод поиска самого длинного префикса (prefix matching).
  • Генерация альтернативных представлений: Для каждого сегмента определяются альтернативные формы (например, иероглиф заменяется на Pinyin). Путем комбинации этих форм создаются Alternative Representations ввода в Ambiguous Form.
  • Запрос к службе подсказок: Эти неоднозначные представления отправляются в Suggestion Service для получения широкого спектра кандидатов.
  • Сравнение и Фильтрация: Полученные подсказки сравниваются с исходным вводом. Те, которые лингвистически не соответствуют вводу, отсеиваются.
  • Ранжирование и Отображение: Оставшиеся варианты ранжируются и показываются пользователю.

Актуальность для SEO

Высокая. Обработка многоязычных и смешанных запросов остается критически важной задачей, особенно на мобильных устройствах и на рынках, использующих нелатинские системы письма (CJK – Китай, Япония, Корея). Описанная архитектура обработки неоднозначности ввода для Autocomplete остается фундаментальной для обеспечения качественного пользовательского опыта.

Важность для SEO

Влияние на SEO умеренное (4/10). Патент не описывает алгоритмы ранжирования поисковой выдачи. Он полностью сосредоточен на этапе формулирования запроса (Query Formulation) и работе системы Autocomplete. Однако он критически важен для международного SEO и Keyword Research, поскольку демонстрирует, как Google интерпретирует сложные запросы и направляет поисковое поведение пользователей, особенно в многоязычных контекстах.

Детальный разбор

Термины и определения

Alternative Representations (Альтернативные представления)
Набор строк, сгенерированных из исходного ввода путем замены одного или нескольких сегментов их альтернативными формами (например, замена иероглифа на его фонетическую транскрипцию). Используются для запроса к службе подсказок.
Ambiguous Form (Неоднозначная форма)
Формат альтернативного представления, который намеренно охватывает несколько возможных интерпретаций. Он может соответствовать подсказкам, которые не точно соответствуют исходному вводу. Используется для увеличения охвата (Recall) потенциальных подсказок.
First Form / Second Form (Первая / Вторая форма)
Различные способы представления одного языка. В контексте патента: Первая форма – иероглифы (Hanzi); Вторая форма – фонетические представления (Pinyin).
Input Suggestion Aggregator (Агрегатор поисковых подсказок)
Компонент системы, включающий Transform Submodule (для генерации альтернативных представлений) и Comparison Submodule (для фильтрации подсказок).
N-gram (N-грамма)
Последовательность из N последовательных токенов (символов или слов) в текстовом вводе.
Pinyin Abbreviation (Аббревиатура Пиньинь)
Частичное фонетическое представление (partial phonetic representation). Например, "z" для "zhong".
Pinyin Syllable (Слог Пиньинь)
Полное фонетическое представление (complete phonetic representation). Например, "zhong".
Segmentation (Сегментация)
Процесс разделения текстового ввода на непрерывные последовательности символов (сегменты), где каждый сегмент представляет слово или запрос.
Selectable Alternatives (Выбираемые альтернативы)
Финальный набор поисковых подсказок, прошедших фильтрацию и готовых к отображению пользователю.
Suggestion Service (Служба подсказок)
Сервис, который принимает текстовый ввод (в данном случае Alternative Representations) и возвращает набор поисковых подсказок.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы для обработки смешанного ввода.

  1. Система получает текстовый ввод, который содержит смешанные формы: N-грамму в Форме 1 Языка 1 (например, Hanzi) И, как минимум, одно из: N-грамму в Форме 2 Языка 1 (например, Pinyin) ИЛИ N-грамму на Языке 2 (например, Английский).
  2. Генерируются одна или несколько Alternative Representations этого ввода.
  3. Эти представления имеют Ambiguous Form и могут представлять подсказки, которые не напрямую соответствуют исходному вводу.
  4. Представления отправляются в Suggestion Service, откуда система получает поисковые подсказки.
  5. Полученные подсказки сравниваются с исходным вводом для идентификации группы Selectable Alternatives для отображения пользователю.

Claim 2 (Зависимый от 1): Детализирует процесс генерации Alternative Representations.

  1. Текстовый ввод сегментируется на непрерывные последовательности символов (слова или запросы).
  2. Для каждого сегмента идентифицируются его представления в альтернативной форме.
  3. В исходном вводе один или несколько сегментов заменяются их альтернативными формами, формируя Alternative Representation.

Claims 6, 7, 8 (Зависимые): Определяют конкретный сценарий применения.

Система спроектирована для обработки китайского языка, где Форма 1 — иероглифы (Hanzi), а Форма 2 включает полные (Pinyin syllable) и частичные (Pinyin abbreviation) фонетические представления. Также учитывается смешивание с английским языком (Язык 2).

Где и как применяется

Изобретение применяется на этапе взаимодействия пользователя с поисковой строкой, до того как запрос отправлен на ранжирование.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента, конкретно в подсистеме Autocomplete (Google Suggest). Система работает в реальном времени по мере ввода пользователем символов. Она отвечает за интерпретацию сложного, смешанного ввода и генерацию списка предполагаемых запросов.

Взаимодействие компонентов:

  • Input Suggestion Aggregator получает ввод от клиента, обрабатывает его с помощью Transform Submodule, взаимодействует с Suggestion Service для получения кандидатов, и фильтрует их с помощью Comparison Submodule.

Входные данные:

  • Сырой текстовый ввод пользователя в смешанном формате (например, "北jingfd office hour").
  • Лингвистические данные для сегментации и трансформации (словари, соответствия Hanzi/Pinyin).

Выходные данные:

  • Отфильтрованный и отсортированный список поисковых подсказок (Selectable Alternatives).

На что влияет

  • Языковые и географические ограничения: Наибольшее влияние оказывает на языки с нелатинскими системами письма, которые используют фонетический ввод на основе латиницы. Патент явно фокусируется на китайском, но метод применим к другим (например, японскому, корейскому).
  • Многоязычные запросы: Влияет на ситуации глобального поиска, когда пользователи смешивают языки в одном запросе (например, название бренда на английском и категория товара на местном языке).

Когда применяется

  • Условия работы: Алгоритм активируется, когда система обнаруживает в строке ввода смешение различных форм представления одного языка или смешение разных языков.
  • Временные рамки: Применяется в реальном времени. Патент упоминает возможность отправки запроса немедленно после получения каждого токена или после ожидания предопределенного количества времени (predetermined amount of time).

Пошаговый алгоритм

Процесс генерации поисковых подсказок для смешанного ввода:

  1. Получение ввода: Система получает текстовый ввод от пользователя (например, "中ggug").
  2. Сегментация ввода: Transform Submodule разбивает ввод на сегменты. В патенте описывается метод prefix matching (поиск самого длинного префикса): ищется самая длинная последовательность символов, представляющая слово или запрос, начиная с начала строки.
    • Пример: "中ggug" сегментируется как: "中" | "g" | "gu" | "g".
  3. Идентификация альтернативных форм: Для каждого сегмента определяются его альтернативные формы.
    • Пример: Для "中" альтернативы – "zhong" (полный Pinyin) и "z" (аббревиатура). Для "gu" альтернатива – "g" (аббревиатура).
  4. Генерация альтернативных представлений (Alternative Representations): Система комбинирует исходные сегменты и их альтернативные формы для создания набора представлений в Ambiguous Form.
    • Пример: "zhongggug", "zggug", "zhongggg", "zggg", "中ggg".
  5. Запрос к Suggestion Service: Сгенерированные представления отправляются в службу подсказок.
  6. Получение кандидатов: Suggestion Service возвращает список подсказок, соответствующих этим неоднозначным представлениям.
    • Пример: "中国谷歌" (Google China), "中国国歌" (Chinese national anthem), "做广告工" (advertising industry).
  7. Сравнение и Фильтрация: Comparison Submodule сравнивает полученные подсказки с исходным вводом ("中ggug"), чтобы обеспечить точность. Подсказки, которые вряд ли соответствуют вводу, исключаются.
    • Пример: "做广告工" (zuo guang gao gong) отфильтровывается, так как "zuo" не соответствует "中" (zhong). "中国谷歌" (zhong guo gu ge) проходит фильтрацию как прямое соответствие (direct match).
  8. Ранжирование и Отображение: Оставшиеся подсказки (Selectable Alternatives) ранжируются. В описании патента упоминается ранжирование на основе частоты использования запросов уникальными пользователями (популярности) и возможное модифицирование ранга с использованием edit distance (редакционного расстояния) до исходного ввода.

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке ввода и не детализирует все данные, используемые Suggestion Service.

  • Пользовательские факторы (Ввод): Непосредственный текстовый ввод пользователя в смешанном формате.
  • Лингвистические данные: Система должна иметь доступ к данным, определяющим взаимосвязи между разными формами языка:
    • Соответствие иероглифов (Hanzi) и фонетических представлений (Pinyin syllables и Pinyin abbreviations).
    • Словари для выполнения корректной сегментации.
  • Поведенческие факторы (для ранжирования подсказок): Агрегированные данные о частоте (frequencies), с которой уникальные пользователи ранее вводили определенные запросы.

Какие метрики используются и как они считаются

  • Prefix Matching (Совпадение префикса): Алгоритм, используемый для сегментации ввода путем поиска самой длинной последовательности, являющейся известным словом или запросом.
  • Frequency (Частота использования / Популярность): Упоминается как основа для ранжирования финальных подсказок. Чем популярнее запрос, тем выше его ранг в Autocomplete.
  • Edit Distance (Редакционное расстояние): Упоминается как возможный модификатор ранжирования. Подсказки, которые текстуально ближе к вводу пользователя (например, не требуют транслитерации), могут получать повышение.

Выводы

  1. Инфраструктура Autocomplete для сложных языков: Патент описывает техническую реализацию Google Autocomplete, позволяющую обрабатывать сложные входные данные, смешивающие языки и форматы ввода. Это инфраструктурное решение для улучшения UX, особенно для CJK-языков.
  2. Двухэтапный процесс: Баланс Полноты и Точности: Ключевым является разделение процесса на этап генерации широкого набора кандидатов (используя Ambiguous Form для повышения Полноты/Recall) и этап точной фильтрации (сравнение с исходным вводом для обеспечения Точности/Precision).
  3. Генерация через трансформацию: Система не пытается понять смешанный ввод напрямую, а трансформирует его в стандартизированные альтернативные представления путем сегментации и замены компонентов (например, иероглифов на пиньинь).
  4. Ранжирование подсказок по популярности: Подтверждается, что основным фактором ранжирования в Autocomplete является популярность запроса (частота использования), с возможными корректировками на основе текстуальной близости (edit distance).
  5. Отсутствие связи с ранжированием поиска: Описанные механизмы не влияют на ранжирование результатов в органической выдаче. Они влияют только на то, какие запросы будут предложены пользователю на этапе ввода.

Практика

Best practices (это мы делаем)

  • Использование Autocomplete для исследования ключевых слов: Необходимо активно использовать поисковые подсказки как основной источник данных о реальном поведении пользователей. Этот патент подтверждает, что подсказки — это результат сложной обработки, направленной на выявление популярных и корректно интерпретированных запросов.
  • (Международное SEO) Анализ смешанных запросов: При работе на рынках, где актуальны смешанные вводы (например, Азия), необходимо анализировать подсказки, включающие транслитерацию, аббревиатуры и смешение языков (например, Бренд на английском + категория товара на местном языке). Контент должен быть оптимизирован под те популярные паттерны, которые предлагает Google.
  • (Международное SEO) Укрепление фонетических ассоциаций: На рынках типа Китая важно убедиться, что Google ассоциирует фонетические варианты (Pinyin) вашего бренда или ключевых терминов с их официальным написанием (Hanzi). Это повышает вероятность показа вашего бренда в подсказках при вводе Pinyin.
  • Мониторинг брендовых подсказок (SERM): Регулярно проверяйте подсказки при вводе названия вашего бренда. Поскольку ранжирование основано на популярности, появление негативных подсказок требует активной работы по управлению репутацией и стимулированию положительных запросов.

Worst practices (это делать не надо)

  • Игнорирование локальных особенностей ввода: Строить семантическое ядро для международного рынка, исходя из предположения, что пользователи используют только один формат ввода. Это может привести к потере охвата по запросам, которые вводятся в смешанном или фонетическом формате.
  • Оптимизация контента под "сырой" смешанный ввод: Не нужно оптимизировать страницы под гибридные формы ввода (например, под "北jingfd"). Нужно оптимизировать под финальный запрос, который предлагает Google (например, "北京饭店"). Система сама свяжет смешанный ввод с корректной подсказкой.

Стратегическое значение

Патент подчеркивает важность этапа Понимания Запросов (Query Understanding) в архитектуре поиска. Система Autocomplete, поддерживаемая такими технологиями, не просто предлагает слова, а интерпретирует сложные намерения и активно направляет пользователя к наиболее популярным и каноническим формулировкам. Стратегически важно оптимизировать контент под эти популярные интенты, которые формируют поисковый спрос.

Практические примеры

Сценарий: Оптимизация для международного бренда на азиатском рынке

  1. Задача: Продвижение западного бренда электроники (например, "BrandX") в Китае.
  2. Анализ ввода: SEO-специалист анализирует Autocomplete и замечает, что пользователи часто ищут бренд в смешанных форматах. Например, при вводе "BrandX shouji" (BrandX + Pinyin для "мобильный телефон").
  3. Действие механизма: Благодаря описанному в патенте механизму, система генерирует альтернативные представления, находит популярный запрос "BrandX 手机" (BrandX + иероглифы для "мобильный телефон") и предлагает его пользователю.
  4. Действие SEO: Убедиться, что в контенте (Title, H1, тексте) используются как оригинальное написание бренда ("BrandX"), так и его популярные сочетания с ключевыми терминами на местном языке (手机), чтобы максимально соответствовать популярным подсказкам, которые выбирают пользователи.
  5. Ожидаемый результат: Повышение релевантности страниц сайта тем запросам, которые Google активно предлагает пользователям, что ведет к увеличению органического трафика по этим ключевым направлениям.

Вопросы и ответы

Влияет ли этот патент на ранжирование сайтов в Google?

Нет, напрямую не влияет. Патент описывает исключительно работу системы генерации поисковых подсказок (Google Autocomplete). Он касается того, как Google интерпретирует ввод пользователя и предлагает варианты завершения запроса до того, как поиск выполнен. Алгоритмы ранжирования работают уже после выбора запроса.

Какова практическая польза этого патента для SEO специалиста?

Основная польза заключается в понимании механики работы Autocomplete, особенно для международного SEO. Это подтверждает, что подсказки — это результат сложного процесса интерпретации смешанного ввода и отражение популярных запросов. SEO-специалисты должны использовать Autocomplete как критически важный инструмент для исследования ключевых слов.

Что такое "Ambiguous Form" (Неоднозначная форма) и зачем она нужна?

Ambiguous Form — это промежуточное представление ввода, которое намеренно создается неоднозначным для увеличения охвата (Recall). Например, использование аббревиатур Pinyin. Это позволяет системе запросить у Suggestion Service широкий спектр потенциальных подсказок, а затем отфильтровать их, повышая вероятность нахождения правильного варианта.

Как система избегает неточных подсказок, если используется неоднозначная форма?

Для этого используется этап сравнения и фильтрации (Comparison). Все кандидаты, полученные на основе неоднозначной формы, строго сравниваются с исходным вводом пользователя. Если подсказка лингвистически плохо соответствует тому, что ввел пользователь (например, фонетически или по символам), она отсеивается.

Как ранжируются поисковые подсказки согласно патенту?

В описании патента указано, что подсказки ранжируются в соответствии с частотой (frequencies), с которой уникальные пользователи вводили этот запрос ранее (популярность). Также упоминается возможность корректировки ранга с помощью edit distance (насколько подсказка текстуально близка к вводу).

Актуален ли этот патент только для китайского языка?

Хотя большинство примеров используют китайский язык (Hanzi, Pinyin) и английский, запатентованный метод (Claim 1) сформулирован обобщенно. Он применим к любому сценарию, где ввод смешивает разные формы одного языка (например, японский) или разные языки в многоязычных регионах.

Что такое сегментация ввода и как она работает?

Сегментация — это разделение строки ввода на осмысленные части (слова или фразы). В патенте описан метод prefix matching: система ищет самое длинное совпадение с известным словом или запросом, начиная с начала строки. Если совпадение найдено, этот кусок отделяется, и процесс повторяется для оставшейся части строки.

Нужно ли оптимизировать контент сайта под смешанный ввод или Pinyin?

Не нужно оптимизировать контент под "сырой" смешанный ввод. Нужно оптимизировать контент под те запросы, которые пользователи в итоге выбирают из списка подсказок (Selectable Alternatives). Однако, если популярные запросы сами по себе содержат Pinyin или являются смешанными (например, английский бренд + русский термин), то их использование на сайте целесообразно.

Может ли этот механизм помочь в управлении репутацией (SERM)?

Да, косвенно. Понимание того, что подсказки ранжируются в основном по популярности, дает основу для стратегий SERM. Если появился негативный подсказка, необходимо работать над снижением её популярности и увеличением популярности положительных или нейтральных запросов, связанных с брендом.

Как быстро работает этот механизм?

Патент предполагает работу в реальном времени. Система может отправлять запрос на генерацию подсказок после ввода каждого символа (after receiving each token) или после короткой предопределенной паузы. Это необходимо для обеспечения бесшовного пользовательского опыта при использовании Autocomplete.

Похожие патенты

Как Google использует анализ окончаний запросов (суффиксов) для улучшения работы Автокомплита, игнорируя начало запроса
Google использует механизм для улучшения подсказок Автокомплита (Search Suggest), фокусируясь на окончании (суффиксе) запроса. Если начало запроса редкое или неоднозначное, система ищет популярные прошлые запросы с похожими окончаниями, но разными началами. Это позволяет предлагать релевантные подсказки, основываясь на том, как пользователи обычно заканчивают схожие по структуре запросы.
  • US8417718B1
  • 2013-04-09
Как Google Autocomplete использует статистические модели для нормализации разных фонетических написаний одного запроса
Google решает проблему неоднозначности ввода в языках без стандартной романизации (например, кантонский диалект). Система строит статистические языковые модели на основе предпочтений пользователей, чтобы распознавать разные фонетические варианты ввода латиницей (например, "lauta" и "lauda") как один и тот же иероглифический запрос, обеспечивая унифицированные подсказки автозаполнения.
  • US8996550B2
  • 2015-03-31
  • Мультиязычность

Как Google консолидирует оценки популярности и фильтрует подсказки в Autocomplete для оптимизации выдачи
Google использует механизм консолидации оценок в Autocomplete: популярность длинных запросов суммируется с популярностью их коротких префиксов. Это позволяет точнее определить реальный спрос. Затем система фильтрует список, предпочитая более длинные и информативные подсказки коротким, если длинная подсказка составляет значительную часть популярности короткой, оптимизируя интерфейс пользователя.
  • US8713042B1
  • 2014-04-29
  • SERP

Как Google формирует персонализированные поисковые подсказки (Autocomplete) на основе контента пользователя (например, в Gmail)
Google использует механизм для улучшения поисковых подсказок (Autocomplete) в таких сервисах, как Gmail. Система анализирует корпус документов пользователя, распознает сущности (например, email-адреса, имена) и предлагает их в качестве подсказок. Это помогает пользователю быстрее находить нужный контент, предлагая контекстуализированные подсказки (например, полный контакт) вместо отдельных слов.
  • US20140201229A1
  • 2014-07-17
  • Персонализация

  • Индексация

  • Семантика и интент

Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно
Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.
  • US9235654B1
  • 2016-01-12
  • Семантика и интент

Популярные патенты

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.
  • US7657520B2
  • 2010-02-02
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
  • US9081832B2
  • 2015-07-14
  • Ссылки

  • SERP

  • Свежесть контента

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

Как Google автоматически изучает синонимы, анализируя последовательные запросы пользователей и вариации анкорных текстов
Google использует методы для автоматического определения синонимов, акронимов и эквивалентных фраз. Система анализирует логи запросов: если пользователь быстро меняет запрос, сохраняя часть слов (например, с «отели в париже» на «гостиницы в париже»), система учится, что «отели» и «гостиницы» эквивалентны. Также анализируются вариации анкорных текстов, указывающих на одну и ту же страницу.
  • US6941293B1
  • 2005-09-06
  • Семантика и интент

  • Ссылки

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

seohardcore