SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет язык смешанных запросов с помощью посимвольного анализа на стороне клиента

DETECTING SOURCE LANGUAGES OF SEARCH QUERIES (Определение исходных языков поисковых запросов)
  • US20120330989A1
  • Google LLC
  • 2011-09-29
  • 2012-12-27
  • Мультиязычность
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует легковесный механизм для определения языка поисковых подсказок, который может выполняться на стороне клиента. Система анализирует каждый символ подсказки и оценивает, насколько он уникален для разных языков, используя локальную базу данных. Это позволяет точно определить исходный язык даже для смешанных запросов (например, Английский + Китайский) и обеспечить качественный машинный перевод кросс-язычных подсказок.

Описание

Какую проблему решает

Патент решает проблему неточного автоматического определения исходного языка (Source Language) для коротких текстов, в частности, поисковых подсказок (query suggestions). Традиционные методы часто дают сбои на смешанных запросах (mixed language queries), содержащих элементы разных языков (например, "Autobot 玩具"). Неверное определение языка приводит к низкому качеству машинного перевода при генерации кросс-язычных подсказок (cross-language query suggestions). Также патент предлагает решение, которое может работать быстро на стороне клиента (client device), снижая нагрузку на сервер.

Что запатентовано

Запатентован метод определения языка запроса, основанный на анализе уникальности составляющих его символов. Система использует предварительно созданное отображение "символ-язык" (character-to-language mapping), которое может храниться локально на клиенте. Для каждого символа вычисляется оценка (sub-score), обратно пропорциональная количеству языков, использующих этот символ. Агрегация этих оценок определяет наиболее вероятный исходный язык всего запроса.

Как это работает

Механизм работает посимвольно:

  • Анализ символа: Каждый символ подсказки проверяется по базе character-to-language mapping (которая может храниться локально).
  • Оценка уникальности: Определяется количество языков (N), использующих этот символ.
  • Расчет Sub-score: Каждому языку-кандидату присваивается оценка. Если символ распространен (N велико), оценка низкая (отрицательная корреляция).
  • Бустинг (Boosting): Если символ уникален для одного языка (N=1), оценка для этого языка значительно повышается.
  • Агрегация: Оценки суммируются по всем символам запроса. Язык с наивысшей итоговой оценкой выбирается в качестве исходного для перевода.

Актуальность для SEO

Высокая (для инфраструктуры Autocomplete). Точное и быстрое определение языка коротких и смешанных запросов остается критически важной задачей. Описанный метод посимвольного анализа эффективен для реализации на стороне клиента и обеспечивает надежную обработку смешанных систем письма (например, CJK и Латиницы), хотя на стороне сервера могут применяться и более сложные нейросетевые модели.

Важность для SEO

Влияние на SEO минимальное (2/10). Патент является инфраструктурным и описывает механизм работы Google Autocomplete (Suggest) на этапе QUNDERSTANDING, а не алгоритмы ранжирования веб-документов. Значение для SEO заключается в понимании того, как Google технически классифицирует по языку смешанные запросы, что актуально для международного SEO и анализа поисковых подсказок.

Детальный разбор

Термины и определения

Character-to-language mapping (Отображение "символ-язык")
База данных, связывающая каждый уникальный символ (например, по Unicode) с набором пар Language-writing system, в которых он используется. Может храниться на Client device.
Client device (Клиентское устройство)
Устройство пользователя (например, браузер), на котором может выполняться процесс определения языка для ускорения работы и снижения нагрузки на сервер.
Count (N) (Счетчик)
Количество пар Language-writing system, в которых встречается определенный символ. Является мерой распространенности символа.
Cross-language query suggestion (Кросс-язычная поисковая подсказка)
Перевод Primary-language query suggestion на другой язык.
Language-writing system pair (Пара "язык-система письма")
Комбинация естественного языка и системы письма (скрипта). Например, Японский-Хирагана, Японский-Кандзи, Китайский-Ханцзы.
Primary-language query suggestion (Основная поисковая подсказка)
Подсказка, сгенерированная Suggestion Service на основе ввода пользователя. Именно ее язык определяется в патенте.
Sub-score (Промежуточная оценка)
Оценка, генерируемая для Language-writing system pair на основе анализа одного символа. Обратно пропорциональна Count (N).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный процесс, выполняемый на client device для определения языка и генерации перевода подсказки.

  1. Хранение character-to-language mapping на клиентском устройстве.
  2. Получение search query (который является query suggestion).
  3. Для каждого символа запроса:
    1. Идентификация кандидатов language-writing system pairs с помощью mapping.
    2. Генерация sub-score для каждого кандидата на основе общего количества (count) найденных пар для этого символа.
  4. Агрегация всех sub-scores для получения итоговой оценки для каждой пары-кандидата.
  5. Определение исходного языка (source language) на основе итоговых оценок.
  6. Генерация запроса на перевод (translation request) к сервису машинного перевода.

Claim 2 (Независимый пункт): Описывает ядро метода определения языка (аналогично шагам 3-5 из Claim 1), но без привязки к клиентскому устройству и генерации перевода.

Claim 5 (Зависимый от 2): Уточняет расчет sub-score.

Он имеет отрицательную корреляцию (negative correlation) с количеством language-writing system pairs, идентифицированных для символа. Чем больше языков используют символ, тем ниже оценка, которую получает каждый из них.

Claim 6 (Зависимый от 2): Вводит механизм повышения (boosting).

Если language-writing system pair является единственным кандидатом (the only candidate) для какого-либо символа в запросе (т.е. символ уникален для этого языка), ее sub-score повышается.

Где и как применяется

Изобретение применяется на этапе взаимодействия пользователя с поисковой строкой и связано с инфраструктурой Autocomplete/Suggest.

QUNDERSTANDING – Понимание Запросов

Механизм используется для определения языка primary-language query suggestions. Ключевая особенность, описанная в патенте, — возможность выполнения этого процесса на Клиентском устройстве (Client device).

Сценарий взаимодействия:

  1. Пользователь вводит текст (q). Клиент отправляет его в Suggestion Service.
  2. Suggestion Service возвращает основные подсказки (Q).
  3. Активация механизма: Language Detector на клиенте анализирует Q, используя локальный Character-to-language mapping, и определяет исходный язык (A).
  4. Клиент отправляет запрос в Translation Service (Q, A->B, где B — целевой язык).
  5. Translation Service возвращает кросс-язычные подсказки (QAB).
  6. Клиент отображает Q и QAB пользователю.

Входные данные:

  • Текст Primary-language query suggestion.
  • Локально хранимая база Character-to-language mapping.

Выходные данные:

  • Определенный исходный язык (Source Language).
  • Запрос на перевод (Translation Request).

На что влияет

  • Специфические запросы: Наибольшее влияние на смешанные запросы (mixed language queries), содержащие символы из разных систем письма (например, Латиница + Кириллица или CJK иероглифы).
  • Языковые ограничения: Критичен для различения языков с пересекающимися наборами символов (например, Китайский, Японский, Корейский — CJK).
  • Качество UX: Влияет на точность кросс-язычных подсказок в Autocomplete.

Когда применяется

  • Условия работы: Применяется в реальном времени, когда пользователь вводит запрос и система генерирует primary-language query suggestions.
  • Триггеры активации: Необходимость определить исходный язык подсказки для её корректного перевода на другой язык (генерация cross-language query suggestions).

Пошаговый алгоритм

Процесс определения исходного языка запроса Q.

  1. Получение данных: Система получает поисковую подсказку Q.
  2. Предварительная обработка (Опционально): Удаление универсальных символов (например, пробелы, цифры), не несущих информации о языке.
  3. Цикл обработки символов: Для каждого символа CiC_{i}Ci​ в запросе Q:
    1. Поиск соответствий: Поиск CiC_{i}Ci​ в Character-to-language mapping.
    2. Идентификация кандидатов: Определение набора пар language-writing system (Lj)(L_{j})(Lj​), к которым принадлежит CiC_{i}Ci​.
    3. Подсчет (Ni): Определение общего количества найденных пар (Ni)(N_{i})(Ni​) для символа CiC_{i}Ci​.
    4. Расчет Sub-score (SS): Генерация sub-score для каждой пары LjL_{j}Lj​. SS отрицательно коррелирует с NiN_{i}Ni​ (например, по формуле вида 1/Ni1/N_{i}1/Ni​).
    5. Бустинг (Опционально): Если Ni=1N_{i}=1Ni​=1 (символ уникален), SS для этой пары значительно увеличивается (boosted).
  4. Агрегация: Для каждой уникальной пары LjL_{j}Lj​ суммируются все её sub-scores для получения Final Score.
  5. Определение языка: Выбирается пара с наивысшим Final Score в качестве исходного языка.
  6. Генерация перевода: Отправка Translation request.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на анализе символов и использовании предварительно созданной базы данных.

  • Контентные факторы: Текст primary-language query suggestion. Анализируется на уровне отдельных символов и их уникальных идентификаторов (например, Unicode).
  • Системные данные: Character-to-language mapping. Ключевая структура данных, содержащая информацию о принадлежности символов к языкам и системам письма.

Какие метрики используются и как они считаются

  • Count (N): Количество пар language-writing system, в которых существует анализируемый символ. Является мерой уникальности символа.
  • Sub-score (SS): Промежуточная оценка. Рассчитывается на основе Count (N) с использованием отрицательной корреляции. Например, SS=1/NSS = 1/NSS=1/N.
  • Boosting (Повышающий коэффициент): Множитель или константа, применяемая к Sub-score, если N=1.
  • Final Score (Итоговая оценка): Рассчитывается путем агрегации (суммирования) всех Sub-scores для данного языка по всем символам запроса.

Выводы

  1. Инфраструктурный патент для Autocomplete: Патент описывает внутренние процессы Google Autocomplete/Suggest, а не алгоритмы ранжирования веб-страниц. Его цель — точное определение языка подсказок для их корректного перевода.
  2. Определение языка по уникальности символов: Ключевой механизм — использование уникальности символов для определения языка коротких строк. Система отдает предпочтение языкам, чьи символы реже встречаются в других языках.
  3. Механизм Бустинга (Boosting): Символы, уникальные для одного языка (N=1), являются очень сильным сигналом и получают значительное повышение в оценке. Это позволяет надежно идентифицировать язык даже по одному символу.
  4. Обработка смешанных запросов: Метод эффективно обрабатывает mixed language queries путем взвешивания вклада символов разных языков.
  5. Клиентская реализация (Client-side): Механизм оптимизирован для быстрого выполнения на стороне клиента с использованием локального Character-to-language mapping, что критично для мгновенного отклика интерфейса.

Практика

Патент является инфраструктурным и не дает прямых практических выводов для SEO-стратегий, направленных на улучшение ранжирования. Основная ценность заключается в понимании работы Google Autocomplete и обработки мультиязычных запросов.

Best practices (это мы делаем)

  • Анализ смешанных запросов (Международное SEO): При работе на мультиязычных рынках (особенно CJK — Китай, Япония, Корея) важно анализировать Autocomplete, чтобы понять, как пользователи формируют смешанные запросы (например, бренд на английском + термин на локальном языке). Патент показывает, что Google корректно интерпретирует язык таких запросов. Контент сайта должен быть релевантен этим комбинациям.
  • Техническая корректность (Кодировка): Убедитесь, что сайт использует корректную кодировку (UTF-8). Это гарантирует, что все символы будут правильно считаны и обработаны системами определения языка.
  • Использование стандартных систем письма: Создавайте контент, используя корректные системы письма для целевого языка (например, Хирагана и Катакана в японском), чтобы соответствовать тому, как пользователи ищут и как Google интерпретирует эти запросы.

Worst practices (это делать не надо)

  • Манипуляции с языком для влияния на ранжирование: Попытки искусственно смешивать языки или символы в контенте страниц в надежде повлиять на ранжирование бессмысленны. Описанный алгоритм применяется к тексту подсказок в Autocomplete, а не к контенту веб-страниц для ранжирования.
  • Неестественное смешение символов: Использование символов из разных систем письма для стилизации или обфускации может потенциально усложнить определение основного языка контента.

Стратегическое значение

Патент подтверждает способность Google обрабатывать многоязычные запросы на гранулярном (посимвольном) уровне. Это подчеркивает сложность международного SEO и внимание Google к корректной интерпретации языка, даже если запрос сформулирован неоднозначно. Стратегически важно понимать, что Google располагает эффективными механизмами для языковой классификации даже самых коротких фрагментов текста.

Практические примеры

Сценарий 1: Различение языков CJK (Китай, Япония, Корея)

Запрос: “春の花” (Японский: Весенние цветы).

  1. Анализ '春' (Весна): Используется в Китайском (Hanzi), Японском (Kanji), Корейском (Hanja). N=3. Sub-score для каждого ≈ 0.33.
  2. Анализ 'の' (Частица): Используется только в Японском (Hiragana). N=1. Sub-score = 1. Применяется Boosting (например, множитель 10). Итоговый вклад ≈ 10.
  3. Анализ '花' (Цветок): Используется в Китайском и Японском. N=2. Sub-score для каждого = 0.5.
  4. Агрегация: Японский получает наивысшую оценку (≈ 0.33 + 10 + 0.5) благодаря уникальному символу Хираганы и бустингу.
  5. Результат: Язык корректно определен как Японский.

Сценарий 2: Обработка смешанного запроса (Латиница + Локальный язык)

Запрос: “iPhone отзывы”

  1. Анализ “iPhone”: Латинские символы используются во многих языках (N>30). Sub-score для каждого языка очень низкий (например, <0.03 за символ).
  2. Анализ “отзывы”: Кириллические символы используются в нескольких языках (Русский, Украинский и т.д., N≈10). Sub-score для этих языков средний (например, 0.1 за символ).
  3. Агрегация: Языки на кириллице получат значительно более высокую итоговую оценку, чем языки на латинице, так как их символы являются более сильным (менее распространенным) сигналом.
  4. Результат: Система определит основной язык как Русский (или другой язык на кириллице).

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в поиске?

Нет, прямого влияния на ранжирование веб-страниц этот патент не оказывает. Он описывает исключительно механизм определения языка поисковых подсказок в Google Autocomplete (Suggest). Этот процесс часто выполняется на стороне клиента и используется для корректного перевода подсказок на другие языки.

Как система определяет язык, если запрос содержит символы из разных языков (смешанный запрос)?

Система использует взвешенный подход, основанный на уникальности символов. Если символ используется во многих языках (например, 'A'), он дает слабый сигнал. Если символ уникален для одного языка (например, 'Ї' для украинского или 'の' для японского), он дает этому языку сильное преимущество (boosting). Побеждает язык с наивысшей суммарной оценкой по всем символам.

Что такое Character-to-language mapping и где он хранится?

Это база данных, которая связывает каждый уникальный символ (Unicode) с языками и системами письма, в которых он используется. Согласно патенту, эта база может храниться локально на устройстве пользователя (client device). Это позволяет очень быстро определять язык без задержек на обращение к серверу.

Как работает механизм Boosting?

Boosting (повышение) активируется, если символ принадлежит только одному языку согласно Character-to-language mapping (т.е. Count N=1). В этом случае оценка (sub-score) для этого языка значительно увеличивается (например, умножается на большой коэффициент). Это делает уникальные символы решающим фактором при определении языка.

Какая польза от этого патента для Senior SEO-специалиста?

Основная польза — это понимание инфраструктуры мультиязычного поиска и того, как Google обрабатывает смешанные запросы (mixed language queries) в Autocomplete. Это важно при анализе семантики и разработке стратегий международного SEO, особенно на рынках, где пользователи часто смешивают системы письма (например, в Азии).

Применяется ли этот метод для определения языка веб-страниц при индексировании?

Нет. Патент четко указывает, что этот метод предназначен для поисковых запросов и подсказок, которые часто слишком коротки для анализа другими методами. Для определения языка длинных текстов на веб-страницах Google использует гораздо более сложные статистические и NLP-модели, анализирующие контекст, слова и фразы.

Как система различает Китайский (Ханцзы) и Японский (Кандзи), если иероглифы одинаковые?

Если запрос состоит только из общих иероглифов, система может испытывать трудности. Однако, если в запросе присутствуют уникальные элементы — например, символы упрощенного Китайского или символы Японской азбуки (Хирагана/Катакана) — система использует механизм Boosting для уверенного определения правильного языка по этим уникальным символам.

Что происходит, если система не может уверенно определить язык?

Если система не может идентифицировать исходный язык с достаточным уровнем уверенности (например, если баллы для нескольких языков равны), патент упоминает возможность предоставления нескольких кандидатов language-writing system pairs сервису перевода. В этом случае сервис перевода может выполнить дополнительные процессы определения языка.

Анализирует ли система цифры и пробелы?

В патенте упоминается возможность предварительной обработки запроса для удаления символов, которые являются универсальными для всех языков, таких как пробелы или цифры (например, арабские цифры или римские числа). Они могут быть исключены из анализа, так как не несут информации о конкретном языке.

Нужно ли мне оптимизировать текст на странице, учитывая этот механизм?

Нет, оптимизировать контент под этот механизм не нужно. Он используется для интерпретации запроса пользователя в Autocomplete, а не для анализа вашего контента для ранжирования. Однако, важно использовать корректную кодировку (UTF-8) и естественный язык с правильными системами письма для вашего целевого региона, чтобы обеспечить техническую корректность сайта.

Похожие патенты

Как Google использует логи запросов, чтобы выбирать лучшие переводы для межъязыковых подсказок в Autocomplete
Google разработал систему для улучшения качества межъязыковых поисковых подсказок (Autocomplete). Вместо буквального перевода система оценивает различные варианты перевода, отдавая предпочтение тем фразам, которые чаще всего используются носителями целевого языка в качестве реальных поисковых запросов. Это гарантирует, что предложенная подсказка является не только точным переводом, но и эффективным поисковым запросом.
  • US20120330990A1
  • 2012-12-27
  • Мультиязычность

  • Семантика и интент

  • Поведенческие сигналы

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google определяет язык запроса, используя язык интерфейса и статистику по словам для добавления правильных диакритических знаков
Google использует механизм для точного определения языка, на котором пользователь вводит запрос, особенно когда слова неоднозначны или не содержат диакритических знаков. Система анализирует язык интерфейса пользователя и статистику использования слов в разных языках. Это позволяет Google понять, какие диакритические знаки (например, акценты) следует добавить к запросу, чтобы найти наиболее релевантные документы на правильном языке.
  • US8762358B2
  • 2014-06-24
  • Мультиязычность

  • Семантика и интент

Как Google выбирает лучший перевод для межъязыковых подсказок в автокомплите, сравнивая N-граммы
Google использует этот механизм для улучшения качества межъязыковых поисковых подсказок (автокомплита), особенно для смешанных запросов. Если автоматическое определение языка затруднено, система генерирует два перевода в разных направлениях (Язык A -> Язык B и Язык B -> Язык A). Затем она сравнивает их с оригиналом с помощью N-грамм. Перевод, который максимально отличается от оригинала, выбирается как наилучшая межъязыковая подсказка.
  • US20120330919A1
  • 2012-12-27
  • Мультиязычность

  • Семантика и интент

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Популярные патенты

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)
Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.
  • US20250005303A1
  • 2025-01-02
  • SERP

  • EEAT и качество

  • Персонализация

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент
Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.
  • US9274683B2
  • 2016-03-01
  • SERP

  • Персонализация

  • Поведенческие сигналы

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
  • US9436742B1
  • 2016-09-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

seohardcore