SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google решает, когда переводить запрос пользователя на другие языки, а когда уважать его языковой выбор

QUERY LANGUAGE FILTER FOR CROSS-LANGUAGE INFORMATION RETRIEVAL (Фильтр языка запроса для межъязыкового информационного поиска)
  • US9824147B1
  • Google LLC
  • 2013-02-28
  • 2017-11-21
  • Мультиязычность
  • Персонализация
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему фильтрации для управления межъязыковым поиском (CLIR). Система анализирует язык запроса, язык интерфейса пользователя и его местоположение. Если пользователь вводит запрос на языке, отличном от языка интерфейса, Google предполагает мультиязычность и не переводит запрос, экономя ресурсы. Перевод активируется, если язык запроса совпадает с языком интерфейса, особенно если локальных результатов мало.

Описание

Какую проблему решает

Патент решает проблему баланса между качеством поиска и вычислительными затратами в системах межъязыкового поиска (Cross-Language Information Retrieval, CLIR). С одной стороны, CLIR необходим для улучшения выдачи на менее распространенных языках путем поиска контента на доминирующих языках (например, английском). С другой стороны, автоматический перевод запросов и результатов дорог. Кроме того, он часто нежелателен для мультиязычных пользователей, которые намеренно ищут на языке, отличном от языка их интерфейса. Изобретение направлено на определение ситуаций, когда перевод не нужен, чтобы избежать лишних вычислений и точнее соответствовать интенту пользователя.

Что запатентовано

Запатентована система фильтрации для выборочной активации CLIR. Система определяет язык входящего запроса и сравнивает его с языком интерфейса пользователя (Application Language). Ключевой механизм блокирует перевод запроса, если язык запроса отличается от языка интерфейса. Это используется как индикатор того, что пользователь мультиязычен и намеренно ищет на этом языке. Перевод активируется преимущественно тогда, когда языки совпадают.

Как это работает

Механизм работает как фильтр перед системой перевода:

  • Получение данных: Система получает запрос, Application Language и местоположение пользователя (Client Locale).
  • Классификация: Classification Engine определяет наиболее вероятный язык запроса и степень уверенности (Probability Factor), учитывая контекст локали и интерфейса.
  • Фильтрация: Система сравнивает язык запроса с Application Language.
  • Решение: Если языки совпадают, система может инициировать CLIR (перевод запроса и обратный перевод результатов). Если языки отличаются, CLIR блокируется, и выполняется поиск по исходному запросу.
  • Пост-фильтрация: Дополнительная логика определяет необходимость смешивания результатов, основываясь на количестве и языке исходных результатов.

Актуальность для SEO

Высокая. Межъязыковой поиск является критически важным компонентом глобальной поисковой системы. Эффективное управление вычислительными ресурсами и точное определение языкового интента пользователя остаются центральными задачами Google. Хотя конкретные методы классификации могли эволюционировать (например, от n-грамм к нейросетям), базовая логика фильтрации остается актуальной.

Важность для SEO

Влияние на SEO умеренное (5/10). Патент не описывает алгоритмы ранжирования, а фокусируется на инфраструктуре обработки запросов. Однако он имеет высокое стратегическое значение для международного SEO. Он объясняет, при каких условиях контент на одном языке (например, английском) может конкурировать в выдаче на другом языке, и когда Google будет строго придерживаться языка, выбранного пользователем, даже если он отличается от языка интерфейса.

Детальный разбор

Термины и определения

Application Language (Язык приложения/интерфейса)
Язык пользовательского интерфейса (UI) приложения (например, браузера), через которое отправляется запрос. Определяется настройками пользователя.
Classification Engine (Механизм классификации)
Компонент системы, отвечающий за определение языка входящего поискового запроса.
Client Locale (Локаль клиента/Местоположение)
Географическое местоположение клиента, отправившего запрос (страна, регион).
CLIR (Cross-Language Information Retrieval / Межъязыковой поиск информации)
Процесс поиска информации, написанной на языке, отличном от языка запроса. Включает перевод запроса и обратный перевод результатов.
Filter Criteria (Критерии фильтрации)
Набор условий, которые должны быть выполнены для активации процесса перевода запроса (CLIR).
Locale-specific query (Локально-ориентированный запрос)
Запрос, направленный на поиск результатов, связанных с текущим местоположением пользователя (например, «рестораны», «погода»). Для таких запросов CLIR может быть отключен.
N-grams (Н-граммы)
Последовательности элементов (слов или символов) из текста запроса. Используются классификатором для статистического определения языка.
Probability Factor (Фактор вероятности)
Числовая оценка, указывающая на вероятность того, что поисковый запрос написан на определенном языке. Мера уверенности классификатора.
Target Language (Целевой язык)
Язык, на который переводится исходный запрос для выполнения CLIR (часто английский или основной язык локали).
Translated Search Server (Сервер переведенного поиска)
Сервер, который управляет процессом CLIR, включая фильтрацию, перевод и обработку результатов.

Ключевые утверждения (Анализ Claims)

Патент описывает внутренние процессы Google по управлению эффективностью и улучшению пользовательского опыта в мультилингвальной среде.

Claim 1 (Независимый пункт): Описывает основной метод обработки поисковых запросов с использованием фильтрации CLIR.

  1. Система получает запрос и индикатор Application Language (языка интерфейса), который частично основан на определенной локали (determined locale) клиента.
  2. Система идентифицирует Первый Язык запроса и Первый Probability Factor, а также Второй Probability Factor, связанный с локалью клиента.
  3. Система проверяет выполнение Filter Criteria для обоих факторов. Критерии включают:
    • Определение того, что Первый Язык соответствует Application Language. (Основной фильтр).
    • Определение того, что язык запроса ассоциирован с локалью, отличной от текущей локали клиента. (Фильтр контекста).
  4. Если критерии выполнены (например, пользователь ищет на языке интерфейса, и этот язык не основной для его текущей локали), система переводит запрос на Второй Язык (Target Language).
  5. Система получает результаты поиска для переведенного запроса и переводит их (включая сниппеты) обратно на Application Language.
  6. Система предоставляет клиенту переведенные результаты.

Claim 5 (Зависимый): Уточняет логику фильтрации и экономии ресурсов.

Если система определяет, что Первый Язык запроса НЕ соответствует Application Language, она предоставляет результаты для исходного запроса, минуя процесс перевода. Это ключевой механизм уважения к мультилингвальному интенту.

Claim 6, 7 и 8 (Зависимые): Детализируют процесс классификации.

Генерация Probability Factor включает анализ N-grams из запроса (Claim 8). Полученная вероятность взвешивается на основе Application Language (Claim 6) и местоположения клиента (Claim 7) для повышения точности.

Где и как применяется

Изобретение применяется на ранних этапах обработки запроса для определения маршрута его выполнения.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Classification Engine анализирует запрос сразу после его получения. На этом этапе происходит классификация языка запроса и сравнение его с Application Language и Client Locale. Принимается стратегическое решение: выполнять запрос как есть или активировать механизм межъязыкового поиска (CLIR).

RANKING – Ранжирование
В зависимости от решения на этапе QUNDERSTANDING, система ранжирования (Search Engine) будет обрабатывать либо исходный запрос, либо переведенный запрос (Translated Query). Патент предполагает возможность параллельного выполнения обоих процессов.

METASEARCH – Метапоиск и Смешивание
Если CLIR был активирован, на этом этапе происходит агрегация результатов. Front End Server применяет пост-фильтры (например, проверяет количество исходных результатов), чтобы решить, следует ли смешивать (Blending) результаты CLIR с основными результатами.

Входные данные:

  • Исходный поисковый запрос.
  • Application Language (Язык интерфейса пользователя).
  • Client Locale (Местоположение пользователя).

Выходные данные:

  • Решение о необходимости активации CLIR (Да/Нет).
  • Переведенный запрос (если CLIR активирован).
  • Финальный набор результатов поиска (исходные, переведенные или комбинированные).

На что влияет

  • Специфические запросы и ниши: Наибольшее влияние на запросы на менее распространенных языках, где контента мало и CLIR может значительно улучшить выдачу.
  • Международный поиск: Влияет на обработку запросов в мультилингвальных регионах и на запросы пользователей, находящихся за пределами своей основной языковой зоны (экспаты, путешественники).
  • Типы запросов: Влияет преимущественно на информационные и транзакционные запросы с глобальным интентом. Локальные запросы могут исключаться.

Когда применяется

Алгоритм фильтрации применяется при обработке большинства запросов, но активация перевода (CLIR) происходит только при определенных условиях.

Триггеры активации CLIR:

  • Язык запроса СОВПАДАЕТ с Application Language.
  • Система уверена в классификации языка (Probability Factor выше порога).

Исключения (когда CLIR НЕ активируется):

  • Язык запроса ОТЛИЧАЕТСЯ от Application Language (предполагается мультиязычный интент).
  • Запрос идентифицирован как Locale-specific query (например, поиск ближайшего ресторана).
  • Система не может уверенно определить язык запроса (низкий Probability Factor).
  • Выдача по исходному запросу уже содержит высокую долю результатов на иностранных языках (пост-фильтр).

Пошаговый алгоритм

Процесс обработки запроса и фильтрации CLIR:

  1. Получение и распределение: Front End Server получает запрос, Application Language и Client Locale. Запрос передается параллельно в Search Engine (для стандартного поиска) и в Translated Search Server (для потенциального CLIR).
  2. Стандартный поиск: Search Engine начинает выполнять поиск по исходному запросу.
  3. Проверка локальной ориентации (CLIR Фильтр 1): Translated Search Server определяет, является ли запрос локально-ориентированным. Если да, процесс CLIR останавливается.
  4. Классификация языка (CLIR): Classification Engine анализирует запрос (например, используя N-grams, взвешенные по локали и языку интерфейса) и генерирует Probability Factors.
  5. Проверка уверенности (CLIR Фильтр 2): Система проверяет, превышает ли наивысший Probability Factor заданный порог. Если нет, CLIR останавливается.
  6. Сравнение языков (CLIR Фильтр 3): Система сравнивает определенный язык запроса с Application Language. Если они не совпадают, CLIR останавливается (предполагается мультиязычный интент).
  7. Перевод запроса (CLIR): Если все проверки пройдены, запрос переводится на Target Language (например, английский).
  8. Выполнение переведенного поиска (CLIR): Переведенный запрос отправляется в Search Engine.
  9. Обратный перевод результатов (CLIR): Результаты (сниппеты, заголовки) переводятся обратно на Application Language.
  10. Пост-фильтрация и объединение (Front End Server): Сервер получает оба набора результатов и применяет дополнительную логику:
    • Проверяется количество результатов исходного поиска. Если их мало (ниже порога), результаты объединяются.
    • Если результатов достаточно, проверяется доля иностранных результатов в исходной выдаче. Если она высока (выше порога), переведенные результаты могут быть отброшены (вторичная проверка интента).
    • Иначе результаты объединяются.
  11. Предоставление результатов: Финальный набор результатов отправляется пользователю.

Какие данные и как использует

Данные на входе

Система использует ограниченный набор данных, фокусируясь на языковых и географических сигналах пользователя.

  • Контентные факторы (Запрос): Текст поискового запроса. Анализируется для определения языка путем извлечения признаков (N-grams).
  • Пользовательские факторы: Application Language (язык интерфейса). Используется как ключевой элемент для фильтрации и для взвешивания вероятностей классификации.
  • Географические факторы: Client Locale (местоположение пользователя). Используется для определения локально-специфичных запросов и для взвешивания вероятностей классификации (например, учет распространенности языков в регионе).

Какие метрики используются и как они считаются

  • Probability Factor (Фактор вероятности): Определяет вероятность принадлежности запроса к определенному языку. Рассчитывается статистическим классификатором на основе N-grams.
  • Взвешивание вероятностей (Weights): Probability Factors корректируются на основе Application Language и Client Locale. Например, вероятность запроса на определенном языке может быть повышена, если этот язык распространен в данной локали.
  • Пороги уверенности (Thresholds): Используются на разных этапах:
    • Минимальный Probability Factor для надежной классификации языка.
    • Порог количества результатов по исходному запросу для активации смешивания.
    • Порог доли иностранных результатов в исходной выдаче, при превышении которого смешивание отменяется.

Выводы

  1. Приоритет явного языкового интента: Google стремится уважать выбор языка пользователя. Если язык запроса отличается от языка интерфейса, система интерпретирует это как намеренное действие мультиязычного пользователя и блокирует автоматический перевод (CLIR).
  2. Экономия ресурсов как ключевой фактор: Основная цель фильтра — повышение эффективности инфраструктуры. Система избегает дорогостоящих операций перевода, когда они не нужны пользователю или бесполезны (например, для локальных запросов или при неуверенной классификации).
  3. CLIR направлен на помощь моноязычным пользователям: CLIR активируется преимущественно тогда, когда пользователь ищет на языке своего интерфейса. Система предполагает, что он может быть заинтересован в контенте на других языках, если локального контента недостаточно.
  4. Сложная логика активации (Контекст имеет значение): Решение о переводе зависит от комбинации языка запроса, языка интерфейса и местоположения пользователя. Согласно Claim 1, CLIR особенно актуален, если пользователь находится в локали, где язык его интерфейса не является основным (сценарий экспата).
  5. Многоуровневая фильтрация: Система использует как пре-фильтры (язык, локальность, уверенность), так и пост-фильтры (анализ полученной выдачи, доля иностранных результатов) для тонкой настройки выдачи и избежания ненужных вычислений.

Практика

Best practices (это мы делаем)

Хотя патент инфраструктурный, он дает важные инсайты для международного SEO.

  • Создание авторитетного контента на доминирующих языках (например, английском): Это ключевая стратегия для глобального охвата. Система CLIR может выбрать ваш англоязычный контент для показа пользователям по всему миру, если локальный контент в их регионах недостаточен. Ваш сайт становится бенефициаром CLIR.
  • Точный языковой и географический таргетинг (Локализация и Hreflang): Необходимо создавать качественный контент на языках целевой аудитории. Если пользователь намеренно ищет на вашем языке (отличном от его интерфейса), Google покажет ваш контент напрямую, без перевода, так как CLIR будет отключен. Корректное использование Hreflang помогает в этом.
  • Анализ международной конкуренции: При анализе выдачи в целевых странах учитывайте не только локальных конкурентов, но и глобальные сайты, которые могут появляться в выдаче через механизм CLIR (с переведенными сниппетами).

Worst practices (это делать не надо)

  • Расчет на автоматический перевод Google как основную стратегию: Не стоит полагаться на то, что Google всегда качественно переведет запрос пользователя или ваш контент. Нативная оптимизация на целевом языке всегда предпочтительнее. CLIR — это вспомогательный механизм.
  • Игнорирование мультиязычности в регионе: Ошибка считать, что все пользователи в стране ищут только на основном языке. Патент показывает, что Google адаптируется под пользователей, ищущих на разных языках. Если вы игнорируете второстепенные языки региона, вы теряете трафик, так как Google не будет переводить запросы этих пользователей, а покажет им контент на выбранном ими языке.
  • Смешивание языков на одной странице: Это может затруднить классификацию контента и запросов, что может привести к непредсказуемому поведению системы CLIR и снижению релевантности.

Стратегическое значение

Патент подтверждает стремление Google найти баланс между стиранием языковых барьеров (через CLIR) и точной интерпретацией намерений пользователя, при этом оптимизируя ресурсы. Для SEO это означает усиление глобальной конкуренции: авторитетные сайты на доминирующих языках получают доступ к международной аудитории. В то же время, это подчеркивает важность локализации для удовлетворения явного спроса на конкретных языках, так как Google предпочитает не вмешиваться в выбор языка мультиязычными пользователями.

Практические примеры

Сценарий 1: Мультилингвальный пользователь (CLIR отключен)

  1. Контекст: Пользователь в Германии (Client Locale=DE). Интерфейс браузера на немецком (Application Language=DE).
  2. Запрос: Пользователь вводит запрос на английском языке ("advanced SEO techniques").
  3. Обработка: Classification Engine определяет язык запроса как английский. Система сравнивает: Язык запроса (EN) != Application Language (DE).
  4. Результат: Фильтр блокирует CLIR. Google выполняет поиск по английскому запросу и возвращает результаты на английском языке, предполагая, что пользователь этого хотел.

Сценарий 2: Дефицит контента (CLIR активирован)

  1. Контекст: Пользователь в Таиланде (Client Locale=TH). Интерфейс на тайском (Application Language=TH).
  2. Запрос: Пользователь вводит узкоспециализированный технический запрос на тайском.
  3. Обработка: Язык запроса (TH) = Application Language (TH). Исходный поиск дает мало результатов. Критерии выполнены.
  4. Результат: CLIR активируется. Запрос переводится на английский. Выполняется поиск по английскому запросу. Найденные авторитетные английские статьи переводятся обратно на тайский (сниппеты) и подмешиваются в выдачу.

Вопросы и ответы

Что такое Cross-Language Information Retrieval (CLIR) в контексте этого патента?

CLIR — это процесс, при котором Google переводит запрос пользователя на другой язык (часто английский), ищет контент на этом языке, а затем переводит найденные результаты (сниппеты) обратно на язык пользователя. Это используется для улучшения выдачи, когда контента на исходном языке недостаточно.

Почему Google не всегда переводит запросы, если это улучшает выдачу?

Патент указывает две основные причины. Первая — экономия вычислительных ресурсов, так как перевод дорог. Вторая — уважение к интенту мультилингвальных пользователей. Если система считает, что вы намеренно ввели запрос на языке, отличном от языка интерфейса, она не вмешивается, предполагая, что вы хотите результаты именно на этом языке.

Когда Google решит перевести мой запрос (активировать CLIR)?

Ключевое условие: язык вашего запроса должен совпадать с языком вашего интерфейса (Application Language). Также запрос не должен быть локально-ориентированным (например, поиск кафе), и система должна быть уверена в определении языка запроса.

Если у меня русский интерфейс, а я ввожу запрос на английском, Google его переведет?

Нет. Согласно этому патенту, если язык интерфейса (русский) отличается от языка запроса (английский), фильтр CLIR не будет активирован. Google предположит, что вы знаете английский и хотите получить результаты на английском языке.

Как Google определяет язык запроса согласно патенту?

Используется статистический классификатор (Classification Engine). Описанный метод включает анализ N-grams (последовательностей слов или символов) в запросе и сравнение их с паттернами, характерными для разных языков, для расчета фактора вероятности (Probability Factor).

Влияет ли мое местоположение (Client Locale) на решение о переводе запроса?

Да. Местоположение используется для повышения точности определения языка запроса. Вероятности могут корректироваться в зависимости от того, какие языки распространены в вашей локали. Также, согласно Claim 1, CLIR может чаще активироваться, если вы находитесь в стране, где язык вашего интерфейса не является основным (сценарий экспата).

Что это значит для моего англоязычного сайта?

Это подчеркивает глобальный потенциал качественного англоязычного контента. Если ваш контент авторитетен, система CLIR может перевести его и показать пользователям в любой стране, где наблюдается дефицит локального контента по данной теме. Это значительно расширяет ваш охват.

Как этот патент влияет на международное SEO?

Он подчеркивает важность создания контента на нативных языках целевой аудитории. Нельзя полагаться только на автоматический перевод. Если вы хотите охватить мультилингвальную аудиторию, вы должны предоставить контент на их языках, так как Google предпочитает показывать результаты на том языке, на котором пользователь явно запросил информацию.

Что такое «локально-ориентированный запрос» (Locale-specific query) и как он обрабатывается?

Это запрос, связанный с текущим местоположением пользователя (например, «погода», «ресторан»). Для таких запросов CLIR обычно отключается, так как перевод запроса на другой язык и поиск в другом индексе не даст релевантных локальных результатов.

Что такое пост-фильтрация или «второй проход»?

Это дополнительная проверка после получения результатов. Если исходный запрос вернул достаточно результатов, или если значительная их часть оказалась на иностранном языке (выше порога), система может решить, что пользователь хотел именно эти результаты. В таком случае переведенные результаты (CLIR) отбрасываются.

Похожие патенты

Как Google автоматически определяет, на каких языках искать ответ на запрос пользователя (CLIR)
Google использует механизм для автоматического определения наиболее релевантных языков для поиска по запросу пользователя. Система анализирует термины, связанные с запросом, и их привязку к различным языкам на основе структурированных данных (например, Википедии). Если система определяет, что ценный контент существует на других языках, она переводит запрос, выполняет поиск и подмешивает переведенные результаты в выдачу.
  • US8862595B1
  • 2014-10-14
  • Мультиязычность

Как Google использует машинный перевод для поиска контента на иностранных языках (Cross-Language Information Retrieval)
Google использует механизмы Cross-Language Information Retrieval (CLIR) для поиска релевантного контента независимо от языка запроса. Система может перевести запрос пользователя на другие языки и искать в индексах этих языков (Query Translation), либо заранее перевести контент сайтов на язык пользователя (Document Translation). Это позволяет предоставлять пользователю лучшие результаты, даже если они изначально опубликованы на иностранном языке.
  • US7890493B2
  • 2011-02-15
  • Мультиязычность

  • Индексация

Как Google реализует кросс-языковой поиск (CLIR) с интерактивным уточнением переведенного запроса
Google использует систему кросс-языкового поиска (CLIR), которая переводит запрос пользователя на целевой язык, выполняет поиск и переводит результаты обратно. Ключевая особенность — интерактивный интерфейс, позволяющий пользователю отредактировать машинный перевод запроса или выбрать альтернативные варианты для повышения точности выдачи.
  • US8799307B2
  • 2014-08-05
  • Мультиязычность

  • Семантика и интент

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google определяет многоязычных пользователей и показывает им результаты на языке, отличном от языка запроса
Google использует механизм для идентификации пользователей, владеющих несколькими языками, анализируя язык текущего запроса, местоположение пользователя и историю его активности. Если пользователь находится в регионе с доминирующим языком (L2), но ищет на другом языке (L1), и система подтверждает владение обоими, Google переводит запрос на L2 и ищет контент на обоих языках. Это позволяет показывать наиболее релевантные результаты, даже если их язык отличается от языка запроса.
  • US20230325421A1
  • 2023-10-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Популярные патенты

Как Google обрабатывает клики по ссылкам на мобильные приложения (App Deep Links) в результатах поиска
Google использует механизм клиентской обработки результатов поиска, ведущих в нативные приложения. Если у пользователя не установлено нужное приложение, система на устройстве автоматически подменяет ссылку приложения (App Deep Link) на эквивалентный веб-URL. Это гарантирует доступ к контенту через браузер и обеспечивает бесшовный пользовательский опыт.
  • US10210263B1
  • 2019-02-19
  • Ссылки

  • SERP

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента
Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.
  • US8145636B1
  • 2012-03-27
  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче
Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.
  • US9424360B2
  • 2016-08-23
  • Local SEO

  • Поведенческие сигналы

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах
Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.
  • US20180113919A1
  • 2018-04-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта
Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.
  • US9348846B2
  • 2016-05-24
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса
Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.
  • US9454621B2
  • 2016-09-27
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

seohardcore