SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google предотвращает потерю смысла при подборе синонимов для многословных запросов (механизм "Pseudo-Drop")

ENSURING THAT A SYNONYM FOR A QUERY PHRASE DOES NOT DROP INFORMATION PRESENT IN THE QUERY PHRASE (Обеспечение того, чтобы синоним для поисковой фразы не терял информацию, присутствующую в этой фразе)
  • US8661012B1
  • Google LLC
  • 2006-12-29
  • 2014-02-25
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм валидации синонимов к многословным фразам, чтобы предотвратить потерю информации (т.н. "pseudo-drop"). Если синоним для всей фразы совпадает с синонимом только для её части, система блокирует такую замену. Это предотвращает чрезмерное обобщение запроса и сохраняет точность исходного поискового намерения.

Описание

Какую проблему решает

Патент решает проблему потери критически важной информации при автоматической генерации синонимов для многословных поисковых фраз (multi-word query phrases). Эта проблема, описываемая в патенте как "pseudo-drop", возникает, когда система заменяет специфическую фразу более общим синонимом, тем самым непреднамеренно удаляя важные уточняющие термины и изменяя интент пользователя. Например, замена [Jackson MS] на [Mississippi] теряет уточнение "Jackson".

Что запатентовано

Запатентована система валидации синонимов для поисковых фраз. Основной механизм заключается в проверке того, является ли кандидат в синонимы для целой фразы также синонимом для её части (sub-component или sub-phrase). Если да, то такой синоним отклоняется для использования с целой фразой, поскольку его применение привело бы к потере информации (pseudo-drop), содержащейся в других частях фразы.

Как это работает

Система работает как фильтр в процессе понимания и переписывания запроса:

  • Идентификация фразы и синонимов: В запросе выделяется многословная фраза (например, [Jackson MS]), и система находит для нее кандидатов в синонимы (например, [Mississippi]).
  • Анализ подфраз: Система генерирует все частичные подфразы (например, [Jackson] и [MS]).
  • Поиск синонимов подфраз: Система проверяет наличие синонимов для подфраз в соответствующем контексте (например, [MS] -> [Mississippi]).
  • Валидация (Pseudo-Drop Detection): Система сравнивает списки. Если синоним для всей фразы ([Mississippi]) также является синонимом только для её части ([MS]), этот синоним блокируется для использования с целой фразой [Jackson MS].

Актуальность для SEO

Высокая. Точное понимание запросов и корректная обработка синонимов являются фундаментом современных поисковых систем, использующих сложные NLP-модели (BERT, MUM). Предотвращение дрейфа интента (intent drift) из-за чрезмерного обобщения остается критически важной задачей, особенно при обработке сложных и длинных запросов (long-tail queries).

Важность для SEO

Значительное влияние (8/10). Этот механизм напрямую влияет на то, как Google интерпретирует, сужает или расширяет пользовательские запросы. Он гарантирует, что оптимизация под конкретные, многословные концепты будет учтена и не будет проигнорирована из-за агрессивного обобщения. Это защищает релевантность страниц, нацеленных на нишевые топики или специфические локации, от вытеснения более общим контентом.

Детальный разбор

Термины и определения

Altered Query (Измененный запрос)
Запрос, полученный путем замены фразы в исходном запросе на синоним.
Context (Контекст)
Слова, окружающие фразу в запросе. Контекст критичен для определения применимости синонима и для валидации pseudo-drops.
Pseudo-Drop (Псевдо-потеря информации)
Термин из описания патента, обозначающий ситуацию, когда использование синонима для фразы приводит к потере важной информации, содержащейся в одном из терминов фразы.
Query Phrase (Поисковая фраза)
Многословная фраза (два или более термина) в исходном запросе, для которой ищутся синонимы.
Session-switching data (Данные о переключении в сессии)
Данные из логов запросов, показывающие, как пользователи последовательно изменяют свои запросы в рамках одной поисковой сессии. Используются как основной источник для генерации кандидатов в синонимы.
Sub-phrase / Portion / Sub-component (Подфраза / Часть)
Часть исходной поисковой фразы, состоящая из меньшего количества терминов, чем исходная фраза.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предотвращения потери информации при использовании синонимов.

  1. Система получает кандидатов в синонимы для Query Phrase (многословной фразы в исходном запросе).
  2. Система получает кандидатов в синонимы для Portion (части) этой Query Phrase.
  3. Происходит сравнение этих двух наборов кандидатов.
  4. Определяется, что конкретный кандидат (particular candidate term) является синонимом как для всей Query Phrase, так и только для её Portion.
  5. Система автоматически выбирает подмножество синонимов для Query Phrase, из которого ИСКЛЮЧАЕТСЯ этот конкретный кандидат.
  6. Генерируются альтернативные поисковые запросы (alternative search queries) с использованием этого отфильтрованного подмножества синонимов.

Ядро изобретения — это механизм фильтрации (шаги 4 и 5). Если синоним для целого (фразы) совпадает с синонимом для части (подфразы), он признается слишком общим и блокируется, чтобы не потерять информацию, содержащуюся в других частях фразы.

Claim 5 (Зависимый от 1): Уточняет, что обнаружение такого совпадения (шаг 4) эквивалентно определению того, что поисковая система "потеряла" (dropped) один или более терминов из исходной фразы.

Где и как применяется

Изобретение применяется на этапе понимания запроса и является критически важным компонентом системы переписывания запросов.

QUNDERSTANDING – Понимание Запросов

  • Query Rewriting/Expansion: Когда система пытается улучшить исходный запрос пользователя путем замены терминов или фраз на их синонимы, активируется этот механизм валидации. Он работает как фильтр: система генерации синонимов предлагает замены, а механизм Pseudo-Drop Detection проверяет эти предложения на предмет потери информации.

Входные данные:

  • Исходный поисковый запрос и выделенная многословная Query Phrase.
  • Список Candidate Synonyms для Query Phrase.
  • База данных синонимов (предварительно рассчитанная, часто на основе session-switching data), содержащая правила для различных фраз, подфраз и их контекстов.

Выходные данные:

  • Валидированный (отфильтрованный) список синонимов для Query Phrase.
  • Altered Queries (измененные запросы), сгенерированные с использованием только валидированных синонимов.

Ключевые технические особенности:

  • Зависимость от контекста: В описании патента подчеркивается, что проверка синонимов для подфраз должна происходить в контексте, который является как минимум таким же специфичным, как и контекст исходной фразы (включая оставшиеся слова фразы). Это необходимо для избежания ложных срабатываний (когда хороший синоним ошибочно классифицируется как pseudo-drop).
  • Консервативное определение синонимов: Для повышения надежности обнаружения pseudo-drops система может использовать более мягкие критерии (conservative notion of synonyms) при идентификации синонимов для подфраз.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на многословные запросы (long-tail), где присутствуют уточняющие модификаторы.
  • Конкретные ниши: Влияет на e-commerce (конкретные модели товаров), локальный поиск (конкретные районы или города, например [Город + Штат]), технические и медицинские тематики, где важна точность.
  • Типы контента: Защищает релевантность контента, оптимизированного под специфические интенты, от вытеснения более общим контентом.

Когда применяется

  • Условия работы: Алгоритм применяется каждый раз, когда система обработки запросов рассматривает возможность замены многословной фразы (Query Phrase длиной 2 и более слов) на её синоним.
  • Триггеры активации: Наличие кандидата в синонимы для многословной фразы в запросе.

Пошаговый алгоритм

Процесс обнаружения "Pseudo-Drop" (на основе FIG. 5 и описания):

  1. Генерация подфраз: Система получает исходную Query Phrase (длиной K слов). Генерируются все возможные непрерывные подфразы длиной от K-1 до 1. (Например, для [A B C] генерируются [A B], [B C], [A], [B], [C]).
  2. Генерация контекстов для подфраз: Для каждой подфразы определяется её максимально специфичный контекст. Он формируется из слов, окружающих исходную фразу, И слов, оставшихся от исходной фразы, но не вошедших в подфразу. (Например, если запрос [X A B C Y], а подфраза [B], то её контекст (X A : C Y)).
  3. Поиск синонимов для подфраз: Система ищет правила синонимов для каждой подфразы именно в её специфичном контексте.
  4. Сравнение и валидация: Система сравнивает список кандидатов в синонимы для исходной Query Phrase со списками синонимов, найденных для всех её подфраз.
  5. Фильтрация (Disallowance): Если кандидат в синонимы для исходной фразы также является синонимом для любой из её подфраз (в соответствующем контексте), этот кандидат отклоняется (pseudo-drop).
  6. Генерация альтернативных запросов: Оставшиеся валидированные синонимы используются для создания Altered Queries.

Какие данные и как использует

Сам механизм фильтрации использует результаты работы системы генерации синонимов. Патент детально описывает данные, используемые для генерации этих синонимов.

Данные на входе

  • Поведенческие факторы (для генерации синонимов): Критически важные данные. Система анализирует логи запросов (user query logs) и session-switching data. Анализируется, как часто пользователи меняют один запрос на другой в рамках одной сессии.
  • Контекстные факторы: Слова, окружающие фразу (context), используются для определения применимости правил синонимов как для всей фразы, так и для её подфраз.

Какие метрики используются и как они считаются

Механизм Pseudo-Drop использует булевый фильтр (наличие синонима в списке для подфразы). Однако, для генерации этих списков синонимов (что описано в патенте как необходимый контекст, в частности FIG. 4), используются следующие метрики:

  • frequently_alterable: Доля запросов с исходной фразой, для которых соответствующий измененный запрос (с синонимом) также существует в логах.
  • frequently_much_in_common: Доля пар запросов (исходный и измененный), которые имеют значительное пересечение в результатах поиска (например, минимум 3 общих результата в ТОПе).
  • frequently_altered: Частота, с которой за исходным запросом следует измененный запрос в рамках одной пользовательской сессии.
  • high_altering_ratio: Отношение переходов от А к Б по сравнению с переходами от Б к А.
  • Функция Scale: Используется для нормализации и оценки метрик при расчете уверенности в синониме. Scale(score,base,high):x=(score−base)/(high−base);y=(x−sqrt(x2+4.0))/2.0;return 1.0+yScale(score, base, high): x = (score-base)/(high-base); y = (x-sqrt(x^2+4.0))/2.0; return\ 1.0+y

Выводы

  1. Приоритет точности над полнотой (Precision over Recall): Патент демонстрирует, что Google активно борется с чрезмерным обобщением при переписывании запросов. Система предпочитает сохранить исходный специфичный интент пользователя, даже если это означает отказ от использования потенциального синонима, который мог бы расширить выдачу.
  2. Механизм "Pseudo-Drop" как защита от дрейфа интента: Этот алгоритм является ключевым защитным механизмом, который предотвращает изменение смысла запроса из-за агрессивного или некорректного сопоставления синонимов для многословных фраз.
  3. Критическая роль контекста в валидации: Валидация синонимов происходит с обязательным учетом специфического контекста. Синоним для подфразы учитывается только в том случае, если он действителен именно в контексте исходного запроса, что снижает количество ложных срабатываний фильтра.
  4. Защита Long-Tail трафика: Этот механизм защищает сайты, оптимизированные под точные, многословные запросы. Он гарантирует, что Google не заменит специфический запрос (например, модель товара или точную локацию) на общий (категория товара или город) без веских оснований.
  5. Сложность системы синонимов: Генерация синонимов — это не просто поиск по словарю. Она основана на анализе поведения пользователей (session-switching data) и требует сложных механизмов валидации и фильтрации, как описанный в патенте.

Практика

Best practices (это мы делаем)

  • Оптимизация под точные многословные концепты (Long-Tail Strategy): Продолжайте создавать контент, нацеленный на специфические запросы и интенты. Этот патент подтверждает, что у Google есть механизмы для защиты точности таких запросов от размытия. Если пользователь ищет [Jackson MS fire department], Google постарается не показать ему [Mississippi fire department].
  • Использование специфичной терминологии: Используйте точную и специфичную для ниши терминологию. Если вы пишете о [fl rentals condos], убедитесь, что контент релевантен именно кондоминиумам, а не просто аренде во Флориде, так как механизм pseudo-drop предотвратит обобщение [fl rentals condos] до [florida] (если [fl] -> [florida]).
  • Точная локальная оптимизация: При продвижении в локальном поиске критически важно оптимизировать контент под конкретные районы, города и штаты. Механизм pseudo-drop гарантирует, что Google сохранит географическую специфичность запроса.

Worst practices (это делать не надо)

  • Надежда на обобщение: Не стоит оптимизировать страницу только под общие высокочастотные запросы в надежде, что Google автоматически сочтет её релевантной для всех связанных специфических запросов. Система активно борется с неявным обобщением, которое ведет к потере информации.
  • Игнорирование модификаторов в запросах: Нельзя игнорировать уточняющие слова в семантическом ядре (прилагательные, геолокацию, спецификации). Эти слова являются ключевыми для механизма pseudo-drop — именно их потерю система предотвращает.
  • Создание двусмысленного контекста: Использование терминов, которые могут иметь сильно разные значения в разных контекстах, без четкого определения текущего контекста на странице, усложняет работу систем понимания контента и запросов.

Стратегическое значение

Патент подтверждает стратегический курс Google на максимальную точность понимания запросов (Precision) и предотвращение изменения пользовательского интента. Это снижает риск того, что крупные сайты с общим контентом будут доминировать в выдаче по специфическим запросам только потому, что они соответствуют широкой теме. Для SEO-специалистов это означает, что точная оптимизация и глубокое понимание интента пользователя важнее, чем общая авторитетность домена при работе со специфическими запросами.

Практические примеры

Сценарий: Оптимизация страницы локальной услуги

  1. Цель: Ранжироваться по запросу [dentist Soho NYC].
  2. Анализ Google (как это работает): Пользователь вводит [dentist Soho NYC]. Система генерации синонимов может предложить заменить [Soho NYC] на [NYC] (так как Soho находится в NYC).
  3. Активация Pseudo-Drop механизма:
    • Фраза: [Soho NYC]. Синоним: [NYC].
    • Подфраза: [NYC]. Синоним: [NYC] (само себе синоним).
    • Результат: Система определяет, что замена [Soho NYC] на [NYC] приведет к потере информации [Soho]. Синоним блокируется.
  4. Действия SEO-специалиста: Необходимо убедиться, что страница максимально оптимизирована именно под район Soho. Упоминание адреса в Soho, локальных ориентиров, отзывов жителей района.
  5. Ожидаемый результат: Страница сохраняет высокие позиции по точному локальному запросу и не вытесняется общими агрегаторами стоматологий Нью-Йорка.

Вопросы и ответы

Что такое "Pseudo-Drop", описанный в патенте?

"Pseudo-Drop" — это ситуация, когда система подбора синонимов предлагает замену для многословной фразы, которая фактически приводит к потере (drop) важной информации из исходной фразы. Например, если для фразы [Jackson MS] предлагается синоним [Mississippi]. Поскольку [MS] само по себе уже означает [Mississippi], такая замена приводит к потере уточнения [Jackson]. Патент описывает механизм для предотвращения таких ситуаций.

Как именно система определяет, что информация будет потеряна?

Система использует простой, но эффективный метод: она проверяет, является ли предложенный синоним для ВСЕЙ фразы также известным синонимом только для ЧАСТИ этой фразы (подфразы) в данном контексте. Если да, система делает вывод, что информация, содержащаяся в других частях фразы, будет потеряна при замене, и блокирует этот синоним.

Означает ли это, что Google никогда не обобщает запросы?

Нет, не означает. Google часто обобщает запросы или использует более широкие синонимы, если считает это уместным. Однако этот патент показывает, что существует защитный механизм, который активно предотвращает обобщение, если оно приводит к очевидной потере специфичности, заложенной пользователем в многословную фразу. Точность имеет приоритет.

Как этот патент влияет на стратегию Long-Tail продвижения?

Он её усиливает и подтверждает её важность. Механизм "Pseudo-Drop" защищает точность длинных и специфичных запросов от размытия. Это означает, что контент, точно оптимизированный под низкочастотные многословные запросы, имеет больше шансов ранжироваться именно по ним, не будучи вытесненным более общим контентом.

Насколько важен контекст в работе этого алгоритма?

Контекст имеет решающее значение. В патенте подчеркивается, что проверка синонимов для подфразы должна происходить в максимально специфичном контексте исходного запроса (включая оставшиеся слова фразы). Это помогает избежать ложных срабатываний, когда система могла бы ошибочно заблокировать хороший синоним, если бы проверяла его в общем контексте.

Откуда Google берет синонимы, которые затем проверяются этим механизмом?

Патент подробно описывает, что синонимы генерируются в основном путем анализа поведения пользователей — session-switching data. Система изучает логи запросов и выявляет, какие фразы пользователи часто заменяют друг на друга в рамках одной поисковой сессии, а также насколько пересекаются результаты поиска по этим запросам.

Приведите пример валидного многословного синонима, который пройдет эту проверку.

Рассмотрим фразу [United Kingdom] и синоним [UK]. Подфразы: [United] и [Kingdom]. Является ли [UK] синонимом только для [United]? Нет. Является ли [UK] синонимом только для [Kingdom]? Нет. Следовательно, этот синоним валиден и не приводит к потере информации. Он пройдет проверку.

Как это влияет на локальное SEO?

Это имеет большое значение для локального поиска, где точность местоположения критична. Механизм предотвратит, например, замену названия конкретного района и города на просто название города (например, [Soho NYC] -> [NYC]), гарантируя, что пользователь получит локально релевантные результаты для района Soho, а не всего города.

Что такое "консервативное определение синонимов" при проверке на Pseudo-Drop?

Это означает, что при поиске синонимов для подфраз (с целью проверки) система может использовать более мягкие критерии (более широкое определение синонимичности). Это делается для того, чтобы увеличить вероятность обнаружения потенциальных pseudo-drops и надежнее предотвратить потерю информации, даже если уверенность в синонимичности подфразы не очень высока.

Что делать SEO-специалисту, чтобы соответствовать требованиям этого патента?

Основная рекомендация — фокусироваться на точности и специфичности. При оптимизации контента необходимо четко понимать интент пользователя и использовать точную терминологию. Не стоит полагаться на то, что Google сам разберется в нюансах, если контент слишком общий; нужно предоставлять точные ответы на точные запросы.

Похожие патенты

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует «Решающие Клики» и «Решающие Пропуски» для валидации и очистки правил синонимов
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а не исходный термин), это засчитывается как «Решающий Клик». Если пропускает такой результат — как «Решающий Пропуск». На основе этих данных система вычисляет оценку уверенности для правила и удаляет неэффективные синонимы.
  • US8965882B1
  • 2015-02-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google разбирает сложные слова в запросе на части и подбирает синонимы к каждой части
Google использует механизм онлайн-декомпозиции для разбора сложных или составных слов в запросе (например, "vlcmediaplayer") на отдельные компоненты ("vlc", "media", "player") прямо во время поиска. Система определяет наилучший вариант разбивки, основываясь на частотности слов в интернете. Затем она подбирает синонимы к каждому компоненту, включая синонимы синонимов (транзитивность), и использует их для расширения запроса.
  • US8392441B1
  • 2013-03-05
  • Семантика и интент

Как Google идентифицирует лексические синонимы (стемминг, акронимы, аббревиатуры) и агрессивно использует их для расширения запросов
Патент описывает гибридную систему Google для генерации синонимов, комбинирующую статистический анализ логов запросов и лингвистический анализ. Ключевая особенность — механизм повышенного доверия к лексическим вариантам (например, словам с общим корнем, акронимам, разному написанию). Если система обнаруживает лексическую связь, она снижает статистические пороги, необходимые для валидации синонима, что позволяет агрессивнее расширять запрос пользователя.
  • US9183297B1
  • 2015-11-10
  • Семантика и интент

Как Google фильтрует географические синонимы, чтобы предотвратить подмену местоположений в поиске
Google использует структурированную иерархическую базу географических данных для валидации синонимов. Если исходный термин и предложенный синоним являются разными, но связанными географическими объектами (например, соседние города или город и штат), система помечает их как «Проблемные синонимы». Это предотвращает автоматическую замену одного местоположения другим при обработке запроса, повышая точность локальной выдачи и избегая географического «дрейфа темы».
  • US8041730B1
  • 2011-10-18
  • Local SEO

  • Семантика и интент

Популярные патенты

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей
Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.
  • US9213748B1
  • 2015-12-15
  • SERP

  • Семантика и интент

  • Поведенческие сигналы

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google использует машинное обучение для прогнозирования желаемого типа контента (Web, Images, News) и формирования смешанной выдачи (Universal Search)
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
  • US7584177B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
  • US10073882B1
  • 2018-09-11
  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

seohardcore