Как Google пессимизирует результаты, содержащие синонимы, если они используются вне контекста исходного запроса

RESTRICTED-LOCALITY SYNONYMS (Синонимы с ограниченной локальностью)

US8631019B1
Google LLC
2012-02-13
2014-01-14

Google классифицирует синонимы на надежные (Non-RLS) и контекстно-зависимые (RLS). Если документ ранжируется благодаря контекстно-зависимому синониму (RLS), но этот синоним используется в документе изолированно (без других слов запроса рядом), система значительно понижает оценку релевантности этого документа, предотвращая ранжирование нерелевантного контента.

Какую проблему решает

Патент решает проблему некорректного ранжирования, возникающую, когда поисковые системы расширяют запрос с помощью синонимов, но стандартные механизмы оценки (Scoring Engine) рассматривают все синонимы как эквивалентные исходному термину запроса. Это игнорирует нюансы надежности (confidence, trust, reliability) синонима в конкретном контексте. В результате документы, содержащие синоним в значении, не соответствующем интенту пользователя, могут ранжироваться высоко.

Что запатентовано

Запатентована система для дифференцированной оценки синонимов при ранжировании. Изобретение вводит классификацию синонимов, выделяя Restricted-Locality Synonyms (RLS) — синонимы, требующие контекстного подтверждения. Для RLS применяется специальная модель оценки (Scoring Model), которая учитывает их расположение (locality) относительно других терминов запроса в документе.

Как это работает

Система работает в несколько этапов:

Расширение запроса: Query Reviser Engine идентифицирует синонимы для терминов запроса.
Классификация синонимов: Classifier оценивает каждый синоним на основе предопределенных критериев (например, уровень уверенности правила, тип синонима) и помечает его как RLS или Non-RLS.
Дифференцированная оценка: Scoring Engine применяет разные модели оценки. Для исходных терминов и Non-RLS используется стандартная модель. Для RLS используется специальная модель.
Применение RLS-модели: Эта модель проверяет контекст использования RLS в документе. Если RLS появляется изолированно (например, не рядом с другими терминами запроса), вклад этого синонима в общий балл документа (Document Score) значительно снижается или игнорируется.

Актуальность для SEO

Высокая. Понимание синонимов и контекстуальной релевантности является ядром современных поисковых систем. С развитием NLP и моделей типа BERT/MUM, способность различать нюансы использования терминов стала еще более критичной. Этот патент описывает фундаментальную логику для обработки неоднозначности синонимов, которая остается крайне актуальной для обеспечения качества поиска.

Важность для SEO

Патент имеет высокое значение (8/10) для формирования контент-стратегии. Он демонстрирует, что оптимизация под синонимы может быть неэффективной или даже вредной, если контекст использования синонима на странице не соответствует контексту исходного запроса. Это подчеркивает критическую важность семантической связности текста, совместной встречаемости (co-occurrence) и близости (proximity) связанных терминов.

Термины и определения

Restricted-Locality Synonym (RLS) (Синоним с ограниченной локальностью): Синоним, который считается релевантным только при выполнении определенных условий контекста (локальности) в документе. Его вклад в Document Score зависит от совместной встречаемости с другими терминами запроса.
Classifier (Классификатор): Компонент системы, который оценивает синонимы на основе критериев (RLS Tagging Criteria) и определяет, следует ли классифицировать синоним как RLS.
Confidence Value (Уровень уверенности): Метрика, связанная с правилом синонимов (Synonym Rule), отражающая надежность или вероятность того, что один термин является заменой другого. Используется для классификации RLS.
Isolation Criteria (Критерии изоляции): Набор правил в модели оценки RLS, проверяющих контекст использования синонима в документе. Например, требование, чтобы RLS находился в пределах X слов от Y других терминов запроса.
Morphological Variant (Морфологический вариант): Словоформы (разные времена, числа, падежи). Как правило, классифицируются как надежные синонимы (Non-RLS).
Query Reviser Engine (Механизм пересмотра запросов): Компонент, который изменяет исходный запрос, например, добавляя или заменяя термины их синонимами.
Scoring Engine (Механизм оценки): Компонент, вычисляющий оценку релевантности документа запросу. Использует разные модели для RLS и Non-RLS.
Scoring Model (Модель оценки): Набор правил, определяющих, как учитывать вхождения терминов запроса и их синонимов при расчете Document Score.
Specific Context Synonym Rule (Правило синонимов для специфического контекста): Правило, которое определяет синоним только при наличии в запросе других определенных терминов (например, "auto" является синонимом "car" только если в запросе есть "dealer"). Синонимы, порожденные такими правилами, часто классифицируются как RLS.
Synonym Rule (Правило синонимов): Правило, определяющее, что один термин является синонимом другого, возможно, с учетом контекста и уровня уверенности.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод классификации синонимов.

Получение запроса с термином и синонима этого термина (полученного из Synonym Rule).
Оценка синонима и термина с использованием предопределенных критериев.
На основе оценки, обозначение синонима как Restricted-Locality Synonym (RLS).
Ключевое утверждение: Синонимы, обозначенные как RLS, оцениваются Scoring Engine по первой модели оценки (first scoring model). Эта модель отличается от второй модели (second scoring model), которая используется для оценки исходных терминов запроса или синонимов, не обозначенных как RLS.

Ядро изобретения — это разделение синонимов на классы и применение разных логик ранжирования к этим классам.

Claim 2 (Зависимый от 1): Уточняет природу первой модели оценки (для RLS).

Первая модель оценки определяет, что вклад вхождений RLS в Document Score зависит от того, встречаются ли вместе с RLS один или более других терминов в документе. Это вводит требование контекстуальной близости (locality).

Claims 3, 4, 5, 6 (Зависимые от 1): Детализируют критерии для классификации RLS (пункт 2 в Claim 1).

Claim 3, 4: Критерии включают проверку, являются ли термин и синоним морфологическими вариантами, аббревиатурами или акронимами. (Обычно это признаки Non-RLS).
Claim 5: Критерий включает идентификацию Confidence Value, связанного с Synonym Rule, и проверку, удовлетворяет ли он порогу. (Низкая уверенность — признак RLS).
Claim 6: Критерий включает проверку, было ли правило синонимов Specific Context Synonym Rule. (Признак RLS).

(Анализ процесса оценки, описанного в патенте, включая FIG. 5):

Метод оценки документа, содержащего RLS, включает шаги по применению первой модели оценки. Эта модель реализует логику пессимизации (demotion) оценки документа, если критерии контекста не выполнены:

Пессимизация, если исходный термин запроса отсутствует в документе.
Пессимизация, если другие синонимы термина отсутствуют в документе.
Пессимизация, если RLS не находится в непосредственной близости (adjacent) к другому термину запроса.
Пессимизация, если не выполнены Isolation Criteria (например, RLS находится слишком далеко от достаточного количества других терминов запроса).

Где и как применяется

Изобретение затрагивает этапы понимания запроса и ранжирования.

QUNDERSTANDING – Понимание Запросов
На этом этапе происходит расширение запроса. Query Reviser Engine получает синонимы. Classifier анализирует эти синонимы и правила, по которым они были сгенерированы, и присваивает им теги (RLS или Non-RLS). Это происходит до основного поиска.

INDEXING – Индексирование
Для работы механизма система должна иметь доступ к позиционной информации о терминах в индексе, чтобы можно было быстро рассчитать близость (adjacency) и выполнить проверку Isolation Criteria.

RANKING – Ранжирование
Основное применение патента. Search Engine находит документы, содержащие исходные термины или их синонимы. Затем Scoring Engine вычисляет Document Score. При этом он проверяет теги синонимов и выбирает соответствующую Scoring Model. Если используется RLS-модель, выполняются проверки контекста и применяются пессимизации.

Входные данные:

Исходный запрос и его термины.
Синонимы, сгенерированные Query Reviser Engine.
Данные о правилах синонимов (Confidence Value, контекст, тип).
Документы, идентифицированные как релевантные (с позиционной информацией терминов).

Выходные данные:

Теги RLS/Non-RLS для синонимов.
Скорректированные оценки релевантности (Document Scores) для документов.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, содержащие многозначные термины, где выбор синонима критически зависит от контекста (например, запрос "apple support" — RLS для "apple" может быть "fruit", но он должен быть пессимизирован, если рядом нет слов о еде).
Типы контента: Влияет на любой контент, который пытается ранжироваться по синонимам основного запроса, но не поддерживает тематический контекст. Особенно актуально для информационных статей и обзоров.

Когда применяется

Алгоритм применяется при выполнении следующих условий:

Триггер активации (Классификация): Когда система использует синоним для расширения запроса, и этот синоним классифицируется как Restricted-Locality Synonym (RLS).
Условие применения (Ранжирование): Когда оценивается документ, содержащий вхождение RLS. В этот момент активируется специальная Scoring Model для RLS.

Пошаговый алгоритм

Процесс состоит из двух основных частей: Классификация синонима и Оценка документа.

Часть А: Классификация синонима (RLS Tagging)

Получение данных: Система получает термин запроса и его синоним, а также данные о правиле, породившем синоним.
Оценка критериев (Сигналы): Анализируется набор сигналов:
- Негативные сигналы (против RLS): Является ли синоним морфологическим вариантом, акронимом, аббревиатурой? Имеет ли правило высокий Confidence Value?
- Позитивные сигналы (за RLS): Было ли использовано Specific Context Synonym Rule? Имеет ли правило низкий Confidence Value?
Агрегация и Принятие решения: Сигналы агрегируются (например, взвешенная сумма). Если результат удовлетворяет порогу, синоним классифицируется как RLS.
Тегирование: Синоним помечается тегом RLS для использования на этапе ранжирования.

Часть Б: Оценка документа (Scoring)

Получение данных: Scoring Engine получает документ, термин запроса и синоним.
Проверка тега: Определяется, помечен ли синоним как RLS.
- Если НЕТ: Применяется стандартная модель оценки.
- Если ДА: Применяется RLS-модель оценки (Шаг 3).
Применение RLS-модели (Каскад проверок): Система выполняет серию проверок контекста. Если условие не выполнено, применяется пессимизация (demotion) оценки документа или вклада синонима.
1. Проверка наличия исходного термина: Присутствует ли исходный термин запроса в документе? Если НЕТ -> Пессимизация.
2. Проверка наличия других синонимов: Присутствуют ли другие синонимы этого термина? Если НЕТ -> Пессимизация.
3. Проверка смежности: Находится ли RLS непосредственно рядом (adjacent) с другим термином запроса? Если НЕТ -> Пессимизация.
4. Проверка критериев изоляции: Удовлетворяет ли вхождение RLS Isolation Criteria (например, находится ли он в пределах окна из 10 слов, содержащего как минимум 3 других термина запроса)? Если НЕТ -> Пессимизация.
Вывод оценки: Выводится итоговый Document Score с учетом всех примененных пессимизаций.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о синонимах и структуре документа.

Контентные и Структурные факторы: Текст документа. Критически важна позиционная информация о терминах в документе для анализа смежности (adjacency) и близости (proximity/locality).
Системные данные (Synonym Data):
- Synonym Rules: Правила, определяющие связь между терминами.
- Confidence Values: Уровень уверенности, связанный с каждым правилом.
- Контекст правила (General vs Specific Context).
- Тип синонима (Morphological, Acronym, Abbreviation).

Какие метрики используются и как они считаются

Confidence Threshold (Порог уверенности): Используется на этапе классификации для определения, является ли синоним надежным.
Adjacency (Смежность): Бинарная метрика, указывающая, находится ли RLS непосредственно перед или после другого термина запроса в документе.
Isolation Metrics (Метрики изоляции): Измеряют контекстуальную близость. В патенте описан пример: поиск кратчайшей последовательности терминов в документе, которая включает RLS и пороговое количество других терминов запроса. Если длина этой последовательности превышает максимальный порог, RLS считается изолированным.
- Maximum sequence length (например, 10 слов).
- Minimum number of query terms (например, 3 термина).
Demotion Factors (Факторы пессимизации): Множители или вычитаемые значения, применяемые к Document Score или к вкладу RLS, если контекстуальные критерии не выполняются.

Не все синонимы одинаково полезны: Google имеет систему для классификации синонимов на надежные (Non-RLS) и контекстно-зависимые (RLS). Надежные синонимы (например, морфологические варианты, аббревиатуры) рассматриваются почти как эквивалент исходного термина. Контекстно-зависимые требуют подтверждения.
Контекст и Близость (Locality) критичны для RLS: Для того чтобы RLS внес значительный вклад в ранжирование документа, он должен использоваться в том же контексте, что и в исходном запросе. Это проверяется через его близость к другим терминам запроса в тексте документа (adjacency и Isolation Criteria).
Изолированное использование RLS пессимизируется: Если RLS используется в документе в отрыве от других ключевых слов запроса, система активно понижает (demotes) оценку документа. Это защитный механизм против ранжирования нерелевантного контента, использующего многозначные синонимы.
Каскадная модель пессимизации: RLS-модель применяет серию проверок (наличие исходного термина, наличие других синонимов, смежность, изоляция). Невыполнение каждого следующего критерия приводит к дополнительной пессимизации, что делает ранжирование по изолированным RLS крайне затруднительным.
Источник синонима определяет его надежность: Классификация RLS зависит от того, как был сгенерирован синоним — правила с низким Confidence Value или правила специфического контекста порождают RLS.

Best practices (это мы делаем)

Обеспечение семантической когерентности и контекста: При использовании синонимов в контенте убедитесь, что окружающий текст (co-occurring terms) четко задает контекст и соответствует интенту пользователя. Термины, связанные с основным запросом, должны находиться в непосредственной близости друг от друга.
Приоритет исходным терминам запроса: Наличие исходного термина запроса в документе является сильным сигналом и защищает от одной из ступеней пессимизации RLS-модели. Фокусируйтесь на прямом ответе на запрос.
Использование надежных синонимов (Non-RLS): Естественное использование морфологических вариантов, аббревиатур и общепринятых акронимов безопасно, так как они обычно классифицируются как Non-RLS и не требуют строгой контекстной близости.
Структурирование контента для близости: При создании контента следите за тем, чтобы ключевые концепции темы находились рядом (в одном предложении или абзаце). Это удовлетворяет Isolation Criteria, гарантируя, что система видит связь между терминами.

Worst practices (это делать не надо)

Synonym Stuffing (Насыщение синонимами): Использование большого количества синонимов без учета контекста в надежде повысить релевантность. Если эти синонимы будут классифицированы как RLS и использованы изолированно, это приведет к пессимизации.
Оптимизация под многозначные синонимы: Попытка ранжироваться по широкому запросу, используя его неоднозначный синоним в другом значении. Например, пытаться ранжироваться по запросу о бренде "Apple", создавая контент о яблоках (fruit). Система определит "fruit" как RLS и пессимизирует документ при отсутствии IT-контекста.
Искусственное разделение связанных терминов: Разнесение ключевых слов и их синонимов далеко друг от друга в тексте. Это нарушает критерии локальности и может активировать пессимизацию RLS.

Стратегическое значение

Патент подтверждает стратегический фокус Google на контекстуальном понимании контента, а не просто на совпадении ключевых слов. Он показывает, что система активно борется с неоднозначностью. Для SEO это означает, что построение тематического авторитета требует демонстрации глубокой связи между концепциями через четкий контекст и совместную встречаемость (co-occurrence) терминов. Стратегия должна фокусироваться на создании семантически насыщенного контента, где близость терминов естественным образом подтверждает их релевантность интенту.

Практические примеры

Сценарий: Обработка неоднозначного синонима (Пример из патента, FIG. 6A и 6B)

Исходный запрос: "Banana Recipe" (Рецепт банана).
Анализ синонимов: Система определяет "Plantain" (Плантан - овощной банан) как синоним для "Banana".
Классификация: Поскольку "Plantain" может использоваться как в контексте рецептов, так и в ботаническом контексте, система классифицирует его как Restricted-Locality Synonym (RLS).
Оценка Документа А ("Plantain Information", Doc 2): Документ содержит три вхождения "Plantain", но не содержит слово "Banana" и не содержит слово "Recipe" рядом с "Plantain".
- Исходный термин отсутствует? Да -> Пессимизация.
- Смежность с другим термином запроса ("Recipe") отсутствует? Да -> Пессимизация.
- Критерии изоляции не выполнены? Да -> Пессимизация.
- Результат: Документ А получает очень низкий балл.
Оценка Документа Б ("Plantain Recipes", Doc 3): Документ содержит фразу "Plantain Recipe".
- Исходный термин ("Banana") отсутствует? Да -> Пессимизация.
- Смежность с другим термином запроса ("Recipe") присутствует? Да -> Пессимизация не применяется.
- Результат: Документ Б получает более высокий балл, чем Документ А, так как контекст подтвержден близостью слов.

Что определяет, будет ли синоним считаться надежным (Non-RLS) или контекстно-зависимым (RLS)?

Классификация зависит от нескольких факторов, проанализированных системой. Надежными (Non-RLS) обычно считаются морфологические варианты (число, время), аббревиатуры, акронимы и синонимы, порожденные правилами с высоким уровнем уверенности (High Confidence Value). Контекстно-зависимыми (RLS) чаще становятся синонимы из правил с низкой уверенностью или правил, требующих специфического контекста в запросе (Specific Context Synonym Rule).

Каков основной риск, если моя страница ранжируется благодаря синониму, который Google считает RLS?

Основной риск заключается в значительной пессимизации (demotion) вашей страницы, если этот RLS используется изолированно или вне контекста исходного запроса. Если на странице отсутствует исходный термин запроса, а RLS находится далеко от других слов запроса, вклад этого синонима в ранжирование будет минимальным или нулевым. Это может привести к резкой потере позиций, если релевантность страницы зависела только от этого синонима.

Как этот патент влияет на концепцию плотности ключевых слов (Keyword Density)?

Этот патент еще больше снижает значимость Keyword Density как метрики. Вместо подсчета общего количества вхождений синонимов, система фокусируется на их расположении — близости (proximity) и смежности (adjacency) к другим терминам запроса. Контекстуальная релевантность и выполнение Isolation Criteria гораздо важнее, чем частота употребления термина.

Стоит ли вообще избегать использования синонимов в тексте?

Нет, использование синонимов важно для создания естественного и богатого контента. Однако необходимо следить за тем, чтобы синонимы использовались в четком контексте, подтверждающем основную тему страницы. Если вы используете потенциально неоднозначный синоним, убедитесь, что он окружен другими релевантными терминами, которые проясняют его значение в данном тексте.

Что такое "Критерии изоляции" (Isolation Criteria) на практике?

Это правила, проверяющие, насколько тесно синоним связан с другими терминами запроса в документе. Например, система может требовать, чтобы RLS находился в пределах окна из 5-10 слов, которое также содержит как минимум 2 других термина из запроса. Если RLS находится в абзаце, где нет других ключевых слов запроса, он считается изолированным и его вес снижается.

Если я использую исходный термин запроса на странице, защищает ли это меня от пессимизации по этому патенту?

Это помогает, но не гарантирует полной защиты. Наличие исходного термина предотвращает первую ступень пессимизации в каскадной RLS-модели. Однако, если на странице также используется RLS, система все равно проверит его смежность и критерии изоляции. Изолированное использование RLS все равно может снизить общую оценку документа, хотя и не так сильно, как если бы исходный термин отсутствовал.

Как узнать, считает ли Google определенный синоним как RLS?

Google не предоставляет эту информацию напрямую. Однако SEO-специалист может предполагать это на основе характеристик синонима. Если синоним является многозначным, не является морфологическим вариантом или аббревиатурой и сильно зависит от контекста (например, "Ягуар" как машина и как животное), его следует рассматривать как потенциальный RLS и обеспечивать строгий контекст при его использовании.

Влияет ли этот механизм на LSI-копирайтинг или использование семантически связанных слов?

Да, он напрямую связан с этими концепциями. Использование семантически связанных слов вокруг основного термина или его синонима помогает удовлетворить критерии локальности и избежать изоляции. Этот патент фактически формализует необходимость создания сильного семантического контекста для подтверждения релевантности.

Применяется ли RLS-модель, если документ содержит только исходные термины запроса и не содержит синонимов?

Нет. Если документ содержит только исходные термины запроса (или только надежные Non-RLS синонимы), применяется стандартная модель оценки. Механизм RLS активируется только тогда, когда в документе присутствует синоним, классифицированный как RLS.

Как этот патент соотносится с современными алгоритмами, такими как BERT?

BERT и подобные трансформерные модели значительно улучшили способность Google понимать контекст и разрешать неоднозначность на уровне предложений и абзацев. Патент RLS описывает более ранний, но фундаментальный механизм обеспечения контекста через правила близости. Можно предположить, что современные системы используют логику, подобную RLS, но реализованную через нейронные сети для более точной оценки контекстуального соответствия синонимов.

Как Google ограничивает использование синонимов, требуя сохранения исходного контекста фразы

Google классифицирует синонимы по степени надежности. Если синоним считается ненадежным или узкоконтекстным (Phrase-Restricted Substitute Term), он должен появиться в документе рядом с теми же соседними словами, что и в исходном запросе. Если это условие не выполняется, документ может быть исключен из ранжирования еще на этапе отбора кандидатов.

US20150205866A1
2015-07-23

Семантика и интент

Как Google автоматически оценивает и удаляет неэффективные синонимы и правила расширения запросов

Google использует механизм для оценки эффективности правил подстановки (синонимов). Если подставленный термин редко встречается в топовых результатах поиска или если пользователи не кликают на результаты, содержащие этот термин, система автоматически удаляет или понижает уверенность в этом правиле. Это позволяет поддерживать качество и точность понимания запросов.

US8600973B1
2013-12-03

Семантика и интент
Поведенческие сигналы
SERP

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей

Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.

US9116957B1
2015-08-25

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует удаленный контекст в запросе ("Floating Context") для точного подбора синонимов

Google использует механизм для валидации синонимов, анализируя не только соседние слова в запросе (Adjacent Context), но и слова, расположенные далеко от исходного термина (Floating Context). Это позволяет точнее определять уместность синонима, опираясь на весь контекст запроса, и избегать неверных замен, если контекст их исключает.

US8538984B1
2013-09-17

Семантика и интент

Как Google обучается распознавать синонимы, анализируя текст сниппетов в результатах поиска

Google использует текст сниппетов для улучшения систем понимания запросов. Анализируя, какие слова часто появляются в сниппетах релевантных или кликабельных результатов, система выявляет потенциальные синонимы для исходных ключевых слов. Это позволяет автоматически расширять будущие запросы, включая эти синонимы для повышения полноты выдачи.

US20140358904A1
2014-12-04

Семантика и интент
SERP

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)

Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.

US8478519B2
2013-07-02

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL

Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.

US20140280133A1
2014-09-18

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)

Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.

US9317605B1
2016-04-19

Семантика и интент
SERP
Поведенческие сигналы

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент

Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.

US9274683B2
2016-03-01

SERP
Персонализация
Поведенческие сигналы

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей

Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.

US8595225B1
2013-11-26

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями

Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.

US20110295842A1
2011-12-01

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов

Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.

US20170068720A1
2017-03-09

Семантика и интент
Поведенческие сигналы
SERP

Как Google находит, фильтрует и подмешивает посты из блогов, релевантные конкретным результатам поиска

Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих ссылок (out-degree), качество входящих ссылок (Link-based score), возраст поста, его длину и расположение ссылок, чтобы гарантировать качество подмешиваемого контента.

US8117195B1
2012-02-14

EEAT и качество
Антиспам
Ссылки

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей

Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.

US10110701B2
2018-10-23

Knowledge Graph
Поведенческие сигналы
Персонализация

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)

Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.

US8280881B1
2012-10-02

Поведенческие сигналы
Семантика и интент
Мультимедиа