SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google автоматически уточняет запросы, используя характеристики топовых результатов из общей выдачи

QUERY MODIFICATION (Модификация запроса)
  • US8819000B1
  • Google LLC
  • 2012-05-01
  • 2014-08-26
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для улучшения качества результатов при использовании фильтров или поиске в специализированных коллекциях (например, по дате или типу документа). Система анализирует, какие характеристики объединяют лучшие результаты в общей (неограниченной) выдаче по этому запросу. Затем эти характеристики автоматически добавляются как скрытые ограничения к исходному запросу пользователя, чтобы гарантировать, что отфильтрованные результаты соответствуют шаблону качества общей выдачи.

Описание

Какую проблему решает

Патент решает проблему снижения качества поисковой выдачи, когда пользователь применяет ограничения (limitations) к своему запросу, например, фильтры по дате, типу документа или ищет внутри определенной коллекции (например, Scholarly Articles, News). Ограничение корпуса документов может привести к тому, что в топ попадут результаты, которые не обладают характеристиками высококачественных ресурсов в данной тематике, или что стандартные сигналы ранжирования могут быть менее эффективны в ограниченном наборе данных.

Что запатентовано

Запатентована система автоматической модификации запросов. Когда пользователь задает ограниченный запрос, система анализирует результаты для более широкой (неограниченной) версии этого запроса. Она выявляет общие характеристики (common characteristics) среди высокоранжируемых результатов в широкой выдаче. Затем система автоматически добавляет эти характеристики в качестве дополнительных ограничений (second limitation) к исходному запросу пользователя, чтобы повысить качество итоговой выдачи.

Как это работает

Механизм работает следующим образом:

  • Получение ограниченного запроса: Система получает запрос с ограничением (например, [запрос] + [фильтр по дате]).
  • Анализ широкой выдачи: Система анализирует результаты для неограниченной версии запроса ([запрос] без фильтра).
  • Идентификация характеристик: Определяются общие черты топовых результатов широкой выдачи (например, «термины запроса встречаются в заголовке»).
  • Оценка и выбор: Если характеристика встречается достаточно часто (превышает порог), она выбирается для модификации.
  • Переписывание запроса: Система генерирует новый запрос, добавляя выявленную характеристику как ограничение ([запрос] + [фильтр по дате] + [термины в заголовке]).
  • Выполнение: Пользователю предоставляются результаты этого нового, автоматически уточненного запроса.

Актуальность для SEO

Высокая. Автоматическое уточнение запросов и использование шаблонов качества из основной выдачи для улучшения вертикального поиска и фильтрованных результатов остается ключевой задачей Information Retrieval. Этот патент описывает конкретный механизм того, как Google может предпочитать результаты, соответствующие определенным критериям качества, выявленным в более широком контексте.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO-стратегии. Он показывает, что Google использует общую (Web) выдачу как эталон качества для конкретной темы. Если контент не соответствует характеристикам, которые Google считает признаками качества в общей выдаче (например, наличие ключевых слов в Title), он может быть исключен из результатов при применении пользователем фильтров или в вертикальном поиске, даже если он релевантен в узком контексте.

Детальный разбор

Термины и определения

Common Characteristics (Общие характеристики)
Признаки, общие для двух или более ресурсов, соответствующих высокоранжируемым результатам. Примеры: вхождение терминов запроса в заголовок (title), в виде фразы (phrase), количество цитирований, дата публикации.
First Limitation (Первое ограничение)
Ограничение, присутствующее в исходном запросе пользователя или добавленное при сужении поиска. Часто это неключевое ограничение (non-keyword limitation), например, фильтр по дате, типу документа или поиск в определенной коллекции (corpus).
Highly-ranked results (Высокоранжируемые результаты)
Набор топовых результатов (например, Топ-N) для модифицированного (более широкого) запроса или исходного запроса.
Modified Query (Модифицированный запрос, первый)
В основном сценарии (Claim 1): Запрос, созданный путем удаления First Limitation из исходного запроса. Это более широкая версия запроса.
Original Query (Исходный запрос)
Запрос, полученный от пользователя.
Second Limitation (Второе ограничение)
Дополнительное ограничение, автоматически сгенерированное системой на основе выявленных Common Characteristics. Используется для уточнения запроса.
Second Modified Query (Второй модифицированный запрос)
Запрос, включающий исходные ограничения и добавленное Second Limitation. Результаты этого запроса предоставляются пользователю.
Suggested Query (Предложенный запрос)
В одном из сценариев (Claim 18): Модифицированный запрос, который предлагается пользователю в интерфейсе для уточнения поиска.

Ключевые утверждения (Анализ Claims)

Патент описывает три основных сценария применения технологии, защищенных разными независимыми пунктами формулы.

Сценарий 1: Автоматическая модификация ограниченного запроса (Claim 1)

Claim 1 (Независимый пункт): Описывает процесс, когда пользователь сразу вводит запрос с ограничением.

  1. Система получает исходный запрос (original query), включающий первое ограничение (first limitation), сужающее поиск.
  2. Система модифицирует его, чтобы получить (первый) модифицированный запрос (modified query), в котором первое ограничение опущено (поиск расширяется).
  3. Получаются первые результаты поиска по широкому запросу.
  4. Идентифицируются общие характеристики (common characteristics) ресурсов, соответствующих высокоранжируемым результатам (highly-ranked results).
  5. Генерируется второй модифицированный запрос (second modified query), включающий исходный запрос и второе ограничение (second limitation), представляющее эти общие характеристики.
  6. Результаты этого второго запроса предоставляются в ответ на исходный запрос.

Ядром является использование сигналов качества из широкой выдачи для автоматического уточнения более узкой (ограниченной) выдачи. Система предполагает, что пользователь хочет видеть результаты, обладающие теми же характеристиками, что и лучшие результаты в общем поиске.

Claim 3 (Зависимый от 1): Детализирует выбор характеристик.

Для каждой общей характеристики генерируются оценки (scores) на основе количества топовых результатов с этой характеристикой. Характеристики добавляются как ограничения, только если их оценки удовлетворяют пороговому значению (threshold).

Сценарий 2: Модификация при сужении выдачи (Claim 9, Независимый)

Описывает процесс, когда пользователь сужает уже полученные результаты (например, применяет фильтр).

  1. После предоставления первых результатов на исходный запрос, система получает запрос на предоставление результатов для суженного запроса (исходный запрос + новое ограничение L1).
  2. Идентифицируются характеристики (C) высокоранжируемых результатов из предыдущего (первого) поиска.
  3. Генерируется модифицированный запрос, включающий исходный запрос, L1 и новое ограничение L2, представляющее характеристики (C).
  4. Результаты этого модифицированного запроса предоставляются в ответ на запрос о сужении.

Сценарий 3: Генерация предложенных запросов (Claim 18, Независимый)

Описывает генерацию Suggested Queries.

  1. Получение исходного запроса и результатов.
  2. Идентификация общих характеристик (C) высокоранжируемых результатов.
  3. Выбор первого ограничения (L1), не включенного в исходный запрос (например, фильтр по дате).
  4. Генерация предложенного запроса, включающего исходный запрос, L1 и второе ограничение (L2), представляющее характеристики (C).
  5. Предоставление результатов и предложенного запроса.

Где и как применяется

Изобретение применяется на этапах обработки запроса и ранжирования.

QUNDERSTANDING – Понимание Запросов
На этом этапе система распознает наличие ограничений или получает запрос на сужение поиска. Это активирует логику патента. Система переписывает запрос (Query Rewrite), генерируя либо более широкий Modified Query (Сценарий 1), либо анализируя текущие результаты для генерации финального Second Modified Query (Сценарии 1 и 2) или Suggested Query (Сценарий 3).

RANKING – Ранжирование
Система должна выполнить несколько процессов ранжирования:

  1. Ранжирование для широкого Modified Query (Сценарий 1) или исходного запроса (Сценарии 2 и 3) для получения Highly-ranked results и их характеристик.
  2. Финальное ранжирование для Second Modified Query для предоставления результатов пользователю.

Входные данные:

  • Исходный запрос пользователя (ключевые слова и ограничения).
  • Данные индекса для широкого корпуса документов (например, Web).
  • Данные индекса для ограниченного корпуса документов (например, News, Scholar).
  • Метаданные о ресурсах (характеристики): наличие терминов в заголовках, анкорах, даты, количество цитирований и т.д.

Выходные данные:

  • Набор результатов, отвечающий автоматически уточненному запросу (Second Modified Query).
  • (Опционально) Предложенные запросы (Suggested Queries).

На что влияет

  • Специфические запросы и Вертикали: Наибольшее влияние оказывается на поиск внутри специализированных коллекций (Scholarly Articles, Books, News, Blogs) или при использовании временных фильтров (Recent, Last 7 days).
  • Типы контента: Влияет на любой контент, который может быть отфильтрован по неключевым ограничениям (non-keyword limitations). Система стремится обеспечить, чтобы отфильтрованный контент структурно и семантически соответствовал шаблонам качества, установленным в основной веб-выдаче.

Когда применяется

Алгоритм применяется в трех сценариях, описанных выше. Общие условия применения:

  • Триггер активации: Получение запроса с ограничением (Сценарий 1), запрос на сужение поиска (Сценарий 2) или генерация предложений (Сценарий 3).
  • Условие применения модификации: Система должна идентифицировать одну или несколько Common Characteristics в топовых результатах соответствующей (широкой или исходной) выдачи, оценки которых превышают установленный порог (Threshold).
  • Исключения: Если ни одна характеристика не превышает порог, модификация не применяется.

Пошаговый алгоритм

Процесс обработки ограниченного запроса (Сценарий 1)

  1. Получение запроса: Система получает исходный запрос, который включает ключевые слова и Первое Ограничение (например, фильтр по дате).
  2. Генерация широкого запроса: Система создает первый модифицированный запрос, удаляя Первое Ограничение.
  3. Выполнение широкого поиска: Получается первый набор результатов для широкого запроса.
  4. Выбор топовых результатов: Идентифицируются высокоранжируемые результаты (Топ-N) из первого набора.
  5. Извлечение характеристик: Анализируются ресурсы, соответствующие топовым результатам, для выявления их признаков (например, термины в заголовке, фразовое соответствие, количество цитирований).
  6. Идентификация общих характеристик: Определяются характеристики, общие для двух или более топовых ресурсов.
  7. Скоринг и фильтрация характеристик:
    • Для каждой общей характеристики рассчитывается оценка (Score), основанная на частоте ее встречаемости в Топ-N или на взвешенной сумме с учетом позиций (position-weighted sum).
    • Оценка сравнивается с порогом (Threshold).
  8. Выбор Второго Ограничения: Выбираются характеристики, превысившие порог. Они преобразуются во Второе Ограничение (например, оператор intitle:). Если кандидатов слишком много, выбирается ограниченное количество (например, топ-3) с наивысшими оценками.
  9. Генерация уточненного запроса: Создается Второй Модифицированный Запрос, который включает Исходный Запрос (с Первым Ограничением) и Второе Ограничение.
  10. Выполнение уточненного поиска: Получается второй набор результатов.
  11. Ответ пользователю: Второй набор результатов предоставляется в ответ на исходный запрос.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании метаданных и структурных особенностей документов для выявления характеристик качества.

  • Контентные и Структурные факторы: Система анализирует, где именно в документе встречаются термины запроса:
    • Заголовки (Title).
    • Аннотации (Abstract).
    • Основной текст (Body).
    • В виде фразы (Phrase occurrence).
    • Близость терминов друг к другу.
  • Ссылочные факторы:
    • Количество цитирований или ссылок на ресурс (Number of citations/links).
    • Вхождение терминов запроса в анкорный текст ссылок, ведущих на ресурс.
  • Временные факторы: Дата публикации ресурса (Publication Date).
  • Технические/Мета-факторы:
    • Тип документа (Document type: book, article, blog, web page).
    • Язык (Language).
    • Длина документа (Document length).
    • Автор и издатель (Author, Publisher).
    • Географическое положение, связанное с ресурсом (Geographical location).

Какие метрики используются и как они считаются

  • Score (Оценка характеристики): Метрика, определяющая распространенность характеристики среди топовых результатов. Может рассчитываться как:
    • Простое количество (Count) результатов в Топ-N, обладающих характеристикой.
    • Доля (Fraction) результатов в Топ-N (Count / N).
    • Взвешенная сумма (Position-weighted sum), где вклад результата зависит от его позиции в ранжировании (более высокие позиции имеют больший вес).
  • Threshold (Порог): Минимальное значение Score, необходимое для того, чтобы характеристика была использована для модификации запроса. Пороги могут быть разными для разных характеристик.
  • Максимальное количество ограничений: Лимит на количество дополнительных ограничений (Second Limitations), добавляемых к запросу, чтобы избежать чрезмерного сужения выдачи (например, максимум 3).

Выводы

  1. Общая выдача как эталон качества: Патент демонстрирует механизм, при котором Google использует характеристики высокоранжируемых результатов из общей (неограниченной) выдачи как шаблон того, как должен выглядеть качественный результат по данной теме. Этот шаблон затем принудительно применяется к более узким (ограниченным) запросам.
  2. Автоматическое и неявное уточнение запросов: Система автоматически добавляет ограничения (например, требуя наличия терминов в заголовке или фразового соответствия), даже если пользователь этого не просил. Это делается для повышения точности (Precision) и качества выдачи, особенно при использовании фильтров.
  3. Важность фундаментальных сигналов релевантности: Такие характеристики, как вхождение запроса в заголовок (Title) или в виде точной фразы, часто являются сильными сигналами качества и релевантности в общей выдаче. Патент показывает, что эти сигналы переносятся и становятся обязательными в ограниченных выдачах.
  4. Контекстно-зависимый выбор ограничений: Система выбирает, какие именно ограничения добавить, основываясь на анализе Топ-N результатов (Highly-ranked results) и пороговых значениях (Thresholds). Если в топе нет четкого паттерна, запрос не будет модифицирован.
  5. Улучшение вертикального поиска: Механизм особенно важен для специализированных поисковых систем (News, Scholar, Books), где объем данных или сигналов ранжирования может быть меньше, чем в основном веб-поиске. Заимствование сигналов из веба позволяет улучшить качество этих вертикалей.

Практика

Best practices (это мы делаем)

  • Анализ характеристик общей выдачи (SERP Blueprinting): Для ключевых запросов необходимо анализировать Топ-10 общей веб-выдачи, чтобы понять, какие характеристики Google считает признаками качества. Обращайте внимание на паттерны: используют ли топовые сайты точное вхождение фразы в Title, H1, как часто термины встречаются в тексте, какова структура контента.
  • Соблюдение фундаментальных On-Page сигналов: Если анализ общей выдачи показывает, что 8 из 10 топовых результатов содержат ключевую фразу в заголовке (Title), ваш контент также должен следовать этому паттерну. Игнорирование этого может привести к тому, что описанный механизм отфильтрует вашу страницу при использовании пользователем уточнений (например, фильтра по дате).
  • Повышение авторитетности и цитируемости: Поскольку количество ссылок/цитирований является одной из характеристик, которые могут быть проанализированы и превращены в ограничение, работа над качественным ссылочным профилем остается критически важной. Если топовые результаты имеют высокий уровень цитируемости, система может неявно требовать этого и от других результатов.
  • Оптимизация под вертикальный поиск: При продвижении в Google News или Google Scholar убедитесь, что ваш контент не только соответствует требованиям этих платформ, но и обладает характеристиками высококачественных веб-документов по этой теме.

Worst practices (это делать не надо)

  • Игнорирование On-Page оптимизации в пользу только Off-Page сигналов: Если контент структурно и семантически не соответствует шаблонам качества общей выдачи, он уязвим перед этим механизмом фильтрации, даже при наличии сильных внешних сигналов.
  • Создание контента, релевантного только в узком контексте: Нельзя полагаться на то, что страница будет хорошо ранжироваться в отфильтрованной выдаче (например, «за последний месяц») только за счет свежести, если она не соответствует базовым критериям качества и релевантности, установленным в общей выдаче.
  • Нестандартное использование заголовков: Использование кликбейтных или нерелевантных заголовков, не содержащих основных терминов запроса, увеличивает риск того, что система применит ограничение intitle: (если это общая характеристика топа) и исключит вашу страницу из уточненной выдачи.

Стратегическое значение

Этот патент подтверждает стратегию Google по унификации сигналов качества и релевантности во всех типах поиска. Основная веб-выдача служит «обучающим набором» для определения того, что представляет собой хороший ответ на запрос. SEO-стратегия должна фокусироваться на создании контента, который соответствует этим эталонным характеристикам. Это также объясняет, почему иногда при использовании фильтров (например, по дате) выдача может казаться чрезмерно ограниченной — система автоматически применяет дополнительные скрытые фильтры, основанные на паттернах качества.

Практические примеры

Сценарий: Оптимизация статьи для Google Scholar

  1. Задача: Опубликовать научную статью по теме "квантовая запутанность" (quantum entanglement) и обеспечить ее видимость в Google Scholar.
  2. Анализ (Действия SEO/Автора): Анализируем общую веб-выдачу по запросу "quantum entanglement". Выявляем, что топовые результаты (Википедия, авторитетные университеты) почти всегда содержат точную фразу в Title и имеют значительное количество внешних ссылок/цитирований.
  3. Применение (Как работает Google согласно патенту):
    • Пользователь ищет в Google Scholar (Применяется First Limitation: Corpus=Scholar).
    • Google анализирует общую веб-выдачу (без ограничения).
    • Google определяет Common Characteristics: "Термины в Title" и "Высокая цитируемость". Обе превышают порог.
    • Google автоматически переписывает запрос пользователя на: intitle:"quantum entanglement" AND (Citation_Count > Threshold) в рамках Corpus=Scholar.
  4. Результат для SEO: Если автор использовал креативный заголовок без точной фразы (например, "Странное действие на расстоянии") или опубликовался в новом журнале без цитирований, статья будет исключена из выдачи этим механизмом, несмотря на ее потенциальную релевантность. Необходимо использовать точный термин в заголовке и работать над цитируемостью.

Вопросы и ответы

Означает ли этот патент, что Google всегда переписывает мои запросы?

Нет, не всегда. Механизм активируется при определенных условиях. Например, если исходный запрос содержит ограничение (First Limitation), такое как фильтр по дате или поиск в определенной вертикали (News, Scholar), или если пользователь сужает предыдущий поиск. Кроме того, в результатах соответствующей (широкой или исходной) выдачи должны наблюдаться четкие общие характеристики (Common Characteristics), которые превышают установленный порог. Если четкого паттерна нет, запрос не модифицируется.

Как система определяет, какие характеристики являются «общими»?

Система анализирует Топ-N результатов для соответствующей версии запроса. Для каждой потенциальной характеристики (например, «термины в заголовке», «фразовое соответствие», «количество цитирований») рассчитывается оценка (Score). Эта оценка может быть основана на количестве результатов, обладающих этой характеристикой, или на взвешенной сумме с учетом позиций. Если оценка превышает заданный порог (Threshold), характеристика считается достаточно общей и важной для применения.

Может ли этот механизм навредить моему сайту?

Да, может. Если ваш контент не обладает теми характеристиками, которые Google идентифицировал как признаки качества в общей выдаче по данной теме, ваш сайт может быть исключен из результатов при использовании пользователями фильтров. Например, если большинство топовых сайтов используют точное вхождение ключа в Title, а вы нет, система может добавить оператор intitle: к запросу пользователя, тем самым отфильтровав вашу страницу.

Как я могу использовать этот патент для улучшения SEO?

Ключевая стратегия — это анализ общей веб-выдачи как эталона (Blueprint). Изучите, какие общие черты объединяют Топ-10 результатов по вашим основным запросам. Это могут быть структурные элементы (наличие ключей в Title/H1), семантические признаки или показатели авторитетности. Убедитесь, что ваш контент соответствует этим выявленным паттернам, чтобы не быть отфильтрованным данным механизмом.

Влияет ли этот патент на обычный веб-поиск без фильтров?

Напрямую в основных сценариях (Claim 1 и 9) — нет, так как они активируются при наличии ограничений или сужении поиска. Однако патент использует данные из обычного веб-поиска как основу для принятия решений. Это подчеркивает важность хорошего ранжирования именно в основном поиске, так как его результаты служат эталоном. Также, механизм генерации предложенных запросов (Claim 18) применяется и в обычном поиске.

Что такое «неключевое ограничение» (non-keyword limitation)?

Это ограничения, которые не связаны напрямую с терминами запроса или их паттернами. К ним относятся фильтры, которые ограничивают корпус документов или метаданные: дата публикации, тип документа (PDF, статья, новость), язык, географическое положение, автор или издатель. Патент в первую очередь фокусируется на модификации запросов, содержащих такие ограничения.

Может ли система добавить сразу несколько ограничений?

Да. В патенте указано, что если несколько характеристик превышают свои пороги, система может сгенерировать модифицированный запрос, включающий несколько дополнительных ограничений (Second Limitation и Third Limitation). Однако может существовать лимит (например, не более трех), чтобы избежать чрезмерного сужения выдачи и нулевого результата.

Узнает ли пользователь, что его запрос был модифицирован?

В основных сценариях (Claim 1 и 9) патент предполагает, что модификация часто происходит автоматически, и результаты модифицированного запроса предоставляются в ответ на исходный запрос. В тексте упоминается, что индикация модификации может не отображаться. В третьем сценарии (Claim 18) модификация представлена как предложенный запрос (Suggested Query).

Как этот патент связан с E-E-A-T?

Патент напрямую не использует термин E-E-A-T, но его механизм тесно связан с определением качества. Система ищет характеристики, коррелирующие с высоким ранжированием в общей выдаче, которое, в свою очередь, зависит от сигналов качества и авторитетности. Например, если авторитетные сайты (высокий E-E-A-T) используют определенную структуру или имеют много цитирований, эти характеристики будут идентифицированы и применены как ограничения.

Что делать, если мой контент свежий, но плохо ранжируется при фильтре «за последний месяц»?

Это может быть результатом работы данного механизма (Сценарий 2). Проверьте, соответствует ли ваш свежий контент характеристикам топовых результатов в общей выдаче (без фильтра по дате). Если топовые результаты имеют ключевые слова в заголовке, а ваш свежий контент — нет, система может автоматически отфильтровать его, добавив требование наличия ключей в заголовке к запросу с фильтром по дате. Свежести недостаточно, нужно соответствовать базовым паттернам качества.

Похожие патенты

Как Google динамически выбирает и отображает инструменты (фильтры) для манипуляции поисковой выдачей
Google анализирует поисковый запрос и состав выдачи (типы контента, даты), а также историю использования фильтров пользователями. На основе этого анализа система динамически определяет, какие инструменты (например, фильтры по времени, типу контента или инструменты визуализации) наиболее релевантны для пользователя, и отображает их на видном месте в интерфейсе поисковой выдачи.
  • US8909619B1
  • 2014-12-09
  • SERP

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует контент, который вы сейчас просматриваете, для фильтрации и уточнения вашей поисковой выдачи
Google анализирует контекст веб-страницы или документа, который просматривает пользователь, чтобы определить основную тему (топик). Когда пользователь вводит запрос, система фильтрует результаты поиска, отдавая предпочтение тем документам, которые соответствуют этой контекстной теме, тем самым уточняя выдачу для неоднозначных запросов.
  • US8762368B1
  • 2014-06-24
  • Семантика и интент

  • SERP

  • Персонализация

Как Google принудительно добавляет в выдачу результаты с авторитетных сайтов, используя модифицированные запросы и сайт-ограниченный поиск
Google использует механизм для гарантированного включения результатов с авторитетных сайтов в поисковую выдачу. Если исходный запрос содержит ключевое слово, связанное с авторитетным источником, или если качество стандартной выдачи низкое, система выполняет дополнительный поиск. Этот поиск строго ограничен рамками авторитетного сайта и использует модифицированную (часто агрессивно расширенную) версию исходного запроса. Полученный результат затем внедряется в топ выдачи.
  • US9659064B1
  • 2017-05-23
  • EEAT и качество

  • SERP

Как Google использует контент открытого документа пользователя для уточнения автодополнений (Autocomplete) поискового запроса
Google использует механизм для персонализации предложений автодополнения (Autocomplete) на основе контента документа, который пользователь просматривает или редактирует в данный момент. Система сравнивает семантику текущего документа пользователя с результатами поиска по потенциальным вариантам завершения запроса. Варианты, чьи результаты поиска наиболее похожи на контекст документа пользователя, повышаются в списке предложений.
  • US9135250B1
  • 2015-09-15
  • Семантика и интент

  • Персонализация

Как Google динамически генерирует фильтры (теги) в выдаче на основе контента ранжируемых страниц
Google использует механизм для автоматического создания фильтров поисковой выдачи (например, в виде тегов или «пузырьков»). Система анализирует контент страниц, уже отобранных для показа по запросу, извлекает из них ключевые слова и проверяет их полезность, используя данные о поведении пользователей. Затем система отбирает наиболее релевантные и разнообразные фильтры, позволяя пользователю уточнить свой интент в один клик.
  • US10242112B2
  • 2019-03-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом
Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.
  • US7346839B2
  • 2008-03-18
  • Свежесть контента

  • Антиспам

  • Ссылки

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах
Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.
  • US20180113919A1
  • 2018-04-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
  • US8195654B1
  • 2012-06-05
  • Поведенческие сигналы

  • SERP

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

seohardcore