SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет истинный смысл неоднозначных запросов, сравнивая результаты поисковой выдачи

EVALUATING SEMANTIC INTERPRETATIONS OF A SEARCH QUERY (Оценка семантических интерпретаций поискового запроса)
  • US10353964B2
  • Google LLC
  • 2015-03-11
  • 2019-07-16
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для разрешения неоднозначности запросов. Система генерирует несколько возможных интерпретаций (интентов) и создает уточненные (модифицированные) запросы для каждой из них. Затем она сравнивает, насколько результаты поиска по уточненным запросам похожи на результаты по исходному запросу. Интерпретация, чьи результаты наиболее схожи, признается наиболее вероятным намерением пользователя.

Описание

Какую проблему решает

Патент решает проблему обработки расплывчатых или неоднозначных (ambiguous) поисковых запросов, для которых сложно определить конкретное намерение пользователя. Например, запрос "Washington's age" может относиться к президенту, актеру или штату. Цель изобретения — оценить различные семантические интерпретации такого запроса, чтобы определить наиболее вероятный интент и повысить качество поисковой выдачи.

Что запатентовано

Запатентована система для автоматической оценки и валидации различных семантических интерпретаций (semantic interpretations) поискового запроса. Механизм использует сравнение результатов поиска (SERP comparison) как критерий для определения наиболее вероятного интента. Для каждой интерпретации генерируется уточненный (модифицированный) запрос, и его результаты сравниваются с результатами исходного запроса. Степень сходства (degree of similarity) используется для оценки качества интерпретации.

Как это работает

Система работает следующим образом:

  • Идентификация интерпретаций: Для исходного неоднозначного запроса определяется набор возможных semantic interpretations.
  • Генерация канонических запросов: Для каждой интерпретации извлекается связанный с ней canonical query (шаблон, точно отражающий интент).
  • Создание модифицированных запросов: Исходный запрос комбинируется с canonical query для создания modified search query. Например, из "How long is Harry Potter?" создается "How long is the Harry Potter movie?".
  • Сравнение результатов (SERP): Система получает результаты поиска для исходного запроса и для каждого модифицированного запроса.
  • Оценка сходства: Вычисляется degree of similarity между результатами исходного и модифицированных запросов. Интерпретация, чьи результаты наиболее похожи на исходные, считается наиболее релевантной.

Актуальность для SEO

Высокая. Понимание запросов (Query Understanding) и разрешение неоднозначности остаются центральными задачами поиска. Учитывая участие Jakob Uszkoreit (одного из авторов архитектуры Transformer), этот патент отражает фундаментальные подходы Google к NLP и семантическому пониманию. Механизм использования SERP как инструмента валидации интерпретаций актуален для современных систем.

Важность для SEO

Патент имеет высокое значение для SEO (8.5/10). Он напрямую описывает механизм, используемый на этапе понимания запроса для определения доминирующего интента. Понимание того, как Google разрешает неоднозначность, критически важно для оптимизации контента. Если контент не соответствует доминирующей интерпретации или не предоставляет четких сигналов контекста, он не будет эффективно ранжироваться по неоднозначным запросам.

Детальный разбор

Термины и определения

Canonical Query (Канонический запрос)
Запрос или шаблон запроса, который однозначно передает намерение пользователя, связанное с конкретной семантической интерпретацией. Может содержать слоты для сущностей (например, "how many pages is the book <ENTITY>").
Degree of Similarity (Степень сходства)
Метрика, оценивающая, насколько похожи два набора результатов поиска. Может основываться на пересечении результатов, их порядке, частоте ключевых слов и т.д.
Interpretation Evaluator (Оценщик интерпретаций)
Компонент системы, отвечающий за определение семантических интерпретаций, генерацию модифицированных запросов и оценку степени сходства результатов.
Modified Search Query (Модифицированный поисковый запрос)
Запрос, сгенерированный на основе исходного запроса и canonical query. Он более точно и менее неоднозначно отражает одну из возможных семантических интерпретаций.
Semantic Interpretation (Семантическая интерпретация)
Возможное намерение (интент) или значение, связанное с исходным поисковым запросом (candidate intent).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод оценки семантических интерпретаций.

  1. Система получает набор результатов поиска для исходного запроса. Исходный запрос содержит подстроку (substring), идентифицирующую определенную сущность (entity).
  2. Получается набор semantic interpretations для исходного запроса, каждая из которых представляет собой возможный интент, связанный с этой сущностью.
  3. Для каждой интерпретации получается canonical search query.
  4. Для каждой интерпретации генерируется modified search query. Ключевой механизм генерации: замена подстроки, идентифицирующей сущность в исходном запросе, на альтернативную подстроку. Эта альтернативная подстрока включает (i) исходные термины, идентифицирующие сущность, И (ii) второй набор терминов из canonical query, которых не было в исходном запросе.
  5. Для каждого modified search query получается набор результатов поиска.
  6. Для каждой интерпретации определяется degree of similarity между результатами модифицированного запроса и результатами исходного запроса. Определение основано на сравнении атрибутов обоих наборов результатов.
  7. Выбирается конкретная семантическая интерпретация на основе вычисленных степеней сходства.

Критически важен пункт 4: это не просто добавление слов, а замена части запроса для уточнения контекста сущности. Если исходный запрос Q1="How long is Harry Potter", система заменяет "Harry Potter" на альтернативную подстроку, включающую исходные термины и новые термины (например, "movie"). Результат: "How long is the Harry Potter movie".

Claims 3-6 (Зависимые от 1): Детализируют методы расчета degree of similarity.

  • Claim 3: Сходство основано на размере пересечения (intersection) между наборами результатов. Чем больше общих результатов, тем выше сходство.
  • Claim 4: Сходство основано на размере разницы (difference) между наборами результатов. Чем меньше разница, тем выше сходство.
  • Claim 5: Сходство основано на частоте встречаемости (frequency of occurrence) определенных ключевых слов, связанных с исходным запросом, в обоих наборах результатов.
  • Claim 6: Сходство основано на сравнении порядка (order) результатов поиска в обоих наборах (ранговая корреляция).

Где и как применяется

Изобретение является ключевой частью системы понимания запросов.

QUNDERSTANDING – Понимание Запросов
Основной этап применения. Interpretation Evaluator анализирует входящий запрос, определяет возможные semantic interpretations и запускает процесс их валидации. Цель — разрешить неоднозначность и точно определить интент пользователя до того, как будет выполнено финальное ранжирование или параллельно с ним.

RANKING – Ранжирование / INDEXING – Индексирование
Система активно взаимодействует с индексом и системами ранжирования для выполнения как исходного запроса, так и всех сгенерированных Modified Search Queries. Результаты этих поисковых операций являются входными данными для оценки интерпретаций.

Входные данные:

  • Исходный поисковый запрос.
  • Набор кандидатов в semantic interpretations и связанные с ними canonical queries.
  • Доступ к поисковому индексу.

Выходные данные:

  • Оценка (score) или ранг для каждой семантической интерпретации, основанная на degree of similarity.
  • Выбранная (доминирующая) семантическая интерпретация запроса.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы (ambiguous queries). Это запросы, содержащие сущности с несколькими значениями или аспектами (например, "Ягуар" – животное или автомобиль; "Apple" – компания или фрукт).
  • Конкретные типы контента: Влияет на выбор типа контента, который будет показан пользователю. Правильное определение интента определяет, какие ресурсы будут приоритетны.

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда поисковая система идентифицирует запрос как потенциально неоднозначный и для него существует несколько возможных semantic interpretations.

Пошаговый алгоритм

Процесс оценки семантических интерпретаций:

  1. Получение исходных данных: Система получает исходный поисковый запрос от пользователя.
  2. Генерация первичных результатов: Получается набор результатов поиска для исходного запроса (SERP A).
  3. Идентификация интерпретаций: Определяется набор кандидатных semantic interpretations (интентов).
  4. Получение канонических запросов: Для каждой интерпретации извлекается соответствующий canonical query.
  5. Генерация модифицированных запросов (Цикл): Для каждой интерпретации:
    1. Система идентифицирует сущность в исходном запросе.
    2. Генерируется modified search query путем замены подстроки сущности на уточненную подстроку из canonical query (включающую исходные термины плюс новые уточняющие термины).
  6. Получение вторичных результатов (Цикл): Для каждого модифицированного запроса получается набор результатов поиска (SERP B, SERP C и т.д.).
  7. Вычисление сходства (Цикл): Для каждой интерпретации вычисляется degree of similarity между SERP A и соответствующей модифицированной SERP (например, SERP B). Используются метрики: пересечение, разница, порядок ранжирования, частота ключевых слов.
  8. Оценка и выбор: Семантические интерпретации ранжируются на основе вычисленной степени сходства. Выбирается интерпретация с наивысшей степенью сходства.
  9. Применение: Выбранная интерпретация используется для дальнейшей обработки запроса и финального ранжирования.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании результатов поиска как основного источника данных для оценки.

  • Системные данные (Search Results/SERP Data): Основные данные — это наборы результатов поиска для исходного и модифицированных запросов (список URL и их порядок).
  • Контентные факторы (Косвенно): Используются ключевые слова (keywords) из запроса для одного из методов расчета схожести (анализ частоты их встречаемости в результатах, Claim 5).
  • Поведенческие факторы (Косвенно): Важное замечание из патента: используя результаты поиска для оценки, система косвенно учитывает другие источники данных, такие как click-through data и user-specific data, которые уже были использованы при формировании этих результатов. Это позволяет оценить интент без прямого анализа этих сигналов.

Какие метрики используются и как они считаются

Ключевая метрика — Degree of Similarity. Она рассчитывается путем сравнения двух наборов результатов поиска с использованием следующих методов:

  • Intersection Size (Размер пересечения): Подсчет количества общих ресурсов (URL). Чем больше пересечение, тем выше сходство (Claim 3).
  • Difference Size (Размер разницы): Подсчет количества ресурсов, которые присутствуют в одном наборе, но отсутствуют в другом. Чем меньше разница, тем выше сходство (Claim 4).
  • Keyword Frequency Comparison (Сравнение частоты ключевых слов): Сравнение частоты встречаемости ключевых слов (связанных с исходным запросом) в контенте результатов (Claim 5).
  • Ranking Order Comparison (Сравнение порядка ранжирования): Анализ того, насколько совпадает порядок ранжирования общих ресурсов (Claim 6).

Выводы

  1. Валидация интента через сравнение SERP: Ключевая идея патента в том, что Google использует сами результаты поиска как механизм обратной связи для валидации своего понимания запроса. Если интерпретация верна, результаты уточненного (модифицированного) запроса должны быть очень похожи на результаты исходного (неоднозначного) запроса.
  2. Активное тестирование гипотез: Система не просто пассивно анализирует запрос, а активно генерирует и тестирует гипотезы об интенте путем создания modified search queries.
  3. Специфичный метод модификации запроса: Патент защищает конкретный способ уточнения запроса (Claim 1) — замену упоминания сущности на расширенную версию, включающую дополнительные термины из canonical query (например, [apple] -> [apple company]).
  4. Косвенное использование поведенческих сигналов: Патент явно указывает, что этот метод позволяет косвенно учитывать поведенческие факторы (например, click-through data). Поскольку эти факторы уже заложены в ранжирование сравниваемых SERP, схожесть выдач отражает коллективное поведение пользователей.
  5. Доминирующая интерпретация: Этот механизм помогает определить доминирующую интерпретацию неоднозначного запроса в вебе. Если большинство качественных ресурсов и поведение пользователей склоняются к одной интерпретации, система валидирует ее как основную.

Практика

Best practices (это мы делаем)

  • Анализ доминирующего интента (SERP Analysis): При исследовании ключевых слов необходимо тщательно анализировать выдачу по неоднозначным терминам. Определите, какая интерпретация является доминирующей. Это та интерпретация, которую Google валидирует с помощью описанного механизма. Ваша стратегия должна соответствовать этому интенту.
  • Четкое сигнализирование контекста сущностей: Если вы таргетируете неоднозначный запрос (например, "Jaguar"), убедитесь, что контент страницы предоставляет исчерпывающие сигналы контекста (например, "автомобиль", "модель", "цена" или "животное", "ареал", "питание"). Используйте термины, которые Google может использовать в своих modified search queries для проверки интента.
  • Оптимизация под четкие интенты (Canonical Queries): Определите, какие canonical queries существуют в вашей тематике (как пользователи задают однозначные вопросы). Убедитесь, что ваш контент оптимально отвечает на эти канонические формы. Это повышает вероятность того, что ваш контент будет присутствовать в результатах modified query, используемых для оценки.
  • Таргетирование вторичных интентов с высокой точностью: Если вы хотите ранжироваться по вторичной (не доминирующей) интерпретации, необходимо сделать контекст страницы абсолютно ясным. Страница должна быть высокорелевантной тому уточненному (modified) запросу, который соответствует этому интенту, и фокусироваться на long-tail запросах.

Worst practices (это делать не надо)

  • Игнорирование неоднозначности и контекста: Создание контента под общий запрос без учета его различных интерпретаций и без предоставления четкого контекста. Страница с неясным контекстом может не соответствовать ни одной конкретной интерпретации достаточно хорошо.
  • Смешивание различных интентов на одной странице: Создание страниц, которые пытаются охватить слишком много разных интерпретаций одной темы. Это может размыть релевантность страницы для конкретного, четкого Canonical Query, который выберет Google.
  • Использование неоднозначности для кликбейта: Создание заголовков, которые намеренно играют на неоднозначности, чтобы привлечь трафик, не соответствующий основному интенту. Если Google определит, что ваш контент не соответствует доминирующей интерпретации, вы не будете ранжироваться.

Стратегическое значение

Патент подтверждает стратегический фокус Google на глубоком понимании намерений пользователя, выходящем за рамки ключевых слов. Он демонстрирует, что понимание запросов в Google — это процесс, тесно связанный с реальным контентом и реакцией пользователей на него (косвенный учет поведенческих факторов). Для SEO это означает, что анализ SERP является отправной точкой: необходимо понять логику выбора интерпретации Google и соответствовать ей. Стратегия должна строиться вокруг интентов, сущностей и контекста.

Практические примеры

Сценарий: Определение интента для запроса "Ягуар"

  1. Исходный запрос (Q_orig): "Ягуар".
  2. Исходная выдача (SERP_orig): Смешанная выдача, но преимущественно сайты об автомобилях (например, 7 из 10).
  3. Интерпретации и Модифицированные запросы:
    • SI 1 (Автомобиль): Q_mod1 = "Автомобиль Ягуар цена".
    • SI 2 (Животное): Q_mod2 = "Животное Ягуар фото".
  4. Сравнение:
    • Сравнение SERP_orig и SERP_mod1: Сходство высокое (много общих результатов, порядок похож).
    • Сравнение SERP_orig и SERP_mod2: Сходство низкое.
  5. Результат: Система выбирает Интерпретацию 1 (Автомобиль) как доминирующий интент, так как текущая выдача по исходному запросу больше похожа на выдачу по уточненному запросу об автомобиле.
  6. Действие SEO (для сайта зоопарка): Ранжироваться по общему запросу "Ягуар" будет сложно. Необходимо сосредоточиться на более специфических запросах (как Q_mod2), где интент ясен.

Вопросы и ответы

Как система определяет, какая интерпретация запроса верна?

Система использует метод валидации через сравнение результатов поиска. Она предполагает, что если интерпретация верна, то результаты поиска по уточненному запросу (Modified Query), сгенерированному на основе этой интерпретации, должны быть максимально похожи на результаты поиска по исходному неоднозначному запросу. Сходство измеряется по составу, порядку и другим характеристикам SERP.

Что такое "Канонический запрос" (Canonical Query) и как он используется?

Это шаблон или пример запроса, который однозначно выражает конкретное намерение пользователя. Например, для интента "узнать количество страниц в книге" каноническим запросом может быть "how many pages is the book <Название книги>". Система использует эти шаблоны для создания уточненных версий исходного неоднозначного запроса пользователя.

Как именно генерируется "Модифицированный запрос" (Modified Search Query)?

Ключевой механизм, описанный в Claim 1, — это замена подстроки. Система идентифицирует сущность в исходном запросе и заменяет её на более специфическое упоминание, взятое из canonical query. Это включает добавление терминов, которых не было в исходном запросе. Например, в запросе "how long is harry potter" подстрока "harry potter" может быть заменена на "harry potter book" или "harry potter movie".

Какие метрики используются для сравнения двух наборов результатов поиска (SERP)?

Патент перечисляет несколько методов: размер пересечения результатов (сколько общих документов), размер разницы (сколько уникальных документов), сравнение порядка ранжирования документов и сравнение частоты встречаемости ключевых слов в результатах. Google может использовать комбинацию этих метрик для расчета degree of similarity.

Как этот патент связан с поведенческими факторами (CTR)?

Патент утверждает, что этот метод позволяет косвенно учитывать поведенческие факторы. Поскольку результаты поиска, используемые для сравнения, уже отранжированы с учетом click-through data и других сигналов, сравнение этих результатов автоматически включает влияние этих факторов в процесс оценки интерпретаций без их прямого анализа.

Может ли этот механизм объяснить, почему иногда выдача по общему запросу полностью смещается в сторону одного конкретного интента?

Да, абсолютно. Если результаты по общему запросу (например, "Apple") очень сильно пересекаются с результатами по уточненному запросу (например, "Apple company"), система с высокой уверенностью определит, что пользователи ищут информацию о компании (доминирующий интент), и будет приоритизировать этот интент в выдаче.

Как SEO-специалисту использовать знание о Canonical Queries на практике?

Необходимо исследовать, как пользователи формулируют однозначные запросы в вашей нише (канонические формы). Оптимизация контента под эти формы гарантирует, что ваш сайт будет релевантен для конкретного интента. Это поможет Google правильно классифицировать ваш контент при разрешении неоднозначности в более широких запросах.

Что делать, если мой контент нацелен на второстепенный интент неоднозначного запроса?

Если Google отдает предпочтение доминирующему интенту, получить трафик по исходному неоднозначному запросу будет сложно. В этом случае стратегия должна фокусироваться на более специфических, длинных запросах (long-tail), которые соответствуют вашему второстепенному интенту — по сути, нацеливаться напрямую на modified search queries.

Может ли доминирующий интент запроса измениться со временем?

Да. Поскольку механизм основан на сравнении текущих результатов поиска, интент может измениться, если изменится сама выдача. Это может произойти из-за появления нового актуального контента (например, новости, тренды) или изменения поведения пользователей и их предпочтений в кликах.

Как обеспечить релевантность моего сайта для нужной интерпретации?

Необходимо предоставлять четкий контекст вокруг сущностей на странице. Если вы пишете об Apple (компании), используйте связанную терминологию (iPhone, CEO, stock, technology). Это поможет поисковой системе понять, какому именно canonical query соответствует ваш контент, и повысит его ранжирование при выборе соответствующей интерпретации.

Похожие патенты

Как Google использует результаты веб-поиска для выбора правильного ответа на неоднозначные фактические запросы
Google использует этот механизм для разрешения неоднозначности в запросах (например, «возраст Вашингтона»). Система генерирует несколько потенциальных ответов из Knowledge Graph, а затем проверяет, какой из них лучше всего подтверждается топовыми результатами органического поиска. Оценка кандидата зависит от того, насколько часто и уверенно Сущность (Topic) и Ответ (Answer) упоминаются (аннотируются) на страницах в топе выдачи.
  • US9336269B1
  • 2016-05-10
  • Семантика и интент

  • Knowledge Graph

  • SERP

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует трендовые результаты поиска для понимания неоднозначных запросов в Ассистенте
Google использует этот механизм для разрешения неоднозначных запросов в Цифровом Ассистенте. Если намерение пользователя неясно, система анализирует текущие трендовые результаты веб-поиска или всплески похожих запросов, чтобы определить актуальный контекст (например, новости или музыка). Затем Ассистент формирует ответ, используя предпочитаемые пользователем источники информации для этого контекста.
  • US20220382819A1
  • 2022-12-01
  • Семантика и интент

  • Персонализация

Как Google может генерировать альтернативные запросы из контента страниц и встраивать их в сниппеты
Google использует механизм для помощи пользователям в уточнении их поискового намерения. Система анализирует текст веб-страниц в результатах поиска и находит фразы, похожие на исходный запрос или характеризующие документ. Эти фразы затем встраиваются непосредственно в сниппеты как кликабельные предложения для нового поиска, облегчая навигацию и уточнение запроса.
  • US9183323B1
  • 2015-11-10
  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2015-11-24
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
  • US8538989B1
  • 2013-09-17
  • Семантика и интент

  • Индексация

  • Структура сайта

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore