SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует контент, который вы сейчас просматриваете, для фильтрации и уточнения вашей поисковой выдачи

CONTEXT-BASED FILTERING OF SEARCH RESULTS (Фильтрация результатов поиска на основе контекста)
  • US8762368B1
  • Google LLC
  • 2012-04-30
  • 2014-06-24
  • Семантика и интент
  • SERP
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует контекст веб-страницы или документа, который просматривает пользователь, чтобы определить основную тему (топик). Когда пользователь вводит запрос, система фильтрует результаты поиска, отдавая предпочтение тем документам, которые соответствуют этой контекстной теме, тем самым уточняя выдачу для неоднозначных запросов.

Описание

Какую проблему решает

Патент решает проблему неоднозначности поисковых запросов. Когда стандартная выдача содержит результаты, относящиеся к разным темам (например, запрос "rock" может вернуть результаты о музыке и геологии), система пытается определить истинное намерение пользователя. Изобретение улучшает релевантность, используя текущий контекст пользователя (например, веб-страницу, которую он просматривает) для фильтрации результатов в соответствии с этим намерением.

Что запатентовано

Запатентована система для фильтрации или переранжирования результатов поиска на основе Context Information (контекстной информации), предоставленной пользователем. Система определяет доминирующую тему (Topic) этого контекста, используя предопределенную Hierarchy of Topics. Затем результаты поиска по запросу пользователя оцениваются на предмет их релевантности этой доминирующей теме, а не только самому запросу.

Как это работает

Механизм работает следующим образом:

  • Получение данных: Система получает поисковый запрос и Context Information (например, URL, фрагмент текста или целый документ).
  • Анализ контекста: Контекст анализируется для определения его релевантности различным темам в иерархии. Для этого вычисляются First Scores.
  • Выбор темы: Выбирается тема с наивысшим First Score, которая считается наиболее релевантной контексту (при условии прохождения порогов уверенности).
  • Оценка результатов: Стандартные результаты поиска оцениваются на предмет их релевантности выбранной теме. Для этого вычисляются Second Scores.
  • Фильтрация: Результаты с наивысшими Second Scores выбираются и предоставляются пользователю, тем самым фильтруя выдачу по контекстуальной теме.

Актуальность для SEO

Высокая. Понимание контекста пользователя и уточнение неоднозначных запросов являются ключевыми задачами современных поисковых систем. Хотя методы классификации могли эволюционировать с момента подачи патента (например, отход от явных иерархий вроде ODP к моделям на основе машинного обучения), базовая идея использования текущего контекста для фильтрации выдачи крайне актуальна.

Важность для SEO

Патент имеет значительное влияние на SEO (75/100). Он подчеркивает важность четкого тематического позиционирования контента. Чтобы ранжироваться в условиях контекстного поиска, страница должна быть строго релевантна конкретной теме (Topic), которую Google может идентифицировать. Это подтверждает необходимость построения тематического авторитета и использования терминологии, соответствующей конкретной тематической вертикали.

Детальный разбор

Термины и определения

Context Information (Контекстная информация)
Данные, связанные с текущей активностью пользователя, используемые для определения его интересов. Это может быть URL просматриваемой страницы, загруженный документ или выделенный фрагмент текста (snippet).
First Scores (Первичные оценки)
Метрики, отражающие меру релевантности между Context Information и конкретной темой (Topic) в иерархии. Используются для выбора доминирующей темы контекста.
Hierarchy of Topics (Иерархия тем и подтем)
Предопределенная таксономия или структура данных, классифицирующая знания по категориям и подкатегориям. Патент упоминает использование внешних источников, таких как Open Directory Project или Yahoo! Directory.
Second Scores (Вторичные оценки)
Метрики, отражающие меру релевантности между результатом поиска и выбранной доминирующей темой (Topic). Используются для финальной фильтрации или переранжирования выдачи.
Combined Score (Комбинированная оценка)
Оценка релевантности темы, которая агрегирует оценки самой темы и всех её подтем в иерархии.
Topic (Тема)
Категория предметной области в Hierarchy of Topics.
Weighting Factors (Весовые коэффициенты)
Значения (W1, W2.1 и т.д.), присваиваемые темам или уровням иерархии. Используются для корректировки оценок релевантности, например, на основе популярности темы или количества связанного с ней контента.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс фильтрации поиска на основе контекста.

  1. Система получает запрос и информацию, идентифицирующую документ (Context Information).
  2. Получаются стандартные результаты поиска по запросу.
  3. Анализируется контекстная информация для извлечения контента.
  4. Генерируется множество First Scores, измеряющих релевантность контента к темам в Hierarchy of Topics.
  5. Выбирается тема (Topic), наиболее релевантная контексту (с наивысшим First Score).
  6. Генерируется множество Second Scores, измеряющих релевантность результатов поиска к выбранной теме.
  7. Выбираются результаты поиска, наиболее релевантные теме (с наивысшими Second Scores).
  8. Генерируется и предоставляется документ с отфильтрованными результатами.

Claim 5 (Зависимый): Вводит порог уверенности (Confidence Threshold) для активации механизма.

  1. Система определяет, превышает ли наивысший First Score установленный порог.
  2. Если НЕТ (система не уверена в теме контекста), отправляются стандартные результаты поиска (без фильтрации).
  3. Если ДА, отправляются отфильтрованные результаты.

Claim 6 (Зависимый): Вводит порог для разрешения неоднозначности (Ambiguity Threshold).

  1. Система определяет, превышает ли наивысший First Score следующую за ним оценку на величину, большую порогового значения (т.е. есть ли явный лидер среди тем).
  2. Если НЕТ (контекст релевантен нескольким темам одновременно), отправляются стандартные результаты поиска.
  3. Если ДА, отправляются отфильтрованные результаты по теме-лидеру.

Claim 9 (Зависимый): Детализирует метод расчета First Scores с использованием иерархии.

  1. Идентифицируется количество терминов в контенте, которые соответствуют каждой теме и подтеме.
  2. Назначаются оценки на основе этих количеств.
  3. Для каждой темы генерируется Combined Score путем объединения оценки самой темы и оценок ее подтем.
  4. Выбирается тема с наивысшей Combined Score.

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса, модифицируя стандартную выдачу на основе контекста пользователя.

INDEXING – Индексирование и извлечение признаков
Система может предварительно (офлайн) классифицировать документы в индексе по темам из Hierarchy of Topics и рассчитывать для них Second Scores (релевантность документа теме). Это позволяет ускорить обработку запросов в реальном времени.

RANKING – Ранжирование
На этом этапе генерируется стандартный набор результатов поиска, релевантных только запросу пользователя.

RERANKING – Переранжирование (или METASEARCH – Смешивание)
Основной этап применения патента. Система активируется, если доступна Context Information.

  1. Анализ контекста: Вычисляются First Scores для определения доминирующей темы контекста.
  2. Принятие решения (Filtering Decision): Система проверяет пороги уверенности и неоднозначности (Claims 5, 6). Если они пройдены, механизм фильтрации активируется.
  3. Фильтрация и Сортировка: Результаты этапа RANKING фильтруются (отбираются) или пересортировываются на основе их Second Scores (релевантности выбранной теме).

Входные данные:

  • Поисковый запрос.
  • Context Information (URL, документ, текст).
  • Стандартные результаты поиска (от этапа RANKING).
  • Hierarchy of Topics и Weighting Factors.

Выходные данные:

  • Отфильтрованный или переранжированный список результатов поиска, релевантный контекстуальной теме.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на широкие или неоднозначные запросы (например, "Ягуар", "Рок", "Apple"), где контекст необходим для уточнения интента. Для узкоспециализированных запросов влияние минимально.
  • Типы контента: Влияет на все типы контента, которые могут быть классифицированы в рамках Hierarchy of Topics.

Когда применяется

  • Условия активации: Алгоритм применяется только тогда, когда система получает Context Information вместе с запросом. Это может происходить, когда пользователь инициирует поиск со страницы, которую он активно просматривает.
  • Триггеры и пороги: Механизм фильтрации активируется только при высокой уверенности системы:
    • Наивысший First Score должен превышать порог уверенности (Claim 5).
    • Наивысший First Score должен значительно превосходить следующую оценку (порог неоднозначности, Claim 6).
  • Исключения: Если контекст слишком широк, неоднозначен или если по выбранной теме нет достаточно релевантных результатов (упоминается порог для Second Scores в Claim 7), система возвращает стандартную выдачу.

Пошаговый алгоритм

  1. Получение данных: Система получает поисковый запрос и Context Information от клиента.
  2. Генерация стандартных результатов: Выполняется поиск по запросу для получения стандартного набора результатов (SR).
  3. Анализ контекста: Context Information анализируется для извлечения контента (ключевых слов, фраз и т.д.). Если контекст – это URL, документ загружается или извлекается из кеша.
  4. Получение иерархии: Извлекается Hierarchy of Topics.
  5. Расчет Первичных Оценок (First Scores):
    • Контент контекста сопоставляется с темами и подтемами в иерархии.
    • Для каждой темы рассчитывается оценка релевантности, часто как Combined Score, учитывающий оценки подтем и, возможно, Weighting Factors.
  6. Выбор Темы и Валидация:
    • Идентифицируется тема с наивысшим First Score.
    • Проверяются пороги (Уверенность и Неоднозначность).
    • Если пороги не пройдены: перейти к шагу 10 (стандартная выдача).
    • Если пороги пройдены: Тема выбрана (T).
  7. Расчет Вторичных Оценок (Second Scores): Для каждого результата поиска (SR) рассчитывается мера его релевантности выбранной теме (T). Это может быть сделано в реальном времени или путем извлечения предварительно рассчитанных оценок из индекса.
  8. Выбор результатов: Результаты поиска выбираются на основе их Second Scores (например, Топ-L результатов или результаты с оценкой выше порога).
  9. Формирование выдачи: Генерируется финальный документ с отфильтрованными результатами. Порядок может основываться на Second Scores, стандартных оценках ранжирования или их комбинации.
  10. Предоставление результатов: Документ отправляется клиенту.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании контентных и структурных данных для классификации.

  • Контентные факторы: Ключевые слова, фразы, изображения, видео, извлеченные из Context Information. Также анализируется контент результатов поиска для определения их тематической релевантности.
  • Технические факторы: URL или адрес контекстного документа используется для его получения.
  • Структурные факторы (Системные): Hierarchy of Topics – предопределенная таксономия, используемая как эталон для классификации. Weighting Factors, присвоенные узлам этой иерархии.

Какие метрики используются и как они считаются

  • First Scores (и Combined Score): Мера релевантности контекста теме. Рассчитывается путем идентификации количества совпадающих терминов между контентом и темой/подтемами. Патент описывает возможность суммирования оценок по иерархии. Например, простое суммирование: S=T+S1+S2+S3S = T+S1+S2+S3S=T+S1+S2+S3 (где T - оценка темы, S1..S3 - оценки подтем). Или взвешенное суммирование (Weighted Score, WS): WS=W1∗T+W1.1∗S1+...WS = W1*T + W1.1*S1 + ...WS=W1∗T+W1.1∗S1+....
  • Second Scores: Мера релевантности результата поиска выбранной теме. Рассчитывается аналогично First Scores, но источником контента является результат поиска.
  • Пороги (Thresholds): Используются для валидации First Scores. Проверяется абсолютное значение оценки (Confidence) и ее отрыв от ближайшего конкурента (Ambiguity), чтобы избежать фильтрации при слабом или неоднозначном контексте.

Выводы

  1. Контекст может радикально менять выдачу: Патент описывает механизм, при котором текущий контекст пользователя (просматриваемый контент) может полностью переопределить поисковую выдачу, фильтруя ее по теме, даже если сам запрос является широким или неоднозначным.
  2. Зависимость от классификации контента: Эффективность системы напрямую зависит от качества Hierarchy of Topics и способности алгоритмов точно классифицировать контент (как контекст, так и результаты поиска) в рамках этой иерархии.
  3. Двухэтапная оценка релевантности: Система использует двухэтапный процесс: сначала определяется тема контекста (First Scores), а затем оценивается релевантность результатов этой теме (Second Scores). Это смещает фокус с прямой релевантности запросу на релевантность теме.
  4. Важность иерархической структуры (Topical Depth): Расчет Combined Score (Claim 9) показывает, что система учитывает не только основную тему, но и ее подтемы. Контент, который глубоко и иерархически охватывает тему, будет иметь более высокие оценки релевантности.
  5. Система предохранителей (Fail-safes): Патент включает критически важные механизмы защиты от ошибок (Claims 5, 6). Если система не уверена в теме контекста (оценки низкие или слишком близкие), она не применяет фильтрацию, чтобы не ухудшить пользовательский опыт.

Практика

Best practices (это мы делаем)

  • Усиление тематического авторитета (Topical Authority): Создавайте контент, который четко и однозначно соответствует определенным темам и подтемам. Система должна быть способна легко классифицировать вашу страницу в рамках своей Hierarchy of Topics.
  • Использование тематически релевантной терминологии: Насыщайте контент терминами и фразами, которые ассоциируются с конкретными узлами в тематической иерархии. Патент указывает (Claim 9), что классификация основана на сопоставлении терминов. Ориентируйтесь на терминологию, используемую в авторитетных, энциклопедических источниках.
  • Четкая структура и иерархия контента: Организуйте контент в иерархические кластеры. Механизм расчета Combined Score учитывает релевантность как основной теме, так и её подтемам. Хорошо структурированный контент помогает системе точнее определить его место в иерархии и повысить оценку.
  • Оптимизация под контекстные сценарии: Понимайте, в каком контексте пользователи могут искать информацию. Если пользователь находится на тематическом ресурсе и ищет связанную информацию, ваш контент должен строго соответствовать этой теме, чтобы пройти фильтрацию по Second Scores.

Worst practices (это делать не надо)

  • Создание смешанного или поверхностного контента: Контент, который пытается охватить слишком много разных тем без глубины, будет иметь низкие First Scores и Second Scores по конкретным темам, что затруднит его классификацию и ранжирование в контекстном поиске.
  • Игнорирование структуры контента: Сплошной текст без четкой иерархии и выделения подтем усложняет системе расчет Combined Score и точное определение тематической релевантности.
  • Фокус только на ключевых словах без учета темы: Оптимизация под конкретный запрос без учета более широкой тематической принадлежности страницы рискованна. Страница может быть отфильтрована, если контекст пользователя указывает на другую тему, даже если запрос совпадает.

Стратегическое значение

Этот патент подтверждает стратегическую важность понимания того, как Google классифицирует контент по темам для целей контекстного поиска и уточнения интента. Для SEO это означает необходимость перехода от оптимизации под изолированный "запрос" к оптимизации под "тему" (Topic). Долгосрочная стратегия должна фокусироваться на том, чтобы сайт стал авторитетным источником для конкретного узла (или кластера узлов) в тематической иерархии Google.

Практические примеры

Сценарий: Уточнение неоднозначного запроса "Ягуар"

  1. Контекст (Context Information): Пользователь читает статью на автомобильном портале о новом электрическом внедорожнике. URL этой статьи используется как контекст.
  2. Запрос (Query): Пользователь вводит запрос "Ягуар".
  3. Анализ контекста: Система анализирует статью и рассчитывает First Scores. Оценка для темы "Автомобили" значительно выше, чем для темы "Животные" или "Биология". Пороги уверенности пройдены.
  4. Выбор темы (Topic): Выбрана тема "Автомобили".
  5. Генерация результатов: Система получает стандартные результаты по запросу "Ягуар" (информация о животном, сайт автопроизводителя, новости).
  6. Фильтрация (Second Scores): Система рассчитывает Second Scores для этих результатов на предмет их релевантности теме "Автомобили". Статьи о животном получают низкие оценки.
  7. Результат: Пользователь видит выдачу, где доминируют результаты, связанные с автомобильным брендом Jaguar, отфильтровав нерелевантную информацию о животном.

Вопросы и ответы

Что используется в качестве контекстной информации (Context Information)?

Патент описывает несколько вариантов источника контекстной информации. Это может быть URL или адрес веб-страницы, которую пользователь просматривает в данный момент, документ, загруженный пользователем, или даже фрагмент текста (snippet), выделенный пользователем на странице. Система анализирует контент из этого источника для определения доминирующей темы.

Как система определяет релевантность контента теме (First Scores и Second Scores)?

Основной метод, описанный в патенте (Claim 9), заключается в подсчете количества терминов в контенте, которые соответствуют терминам, ассоциированным с темой и ее подтемами в Hierarchy of Topics. Затем эти подсчеты агрегируются в комбинированную оценку (Combined Score), часто с использованием весовых коэффициентов (Weighting Factors) для разных уровней иерархии.

Что такое Hierarchy of Topics и откуда она берется?

Это предопределенная таксономия, классифицирующая знания по иерархическим категориям (например, Искусство -> Музыка -> Жанры). Патент явно упоминает, что эти категории могут быть получены из внешних авторитетных источников, таких как The Open Directory Project (DMOZ) или Yahoo! Directory. Для SEO это подчеркивает важность ориентации на общепринятые классификации знаний и сущностей.

Что произойдет, если система не сможет однозначно определить тему контекста?

Патент предусматривает механизмы защиты (Claims 5 и 6). Если наивысшая оценка релевантности (First Score) не превышает порог уверенности, или если несколько тем имеют очень близкие оценки (нет явного лидера), система не активирует фильтрацию. В таких случаях пользователю будет показана стандартная поисковая выдача по его запросу.

Как SEO-специалисту оптимизировать контент с учетом этого патента?

Ключевая стратегия – это обеспечение четкой тематической фокусировки и глубины. Необходимо использовать терминологию, которая однозначно ассоциируется с целевой темой и ее подтемами. Структурирование контента в соответствии с иерархией темы поможет системе рассчитать более высокий Combined Score, что повысит шансы на ранжирование в контекстном поиске.

Влияет ли этот механизм на ранжирование, если пользователь ищет из "чистого" окна браузера без контекста?

Нет. Согласно патенту, этот механизм активируется только тогда, когда вместе с запросом поступает Context Information. Если контекста нет, система использует стандартные алгоритмы ранжирования, основанные на релевантности запросу, а не контекстной теме.

Может ли система предварительно классифицировать мой сайт по темам?

Да, патент упоминает возможность офлайн-обработки. Система может заранее анализировать документы в индексе, классифицировать их по темам и рассчитывать Second Scores (релевантность документа теме). Это позволяет ускорить процесс фильтрации в реальном времени, так как системе останется только извлечь нужные оценки из индекса.

Как используются весовые коэффициенты (Weighting Factors)?

Weighting Factors присваиваются темам в иерархии и могут основываться на популярности темы или объеме контента по ней. Они используются для корректировки First Scores при расчете Combined Score, позволяя системе придавать больший вес более значимым темам или уровням иерархии при определении контекста.

Что важнее для финального ранжирования: релевантность запросу или релевантность теме?

Когда механизм активирован, релевантность теме (Second Scores) становится определяющим фактором для фильтрации и выбора результатов. Однако патент также упоминает, что финальный порядок может учитывать как Second Scores, так и стандартные оценки ранжирования (релевантность запросу), или их комбинацию.

Влияет ли этот патент на работу с низкочастотными (long-tail) запросами?

Влияние на низкочастотные запросы, вероятно, будет меньше, так как они обычно менее неоднозначны и не требуют контекстного уточнения. Патент в первую очередь направлен на решение проблемы широких или многозначных запросов, где высока вероятность неверной интерпретации интента пользователя без дополнительного контекста.

Похожие патенты

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google анализирует контент на экране пользователя для генерации и рекомендации контекстных поисковых запросов
Google использует систему для анализа контента, который пользователь просматривает в данный момент (веб-страница, приложение). Система генерирует потенциальные поисковые запросы на основе этого контента, оценивает их качество (популярность, качество результатов, визуальное выделение терминов) и предлагает пользователю лучшие запросы для быстрого контекстного поиска без необходимости вручную вводить текст.
  • US10489459B1
  • 2019-11-26
  • Семантика и интент

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Как Google использует контент открытого документа пользователя для уточнения автодополнений (Autocomplete) поискового запроса
Google использует механизм для персонализации предложений автодополнения (Autocomplete) на основе контента документа, который пользователь просматривает или редактирует в данный момент. Система сравнивает семантику текущего документа пользователя с результатами поиска по потенциальным вариантам завершения запроса. Варианты, чьи результаты поиска наиболее похожи на контекст документа пользователя, повышаются в списке предложений.
  • US9135250B1
  • 2015-09-15
  • Семантика и интент

  • Персонализация

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей
Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.
  • US11379527B2
  • 2022-07-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов
Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.
  • US8682892B1
  • 2014-03-25
  • Ссылки

  • EEAT и качество

  • SERP

seohardcore