SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google принудительно добавляет в выдачу результаты с авторитетных сайтов, используя модифицированные запросы и сайт-ограниченный поиск

OBTAINING AUTHORITATIVE SEARCH RESULTS (Получение авторитетных результатов поиска)
  • US9659064B1
  • Google LLC
  • 2013-03-15
  • 2017-05-23
  • EEAT и качество
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для гарантированного включения результатов с авторитетных сайтов в поисковую выдачу. Если исходный запрос содержит ключевое слово, связанное с авторитетным источником, или если качество стандартной выдачи низкое, система выполняет дополнительный поиск. Этот поиск строго ограничен рамками авторитетного сайта и использует модифицированную (часто агрессивно расширенную) версию исходного запроса. Полученный результат затем внедряется в топ выдачи.

Описание

Какую проблему решает

Патент решает задачу улучшения качества поисковой выдачи в ситуациях, когда стандартные алгоритмы не возвращают достаточно качественных результатов или когда запрос пользователя подразумевает поиск информации на конкретном доверенном ресурсе. Цель — гарантировать присутствие в выдаче хотя бы одного результата с сайта, который система считает доверенным, точным и надежным (authoritative site) для данного запроса, снижая видимость низкокачественных сайтов (low-quality sites).

Что запатентовано

Запатентована система, которая выборочно добавляет в выдачу результаты с предварительно определенных авторитетных сайтов. Система поддерживает базу данных соответствий (mapping) между ключевыми словами и авторитетными сайтами. При срабатывании триггера система идентифицирует соответствующий авторитетный сайт и выполняет отдельный поиск, строго ограниченный этим сайтом (search limited to resources occurring on the first authoritative site), используя измененный второй запрос (second search query), чтобы найти наиболее подходящий контент на этом сайте.

Как это работает

Ключевой механизм работы:

  • Идентификация авторитета: Система использует Keyword-to-Authoritative Site Database для определения, какой сайт является авторитетным для запроса. Эта база строится на основе анализа поведения пользователей.
  • Триггеры: Механизм активируется, если (а) термины запроса указывают на авторитетный сайт (например, содержат его название или связанную тему) или (б) начальные результаты поиска имеют низкие оценки релевантности (IR scores).
  • Ограниченный поиск: Система выполняет второй поиск, используя, возможно, агрессивно измененный (расширенный) запрос, но ограничивает область поиска только идентифицированным авторитетным сайтом.
  • Агрессивное ранжирование: Найденный авторитетный результат (authoritative search result) добавляется к исходным результатам и ранжируется так, чтобы занять одну из верхних позиций.

Актуальность для SEO

Высокая. Концепции авторитетности (E-E-A-T) и Topical Authority являются центральными в современном поиске Google. Этот патент описывает конкретный и агрессивный механизм, позволяющий системе предпочесть авторитетный источник, даже если для поиска контента на нем требуется изменить и расширить исходный запрос пользователя. Это особенно актуально для YMYL-тематик и запросов, где важна точность и надежность информации.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO. Он описывает механизм, с помощью которого Google может принудительно вставить результат с определенного сайта в топ выдачи, если считает этот сайт авторитетным для запроса или темы. Это подчеркивает первостепенную важность построения авторитета сайта в своей нише. Если сайт признан авторитетным, этот механизм может обеспечить ему видимость даже по запросам, где стандартные сигналы релевантности страницы могут быть слабее, чем у конкурентов.

Детальный разбор

Термины и определения

Authoritative Site (Авторитетный сайт)
Сайт, который поисковая система определила как содержащий особо доверенный, точный или надежный контент. Авторитетность зависит от запроса (query-dependent). Система отличает их от low-quality sites.
Authoritative Search Result (Авторитетный результат поиска)
Результат поиска, который идентифицирует ресурс на сайте, являющемся авторитетным для данного запроса.
Confidence Score (Оценка уверенности)
Метрика, используемая в двух контекстах: (1) Уверенность в том, что ключевое слово в запросе относится к конкретному авторитетному сайту. (2) Уверенность в том, что заменяющий термин (substitute term) подходит для расширения запроса.
Demotion Factor (Фактор понижения / Демпфирующий фактор)
Коэффициент, используемый для корректировки IR score авторитетного результата. Он может понижать оценку, если второй запрос сильно отличается от первого или если уверенность в авторитетности сайта не максимальна.
IR Scores (Information Retrieval Scores / Оценки релевантности)
Оценки, генерируемые поисковой системой для ресурсов. Используются для ранжирования и для оценки общего качества выдачи.
Keyword-to-Authoritative Site Database (База данных соответствия ключевых слов авторитетным сайтам)
Хранилище, содержащее соответствия (mapping) между ключевыми словами и авторитетными сайтами.
Level of aggressiveness (Уровень агрессивности)
Параметр для Query Reviser Engine. Более высокий уровень позволяет использовать заменяющие термины с более низкими Confidence Scores, что расширяет область поиска.
Query Reviser Engine (Механизм переписывания запросов)
Компонент системы, генерирующий измененные запросы путем добавления или замены терминов.
Site Name Keyword (Ключевое слово – название сайта)
Ключевое слово, соответствующее названию авторитетного сайта или бренда (например, "cdc").
Site-Restricted Search (Поиск, ограниченный сайтом)
Поисковая операция, ограниченная ресурсами, находящимися на конкретном идентифицированном сайте (Claim 1).
Topic Keyword (Тематическое ключевое слово)
Ключевое слово, представляющее тему или категорию (например, "insurance").

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной защищенный метод.

  1. Система поддерживает соответствие (mapping) ключевых слов и авторитетных сайтов.
  2. Получается первый запрос (Q1) и первые результаты (R1).
  3. После получения R1 система определяет, что (а) необходимо получить результат с авторитетного сайта и (б) идентифицирует конкретный авторитетный сайт (Site A) для этого запроса.
  4. В ответ на это определение система выполняет второй поиск, ограниченный ресурсами на Сайте A (second search limited to resources occurring on the first authoritative site).
  5. Этот второй поиск использует второй запрос (Q2), отличный от первого (second search query different from the first search query).
  6. В результате получается авторитетный результат поиска (AR).
  7. Генерируется общее ранжирование, включающее R1 и AR, которое предоставляется пользователю.

Ядром изобретения является выполнение дополнительного, сайт-ограниченного поиска по модифицированному запросу для гарантированного извлечения контента с предварительно идентифицированного авторитетного источника.

Claim 4 (Зависимый): Уточняет Триггер 1 – Низкое качество выдачи.

Определение необходимости основано на анализе оценок релевантности (IR scores) первых результатов. Если количество результатов, чьи IR scores превышают пороговое значение, меньше определенного числа, система активирует механизм для улучшения выдачи.

Claim 15 и 16 (Зависимые): Уточняют Триггер 2 – Совпадение по ключевому слову.

Определение основано на том, что термин из первого запроса (Claim 15), и в частности, первый термин запроса (Claim 16), присутствует в базе данных соответствий (mapping) и связан с конкретным авторитетным сайтом.

Claim 5 и 6 (Зависимые): Уточняют механизм генерации второго запроса (Q2) – Агрессивное переписывание.

Второй запрос генерируется путем добавления к первому запросу дополнительных заменяющих терминов (additional substitute terms). Эти термины могут иметь более низкие confidence scores, чем те, что использовались изначально. Это позволяет расширить область поиска на авторитетном сайте.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя предварительно рассчитанные данные об авторитетности и влияя на финальное формирование выдачи.

INDEXING – Индексирование и извлечение признаков
На этом этапе система собирает базовые данные, позволяющие определить авторитетность сайтов и отличать их от low-quality sites.

QUNDERSTANDING – Понимание Запросов
Офлайн: Система заранее анализирует поведение пользователей (предыдущие выборы результатов, уточнения запросов) для генерации и обновления Keyword-to-Authoritative Site Database (см. Пошаговый алгоритм, Процесс Б).
Онлайн: Во время обработки запроса система проверяет термины на совпадение с базой данных (Триггер 2). Также Query Reviser Engine используется для генерации второго запроса с повышенным уровнем агрессивности.

RANKING – Ранжирование
На этом этапе генерируется первый набор результатов (R1) для исходного запроса и рассчитываются их IR scores.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента происходит здесь:

  1. Оценка SERP и Триггер: Система анализирует IR scores R1 (Триггер 1) или сам запрос (Триггер 2).
  2. Идентификация сайта: Определяется авторитетный сайт на основе Keyword-to-Authoritative Site Database.
  3. Вторичный поиск (Метапоиск): Выполняется отдельный Site-Restricted Search, ограниченный авторитетным сайтом, с использованием второго (модифицированного) запроса.
  4. Смешивание и Переранжирование: Авторитетный результат оценивается (возможно, с применением Demotion Factor) и смешивается с первым набором результатов. Происходит финальная сортировка.

Входные данные:

  • Исходный запрос пользователя (Q1).
  • Первый набор результатов (R1) и их IR scores.
  • Keyword-to-Authoritative Site Database (включая Confidence Scores для сайтов).
  • База данных заменяющих терминов и их Confidence Scores.

Выходные данные:

  • Объединенный и переранжированный набор результатов, включающий авторитетный результат.

На что влияет

  • Специфические запросы: Наибольшее влияние на навигационные или полунавигационные запросы, где пользователь указывает название авторитетного источника вместе с темой (например, "cdc prevent mosquito bites"). Также влияет на информационные запросы, где качество исходной выдачи низкое.
  • Конкретные ниши или тематики: Сильное влияние в YMYL-нишах (здоровье, финансы, право), где система имеет четко определенные авторитетные источники (например, правительственные сайты, крупные медицинские порталы).

Когда применяется

Алгоритм применяется при выполнении одного из следующих условий (триггеров):

  • Триггер 1 (Низкое качество выдачи): Когда оценки релевантности (IR scores) топовых результатов низкие. Конкретно: когда меньше порогового числа результатов удовлетворяют минимальному порогу IR score (Claim 4).
  • Триггер 2 (Совпадение по ключевому слову): Когда термин в запросе (особенно первый термин) совпадает с ключевым словом (Site Name Keyword или Topic Keyword) в Keyword-to-Authoritative Site Database (Claim 15, 16).

Пошаговый алгоритм

Процесс А: Обработка запроса в реальном времени

  1. Получение запроса и первичный поиск: Система получает первый запрос (Q1) и генерирует первый набор результатов (R1) и их IR scores.
  2. Принятие решения и Идентификация сайта: Система проверяет Триггер 1 (низкие IR scores R1) и Триггер 2 (совпадение ключевых слов в Q1). Если один из триггеров сработал, идентифицируется авторитетный сайт (S1).
  3. Генерация второго запроса (Q2): Система генерирует второй запрос. Это включает агрессивное переписывание Q1 с использованием заменяющих терминов с более низкими Confidence Scores для расширения охвата.
  4. Выполнение ограниченного поиска: Система выполняет Site-Restricted Search, используя Q2, ограничивая его только ресурсами сайта S1.
  5. Получение авторитетного результата (AR): Система выбирает лучший авторитетный результат.
  6. Расчет оценки и масштабирование: Система рассчитывает оценку для AR. Это может быть IR score по Q2, скорректированный с помощью Demotion Factor. Фактор зависит от схожести Q1 и Q2 и/или от Confidence Score сайта S1.
  7. Генерация общего ранжирования: Система генерирует ранжирование R1 и AR. AR может быть принудительно размещен на высокой позиции или ранжирован на основе его скорректированной оценки.
  8. Предоставление результатов: Система предоставляет объединенное ранжирование пользователю.

Процесс Б: Офлайн-генерация базы авторитетных сайтов

  1. Анализ поведения пользователей: Система анализирует предыдущие выборы пользователей (user selections of search results).
  2. Идентификация связей (Topic Keywords): Если запросы с определенным тематическим ключевым словом часто приводят к навигации на конкретный сайт, система создает соответствие между ключевым словом и сайтом.
  3. Анализ уточнений запросов (Query Refinements): Если пользователи часто уточняют запрос (Query A -> Query B) и затем переходят на определенный сайт, система может связать ключевые слова из Query A с этим сайтом.
  4. Расчет Confidence Score: На основе частоты наблюдений система рассчитывает или корректирует Confidence Score для соответствия между ключевым словом и сайтом.
  5. Сохранение данных: Соответствия и оценки сохраняются в Keyword-to-Authoritative Site Database.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных об авторитетности сайтов и поведении пользователей для корректировки ранжирования.

  • Поведенческие факторы (Используются офлайн): Данные о предыдущих выборах пользователей (user selections of search results) и история уточнений запросов (user query refinements). Эти данные являются основой для генерации Keyword-to-Authoritative Site Database и расчета Confidence Scores (Процесс Б).
  • Системные данные (Факторы Авторитетности): Keyword-to-Authoritative Site Database, содержащая соответствия между ключевыми словами (темами или названиями сайтов) и авторитетными сайтами.
  • Системные данные (Ранжирование): IR Scores (оценки релевантности), полученные для исходного и второго запросов.
  • Контентные/Запросные факторы: Термины исходного запроса и их порядок (особенно первый термин) используются как триггер (Триггер 2).

Какие метрики используются и как они считаются

  • Confidence Score (для сайтов): Метрика, отражающая степень уверенности в авторитетности сайта для данного ключевого слова. Рассчитывается офлайн на основе анализа поведения пользователей.
  • Confidence Score (для заменяющих терминов): Метрика, используемая Query Reviser Engine. Патент предлагает снижать порог этой метрики (повышать aggressiveness) при генерации второго запроса.
  • IR Score Threshold (Порог оценки релевантности): Пороговое значение IR score, используемое для оценки качества исходной выдачи.
  • Threshold Number (Пороговое число): Минимальное количество результатов в топе, которые должны удовлетворять IR Score Threshold. Если это условие не выполняется, активируется Триггер 1.
  • Similarity Score (Оценка схожести запросов): Метрика схожести между Q1 и Q2. Может основываться на количестве удаленных/замененных терминов и их Confidence Scores.
  • Demotion Factor (Демпфирующий фактор): Коэффициент, используемый для понижения IR score авторитетного результата. Рассчитывается на основе Similarity Score (ниже схожесть — выше демпфирование) или Confidence Score сайта (ниже уверенность — выше демпфирование).

Выводы

  1. Авторитетность сайта как триггер для изменения логики поиска: Статус Authoritative Site — это не просто фактор ранжирования. Это основание для запуска альтернативного процесса поиска (Site-Restricted Search с измененным запросом), минуя стандартное ранжирование в общем индексе.
  2. Авторитет строится на основе поведения пользователей: База данных авторитетных сайтов (Keyword-to-Authoritative Site Database) формируется офлайн путем анализа того, на какие сайты пользователи переходят после определенных запросов и как они уточняют свои запросы. Это подтверждает важность удовлетворения интента пользователя и построения бренда для формирования авторитета.
  3. Два пути активации: Механизм может активироваться как реактивно (Триггер 1: в ответ на низкие IR scores выдачи), так и проактивно (Триггер 2: если запрос содержит явное указание на авторитетный источник).
  4. Ограничение поиска по сайту (Site-Restricted Search): Ключевым механизмом является выполнение отдельного поиска, ограниченного только авторитетным сайтом. Это гарантирует, что добавленный результат будет именно с этого источника.
  5. Готовность агрессивно изменять запрос: Для поиска релевантного контента на авторитетном сайте система применяет агрессивное переписывание запроса (используя менее надежные синонимы с низким Confidence Score). Это означает, что авторитет может компенсировать недостаток прямой текстовой релевантности.
  6. Принудительное включение в топ: Цель механизма — не просто найти авторитетный результат, но и обеспечить его высокую позицию в выдаче, вплоть до принудительного размещения на первом месте или применения масштабирующих факторов к его оценке.

Практика

Best practices (это мы делаем)

  • Построение Topical Authority и E-E-A-T: Ключевая долгосрочная цель — добиться того, чтобы ваш сайт был включен в Keyword-to-Authoritative Site Database как авторитетный источник для вашей целевой тематики (Topic Keywords). Это требует последовательного создания высококачественного, экспертного контента, покрывающего кластер тем.
  • Фокус на Удовлетворенности Пользователей (User Satisfaction): Поскольку база данных авторитетов строится на основе анализа кликов и рефайментов (см. Процесс Б), необходимо гарантировать, что ваш контент максимально полно отвечает на запросы пользователей. Успешное завершение поисковой сессии повышает вероятность признания сайта авторитетным.
  • Усиление Узнаваемости Бренда и Навигационного Спроса: Стимулируйте брендовый трафик и ассоциацию бренда с тематикой. Если пользователи включают название вашего бренда в запросы (Site Name Keyword), это является сильным триггером (Триггер 2) для активации сайт-ограниченного поиска на вашем ресурсе.
  • Широкий Семантический Охват Контента: Поскольку система может использовать агрессивно расширенный запрос (Q2) для поиска на вашем сайте, контент должен быть семантически богатым и охватывать смежные понятия. Это увеличивает шансы найти релевантный результат даже при измененном запросе.
  • Оптимизация информационной архитектуры и навигации: Так как Google выполняет ограниченный поиск по вашему сайту (Site-Restricted Search), критически важно, чтобы контент был легко обнаруживаем. Хорошая структура и перелинковка помогают системе найти лучшую страницу во время этого ограниченного поиска.

Worst practices (это делать не надо)

  • Фокус только на узких запросах без широкого контекста: Если сайт оптимизирован только под очень специфические запросы и не имеет широкого охвата темы, система может не найти подходящего контента на нем при использовании расширенного запроса (Q2), даже если признает сайт авторитетным.
  • Игнорирование Поведенческих Сигналов: Создание контента, который не удовлетворяет интент пользователя (приводит к возврату в выдачу и рефайнментам), будет препятствовать признанию сайта авторитетным в Keyword-to-Authoritative Site Database.
  • Поверхностный контент и спам: Патент явно направлен на замену результатов с low-quality sites. Их присутствие в топе может активировать Триггер 1 (низкое качество выдачи) и привести к их вытеснению авторитетными источниками.
  • Слабая информационная архитектура: Если система не сможет найти релевантный контент на вашем сайте во время ограниченного поиска из-за запутанной структуры, механизм не сработает в вашу пользу.

Стратегическое значение

Этот патент подтверждает стратегию Google по приоритизации авторитетных источников. Он демонстрирует, что авторитетность сайта в теме — это не просто один из факторов ранжирования, а основание для применения совершенно иного алгоритма поиска (ограниченного поиска по сайту с измененным запросом). Для SEO это означает, что инвестиции в построение Topical Authority, E-E-A-T и сильного бренда являются долгосрочной стратегией, позволяющей получать трафик за счет механизмов принудительного ранжирования, функционирующих как "быстрый проход" на вершину SERP.

Практические примеры

Сценарий 1: Низкое качество выдачи (Триггер 1, YMYL)

  1. Исходный запрос (Q1): "симптомы низкого холестерина".
  2. Исходная выдача (R1): Топ-5 занимают сайты с низкими IR scores (например, форумы, блоги без медицинской экспертизы). Триггер 1 активирован.
  3. Идентификация: Система проверяет Keyword-to-Authoritative Site Database и определяет, что для темы "холестерин" (Topic Keyword) авторитетным сайтом (S1) является WebMD.com.
  4. Второй запрос (Q2): Система генерирует более широкий запрос, используя агрессивное переписывание: "проблемы холестерин здоровье".
  5. Ограниченный поиск: Система выполняет Site-Restricted Search по WebMD.com, используя Q2.
  6. Результат: Находится релевантная статья на WebMD. Система вставляет её на позицию №1 в выдаче по Q1.

Сценарий 2: Полунавигационный запрос (Триггер 2)

  1. Исходный запрос (Q1): "amazon prime отмена подписки".
  2. Активация: Система обнаруживает термин "amazon" в начале запроса (Claim 16). Keyword-to-Authoritative Site Database подтверждает, что Amazon.com является авторитетным сайтом для этого Site Name Keyword. Триггер 2 активирован.
  3. Второй запрос (Q2): Система может использовать исходный запрос или слегка измененный (например, "отмена prime").
  4. Ограниченный поиск: Система выполняет Site-Restricted Search, ограниченный только сайтом Amazon.com.
  5. Результат: Система находит официальную страницу отмены подписки на Amazon.com и гарантирует её ранжирование на первой позиции.

Вопросы и ответы

Как Google определяет, какой сайт является авторитетным для конкретной темы?

Согласно патенту, система поддерживает базу данных Keyword-to-Authoritative Site Database. Эта база формируется офлайн путем анализа поведения пользователей. Если пользователи часто переходят на определенный сайт после запросов, содержащих ключевое слово (тему), или после их уточнений (query refinements), система создает связь между этим ключевым словом и сайтом, присваивая ему Confidence Score.

Что такое "второй запрос" (Q2) и зачем он нужен, если уже есть исходный запрос (Q1)?

Второй запрос используется для поиска контента исключительно на идентифицированном авторитетном сайте. Он может отличаться от исходного. Система может использовать агрессивное переписывание (добавляя синонимы с низким Confidence Score), чтобы сделать запрос шире. Это нужно, если на авторитетном сайте нет контента, идеально оптимизированного под исходный узкий запрос, но есть более общая релевантная информация.

В каких случаях активируется этот механизм добавления авторитетных результатов?

Патент описывает два основных триггера. Первый (Триггер 1) — низкое качество исходной выдачи, когда оценки релевантности (IR scores) топовых результатов не достигают определенного порога. Второй (Триггер 2) — наличие в запросе (особенно в начале) термина, который система распознает как указание на авторитетный сайт (например, название бренда или ключевая тема).

Означает ли это, что Google буквально выполняет поиск с оператором "site:"?

Да, механизм, описанный в патенте (Claim 1: performing [...] a second search limited to resources occurring on the first authoritative site), функционально эквивалентен поиску с оператором site:. Система изолирует поиск в рамках одного конкретного домена, используя при этом потенциально переписанный запрос (Q2).

Что такое "агрессивное переписывание запроса" (aggressive query revision)?

Это процесс изменения запроса, при котором система использует заменяющие термины (синонимы), имеющие более низкие Confidence Scores, чем обычно допускается. Это расширяет область поиска (делает запрос шире), увеличивая шансы найти хоть какой-то релевантный контент на авторитетном сайте.

Может ли этот механизм помочь моему авторитетному сайту ранжироваться по запросам, под которые он не оптимизирован?

Да, это одно из ключевых преимуществ. Если ваш сайт признан авторитетным для темы, и в выдаче по связанному запросу наблюдается низкое качество (Триггер 1), система может агрессивно расширить запрос и найти вашу страницу через Site-Restricted Search, даже если она слабо оптимизирована под исходную формулировку пользователя.

Как SEO-специалисту использовать знание этого патента для продвижения сайта?

Ключевая стратегия — добиться признания сайта авторитетным источником в своей нише (Topical Authority). Это требует комплексной работы над E-E-A-T, полного охвата темы и, что критически важно согласно этому патенту, удовлетворения интента пользователей (так как это основа для построения базы авторитетов). Также важно иметь контент, отвечающий на широкие запросы.

Какое значение этот патент имеет для оптимизации внутреннего поиска и структуры сайта?

Это имеет прямое значение. Поскольку Google выполняет поиск, ограниченный вашим доменом (Site-Restricted Search), эффективность этого поиска зависит от того, насколько хорошо ваш контент находится по различным формулировкам. Хорошая информационная архитектура, четкая структура контента и эффективная внутренняя перелинковка помогают системе найти лучшую страницу на вашем сайте.

Что такое демпфирующий фактор (Demotion Factor) и как он рассчитывается?

Это коэффициент, понижающий оценку авторитетного результата. Он нужен, чтобы сбалансировать ранжирование, если второй запрос (Q2) сильно отличается от исходного (Q1). Патент предлагает рассчитывать его на основе схожести (Similarity Score) между Q1 и Q2 (чем меньше схожесть, тем больше понижение) или на основе Confidence Score авторитетного сайта.

Как этот патент связан с концепцией E-E-A-T?

Патент напрямую реализует принципы E-E-A-T на алгоритмическом уровне. Он дает определение авторитетного сайта как содержащего доверенный, точный или надежный контент. Механизм, описанный в патенте, является инструментом для приоритизации таких сайтов в выдаче, особенно когда стандартные сигналы релевантности не обеспечивают достаточного качества.

Похожие патенты

Как Google подмешивает результаты из альтернативных запросов, чтобы вытеснить низкокачественные сайты из топа выдачи
Google использует механизм улучшения качества поисковой выдачи. Если по исходному запросу в топе ранжируется слишком много низкокачественных сайтов, система находит связанный альтернативный запрос, который возвращает высококачественные результаты. Затем эти результаты агрессивно повышаются в ранжировании и подмешиваются в исходную выдачу, чтобы гарантировать пользователю доступ к качественному контенту.
  • US9135307B1
  • 2015-09-15
  • SERP

  • EEAT и качество

Как Google автоматически уточняет запросы, используя характеристики топовых результатов из общей выдачи
Google использует механизм для улучшения качества результатов при использовании фильтров или поиске в специализированных коллекциях (например, по дате или типу документа). Система анализирует, какие характеристики объединяют лучшие результаты в общей (неограниченной) выдаче по этому запросу. Затем эти характеристики автоматически добавляются как скрытые ограничения к исходному запросу пользователя, чтобы гарантировать, что отфильтрованные результаты соответствуют шаблону качества общей выдачи.
  • US8819000B1
  • 2014-08-26
  • SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует авторитетные сайты в органической выдаче для активации и позиционирования блоков с ответами (Answer Boxes)
Google определяет, когда показывать блок с ответом (Answer Box) или вертикальную интеграцию (погода, акции и т.д.), анализируя не только текст запроса, но и состав органической выдачи. Если в результатах присутствуют специфические авторитетные URL или ключевые слова (называемые «индикаторами блока ответов»), система с большей вероятностью покажет соответствующий блок. Эти индикаторы определяются заранее путем анализа того, какие сайты часто появляются по ключевым «исходным запросам» для данной темы.
  • US9607087B1
  • 2017-03-28
  • SERP

  • Семантика и интент

Как Google определяет интент и позицию вертикальных результатов (например, картинок) для длиннохвостых (long-tail) запросов
Google использует механизм для определения интента пользователя по редким или новым (long-tail) запросам, когда исторические данные отсутствуют. Система эффективно "прощупывает" вертикальные индексы (например, картинки), чтобы решить, стоит ли проводить полный поиск. Для определения позиции блока с результатами используется "предполагаемый интент", унаследованный от характеристик найденных веб-страниц и сайтов, а не от истории самого запроса.
  • US9183312B2
  • 2015-11-10
  • Семантика и интент

  • SERP

  • Индексация

Популярные патенты

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)
Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.
  • US20250005303A1
  • 2025-01-02
  • SERP

  • EEAT и качество

  • Персонализация

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей
Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.
  • US11379527B2
  • 2022-07-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

seohardcore