Как Google извлекает, формирует и оценивает контент для Featured Snippets из структурированных и неструктурированных данных

CANDIDATE ANSWER PASSAGES (Кандидатные ответные пассажи)

US10180964B1
Google LLC
2015-08-12
2019-01-15

Google использует систему для генерации Featured Snippets (ответных пассажей) в ответ на запросы-вопросы. Система анализирует топовые результаты, разделяя контент на структурированный (таблицы, списки) и неструктурированный (текст). Применяя разные наборы правил для каждого типа контента, система извлекает блоки текста (Passage Units) и формирует из них кандидатов для показа в блоке ответов, после чего оценивает их с помощью комплексного скоринга.

Какую проблему решает

Патент решает задачу предоставления пользователям прямых, развернутых ответов (Answer Passages, известных как Featured Snippets) непосредственно на странице результатов поиска в ответ на запросы-вопросы (Question Queries). Основная цель — улучшить качество и формат этих ответов за счет способности системы корректно извлекать и комбинировать как неструктурированный контент (обычный текст), так и структурированный контент (списки, таблицы), что позволяет давать более полные и лучше отформатированные ответы.

Что запатентовано

Запатентована система и метод для генерации кандидатных ответных пассажей из ресурсов, входящих в топ выдачи. Ключевым элементом изобретения является применение различных наборов критериев выбора (Passage Unit Selection Criteria) для обработки структурированного и неструктурированного контента. Это позволяет системе применять специфическую логику для извлечения текста, списков и таблиц, обеспечивая корректное формирование итогового сниппета.

Как это работает

Система работает следующим образом:

Идентификация запроса: Определяется, что входящий запрос является вопросом (Question Query).
Анализ ресурсов: Анализируется контент топовых ранжируемых ресурсов (Top-N).
Идентификация блоков: Контент разделяется на блоки (Passage Units) — предложения, заголовки, элементы списка, ячейки таблиц.
Применение критериев извлечения: Система применяет правила для формирования кандидата. Используются разные правила для текста (например, проверка на полные предложения, видимость) и для структурированных данных (например, инкрементальная генерация списка, обработка пар ключ-значение).
Скоринг: Сформированные кандидаты оцениваются Answer Passage Scorer с использованием сигналов, зависящих от запроса (Query Dependent) и не зависящих от запроса (Query Independent).
Выбор: Выбирается кандидат с наивысшей оценкой для показа в качестве Featured Snippet.

Актуальность для SEO

Высокая. Featured Snippets являются доминирующим элементом современной поисковой выдачи Google. Описанные в патенте механизмы, особенно касающиеся извлечения и форматирования списков и таблиц, напрямую соответствуют тому, как Google генерирует эти блоки ответов сегодня. Понимание этих правил критически важно для SEO в 2025 году.

Важность для SEO

Патент имеет критическое значение для SEO (95/100). Он детально описывает технические механизмы, лежащие в основе генерации и выбора Featured Snippets. Понимание специфических правил извлечения контента (особенно для списков и таблиц) и факторов скоринга дает конкретные рычаги для оптимизации контента с целью занятия "нулевой позиции" в выдаче.

Термины и определения

Answer Passage (Ответный пассаж): Развернутый ответ на запрос-вопрос, предоставляемый отдельно от стандартных результатов поиска (Featured Snippet).
Answer Passage Generator (Генератор ответных пассажей): Компонент системы, отвечающий за извлечение контента из ресурсов и формирование кандидатных пассажей.
Answer Passage Scorer (Оценщик ответных пассажей): Компонент системы, оценивающий качество и релевантность кандидатных пассажей.
Answer Term Match Score (Оценка совпадения терминов ответа): Часть Query Dependent Score. Метрика, оценивающая сходство пассажа с набором "вероятных терминов ответа", извлеченных из всех топовых ресурсов.
Enumerating Reference (Перечисляющая ссылка): Термин или фраза в тексте, которая указывает на последующий список или таблицу (например, "следующие шаги:", "в этой таблице:").
Passage Unit (Блок пассажа): Единица контента из ресурса, которая может быть включена в ответный пассаж (например, предложение, заголовок, элемент списка, ячейка таблицы).
Passage Unit Selection Criteria (Критерии выбора блоков пассажа): Набор правил, определяющих условия включения Passage Unit в кандидатный пассаж. Существуют разные наборы правил для структурированного и неструктурированного контента.
Query Dependent Score (Оценка, зависящая от запроса): Оценка релевантности пассажа запросу, основанная на совпадении терминов запроса и терминов ответа.
Query Independent Score (Оценка, не зависящая от запроса): Оценка качества пассажа на основе его характеристик (языковая модель, позиция на странице, форматирование) и характеристик источника, без учета терминов запроса.
Question Query (Запрос-вопрос): Запрос пользователя, сформулированный как вопрос (явно или неявно) и ищущий конкретный ответ.
Structured Content (Структурированный контент): Контент, организованный для визуализации отношений между атрибутами данных (например, списки, таблицы).
Unstructured Content (Неструктурированный контент): Контент в форме текстовых пассажей (например, статьи, параграфы), не организованный по строгой визуальной структуре атрибутов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый процесс генерации ответных пассажей.

Система получает запрос-вопрос и список ранжированных ресурсов.
Для каждого ресурса в топе идентифицируются блоки контента (Passage Units).
К этим блокам применяется набор критериев выбора (Passage Unit Selection Criteria). Ключевое утверждение: первый поднабор критериев применяется к структурированному контенту, второй — к неструктурированному.
Из блоков, удовлетворяющих критериям, генерируется набор кандидатных ответных пассажей.

Claim 3 (Зависимый): Детализирует правила для неструктурированного текста, предшествующего структурированному контенту (например, вводное предложение перед списком).

Если предложение, непосредственно предшествующее структурированному контенту, содержит Enumerating Reference (например, "следующие шаги:"), то в пассаж включается только это одно предложение. Если Enumerating Reference отсутствует, то в пассаж включаются два или более предшествующих предложений.

Claim 4 и 9 (Зависимые): Описывают механизм инкрементальной генерации списка (Incremental list generation) для структурированного контента (списков, таблиц).

Блоки из структурированного контента выбираются итеративно таким образом, что один блок из каждого реляционного атрибута (например, из каждого пункта списка или строки таблицы) выбирается до того, как будет выбран второй блок из любого атрибута. Процесс продолжается до выполнения условия остановки (например, достижения максимального размера пассажа). Это гарантирует, что система пытается собрать полный список первых предложений из каждого пункта, прежде чем брать вторые предложения (сборка "в ширину").

Claim 7 и 10 (Зависимые): Описывают обработку запросов с суперлативами (превосходной степенью).

Если запрос ищет суперлативы по определенному атрибуту (например, "самые длинные мосты"), система выбирает из структурированного контента подмножество блоков в порядке убывания их ранга согласно этому атрибуту.

Claim 8 (Зависимый): Описывает обработку запросов об атрибутах сущности.

Если запрос ищет атрибут конкретной сущности (например, "стоимость багажа Airline X"), система выбирает блок, содержащий значение этого атрибута для данной сущности.

Claim 11 (Зависимый): Описывает обработку пар ключ-значение.

Если структурированный контент содержит пары ключ-значение, система выбирает полные пары для включения в пассаж.

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса для формирования блока Featured Snippet.

QUNDERSTANDING – Понимание Запросов
На этом этапе система должна определить, что запрос является Question Query, что служит триггером для активации описанного механизма. Также определяется тип вопроса (например, суперлативный), что влияет на логику извлечения.

RANKING – Ранжирование
Этот этап предоставляет входные данные для системы: набор топовых ранжируемых ресурсов (Top-N), из которых будут извлекаться ответы.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента. Answer Passage Generator анализирует контент из Top-N ресурсов, применяет Selection Criteria и генерирует кандидатов. Затем Answer Passage Scorer оценивает их. Лучший результат внедряется в выдачу как отдельный блок (Featured Snippet).

Входные данные:

Запрос-вопрос (Question Query).
Top-N ранжированных ресурсов.
Наборы критериев выбора (Passage Unit Selection Criteria).
Данные для скоринга (языковые модели, исторические данные ответов).

Выходные данные:

Набор кандидатных ответных пассажей с присвоенными оценками (Answer Scores).
Выбранный Featured Snippet для показа пользователю.

На что влияет

Типы контента: Влияет на все типы контента, которые могут содержать ответы. Особенно критично для статей, инструкций (How-to), списков и сравнительных таблиц.
Специфические запросы: Наибольшее влияние на информационные запросы, где пользователи ищут определения, объяснения процессов, списки шагов или сравнения.
Форматы контента: Повышает значимость корректно отформатированных списков (<ol>, <ul>) и таблиц (<table>).

Когда применяется

Триггер активации: Когда система классифицирует запрос как Question Query, ищущий ответ.
Условия применения: Алгоритм анализирует только ресурсы из топового подмножества (Top-N) результатов поиска.

Пошаговый алгоритм

Этап 1: Генерация кандидатов (Answer Passage Generator)

Получение данных: Получение Question Query и Top-N ресурсов.
Идентификация блоков: В каждом ресурсе определяются Passage Units (предложения, заголовки, элементы списков, ячейки таблиц).
Итеративное формирование кандидата: Для формирования конкретного кандидата:
1. Выбор блока: Выбирается начальный Passage Unit.
2. Применение критериев неструктурированного контента: Проверяется, соответствует ли блок критериям для текста (например, является ли полным предложением, видимость контента, отсутствие boilerplate, не является ли подписью к изображению). Если ОК, блок включается.
3. Применение критериев структурированного контента: Если блок является частью списка или таблицы, применяются специфические правила:
  - Инкрементальная генерация: Соблюдается порядок выбора (сначала первые элементы из всех пунктов, затем вторые).
  - Обработка инструкций: Если обнаружены маркеры шагов ("первый", "второй"), система пытается включить все шаги.
  - Обработка суперлативов/атрибутов: Выборка данных согласно запросу (топ по рангу или конкретный атрибут сущности).
4. Применение критериев комбинирования: При переходе от текста к структуре проверяется наличие Enumerating Reference в последнем текстовом блоке для определения количества включаемого текста. Также может быть правило, запрещающее добавление текста после структуры.
5. Проверка условий остановки: Проверяется, достигнут ли максимальный размер пассажа или закончился ли релевантный контент.
Сохранение кандидата: Сформированный кандидат передается на оценку.

Этап 2: Скоринг кандидатов (Answer Passage Scorer)

Расчет Query Dependent Score:
1. Query Term Match Score: Оценка совпадения терминов запроса с пассажем.
2. Answer Term Match Score: Оценка совпадения пассажа с "вероятными терминами ответа" (генерируется путем анализа и взвешивания терминов из всех Top-N ресурсов).
Расчет Query Independent Score: Оценка на основе позиционных, языковых, структурных факторов и качества источника (детали в разделе 4.2).
Комбинирование оценок: Генерация итогового Answer Score.
Выбор: Выбор кандидата с наивысшей оценкой.

Какие данные и как использует

Данные на входе

Контентные и Структурные факторы: Система анализирует текст, заголовки и HTML-структуру ресурса для идентификации параграфов (<p>), списков (<ul>, <ol>, <li>) и таблиц (<table>, <tr>, <td>). Это критически важно для разделения контента на структурированный и неструктурированный.
Технические факторы: Учитывается видимость контента. Контент, скрытый от пользователя (например, через CSS/JS), исключается из рассмотрения.
Системные данные: Используется исходное ранжирование ресурсов для определения Top-N и для учета ранга ресурса при скоринге пассажа.

Какие метрики используются и как они считаются

Система использует два основных типа оценок: Query Dependent Score и Query Independent Score.

Query Dependent Score (Зависящая от запроса)

Query Term Match Score: Метрика сходства терминов запроса с терминами пассажа (например, на основе количества совпадений, возможно с весами TF-IDF).
Answer Term Match Score: Метрика сходства пассажа с "идеальным ответом". Рассчитывается следующим образом:
1. Генерируется список всех терминов из Top-N ресурсов.
2. Для каждого термина рассчитывается вес (например, на основе количества ресурсов, где он встретился, умноженного на IDF термина). Это формирует вектор "вероятных терминов ответа".
3. Каждый кандидатный пассаж сравнивается с этим вектором (путем умножения веса термина на частоту его встречаемости в пассаже и суммирования).
4. Дополнительно может проверяться тип сущности ответа (например, если запрос "кто", ищется сущность типа "человек"). Отсутствие нужного типа снижает оценку.

Query Independent Score (Не зависящая от запроса)

Passage Unit Position Score: Оценка позиции контента на странице. Чем выше контент, тем выше оценка.
Language Model Score: Оценка соответствия пассажа языковой модели. Проверяет грамматическую корректность (полные предложения). Также проверяет, насколько текст похож на исторические ответные пассажи в целом (например, используя N-грамм модели). Структурированный контент может быть исключением из этих правил.
Section Boundary Score: Штраф, если пассаж пересекает границы форматирования (например, параграфы или разрывы разделов).
Interrogative Score: Штраф, если пассаж содержит вопросительные термины или сам является вопросом.
Discourse Boundary Term Position Score: Штраф, если пассаж начинается с дискурсивного маркера (например, "однако", "с другой стороны", "наоборот").
Resource Scores: Оценки источника, из которого взят пассаж. Включают Ranking Score ресурса, его репутацию и Site Quality Score.

Дифференцированная обработка контента: Google применяет принципиально разные правила для извлечения текста, списков и таблиц при формировании Featured Snippets. Оптимизация требует понимания правил для каждого формата.
Правила комбинирования (Enumerating Reference): Существуют четкие правила для определения того, сколько текста включать перед списком или таблицей. Наличие или отсутствие Enumerating Reference ("следующие шаги:") определяет, будет ли включено одно предложение или несколько.
Инкрементальная генерация списков (Сборка "в ширину"): Механизм Incremental list generation критически важен. Google стремится включить понемногу из каждого пункта списка (обычно первое предложение), прежде чем брать дополнительный контент из этих же пунктов. Это диктует структуру написания списков.
Комплексный скоринг: Выбор сниппета зависит не только от релевантности запросу. Query Independent Score учитывает множество факторов: позицию на странице, качество языка, форматирование и авторитетность источника.
Релевантность "Идеальному ответу": Answer Term Match Score показывает, что Google оценивает пассаж не только по запросу, но и по его соответствию консенсусу ответов, найденных в Топ-N результатах. Это подчеркивает важность Topical Authority и полноты раскрытия темы.

Best practices (это мы делаем)

Четкое структурирование ответов: Используйте нативные HTML-теги для списков (<ol>, <ul>) и таблиц (<table>) при ответе на запросы типа "How-to", инструкции или сравнения. Это позволяет системе идентифицировать контент как структурированный и применить соответствующие правила извлечения.
Оптимизация под инкрементальную генерацию: При создании списков убедитесь, что первое предложение каждого пункта (bullet point) содержит самую важную информацию. Согласно правилу Incremental list generation, Google скорее всего возьмет именно эти первые предложения.
Управление вводным текстом (Enumerating Reference): Контролируйте, сколько текста будет захвачено перед списком или таблицей. Используйте явные Enumerating References (например, "Вот инструкция:", "Шаги включают:"), чтобы ограничить вводный текст одним предложением. Если вводный контекст важен, избегайте этих маркеров, чтобы захватить больше текста.
Декларативный и чистый язык: Пишите четкие, полные, декларативные предложения. Это повышает Language Model Score. Избегайте использования вопросов в той части контента, которая предназначена для ответа (снижает Interrogative Score).
Позиционирование ответов: Размещайте контент, оптимизированный под Featured Snippet, как можно выше на странице, чтобы повысить Passage Unit Position Score.
Повышение полноты ответа (Topical Authority): Анализируйте терминологию, используемую конкурентами в Топ-N. Убедитесь, что ваш контент содержит термины, которые Google считает важными для ответа (те, что имеют высокий вес в Answer Term Match Score).

Worst practices (это делать не надо)

Использование сложной верстки для имитации структур: Использование <div> или CSS для создания визуальных списков или таблиц вместо нативных HTML-тегов может помешать системе распознать контент как структурированный.
Начинать ответ с дискурсивных маркеров: Избегайте начинать параграфы, оптимизированные под сниппет, со слов типа "Однако", "С другой стороны", "Тем не менее". Это снижает Discourse Boundary Term Position Score.
"Хоронить" ключевую информацию: Размещение основного ответа глубоко в тексте параграфа или во втором-третьем предложении пункта списка снижает вероятность его выбора из-за правил позиционирования и инкрементальной генерации.
Скрытие контента: Попытки предоставить ответ в контенте, который скрыт от пользователя. Система проверяет видимость контента.

Стратегическое значение

Этот патент подтверждает критическую важность семантической структуры и форматирования контента для захвата Featured Snippets. SEO-стратегия должна включать не только написание релевантного текста, но и его форматирование в соответствии с правилами извлечения Google для различных типов данных. Понимание того, как Google комбинирует и оценивает блоки контента, позволяет проводить более точную оптимизацию для занятия "нулевой позиции".

Практические примеры

Сценарий: Оптимизация статьи "Как завязать галстук" для получения Featured Snippet в виде нумерованного списка.

Анализ запроса: Запрос "Как завязать галстук" является Question Query типа "How-to". Целевой формат — нумерованный список (<ol>).
Форматирование вводного предложения: Используем явный Enumerating Reference, чтобы Google взял только одно предложение перед списком. Текст: "Чтобы завязать галстук узлом Виндзор, выполните следующие шаги:".
Структурирование списка: Используем тег <ol>.
Оптимизация пунктов (Incremental Generation): Для каждого шага формулируем первое предложение максимально четко и информативно.
Пример плохого пункта: "Теперь перекиньте широкий конец. Это важно сделать аккуратно. Затем протяните его через петлю."
Пример хорошего пункта: "Перекиньте широкий конец галстука через узкий. Убедитесь, что он лежит ровно, и протяните его через шейную петлю снизу вверх."
Google с большей вероятностью возьмет первое предложение из хорошего примера.
Позиционирование: Размещаем эту инструкцию сразу после основного заголовка H1 и краткого введения.
Ожидаемый результат: Google извлекает вводное предложение и первые предложения каждого шага из списка для формирования Featured Snippet.

Как Google решает, взять для сниппета обычный текст или список/таблицу?

Система не выбирает заранее формат. Она генерирует множество кандидатов из одного и того же ресурса, используя разные комбинации структурированного и неструктурированного контента, согласно описанным правилам извлечения. Затем все кандидаты (и текстовые, и структурированные) оцениваются с помощью Answer Passage Scorer. Тот формат, который получит наивысший итоговый Answer Score, будет выбран.

Почему Google часто берет только первое предложение из каждого пункта моего списка?

Это результат работы механизма Incremental list generation (Claim 4 и 9). Система итеративно выбирает один блок (например, предложение) из каждого пункта списка, прежде чем взять второй блок из любого пункта. Если при включении первых предложений достигается максимальный размер сниппета, генерация останавливается. Поэтому самую важную информацию нужно помещать в начало каждого пункта.

Что такое "Enumerating Reference" и как это использовать?

Enumerating Reference — это фраза, указывающая на последующий список или таблицу (например, "следующие шаги:", "в этой таблице:"). Согласно Claim 3, если такая фраза есть в предложении прямо перед списком, Google включит только это одно предложение. Если ее нет, он включит два или более предложений. Это можно использовать для контроля объема вводного текста в сниппете.

Как работает "Answer Term Match Score" и почему он важен?

Answer Term Match Score оценивает, насколько пассаж похож на "идеальный ответ". Google формирует этот "идеальный ответ", анализируя и взвешивая все термины из Top-N результатов. Если ваш пассаж содержит много этих взвешенных терминов, он получит высокую оценку. Это означает, что ваш ответ должен соответствовать консенсусу авторитетных источников по данной теме.

Влияет ли позиция контента на странице на вероятность попадания в Featured Snippet?

Да, напрямую. Патент описывает Passage Unit Position Score как часть Query Independent Score. Чем выше контент расположен на странице, тем выше эта оценка. Это стимулирует размещать ключевые ответы ближе к началу документа.

Правда ли, что Google не любит, когда ответный пассаж сам содержит вопрос?

Да. Патент упоминает Interrogative Score. Если кандидатный пассаж содержит вопросительные термины или сам сформулирован как вопрос, он получает штраф, так как это менее полезно для пользователя, ищущего декларативный ответ. При оптимизации следует избегать риторических вопросов в блоках ответа.

Как оптимизировать таблицы для Featured Snippets согласно патенту?

Используйте стандартную HTML-разметку. Для запросов с суперлативами (например, "лучший", "самый дешевый") убедитесь, что данные в таблице можно отсортировать по нужному атрибуту, так как Google попытается извлечь топовые строки (Claim 7). Для запросов об атрибутах сущности (например, "цена продукта X") убедитесь, что пара сущность-атрибут четко представлена в таблице (Claim 8).

Что произойдет, если мой ответ начинается со слова "Однако" или "С другой стороны"?

Такие слова называются дискурсивными маркерами (Discourse boundary terms). Патент указывает, что если пассаж начинается с такого термина, он получает низкую оценку Discourse Boundary Term Position Score. Это значительно снижает шансы на выбор такого пассажа в качестве Featured Snippet.

Как Google оценивает качество языка в сниппете?

Используется Language Model Score. Он проверяет две вещи: во-первых, грамматическую корректность и использование полных предложений (для неструктурированного текста). Во-вторых, он сравнивает текст пассажа (например, используя N-граммы) с большой базой исторических ответных пассажей, чтобы определить, насколько он похож на типичный качественный ответ.

Влияет ли авторитетность или ранг сайта на выбор Featured Snippet?

Да. Патент указывает, что Resource Scores используются при расчете Query Independent Score. Эти оценки включают Ranking Score ресурса, его репутацию и Site Quality Score. При прочих равных, предпочтение будет отдано пассажу с более авторитетного и высокоранжируемого ресурса.

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи

Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.

US9940367B1
2018-04-10

SERP
Семантика и интент
EEAT и качество

Как Google извлекает и ранжирует прямые ответы (Featured Snippets) из веб-страниц

Google использует систему для ответов на вопросы пользователей путем извлечения конкретных предложений из результатов поиска. Система оценивает предложения-кандидаты по трем критериям: насколько часто похожие фразы встречаются в других результатах (консенсус), насколько предложение соответствует запросу (релевантность) и насколько авторитетен источник (ранг документа). Лучшие ответы отображаются над стандартными результатами поиска.

US8682647B1
2014-03-25

SERP
Семантика и интент

Как Google извлекает факты из веб-страниц для прямых ответов и автоматического наполнения Knowledge Graph

Google использует систему для ответов на вопросительные запросы. Система анализирует текстовые сниппеты из результатов поиска, применяет NLP-анализ (аннотирование) для извлечения кандидатов в ответы и выбирает лучший на основе консенсуса и качества источников. Этот механизм используется как для предоставления прямых ответов пользователям (Featured Snippets), так и для автоматического поиска недостающей информации и обновления базы знаний (Entity Database).

US20160132501A1
2016-05-12

Knowledge Graph
Семантика и интент
SERP

Как Google анализирует, извлекает и ранжирует данные из таблиц для формирования Featured Snippets

Google использует систему для идентификации таблиц с упорядоченными данными (рейтингами) на веб-страницах. Система анализирует структуру таблицы и контекст страницы (заголовки, окружающий текст, прошлые запросы), чтобы понять, что именно и по какому критерию ранжируется. Если исходная страница уже занимает высокие позиции, Google может извлечь данные из таблицы и показать их непосредственно в выдаче в виде Featured Snippet, отвечая на запросы о рейтингах и сравнениях.

US20190065502A1
2019-02-28

Семантика и интент
Индексация
SERP

Как Google создает модель "идеального ответа" (Answer Term Vector) для оценки и выбора Featured Snippets

Google анализирует тысячи существующих пар Вопрос-Ответ в интернете, чтобы понять, какие термины чаще всего используются при ответе на конкретный вопрос. На основе этого анализа создается "Вектор Терминов Ответа" (Answer Term Vector) — эталонная модель ожидаемых слов и их важности. Затем кандидаты в Featured Snippet оцениваются по тому, насколько хорошо их текст совпадает с этим вектором.

US10019513B1
2018-07-10

SERP
Семантика и интент

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR

Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).

US10650066B2
2020-05-12

Ссылки
SERP

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP

Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.

US9275421B2
2016-03-01

Семантика и интент
SERP
Ссылки

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий

Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.

US7840407B2
2010-11-23

Поведенческие сигналы
Семантика и интент
Структура сайта

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта

Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.

US9208233B1
2015-12-08

Ссылки
Семантика и интент
Индексация

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи

Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.

US9092510B1
2015-07-28

Свежесть контента
Поведенческие сигналы
SERP

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента

Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.

US8145636B1
2012-03-27

Семантика и интент
Поведенческие сигналы

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам

Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).

US11609949B2
2023-03-21

Антиспам
SERP
Поведенческие сигналы

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним

Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.

US9235625B2
2016-01-12

Ссылки
Поведенческие сигналы
Мультимедиа

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска

Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.

US8959083B1
2015-02-17

Персонализация
Поведенческие сигналы
SERP

Как Google использует анализ сущностей в результатах поиска для подтверждения интента и продвижения авторитетного контента

Google анализирует сущности (Topics/Entities) и их типы, общие для топовых результатов поиска, чтобы определить истинный интент запроса. Если интент подтверждается этим тематическим консенсусом выдачи, система продвигает "авторитетные кандидаты" (например, полные фильмы). Если консенсуса нет, продвижение блокируется для предотвращения показа нерелевантных результатов.

US9213745B1
2015-12-15

Семантика и интент
EEAT и качество
SERP