SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google создает модель "идеального ответа" (Answer Term Vector) для оценки и выбора Featured Snippets

WEIGHTED ANSWER TERMS FOR SCORING ANSWER PASSAGES (Взвешенные термины ответа для оценки пассажей-ответов)
  • US10019513B1
  • Google LLC
  • 2015-08-12
  • 2018-07-10
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует тысячи существующих пар Вопрос-Ответ в интернете, чтобы понять, какие термины чаще всего используются при ответе на конкретный вопрос. На основе этого анализа создается "Вектор Терминов Ответа" (Answer Term Vector) — эталонная модель ожидаемых слов и их важности. Затем кандидаты в Featured Snippet оцениваются по тому, насколько хорошо их текст совпадает с этим вектором.

Описание

Какую проблему решает

Патент решает задачу объективной и масштабируемой оценки качества, полноты и точности кандидатов в пояснительные ответы (Answer Passages или long answers, т.е. Featured Snippets). Основная цель — оценить точность ответа, не зная заранее самого ответа, путем сравнения кандидата с моделью, построенной на основе консенсуса информации в вебе.

Что запатентовано

Запатентована система генерации и использования Answer Term Vectors (Векторов Терминов Ответа). Система в офлайн-режиме анализирует веб-корпус для выявления существующих пар "Вопрос-Ответ". Ответы на схожие вопросы агрегируются, и система определяет важность (вес) ключевых терминов в этих ответах. Полученный вектор служит эталонной моделью для оценки качества кандидатов в Featured Snippet.

Как это работает

Механизм работает в два этапа:

  • Офлайн (Генерация): Term Vector Generator сканирует ресурсы, идентифицирует Question Phrases (например, в заголовках) и извлекает следующий за ними текст как ответ. Схожие вопросы группируются. Ответы для каждой группы агрегируются, и создается Answer Term Vector — набор ключевых терминов с весами, отражающими их важность в консенсусном ответе.
  • Онлайн (Оценка): Когда пользователь задает вопрос, система находит соответствующий предварительно рассчитанный вектор. Answer Passage Scorer оценивает кандидатов в Featured Snippet по тому, насколько хорошо их содержание совпадает с этим вектором. Кандидат с наилучшим совпадением выбирается для показа.

Актуальность для SEO

Высокая. Featured Snippets являются доминирующим элементом современной поисковой выдачи. Этот патент описывает фундаментальный механизм, позволяющий Google масштабируемо оценивать качество этих блоков, опираясь на "мудрость толпы" (консенсус данных в вебе). Технология критически важна для оптимизации под нулевую позицию.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO-стратегий, направленных на захват Featured Snippets. Он раскрывает, что Google сравнивает контент с моделью "идеального ответа" (Answer Term Vector). Это подчеркивает стратегическую важность использования консенсусной терминологии и четкого структурирования контента в формате Q&A для обучения систем Google и захвата сниппетов.

Детальный разбор

Термины и определения

Answer Passage (Пассаж-ответ)
Фрагмент текста (например, абзац), выбранный из ресурса для предоставления прямого ответа на вопрос пользователя. Аналог Featured Snippet. В патенте также упоминается как "long answer" или "explanatory answer".
Answer Term Vector (Вектор терминов ответа)
Структура данных, содержащая ключевые термины (Answer Terms) и их веса (Answer Term Weights). Представляет собой эталонную модель или "консенсусный словарь" для ответа на определенный вопрос.
Answer Term Weight (Вес термина ответа)
Числовое значение, отражающее важность термина в агрегированных ответах. Основано на частоте использования термина в вебе.
Question Phrase (Фраза-вопрос)
Текст в ресурсе (часто заголовок), идентифицированный системой как вопрос (например, содержащий интеррогативные термины: "как", "почему" или "?").
Query Definition (Определение запроса)
Абстракция для группировки схожих вопросов. Может быть конкретным запросом, набором синонимичных запросов или набором ключевых терминов. Используется для связи запроса пользователя с Answer Term Vector.
Term Vector Generator (Генератор векторов терминов)
Офлайн-компонент системы, который анализирует ресурсы, извлекает пары Q&A и генерирует Answer Term Vectors.
Answer Passage Scorer (Оценщик пассажей-ответов)
Онлайн-компонент, который оценивает кандидатов в Answer Passage, используя Answer Term Vectors.

Ключевые утверждения (Анализ Claims)

Патент описывает два основных варианта реализации офлайн-процесса группировки вопросов для генерации векторов.

Claim 2 (Независимый пункт) — Группировка через Query Definitions: Описывает основной офлайн-процесс.

  1. Доступ к данным ресурсов и Query Definitions.
  2. Идентификация Question Phrases в ресурсах.
  3. Для каждой фразы выбор последующего (subsequent) текста как Ответа.
  4. Группировка Question Phrases путем сопоставления их с конкретным Query Definition.
  5. Для каждой группы: генерация Answer Terms и Answer Term Weights из собранных ответов.
  6. Сохранение этих данных (Вектора) в ассоциации с Query Definition.

Claim 1 (Независимый пункт) — Группировка через кластеризацию: Альтернативный офлайн-процесс.

Шаги 1-3 аналогичны. Ключевое отличие в шаге 4: Question Phrases группируются путем кластеризации на основе метрик схожести (cluster similarity metrics). После генерации Вектора (шаг 5), система идентифицирует запросы пользователей, схожие с этим кластером, и ассоциирует вектор с ними (шаг 6).

Claim 4 (Зависимый пункт) — Использование векторов онлайн: Описывает применение системы во время поиска.

  1. Получение запроса, определенного как вопрос (Question Query).
  2. Получение кандидатов в Answer Passages из релевантных ресурсов.
  3. Определение Query Definition, соответствующего запросу.
  4. Выбор связанного с ним Answer Term Vector.
  5. Оценка (Scoring) каждого кандидата с использованием вектора.
  6. Выбор лучшего Answer Passage на основе этой оценки (в том числе).

Claim 10 (Зависимый от 8 и 2) — Продвинутый расчет весов (Масштабирование):

Критически важное уточнение. Весовой вклад (weight contribution) термина из конкретного ответа может быть пропорционален схожести (similarity) между Query Definition и той Question Phrase, за которой следовал этот ответ. Ответы на более точные и релевантные формулировки вопросов вносят больший вклад в формирование эталонного вектора.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, работая как офлайн, так и онлайн.

INDEXING – Индексирование и извлечение признаков (Офлайн)
На этом этапе система анализирует структуру документов (DOM, HTML) для идентификации Question Phrases (например, заголовков) и соответствующих им ответов (последующего или подчиненного текста).

QUNDERSTANDING – Понимание Запросов (Офлайн)
Term Vector Generator использует данные индекса, группирует похожие вопросы (через кластеризацию или Query Definitions) и генерирует Answer Term Vectors. Это процесс предварительного вычисления.

QUNDERSTANDING – Понимание Запросов (Онлайн)
Во время запроса система классифицирует запрос как вопрос и сопоставляет его с существующим Query Definition для выбора нужного вектора.

RANKING / RERANKING (Онлайн)
Answer Passage Generator создает кандидатов из топовых результатов. Затем Answer Passage Scorer использует предварительно рассчитанные Answer Term Vectors для оценки этих кандидатов. Это специализированное ранжирование для выбора Featured Snippet.

Входные данные:

  • (Офлайн): Индекс ресурсов, Query Definitions (опционально).
  • (Онлайн): Запрос пользователя, Кандидаты в Answer Passage, База данных Term Vector Data.

Выходные данные:

  • (Офлайн): Answer Term Vectors, ассоциированные с Query Definitions или кластерами.
  • (Онлайн): Оценка (Answer Score) для кандидатов; Выбранный Answer Passage (Featured Snippet).

На что влияет

  • Специфические запросы: Информационные запросы, сформулированные как явные или неявные вопросы ("как", "почему", "что такое"), требующие пояснительного ответа (explanatory answer).
  • Конкретные типы контента: Контент, структурированный в формате Вопрос-Ответ: FAQ, статьи-руководства, базы знаний. Особенно важна структура с явными заголовками-вопросами.
  • Определенные форматы контента: Влияет на выбор контента для блоков Featured Snippets (абзацы, списки).

Когда применяется

  • Условия работы (Офлайн): Применяется при обработке индекса, когда система обнаруживает в ресурсах явные Question Phrases и может извлечь последующий текст как ответ.
  • Триггеры активации (Онлайн): Активируется, когда система классифицирует запрос как вопрос, ищущий ответ (question query that seeks an answer response), и если для запроса существует соответствующий предварительно рассчитанный Answer Term Vector.

Пошаговый алгоритм

Процесс А: Офлайн-генерация Векторов Терминов (Term Vector Generation)

  1. Выбор Группы Вопросов: Система выбирает Query Definition ИЛИ определяет кластер схожих вопросов.
  2. Идентификация Вопросов в Индексе: Поиск в индексе ресурсов, содержащих Question Phrases, которые соответствуют этой группе.
  3. Извлечение Ответов: Для каждой найденной фразы-вопроса система выбирает последующий участок текста (например, следующий абзац) как ответ.
  4. Агрегация Ответов: Сбор всех извлеченных ответов для данной группы из разных ресурсов.
  5. Расчет Весов Терминов: Анализ терминов во всех агрегированных ответах. Расчет веса (Answer Term Weight) для каждого термина. Вес может основываться на частоте термина или количестве уникальных ответов, где он встретился.
  6. Масштабирование Весов (Claim 10): Вклад термина из конкретного ответа может быть масштабирован пропорционально схожести (similarity) между исходной Question Phrase и Query Definition.
  7. Сохранение Вектора: Сохранение полученного Answer Term Vector в базе данных в ассоциации с группой вопросов.

Процесс Б: Онлайн-оценка Кандидатов (Answer Passage Scoring)

  1. Получение Запроса: Получение пользовательского запроса, идентифицированного как вопрос.
  2. Генерация Кандидатов: Извлечение кандидатов в Answer Passage из топовых ранжирующихся ресурсов.
  3. Сопоставление с Вектором: Определение соответствующего запросу Answer Term Vector из базы данных.
  4. Расчет Оценки (Scoring): Сравнение содержания каждого кандидата с вектором. Оценка рассчитывается на основе наличия в кандидате терминов из вектора и их весов (например, путем суммирования весов совпадающих терминов).
  5. Выбор Ответа: Комбинирование этой оценки с другими сигналами и выбор кандидата с наивысшей итоговой оценкой для показа в Featured Snippet.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст ресурсов. Анализируются термины в Question Phrases и термины в соответствующих ответах.
  • Структурные факторы: Структура документа (DOM) и HTML-разметка критически важны. Система использует их для идентификации вопросов (например, анализ тегов заголовков) и для определения границ ответа (текст, "непосредственно следующий" (subsequent) или "подчиненный" (subordinate) вопросу).
  • Поведенческие факторы: Query Logs могут использоваться для формирования Query Definitions (определения групп схожих запросов).

Какие метрики используются и как они считаются

  • Answer Term Weight (Вес термина в векторе): Рассчитывается офлайн. Определяет важность термина. Методы расчета:
    • Общее количество появлений термина во всех агрегированных ответах (TF).
    • Количество уникальных ответов, содержащих термин (DF).
    • Масштабирование веса (Weight Scaling): Вклад термина может масштабироваться пропорционально показателю схожести (similarity score) между исходной Question Phrase и Query Definition (Claim 10).
  • Term Vector Score (Оценка вектора терминов): Рассчитывается онлайн. Измеряет соответствие кандидата эталонному вектору. Пример расчета: для каждого термина в кандидате количество его вхождений умножается на вес этого термина из Answer Term Vector. Полученные значения суммируются.
  • Similarity Metrics (Метрики схожести): Используются для группировки вопросов (кластеризация), сопоставления Question Phrases с Query Definitions и для масштабирования весов.

Выводы

  1. Google строит модель "идеального ответа" на основе консенсуса. Для оценки Featured Snippets система создает Answer Term Vector, который представляет собой агрегированное мнение веба о том, какие термины должны присутствовать в качественном ответе на конкретный вопрос.
  2. Система активно ищет и анализирует Q&A пары в интернете. Офлайн-процесс специально настроен на поиск вопросов и ответов в контенте для построения своих моделей. Это подчеркивает важность формата Q&A.
  3. Структура контента критически важна для обучения. Система идентифицирует Question Phrase (часто заголовок) и анализирует текст, непосредственно следующий за ним. Четкая структура "Вопрос -> Немедленный ответ" является оптимальной для извлечения данных.
  4. Точность формулировок влияет на модель (Claim 10). Вклад ответа в Answer Term Vector масштабируется в зависимости от того, насколько точно исходный вопрос соответствовал Query Definition. Ответы на более релевантные формулировки вопросов имеют больший вес.
  5. Соответствие вектору — ключ к Featured Snippet. Чтобы захватить Featured Snippet, контент должен содержать термины (консенсусный словарь), которые Google ожидает увидеть в ответе, согласно сгенерированному вектору.

Практика

Best practices (это мы делаем)

  • Используйте терминологию консенсуса (Consensus Terminology). Проанализируйте, какие ключевые слова и сущности используются большинством авторитетных источников при ответе на целевой вопрос. Включите их в свой ответ, так как они, вероятно, имеют высокий вес в Answer Term Vector Google.
  • Структурируйте контент в явном формате Q&A. Используйте теги заголовков (H2, H3) для формулировки вопроса, максимально близкого к запросам пользователей. Сразу после заголовка (в следующем элементе, например

    или

      ) давайте четкий ответ. Это облегчает системе идентификацию Question Phrase и соответствующего ответа.
    • Обеспечивайте полноту ответа. Поскольку Answer Term Vector агрегирует информацию из множества источников, полный ответ, покрывающий разные аспекты вопроса, будет иметь большее пересечение с вектором и получит более высокий Term Vector Score.
    • Используйте точные формулировки вопросов в заголовках. Благодаря механизму масштабирования весов (Claim 10), использование точных и популярных формулировок вопросов в заголовках может увеличить вклад вашего контента в формирование Answer Term Vector и улучшить восприятие вашего ответа системой.

    Worst practices (это делать не надо)

    • Использование нестандартной или жаргонной терминологии. Если вы используете термины, отличные от общепринятых в индустрии, ваш ответ не будет соответствовать консенсусной модели (вектору), даже если он технически корректен.
    • Сложная структура и разрыв связи Вопрос-Ответ. Если ответ не следует непосредственно за вопросом в DOM или между ними находятся посторонние блоки (реклама, изображения), система может неверно определить границы ответа или проигнорировать его.
    • Добавление "воды" в начале ответа. Это снижает плотность ожидаемых терминов и ухудшает совпадение с Answer Term Vector. Ответ должен начинаться сразу по существу.
    • Создание слишком коротких ответов на сложные вопросы. Если вопрос требует объяснения (explanatory answer), слишком короткий ответ вряд ли будет содержать достаточное количество взвешенных терминов из вектора.

    Стратегическое значение

    Патент подтверждает стратегию Google по использованию статистического анализа ("мудрости толпы") для оценки качества ответов. Он демонстрирует переход к оценке конкретного пассажа на соответствие эталонной модели ответа, сформированной на основе анализа всего веба. Для долгосрочной SEO-стратегии это означает, что захват Featured Snippets требует не только высокого ранжирования страницы, но и наличия на ней контента, который структурно и терминологически соответствует ожиданиям системы.

    Практические примеры

    Сценарий: Оптимизация статьи для получения Featured Snippet по запросу "Что такое Рэлеевское рассеяние?"

    1. Анализ Консенсуса (Моделирование Вектора): SEO-специалист изучает авторитетные источники и определяет ключевые термины, которые должны быть в ответе: "свет", "частицы" (или "молекулы"), "длина волны", "атмосфера", "оптическое явление", "голубой цвет неба". Google офлайн уже сформировал Answer Term Vector с высокими весами для этих терминов.
    2. Структурирование Контента: На странице создается заголовок H2: "Что такое Рэлеевское рассеяние?".
    3. Написание Ответа (Кандидата): Непосредственно под заголовком размещается абзац: "Рэлеевское рассеяние — это оптическое явление, при котором свет рассеивается на частицах или молекулах в атмосфере. Поскольку размер этих частиц значительно меньше длины волны света, короткие (синие) волны рассеиваются сильнее, чем длинные (красные). Это объясняет, почему небо выглядит голубым."
    4. Ожидаемый результат: При обработке запроса Google сравнивает этот абзац с Answer Term Vector. Из-за высокой плотности ожидаемых терминов и четкой структуры кандидат получает высокий Term Vector Score, что увеличивает шансы на показ в Featured Snippet.

Вопросы и ответы

Что такое Answer Term Vector и как он влияет на выбор Featured Snippet?

Answer Term Vector — это модель "идеального ответа", которую Google рассчитывает заранее, анализируя множество существующих ответов в интернете. Она содержит набор ожидаемых терминов и их веса. При выборе Featured Snippet система сравнивает кандидатов с этим вектором; чем лучше совпадение, тем выше шансы на показ.

Как Google определяет, какие термины должны быть в векторе и какой у них вес?

Система анализирует ответы на схожие вопросы из множества источников. Термины, которые часто встречаются в этих ответах, попадают в вектор. Вес зависит от частоты появления термина или от количества уникальных источников, использующих его. Также вес может быть выше, если термин взят из ответа на очень точную формулировку вопроса (Claim 10).

Означает ли это, что нужно копировать контент из других сайтов?

Нет, копировать контент не нужно. Нужно использовать общепринятую терминологию и покрывать те аспекты темы, которые покрывает большинство авторитетных источников (консенсус). Ваш ответ должен быть уникальным по изложению, но соответствовать ожиданиям системы по содержанию и используемым терминам.

Какая структура контента оптимальна согласно этому патенту?

Оптимальная структура — это явный вопрос, за которым немедленно следует ответ. На практике это часто реализуется как заголовок (H2/H3), сформулированный как вопрос (Question Phrase), и следующий за ним абзац текста (Answer). Это облегчает системе анализ контента и извлечение данных.

Что такое Query Definition?

Query Definition — это способ группировки похожих вопросов. Например, "как далеко до луны" и "расстояние земля луна" могут относиться к одному Query Definition. Это позволяет Google использовать один и тот же Answer Term Vector для оценки ответов на разные формулировки одного и того же интента.

Работает ли эта система в реальном времени или заранее?

Система работает в двух режимах. Генерация векторов (Answer Term Vector) происходит заранее (офлайн) путем анализа всего веба. Оценка кандидатов в Featured Snippet с использованием этих векторов происходит в реальном времени (онлайн) в ответ на запрос пользователя.

Оценивает ли этот механизм фактическую точность ответа?

В рамках данного патента механизм оценивает точность косвенно, полагаясь на консенсус, а не на сверку с базой знаний. Предполагается, что если большинство источников используют определенные термины при ответе на вопрос, эти термины соответствуют правильному ответу. Если консенсус неверен, система может выбрать неверный ответ.

Как узнать, какие термины находятся в Answer Term Vector для моего запроса?

Google не публикует эти данные. SEO-специалистам необходимо проводить конкурентный анализ: изучать текущий Featured Snippet и контент топовых сайтов, чтобы выявить закономерности в используемой терминологии. Это позволит предположить состав вектора и оптимизировать контент соответствующим образом.

Влияет ли авторитетность сайта на этот механизм?

Патент напрямую не использует авторитетность для расчета Term Vector Score. Однако кандидаты обычно берутся из топовых ресурсов (которые часто авторитетны). Кроме того, качество и точность формулировок источника (что коррелирует с авторитетностью) могут влиять на вес его вклада в вектор (Claim 10).

Что делать, если в моей нише нет общепринятой терминологии или консенсуса?

В таких случаях (например, новые или спорные темы) системе будет сложнее сформировать надежный Answer Term Vector. На первый план могут выйти другие факторы выбора Featured Snippet. Однако, если вы стремитесь стать лидером мнений, последовательное использование четкой терминологии и структуры Q&A может помочь вам сформировать этот консенсус.

Похожие патенты

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google извлекает, формирует и оценивает контент для Featured Snippets из структурированных и неструктурированных данных
Google использует систему для генерации Featured Snippets (ответных пассажей) в ответ на запросы-вопросы. Система анализирует топовые результаты, разделяя контент на структурированный (таблицы, списки) и неструктурированный (текст). Применяя разные наборы правил для каждого типа контента, система извлекает блоки текста (Passage Units) и формирует из них кандидатов для показа в блоке ответов, после чего оценивает их с помощью комплексного скоринга.
  • US10180964B1
  • 2019-01-15
  • SERP

  • Семантика и интент

Как Google извлекает и ранжирует прямые ответы (Featured Snippets) из веб-страниц
Google использует систему для ответов на вопросы пользователей путем извлечения конкретных предложений из результатов поиска. Система оценивает предложения-кандидаты по трем критериям: насколько часто похожие фразы встречаются в других результатах (консенсус), насколько предложение соответствует запросу (релевантность) и насколько авторитетен источник (ранг документа). Лучшие ответы отображаются над стандартными результатами поиска.
  • US8682647B1
  • 2014-03-25
  • SERP

  • Семантика и интент

Как Google использует консенсус между топовыми результатами для валидации и выбора Featured Snippets (Short Answers)
Google использует систему оценки точности коротких ответов (Featured Snippets). Система сравнивает потенциальный ответ из топового результата с контентом других высокоранжированных страниц (контекстными пассажами). Если ответ подтверждается консенсусом между источниками, он получает высокий балл точности и отображается в выдаче. Это снижает вероятность показа неверной или спорной информации в блоках с ответами.
  • US12248529B2
  • 2025-03-11
  • SERP

  • EEAT и качество

Как Google выбирает изображения для блоков с ответами (Featured Snippets), обеспечивая контекст и скорость
Google использует многоэтапный процесс для выбора изображений, отображаемых рядом с прямыми ответами на вопросы. Система генерирует отдельный запрос для поиска изображений на основе темы вопроса и заранее оценивает изображения на релевантных страницах. Когда источник текстового ответа определен, Google отдает предпочтение лучшему изображению с этой же страницы, гарантируя его контекстуальную связь с ответом.
  • US10691746B2
  • 2020-06-23
  • Мультимедиа

  • SERP

  • Семантика и интент

Популярные патенты

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
  • US10303684B1
  • 2019-05-28
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
  • US9152652B2
  • 2015-10-06
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank
Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.
  • US7565630B1
  • 2009-07-21
  • Персонализация

  • SERP

  • Ссылки

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
  • US9268880B2
  • 2016-02-23
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)
Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
  • US8065316B1
  • 2011-11-22
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

seohardcore