SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает изображения для блоков с ответами (Featured Snippets), обеспечивая контекст и скорость

IMAGES FOR QUERY ANSWERS (Изображения для ответов на запросы)
  • US10691746B2
  • Google LLC
  • 2016-07-12
  • 2020-06-23
  • Мультимедиа
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует многоэтапный процесс для выбора изображений, отображаемых рядом с прямыми ответами на вопросы. Система генерирует отдельный запрос для поиска изображений на основе темы вопроса и заранее оценивает изображения на релевантных страницах. Когда источник текстового ответа определен, Google отдает предпочтение лучшему изображению с этой же страницы, гарантируя его контекстуальную связь с ответом.

Описание

Какую проблему решает

Патент решает две основные задачи при отображении прямых ответов (например, в Answer Box или Featured Snippets) на вопросительные запросы (question queries). Во-первых, он обеспечивает выбор изображения, которое релевантно как вопросу, так и самому ответу, улучшая информативность блока. Во-вторых, он оптимизирует задержку (latency) системы, выполняя поиск и оценку потенциальных изображений до того, как будет окончательно определен источник текстового ответа.

Что запатентовано

Запатентована система выбора изображений для сопровождения текстового ответа на вопрос. Система генерирует второй запрос (second query) на основе исходного вопроса и использует его для поиска релевантных веб-ресурсов. Затем она проактивно ищет и ранжирует изображения, содержащиеся на этих ресурсах. Когда отдельная система (Answer System) определяет источник текстового ответа (source resource), система выбирает наилучшее ранжированное изображение именно с этого источника.

Как это работает

Механизм работает следующим образом:

  • Определение вопроса: Система получает запрос и классифицирует его как question query.
  • Генерация запроса для изображений: Из исходного запроса создается second query (например, путем извлечения ключевой сущности).
  • Проактивный поиск (до определения ответа): Система ищет веб-страницы, релевантные second query, и затем выполняет поиск изображений, строго ограниченный этими страницами. Изображения ранжируются.
  • Определение источника ответа: Параллельно Answer System определяет source resource, откуда будет взят текст ответа.
  • Выбор изображения: Система проверяет, был ли source resource среди заранее проанализированных страниц. Если да, выбирается изображение с наивысшим рейтингом с этой страницы.
  • Отображение: Текстовый ответ отображается вместе с выбранным изображением.

Актуальность для SEO

Высокая. Механизмы, описанные в патенте, напрямую связаны с тем, как формируются Featured Snippets и блоки прямых ответов, которые являются критически важной частью современной поисковой выдачи. Оптимизация скорости и обеспечение контекстуальной релевантности между текстом и изображением в этих блоках остаются приоритетными задачами для Google.

Важность для SEO

Патент имеет высокое значение для SEO, особенно для стратегий оптимизации под Featured Snippets (FS). Он раскрывает конкретный механизм, который Google использует для выбора изображения в FS. Понимание этого процесса позволяет SEO-специалистам оптимизировать изображения на своих страницах (их релевантность теме, расположение, тип), чтобы повысить вероятность их выбора и улучшить визуальное представление и CTR сниппета.

Детальный разбор

Термины и определения

Answer (Ответ)
Факт или утверждение, отвечающее на вопрос. В контексте патента — текстовые данные, извлеченные из источника для отображения в ответ на question query.
Answer System (Система ответов)
Отдельная система, ответственная за определение того, является ли запрос вопросом, и за извлечение текстового ответа из source resource.
First Query (Первый запрос)
Исходный запрос пользователя, идентифицированный как question query.
Image Processor (Процессор изображений)
Компонент системы, отвечающий за генерацию second query и выбор изображения для ответа.
Question Query (Вопросительный запрос)
Запрос, который ищет конкретный ответ (факт), в отличие от широкого информационного запроса.
Second Query (Второй запрос / Image Query)
Запрос, сгенерированный из first query специально для поиска релевантных веб-ресурсов и изображений. Может быть ключевой сущностью из вопроса или самим вопросом.
Source Resource (Исходный ресурс)
Веб-страница (или другой ресурс), из которой Answer System извлекает текстовый ответ.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс выбора изображения для ответа с акцентом на оптимизацию задержки и контекстуальную привязку.

  1. Система получает первый запрос (question query), на который будет дан ответ, извлеченный из исходного ресурса (source resource). Важно: это происходит до того, как отдельная Answer System идентифицирует этот source resource.
  2. Генерируется второй запрос (second query).
  3. Выполняется поиск по корпусу веб-ресурсов с использованием second query.
  4. Получается набор ранжированных веб-ресурсов.
  5. Инициируется поиск изображений. Этот поиск начинается до идентификации source resource и ограничен только изображениями, найденными на страницах из полученного набора ранжированных веб-ресурсов.
  6. Генерируется набор ранжированных изображений из этих ресурсов.
  7. Процесс выбора изображения:
    • Определяется source resource (на основе данных от Answer System).
    • Проверяется, входит ли этот source resource в ранее полученный набор ранжированных веб-ресурсов И содержит ли он изображения из набора ранжированных изображений.
    • Если да, изображение выбирается из числа изображений на source resource в соответствии с их ранжированием.
  8. Выбранное изображение предоставляется вместе с ответом.

Ключевая инновация заключается в проактивном поиске и ранжировании изображений (шаги 5-6) до того, как станет известен источник текста (шаг 7). Это сокращает время ответа. Одновременно требование выбирать изображение именно из источника текста (шаг 7) обеспечивает высокую контекстуальную релевантность между текстом и картинкой.

Claim 3 и 4 (Зависимые): Детализируют критерии выбора изображения.

Выбор изображения на source resource может дополнительно учитывать критерии, отличные от базового ранжирования. К ним относятся: расположение изображения (image location) на отображаемой странице и метки изображения (image labels).

Claim 5 (Зависимый): Описывает метод генерации second query.

Определяется, идентифицирует ли первый запрос конкретный экземпляр класса сущностей (specific instance of an entity class). Если да, этот экземпляр становится second query. Если нет, первый запрос используется как second query.

Где и как применяется

Изобретение применяется на финальных этапах обработки запроса, когда формируется блок прямого ответа.

QUNDERSTANDING – Понимание Запросов
На этом этапе исходный запрос классифицируется как question query. Также происходит анализ запроса для генерации second query (например, извлечение экземпляра класса сущностей).

RANKING – Ранжирование
Система выполняет два процесса ранжирования:

  1. Ранжирование веб-ресурсов в ответ на second query.
  2. Ранжирование изображений, найденных на этих веб-ресурсах, в ответ на second query.

Эти процессы запускаются проактивно, до завершения работы Answer System.

METASEARCH – Метапоиск и Смешивание
Основное применение патента. На этом этапе система получает данные от Answer System (идентификацию source resource и текст ответа) и данные от Image Processor (предварительно ранжированные изображения). Происходит финальный выбор изображения из source resource и формирование блока ответа (Answer Box / Featured Snippet), объединяющего текст и изображение.

Входные данные:

  • Исходный запрос пользователя (first query).
  • Данные классификации сущностей (для генерации second query).
  • Индекс веб-ресурсов и индекс изображений.

Выходные данные:

  • Блок ответа, содержащий текстовый ответ и релевантное изображение из того же источника.

На что влияет

  • Специфические запросы: Влияет в первую очередь на информационные запросы, сформулированные как вопросы (Явные: "Кто президент Франции?", Неявные: "население Токио"), для которых система может сформировать прямой ответ.
  • Конкретные типы контента: Влияет на страницы, которые претендуют на попадание в Featured Snippets. Это могут быть статьи, справочные материалы, страницы определений.
  • Определенные форматы контента: Влияет на то, как изображения на этих страницах оптимизированы и расположены.

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда система идентифицирует запрос как question query и решает предоставить прямой ответ, извлеченный из веб-ресурса.
  • Условия работы: Применяется при условии, что source resource, выбранный для текста, также содержит изображения, которые были успешно проанализированы и ранжированы на проактивном этапе. Если в источнике нет подходящих изображений, изображение может не отображаться (согласно одному из вариантов реализации в патенте) или может быть выбрано из другого источника (согласно другому варианту).

Пошаговый алгоритм

Этап 1: Обработка запроса и генерация Second Query

  1. Получение первого запроса и его классификация как question query.
  2. Анализ запроса для определения, указывает ли он на конкретный экземпляр класса (например, "Cheetah" в запросе про скорость гепарда).
  3. Генерация second query: выбор экземпляра класса, если он найден, или использование первого запроса в противном случае.

Этап 2: Проактивный поиск и ранжирование (Параллельный процесс)
Этот этап выполняется до того, как Answer System определит источник ответа.

  1. Поиск по корпусу веб-ресурсов с использованием second query.
  2. Получение набора Топ-N ранжированных веб-ресурсов.
  3. Выполнение поиска изображений, строго ограниченного Топ-N ресурсами (используя second query).
  4. Получение набора ранжированных изображений.
  5. (Опционально) Корректировка ранжирования изображений на основе дополнительных критериев (расположение на странице, тип изображения).

Этап 3: Финальный выбор изображения и формирование ответа

  1. Получение данных от Answer System: идентификация source resource и текст ответа.
  2. Проверка условий: Входит ли source resource в Топ-N набор? Содержит ли он изображения из ранжированного набора?
  3. При положительном результате: Выбор изображения с наивысшим скорректированным рейтингом, находящегося на source resource.
  4. При отрицательном результате: Принятие решения не отображать изображение или выбор лучшего изображения из всего Топ-N набора (в зависимости от реализации).
  5. Формирование блока ответа с текстом и выбранным изображением.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме выбора изображения, используя следующие данные:

  • Контентные факторы (Изображения): Метаданные изображений, используемые для определения сущностей, изображенных на картинке (используется в одном из вариантов реализации для сопоставления с сущностью ответа).
  • Структурные факторы (Расположение): Данные о расположении изображения на странице (image location). Изображения в центральных или выдающихся позициях могут получать повышение. Изображения в боковых частях могут быть понижены.
  • Технические факторы (Метки/Типы): Метки изображений (image labels), указывающие на тип контента. Изображения, помеченные как иконки, клип-арт, элементы интерфейса (кнопки, полосы), могут быть понижены или исключены как малоинформативные.
  • Ссылочные факторы (Изображения): Данные о том, используется ли изображение в качестве анкоря для ссылки. Такие изображения могут быть понижены или проигнорированы.

Какие метрики используются и как они считаются

  • Ранжирование веб-ресурсов: Стандартные метрики релевантности (например, IR scores) веб-страниц по отношению к second query.
  • Ранжирование изображений: Метрики релевантности изображений по отношению к second query в контексте содержащих их веб-страниц.
  • Корректирующие факторы: Баллы, основанные на дополнительных критериях выбора (additional image selection criteria):
    • Location Score: Оценка на основе расположения изображения на странице. Может использоваться для масштабирования базовой оценки релевантности.
    • Label/Type Score: Оценка информативности на основе меток (понижение для клип-арта/иконок).
  • Entity Matching Score (Опционально): Степень совпадения между сущностью, указанной в ответе, и сущностью, идентифицированной в метаданных изображения.

Выводы

  1. Источник изображения в Featured Snippet: Патент подтверждает, что Google стремится выбирать изображение для блока ответа из того же ресурса (source resource), откуда взят текст. Это обеспечивает максимальную контекстуальную связь и согласованность.
  2. Релевантность изображения определяется темой вопроса, а не текстом ответа: Изображения ищутся и ранжируются на основе second query, который выводится из исходного вопроса (часто это основная тема или сущность вопроса), а не на основе конкретной формулировки извлеченного текста ответа.
  3. Проактивное ранжирование для скорости: Ключевой особенностью системы является выполнение поиска и оценки изображений до того, как источник текста будет окончательно определен. Это техническое решение для снижения задержки, но оно также означает, что система заранее определяет пул кандидатов.
  4. Важность оптимизации и расположения изображений: Система явно учитывает расположение изображения на странице (image location) и его тип (image labels). Информативные, уникальные изображения, расположенные на видном месте, имеют приоритет перед иконками, клип-артом или изображениями в футере.
  5. Генерация Image Query (Second Query): Понимание того, как генерируется second query (извлечение экземпляра класса), критично для оптимизации. Изображения должны быть релевантны именно этой ключевой сущности.

Практика

Best practices (это мы делаем)

  • Оптимизация изображений под ключевую сущность (Second Query): Убедитесь, что изображения на странице четко релевантны основной теме вопроса (экземпляру класса), на который отвечает страница. Если страница о том, "Как быстро бегает гепард", ключевые изображения должны быть релевантны запросу [гепард].
  • Размещение ключевых изображений на видном месте: Размещайте наиболее важные и информативные изображения в основном контенте, предпочтительно ближе к тексту, который может быть использован в качестве ответа. Система учитывает image location и может понижать изображения из боковых панелей или футера.
  • Использование уникальных и информативных изображений: Избегайте использования стоковых фото, клип-арта или иконок в качестве основных изображений. Система фильтрует малоинформативные изображения (low-information images) на основе image labels. Используйте диаграммы, инфографику или качественные фотографии, которые добавляют ценность ответу.
  • Оптимизация контекста изображений: Убедитесь, что страница в целом высоко ранжируется по second query. Поиск изображений ограничен только теми страницами, которые система сочла релевантными этому запросу.

Worst practices (это делать не надо)

  • Использование изображений как ссылок для навигации: Патент указывает, что изображения, используемые как анкоря для ссылок, могут быть понижены или проигнорированы. Не используйте ключевое изображение, которое вы хотите видеть в Featured Snippet, в качестве кликабельного элемента навигации.
  • Наполнение страницы клип-артом и иконками: Полагаться на простые иконки или нерелевантный визуальный контент неэффективно. Система активно фильтрует такие изображения при выборе кандидата для блока ответа.
  • Размещение важных изображений в нестандартных местах: Скрытие ключевых изображений в слайдерах, табах или размещение их далеко от основного контента (например, в футере) снижает вероятность их выбора из-за фактора image location.

Стратегическое значение

Этот патент подчеркивает важность комплексной оптимизации страниц для захвата Featured Snippets. Недостаточно иметь только качественный текст; визуальное сопровождение играет ключевую роль в формировании итогового сниппета. Стратегия должна включать создание высококачественных, релевантных изображений и их правильное техническое и структурное размещение на странице. Понимание этого механизма дает конкурентное преимущество, позволяя контролировать, какое изображение будет представлять ваш сайт в "нулевой позиции".

Практические примеры

Сценарий: Оптимизация статьи для Featured Snippet по запросу "Высота Эйфелевой башни"

  1. Анализ запроса: Исходный запрос (first query): "Высота Эйфелевой башни". Система определяет экземпляр класса: "Эйфелева башня". Second query: [Эйфелева башня].
  2. Требования к контенту: Страница должна хорошо ранжироваться по запросу [Эйфелева башня] и содержать точный текстовый ответ (например, "Высота Эйфелевой башни составляет 330 метров").
  3. Оптимизация изображения (Что делать): Разместить качественную фотографию или схему Эйфелевой башни в основном контенте, рядом с текстовым ответом. Убедиться, что изображение информативно и не является иконкой или клип-артом.
  4. Оптимизация изображения (Чего не делать): Не использовать в качестве основного изображения логотип туристической компании, иконку в виде башни или фотографию Парижа с маленькой башней на горизонте. Не размещать лучшее изображение в футере.
  5. Ожидаемый результат: При захвате Featured Snippet система выберет оптимизированное изображение со страницы, так как оно находится на source resource, релевантно second query [Эйфелева башня] и расположено на видном месте.

Вопросы и ответы

Всегда ли изображение в Featured Snippet берется с той же страницы, что и текст?

Патент описывает механизм, который отдает явное предпочтение выбору изображения из того же источника (source resource), что и текст. Это основной сценарий, направленный на обеспечение контекстуальной согласованности. Однако патент также упоминает альтернативные реализации, где, если в источнике текста нет подходящих изображений, система может выбрать изображение из других релевантных ресурсов, которые были проанализированы на проактивном этапе.

На основе чего ранжируются изображения для выбора в Featured Snippet?

Изображения ранжируются в первую очередь на основе их релевантности second query (обычно это основная тема или сущность вопроса). Затем эта оценка корректируется с учетом дополнительных факторов: расположения изображения на странице (image location), его типа (фильтрация иконок и клип-арта) и того, используется ли оно как ссылка.

Что такое Second Query и как его определить для моей страницы?

Second Query — это запрос, который система генерирует для поиска изображений. Согласно патенту, если вопрос касается конкретного экземпляра класса (например, [Скорость Теслы Модели S]), то second query будет [Тесла Модель S]. Если вопрос общий ([Самая быстрая машина]), то используется исходный запрос. Для оптимизации определите ключевую сущность вашего контента и убедитесь, что изображения релевантны именно ей.

Как расположение изображения на странице влияет на его выбор?

Влияние существенно. Патент явно упоминает image location как критерий выбора. Изображения, расположенные в центральных или выдающихся частях страницы (основной контент), имеют приоритет. Изображения из боковых панелей, футера или рекламных блоков с большей вероятностью будут понижены в рейтинге или проигнорированы.

Влияет ли alt-текст изображения на его выбор согласно этому патенту?

Патент не упоминает атрибут alt напрямую. Однако он упоминает использование стандартных механизмов ранжирования изображений в ответ на second query, где alt-текст и окружающий текст обычно играют роль. Также упоминаются image labels и метаданные для определения содержимого и типа изображения. Качественный alt-текст, описывающий сущность (second query), является лучшей практикой.

Почему система выполняет поиск изображений до того, как определит источник текста?

Это делается исключительно для оптимизации производительности и снижения задержки (latency). Поиск и оценка изображений — ресурсоемкий процесс. Выполняя его проактивно на пуле релевантных страниц, система гарантирует, что к моменту определения источника текста у нее уже будут готовые оценки для изображений с этой страницы.

Могут ли стоковые фотографии или клип-арт попасть в Featured Snippet?

Это маловероятно, если система работает так, как описано в патенте. В нем указано, что изображения, помеченные как клип-арт, иконки или элементы интерфейса, считаются малоинформативными и понижаются в рейтинге. Система отдает предпочтение контенту, который несет реальную информационную ценность по теме запроса.

Что произойдет, если на моей странице несколько хороших изображений?

Система предварительно ранжирует все изображения на вашей странице на основе их релевантности second query и корректирующих факторов (расположение, тип). Будет выбрано изображение с наивысшим итоговым рейтингом. Поэтому важно выделить одно главное изображение и оптимизировать его расположение.

Учитывает ли система сущности, изображенные на картинке?

Да, в одном из вариантов реализации, описанном в патенте (FIG. 3B), система может сравнивать сущность, указанную в текстовом ответе, с сущностями, идентифицированными в метаданных изображения. Совпадение может привести к повышению рейтинга изображения в процессе выбора (first image selection process).

Влияет ли этот патент на обычный поиск по картинкам (Google Images)?

Нет, этот патент специфичен для механизма выбора изображений, которые сопровождают прямые текстовые ответы (Answer Box, Featured Snippets) в основной поисковой выдаче. Он описывает узкоспециализированный процесс, интегрированный в обработку question queries, а не общие алгоритмы ранжирования в вертикали поиска по изображениям.

Похожие патенты

Как Google выбирает контекстуально релевантные изображения для блоков с ответами (Featured Snippets и Direct Answers)
Google улучшает блоки с ответами, добавляя релевантные изображения. Система объединяет вопрос и ответ в «контекстуальный запрос» для поиска изображений. Затем эти изображения фильтруются и переранжируются, чтобы гарантировать, что они представляют как тему вопроса, так и контекст ответа, обеспечивая более точное визуальное представление.
  • US8819006B1
  • 2014-08-26
  • Семантика и интент

  • SERP

  • Мультимедиа

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google извлекает факты напрямую из веб-страниц для формирования прямых ответов (Featured Snippets / Answer Boxes)
Google использует систему для динамического извлечения фактов из веб-индекса. Когда поступает фактический запрос, система определяет ожидаемый тип ответа (например, дата, число, имя), анализирует топовые результаты поиска и извлекает соответствующие фразы. Эти фразы нормализуются, оцениваются по частоте, контексту и авторитетности источника, и лучший вариант показывается в виде прямого ответа.
  • US8655866B1
  • 2014-02-18
  • Индексация

  • Семантика и интент

  • SERP

Как Google использует топовые результаты поиска для активации и выбора блоков с ответами (Answer Boxes/Featured Snippets)
Google может активировать блоки с ответами (Answer Boxes или Featured Snippets), анализируя не только сам запрос, но и топовые результаты поиска. Если ресурсы в выдаче ассоциированы с определенной темой (Answer Box Topic), система покажет соответствующий блок. Это позволяет точнее выбирать ответ при неоднозначных запросах и подчеркивает роль данных, предоставленных издателями.
  • US9355175B2
  • 2016-05-31
  • SERP

  • Семантика и интент

Как Google извлекает и ранжирует прямые ответы (Featured Snippets) из веб-страниц
Google использует систему для ответов на вопросы пользователей путем извлечения конкретных предложений из результатов поиска. Система оценивает предложения-кандидаты по трем критериям: насколько часто похожие фразы встречаются в других результатах (консенсус), насколько предложение соответствует запросу (релевантность) и насколько авторитетен источник (ранг документа). Лучшие ответы отображаются над стандартными результатами поиска.
  • US8682647B1
  • 2014-03-25
  • SERP

  • Семантика и интент

Популярные патенты

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео
Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.
  • US8903812B1
  • 2014-12-02
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)
Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.
  • US9223868B2
  • 2015-12-29
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

seohardcore