SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает контекстуально релевантные изображения для блоков с ответами (Featured Snippets и Direct Answers)

RICH CONTENT FOR QUERY ANSWERS (Обогащенный контент для ответов на запросы)
  • US8819006B1
  • Google LLC
  • 2013-12-31
  • 2014-08-26
  • Семантика и интент
  • SERP
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google улучшает блоки с ответами, добавляя релевантные изображения. Система объединяет вопрос и ответ в «контекстуальный запрос» для поиска изображений. Затем эти изображения фильтруются и переранжируются, чтобы гарантировать, что они представляют как тему вопроса, так и контекст ответа, обеспечивая более точное визуальное представление.

Описание

Какую проблему решает

Патент решает проблему выбора обогащенного контента (например, изображений), который точно соответствует контексту прямого ответа на вопрос. Система стремится избежать показа изображений, которые релевантны только сущности ответа, но не учитывают специфику заданного вопроса. Например, на запрос «Столица Калифорнии» (ответ: «Сакраменто») система должна показать здание Капитолия, а не логотип спортивной команды из Сакраменто.

Что запатентовано

Запатентована система для выбора контекстуально релевантного обогащенного контента (Rich Content) для сопровождения прямых ответов. Система генерирует Contextual Query, объединяя элементы вопроса и ответа. Затем она использует специальные методы фильтрации и переранжирования (Context Conditions), чтобы гарантировать, что выбранный контент релевантен комбинации вопроса и ответа, а не только одному из них.

Как это работает

Система работает следующим образом:

  • Идентификация: Определяется вопрос (Q) и соответствующий ответ (A).
  • Генерация контекста: Создается Contextual Query (CQ), например, путем конкатенации Q и A.
  • Поиск контента: CQ отправляется в систему поиска обогащенного контента (например, поиск по картинкам).
  • Оценка контекста: Полученные результаты оцениваются на соответствие Context Condition — условию, которое проверяет, предоставляет ли контент информацию как о вопросе, так и об ответе. Патент описывает три метода для этой оценки.
  • Переранжирование: Контент, не соответствующий условию, понижается в рейтинге (демотивируется).
  • Выбор: Наиболее высокоранжированный контент после переранжирования выбирается для показа вместе с ответом.

Актуальность для SEO

Высокая. Блоки с ответами (Direct Answers), Панели Знаний (Knowledge Panels) и Избранные Сниппеты (Featured Snippets) занимают центральное место в современной поисковой выдаче. Выбор правильного изображения для этих блоков критически важен для точности информации и пользовательского опыта. Описанные механизмы, включая использование компьютерного зрения, напрямую влияют на то, как Google визуализирует факты и сущности в контексте.

Важность для SEO

Влияние на SEO значительно (7.5/10), но специфично. Патент не влияет на традиционное ранжирование веб-страниц, но критически важен для видимости внутри блоков с ответами. Он описывает механизм, который определяет, какое именно изображение будет выбрано для представления сущности или факта в определенном контексте. Это подчеркивает важность оптимизации изображений не только под ключевые слова, но и под контекстуальную релевантность для захвата визуального пространства в SERP.

Детальный разбор

Термины и определения

Answer (Ответ)
Факт или информация, являющаяся ответом на Question Query.
Context Condition (Условие контекста)
Критерий, используемый для оценки того, предоставляет ли элемент обогащенного контента контекстуальную информацию как об элементах вопроса, так и об элементах ответа.
Contextual Query (CQ) (Контекстуальный запрос)
Запрос, сгенерированный путем объединения элементов Question Query и Answer (например, конкатенация терминов или связанных сущностей). Используется для поиска потенциально релевантного Rich Content.
First Rich Content Items / First Images (Первые элементы контента)
Элементы контента, которые удовлетворяют Context Condition. Они получают приоритет при выборе.
Image Labels / Rich Content Labels (Метки изображения)
Текстовые данные, связанные с изображением (метаданные, окружающий текст, теги, описания сущностей, распознанных на изображении), которые описывают его содержание.
Question Query (Вопросительный запрос)
Запрос пользователя, который система идентифицирует как поиск конкретного ответа (факта).
Rich Content (Обогащенный контент)
Нетекстовый контент, такой как изображения, видео или аудио, используемый для дополнения текстового ответа.
Second Rich Content Items / Second Images (Вторые элементы контента)
Элементы контента, которые не удовлетворяют Context Condition. Они понижаются в ранжировании (демотивируются).

Ключевые утверждения (Анализ Claims)

Патент описывает несколько реализаций (embodiments) для определения Context Condition. Ключевые Claims покрывают три основных метода: сравнение наборов результатов, анализ меток и распознавание сущностей.

Метод 1: Сравнение наборов результатов

Claim 1 (Независимый пункт): Описывает процесс использования нескольких поисковых запросов для определения контекста.

  1. Система получает Вопрос (Q) и Ответ (A).
  2. Генерируется Контекстуальный запрос (CQ).
  3. Система выполняет три поиска: по CQ (получает Набор 1), по Q (получает Набор 2) и по A (получает Набор 3).
  4. Определяются Second Rich Content Items: элементы в Наборе 1, которые присутствуют хотя бы в одном из Наборов 2 или 3.
  5. Определяются First Rich Content Items: элементы в Наборе 1, которые НЕ присутствуют ни в Наборе 2, ни в Наборе 3 (т.е. уникальны для CQ).
  6. Система отдает предпочтение First Rich Content Items при выборе контента для ответа.

Этот метод основан на предположении, что контент, уникальный для комбинированного запроса (CQ), лучше отражает контекст, чем контент, который также высоко ранжируется по отдельным компонентам (Q или A).

Метод 2: Анализ меток

Claim 8 (Независимый пункт): Описывает процесс использования метаданных контента для определения контекста.

  1. Система получает Q, A, генерирует CQ и получает Набор 1 результатов для CQ.
  2. Для каждого элемента в Наборе 1 извлекаются связанные с ним метки (Rich Content Labels).
  3. Определяются First Rich Content Items: элементы, чьи метки соответствуют терминам ИЗ ОТВЕТА и терминам ИЗ ВОПРОСА.
  4. Определяются Second Rich Content Items: элементы, чьи метки не соответствуют терминам из обеих частей (например, только из ответа или только из вопроса).
  5. Система отдает предпочтение First Rich Content Items.

Метод 3: Распознавание сущностей (Компьютерное зрение)

Claim 9 (Независимый пункт): Описывает использование технологий обработки контента (например, компьютерного зрения) для определения контекста.

  1. Система получает Q, A, генерирует CQ и получает Набор 1 результатов для CQ.
  2. Для каждого элемента в Наборе 1 система анализирует содержание (rich content item processing) и распознает изображенные сущности (например, лица, объекты, логотипы).
  3. Определяются First Rich Content Items: элементы, изображающие сущности, которые описываются как терминами ответа, так и терминами вопроса.
  4. Определяются Second Rich Content Items: элементы, не изображающие сущности, соответствующие обеим частям.
  5. Система отдает предпочтение First Rich Content Items.

Где и как применяется

Изобретение применяется на финальных этапах формирования поисковой выдачи, когда система готовит блок с прямым ответом.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка медиаконтента: извлечение и сохранение Rich Content Labels, а также обработка изображений с помощью компьютерного зрения для распознавания сущностей.

QUNDERSTANDING – Понимание Запросов
На этом этапе Query Question Processor должен определить, что запрос является вопросительным (Question Query), и найти соответствующий ответ (Answer). Это является триггером для активации описанной системы.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основной этап работы алгоритма. Rich Content Processor запускает процесс:

  1. Поиск: Генерируется Contextual Query и выполняется поиск в индексе обогащенного контента. В зависимости от метода, может выполняться один или три поиска.
  2. Оценка контекста: Применяется Context Condition (с использованием одного из трех методов).
  3. Корректировка ранжирования: Результаты классифицируются как First или Second Items. Second Items демотивируются (понижаются) относительно First Items.
  4. Смешивание: Лучший результат выбирается и встраивается в блок ответа (Answer Box, Featured Snippet) для показа на SERP.

Входные данные:

  • Вопросительный запрос (Q).
  • Ответ (A).
  • Результаты поиска по картинкам (Наборы 1, 2, 3) с их оценками релевантности.
  • Метки изображений (Rich Content Labels) и данные распознавания сущностей.

Выходные данные:

  • Одно или несколько изображений (Answer Rich Content Items), выбранных как наиболее контекстуально релевантные для пары Q+A.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на изображения, отображаемые в блоках с ответами (Direct Answers), Панелях Знаний (Knowledge Panels) и Избранных Сниппетах (Featured Snippets).
  • Специфические запросы: Влияет на информационные запросы, подразумевающие конкретный фактический ответ (например, «кто», «что», «где», «когда»).
  • Конкретные ниши: Влияет на любые тематики, где важен контекст сущности (история, биографии, география, определения).

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда поисковая система идентифицирует запрос как Question Query, находит конкретный Answer и принимает решение дополнить ответ обогащенным контентом (изображением).

Пошаговый алгоритм

Процесс выбора контекстуального изображения:

  1. Идентификация Запроса и Ответа: Система получает запрос и определяет его как Question Query (Q). Находится соответствующий Answer (A).
  2. Генерация Контекстуального Запроса: Генерируется Contextual Query (CQ), например, путем объединения терминов из Q и A.
  3. Получение Кандидатов (Поиск): CQ отправляется в систему поиска изображений. Возвращается Набор 1 изображений, ранжированных по релевантности CQ.
  4. Оценка Контекста (Contextual Evaluation): Система определяет, какие изображения удовлетворяют Context Condition. Этот шаг может выполняться одним из следующих методов:

    Метод 1 (Сравнение наборов):

    • Выполняются дополнительные поиски по Q (Набор 2) и A (Набор 3).
    • Изображение из Набора 1 удовлетворяет условию, если оно НЕ найдено ни в Наборе 2, ни в Наборе 3.

    Метод 2 (Анализ меток):

    • Извлекаются Rich Content Labels для изображений из Набора 1.
    • Изображение удовлетворяет условию, если его метки содержат термины, соответствующие как Q, так и A.

    Метод 3 (Распознавание сущностей):

    • Изображения из Набора 1 анализируются (например, с помощью компьютерного зрения) для распознавания сущностей.
    • Изображение удовлетворяет условию, если распознанные сущности соответствуют как Q, так и A.
  5. Классификация: Изображения из Набора 1 классифицируются на First Images (удовлетворяют условию) и Second Images (не удовлетворяют).
  6. Корректировка Ранжирования (Ranking Adjustment): Second Images понижаются (демотивируются) относительно First Images. Набор 1 переранжируется в соответствии с пересмотренным порядком. Патент упоминает, что демотивация может быть фиксированной или переменной.
  7. Выбор: Одно или несколько изображений с наивысшим рейтингом в пересмотренном порядке выбираются для показа вместе с ответом.

Какие данные и как использует

Данные на входе

Система использует различные типы данных в зависимости от применяемого метода оценки контекста.

Для всех методов:

  • Системные данные: Оценки релевантности изображений относительно запросов (CQ, Q, A).

Для Метода 1 (Сравнение наборов):

  • Системные данные: Состав и порядок ранжирования результатов поиска по трем разным запросам (CQ, Q, A). Используются идентификаторы изображений для сравнения наборов.

Для Метода 2 (Анализ меток):

  • Контентные и Структурные факторы: Rich Content Labels. Патент определяет их широко: метаданные, окружающий текст на странице, подписи, alt-текст, текст ссылок, указывающих на изображение, и другие текстовые дескрипторы.

Для Метода 3 (Распознавание сущностей):

  • Мультимедиа факторы: Непосредственно данные изображения (пиксели), которые анализируются алгоритмами компьютерного зрения для распознавания объектов, лиц, достопримечательностей.

Какие метрики используются и как они считаются

  • Context Condition (Условие контекста): Булева метрика (Да/Нет), рассчитываемая на основе сравнения наборов, совпадения меток с терминами Q и A, или совпадения распознанных сущностей с Q и A.
  • Demotion Factor (Фактор понижения): Величина, на которую снижается рейтинг Second Images. Патент предлагает несколько вариантов расчета:
    • Фиксированное понижение (на N позиций или скалярный множитель для оценки релевантности).
    • Переменное понижение. Например, в Методе 1 изображение может быть понижено пропорционально его ординальной позиции в Наборе 2 или 3 (чем выше позиция в индивидуальном поиске, тем сильнее понижение в контекстуальном).
    • Дифференцированное понижение. Например, понижение меньше, если изображение присутствует и в Наборе 2, и в Наборе 3, по сравнению с присутствием только в одном из них (Claim 5).

Выводы

  1. Контекст определяет выбор изображения для ответов: Google активно стремится к тому, чтобы изображения в блоках ответов соответствовали специфическому контексту запроса (Вопрос+Ответ), а не только главной сущности ответа. Система готова пожертвовать общей популярностью изображения ради его контекстуальной точности.
  2. Множественные пути оценки контекста: Google запатентовал три различных подхода к проверке контекста: анализ поведения результатов в поиске (сравнение наборов), анализ текстовых данных, связанных с изображением (метки), и анализ самого изображения (компьютерное зрение). Это обеспечивает надежность системы.
  3. Демотивация общей релевантности (Метод 1): Метод сравнения наборов явно предпочитает изображения, которые уникальны для контекстуального запроса, и демотивирует те, которые также высоко ранжируются по вопросу или ответу отдельно. Это механизм для отсеивания слишком общих или популярных, но менее точных изображений.
  4. Важность текстового окружения изображений (Метод 2): Метод анализа меток подчеркивает критическую важность наличия дескриптивного текста (Rich Content Labels), который связывает сущности на изображении с контекстом их использования.
  5. Интеграция компьютерного зрения (Метод 3): Патент подтверждает использование технологий распознавания изображений для определения релевантности контента запросу, что подчеркивает важность четкости и содержания самого изображения.

Практика

Best practices (это мы делаем)

  • Оптимизируйте изображения под контекстуальную релевантность (Q+A): При работе над контентом, нацеленным на блоки с ответами, убедитесь, что изображения точно отражают описываемый факт или отношение. Если вы пишете о Сакраменто как о столице, используйте изображение Капитолия, а не общей панорамы города.
  • Используйте дескриптивные метки и окружение (Метод 2): Критически важно обеспечить Google достаточными текстовыми сигналами (Rich Content Labels) для связи изображения с контекстом.
    • Окружающий текст и заголовки: Размещайте изображение рядом с текстом, который содержит термины как из потенциального вопроса, так и из ответа.
    • Подписи (Captions) и Alt-текст: Используйте подписи и alt-текст, которые четко описывают контекст. Например, «Google CEO Sundar Pichai (A) at the 2025 I/O Conference (Q context)».
  • Создавайте изображения, четко отображающие отношения (Метод 3): Используйте изображения, где ключевые сущности взаимодействуют или представлены вместе. Например, для ответа на вопрос «Вице-президент Билла Клинтона» предпочтительнее изображение, где Клинтон и Гор вместе. Система распознавания сущностей должна идентифицировать обоих.
  • Анализируйте распознавание сущностей: Используйте инструменты (например, Google Vision AI), чтобы проверить, какие сущности Google распознает на ваших изображениях, и убедитесь, что они соответствуют контексту Q+A.

Worst practices (это делать не надо)

  • Использование общих или неточных изображений: Использование стоковых фотографий или изображений, лишь косвенно связанных с темой, снижает вероятность их выбора системой.
  • Оптимизация только под сущность ответа: Фокусировка Image SEO только на названии главной сущности (Ответ) без учета контекста (Вопрос) неэффективна. Изображение может быть классифицировано как Second Image и демотивировано.
  • Отсутствие текстового контекста: Размещение важных изображений без сопроводительного текста, подписей или с пустыми/общими alt-атрибутами не позволяет системе (использующей Метод 2) верифицировать Context Condition.
  • Сложные изображения с множеством сущностей: В патенте упоминается вариант, когда изображения, содержащие дополнительные сущности помимо тех, что указаны в вопросе и ответе, могут быть понижены. Лучше использовать сфокусированные изображения.

Стратегическое значение

Патент подчеркивает стратегическую важность Image SEO за пределами традиционного поиска по картинкам. Видимость в Панелях Знаний и блоках ответов часто зависит от наличия наилучшего контекстуального изображения. Это демонстрирует стремление Google понимать не только текст и не только изображения, но и то, как они связаны между собой и как они отражают отношения между сущностями в реальном мире. Для SEO-стратегии это означает необходимость интеграции оптимизации изображений в процесс создания контента с фокусом на контекст и семантику.

Практические примеры

Сценарий: Оптимизация статьи для попадания в блок ответа на запрос «Кто муж Име Старр?»

  1. Анализ: Вопрос (Q): «Муж Име Старр». Ответ (A): «Хеса Старр». Контекстуальный запрос (CQ): «Муж Име Старр Хеса Старр».
  2. Цель: Сделать изображение на странице предпочтительным для этого контекста.
  3. Выбор изображения: Использовать совместное фото Име и Хеса Старр. Избегать фото только Хеса Старр или только Име Старр.
  4. Действия (Метод 2 - Метки):
    • Добавить подпись: «Име Старр со своим мужем Хеса Старр на церемонии награждения».
    • Указать Alt-текст: "Име Старр и ее муж Хеса Старр".
    • Убедиться, что окружающий текст обсуждает их брак.
    • В этом случае Rich Content Labels будут содержать «Име Старр», «Хеса Старр» и «муж». Условие контекста выполнено.
  5. Действия (Метод 3 - Сущности):
    • Использовать четкое изображение, где система компьютерного зрения может распознать лица обоих людей.
  6. Ожидаемый результат: Система классифицирует это изображение как First Image. Изображения, содержащие только одного из них, будут классифицированы как Second Images и демотивированы. Наше контекстуальное изображение будет выбрано для блока ответа.

Вопросы и ответы

Что такое «Contextual Query» в этом патенте и как он формируется?

Contextual Query (CQ) — это запрос, который система генерирует для поиска обогащенного контента, релевантного как вопросу (Q), так и ответу (A). Чаще всего он формируется путем конкатенации терминов из Q и A. Например, если Q=«Столица Калифорнии» и A=«Сакраменто», то CQ может быть «Столица Калифорнии Сакраменто». Также он может включать синонимы или связанные сущности.

Что такое «Context Condition» и почему это важно?

Context Condition — это критерий, проверяющий, действительно ли изображение соответствует контексту пары Вопрос+Ответ. Это важно, чтобы избежать показа неточных или слишком общих изображений. Система гарантирует, что показанное изображение связано не только с сущностью ответа, но и с тем, что именно о ней спрашивал пользователь.

Какие три основных метода использует Google для проверки контекста изображений согласно патенту?

Google использует три метода. Метод 1 (Сравнение наборов): проверяет, появляется ли изображение в результатах поиска по отдельным компонентам (Q или A); если да, оно может быть демотивировано. Метод 2 (Анализ меток): проверяет, содержат ли текстовые данные, связанные с изображением (Rich Content Labels), термины как из Q, так и из A. Метод 3 (Распознавание сущностей): использует компьютерное зрение для идентификации сущностей на изображении и проверяет их соответствие Q и A.

Метод 1 (Сравнение наборов) кажется нелогичным. Почему Google демотивирует изображения, которые релевантны отдельным частям запроса?

Логика этого метода в том, чтобы найти контент, который уникально релевантен именно комбинации понятий. Если изображение высоко ранжируется только по ответу (например, популярное фото «Сакраменто»), оно может быть слишком общим для контекста «Столица Калифорнии». Система предпочитает изображения, которые появляются только при поиске по комбинированному запросу, считая их более контекстуально точными.

Как этот патент влияет на оптимизацию Featured Snippets?

Влияние прямое, если Featured Snippet содержит изображение. Система, описанная в патенте, используется для выбора изображения, которое сопровождает текст сниппета. Чтобы увеличить шансы на выбор вашего изображения, оно должно строго соответствовать контексту вопроса, на который отвечает сниппет, и иметь соответствующее текстовое окружение (Rich Content Labels).

Что важнее для этого алгоритма: качество изображения или его текстовое окружение?

Оба фактора важны, но текстовое окружение (Rich Content Labels) критично для верификации контекста (Метод 2). Без четких текстовых сигналов система не сможет подтвердить контекстуальную релевантность. Качество и четкость изображения также важны, особенно для Метода 3 (распознавание сущностей).

Как я могу оптимизировать свои изображения, чтобы воспользоваться этим алгоритмом?

Ключ к оптимизации — обеспечение контекстуальной точности. Используйте изображения, которые визуально представляют факт или отношение. Окружите изображение текстом, содержащим термины как из вопроса, так и из ответа. Используйте дескриптивные подписи (captions) и alt-текст, которые четко связывают эти понятия.

Что такое «Rich Content Labels» и откуда Google их берет?

Rich Content Labels — это все текстовые данные, ассоциированные с изображением. Google извлекает их из различных источников: метаданных изображения, окружающего текста на странице, заголовков, подписей (captions), alt-текста, анкоров ссылок, ведущих на изображение, а также из названий сущностей, распознанных на самом изображении.

Может ли изображение быть понижено, если оно содержит слишком много информации?

Да. В патенте упоминается вариант реализации, при котором изображение, метки которого соответствуют вопросу и ответу, но также содержат много других сущностей, может быть классифицировано как Second Rich Content Item и понижено. Это делается для обеспечения максимального фокуса на контексте ответа.

Применяется ли этот алгоритм только к изображениям?

Патент в основном использует изображения в качестве примера, но терминология Rich Content подразумевает, что те же принципы могут применяться к другим типам нетекстового контента, таким как видео или аудио, если они используются для сопровождения прямых ответов.

Похожие патенты

Как Google выбирает изображения для блоков с ответами (Featured Snippets), обеспечивая контекст и скорость
Google использует многоэтапный процесс для выбора изображений, отображаемых рядом с прямыми ответами на вопросы. Система генерирует отдельный запрос для поиска изображений на основе темы вопроса и заранее оценивает изображения на релевантных страницах. Когда источник текстового ответа определен, Google отдает предпочтение лучшему изображению с этой же страницы, гарантируя его контекстуальную связь с ответом.
  • US10691746B2
  • 2020-06-23
  • Мультимедиа

  • SERP

  • Семантика и интент

Как Google контекстуально выбирает изображения и отзывы для локаций на основе атрибутов запроса пользователя
Google использует машинное обучение для анализа изображений и отзывов о местах (например, ресторанах) и связывания их с конкретными атрибутами (например, "есть детское меню", "вид на горы"). При поиске система динамически ранжирует этот контент, отдавая приоритет тем изображениям и отзывам, которые наиболее релевантны атрибутам, указанным в запросе пользователя.
  • US10671660B2
  • 2020-06-02
  • Семантика и интент

  • Мультимедиа

  • Local SEO

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени
Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.
  • US10311096B2
  • 2019-06-04
  • Мультимедиа

  • SERP

  • Поведенческие сигналы

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
  • US8775436B1
  • 2014-07-08
  • Мультимедиа

  • Семантика и интент

  • SERP

Популярные патенты

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов
Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.
  • US20140372873A1
  • 2014-12-18
  • Структура сайта

  • Техническое SEO

  • Ссылки

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
  • US10073882B1
  • 2018-09-11
  • Семантика и интент

  • Поведенческие сигналы

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

seohardcore