SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает главное изображение для сущности, анализируя тематичность веб-страниц и визуальные характеристики картинки

IDENTIFYING AN IMAGE FOR AN ENTITY (Идентификация изображения для сущности)
  • US9110943B2
  • Google LLC
  • 2013-01-31
  • 2015-08-18
  • Knowledge Graph
  • Мультимедиа
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на которых оно размещено. Изображения с нерелевантных страниц отфильтровываются. Финальный выбор делается на основе визуальных характеристик, таких как распознавание лиц, логотипов или флагов.

Описание

Какую проблему решает

Патент решает задачу автоматического выбора одного, наиболее репрезентативного или запоминающегося (evocative) изображения для конкретной сущности (человека, места, организации и т.д.). Это необходимо для представления сущности в поисковой выдаче, например, в Панели знаний (Knowledge Panel). Цель — гарантировать, что выбранное изображение тематически связано с сущностью и обладает оптимальными визуальными характеристиками.

Что запатентовано

Запатентована система для идентификации и ранжирования изображений, связанных с сущностью. Ключевым механизмом является оценка изображений не только по их собственным характеристикам, но и по контексту их размещения. Система рассчитывает оценки тематической релевантности (topical relatedness) как для самого изображения (Entity-Image Score), так и для веб-страницы, на которой оно размещено (Entity-Resource Score). Финальный выбор делается на основе Image Rank Score, учитывающего визуальные характеристики.

Как это работает

Система работает по одному из нескольких сценариев (или их гибриду):

  • Анализ контента (Corpus-Wide): Система анализирует веб-страницы и изображения на них, вычисляя Overall Entity Score (комбинация релевантности изображения и страницы сущности). Каждое изображение присваивается наиболее релевантной сущности.
  • Анализ запросов (Query-Based): Система определяет запросы, относящиеся к сущности (Entity Queries), и находит топовые изображения по этим запросам.
  • Фильтрация по тематичности источника: Изображения, найденные любым методом, проходят фильтрацию. Если изображение не размещено на достаточном количестве страниц, которые тематически связаны с сущностью (высокий Entity-Resource Score), оно удаляется из рассмотрения.
  • Ранжирование и выбор: Оставшиеся кандидаты ранжируются по Image Rank Score, который учитывает визуальные характеристики (размер, разрешение, распознавание лиц/логотипов). Выбирается лучшее изображение.

Актуальность для SEO

Высокая. С развитием Knowledge Graph и увеличением визуальных элементов в SERP, автоматический выбор репрезентативного изображения для сущностей критически важен для Google. Описанные механизмы, связывающие тематичность контента (topicality) с визуальным представлением сущности, остаются фундаментальными для работы поиска и формирования Knowledge Panels.

Важность для SEO

Патент имеет высокое значение для SEO, особенно в области управления репутацией (ORM), брендинга и Entity SEO. Он раскрывает, что для выбора главного изображения сущности Google отдает приоритет изображениям, размещенным на страницах, которые система считает наиболее авторитетными и тематически связанными с этой сущностью. Визуальное качество и оптимизация самого изображения важны, но они не помогут, если хост-страница нерелевантна.

Детальный разбор

Термины и определения

Entity (Сущность)
Идентифицируемый объект, такой как человек, место, страна, организация, спортивная команда, произведение искусства и т.д.
Entity-Image Score
Показатель тематической связи (topical relatedness) между самим изображением и конкретной сущностью. Основан на метаданных изображения, URL, имени файла, окружающем тексте.
Entity-Resource Score
Показатель тематической связи между ресурсом (веб-страницей), на котором размещено изображение, и конкретной сущностью. Указывает, насколько контент страницы посвящен этой сущности.
Entity Queries (Запросы сущности)
Поисковые запросы, которые система определила как запросы информации о конкретной сущности (часто на основе анализа поведения пользователей).
Evocative Image (Репрезентативное изображение)
Единственное изображение, выбранное системой как наилучшее представление сущности (например, для Панели знаний).
Image Rank Score
Финальная оценка для ранжирования изображений-кандидатов. Основана на визуальных характеристиках (visual characteristics), контенте изображения (лица, логотипы, флаги) и может также учитывать Entity-Image Score и количество ресурсов, использующих изображение.
Overall Entity Score
Комбинированная оценка, основанная на Entity-Image Score и Entity-Resource Score. Используется для определения, какую сущность лучше всего представляет данное изображение.
Resource (Ресурс)
Веб-страница или документ, содержащий изображения и текст.

Ключевые утверждения (Анализ Claims)

Патент содержит два основных независимых пункта (Claim 1 и Claim 14), описывающих разные подходы к выбору изображения.

Claim 1 (Независимый пункт): Описывает подход, основанный на анализе всего корпуса ресурсов (Corpus-Wide Assignment).

  1. Система идентифицирует набор ресурсов, содержащих изображения и упоминающих сущности.
  2. Для каждого изображения вычисляется Overall Entity Score по отношению к одной или нескольким сущностям.
  3. Критически важно: Overall Entity Score рассчитывается на основе (i) Entity-Image Score (релевантность изображения сущности) И (ii) Entity-Resource Score (релевантность хост-страницы сущности).
  4. Изображение присваивается конкретной сущности на основе этого Overall Entity Score (обычно той, у которой он максимален).
  5. Для каждой сущности формируется группа присвоенных ей изображений.
  6. Для каждого изображения в группе определяется Image Rank Score, основанный как минимум на visual characteristics изображения.
  7. Выбирается единственное репрезентативное изображение на основе Image Rank Scores.

Claim 14 (Независимый пункт): Описывает подход, основанный на анализе запросов (Query-based approach).

  1. Система идентифицирует Entity Queries для сущности.
  2. Идентифицируется набор изображений, релевантных этим запросам (например, Топ-N из поиска по картинкам).
  3. Идентифицируются ресурсы, которые содержат эти изображения.
  4. Для каждого ресурса вычисляется Entity-Resource Score (мера тематичности контента ресурса по отношению к сущности).
  5. Набор изображений фильтруется (Claim 15 уточняет: изображение остается, только если оно размещено на пороговом количестве тематичных ресурсов). Это означает, что изображения с нерелевантных страниц удаляются.
  6. Для оставшихся изображений вычисляется Image Rank Score, основанный как минимум на visual characteristics.
  7. Выбирается репрезентативное изображение на основе Image Rank Scores.

Зависимые пункты (Claims 4, 18, 19, 20): Детализируют расчет Image Rank Score в зависимости от типа сущности:

  • Для людей: оценка зависит от наличия лица (depiction of a face).
  • Для стран/штатов: оценка зависит от наличия флага (depiction of a flag).
  • Для организаций: оценка зависит от наличия логотипа (depiction of a logo).

Где и как применяется

Изобретение применяется на разных этапах поисковой архитектуры для обеспечения данными и выбора финального изображения.

INDEXING – Индексирование и извлечение признаков
Основная часть работы происходит на этом этапе в офлайн-режиме. Система анализирует ресурсы, извлекает изображения, идентифицирует сущности и вычисляет ключевые метрики: Entity-Resource Scores, Entity-Image Scores и Overall Entity Scores. Также происходит анализ визуальных характеристик и распознавание контента (лица, логотипы). Изображения ассоциируются с сущностями и сохраняются в Entity Index и Resource Index.

QUNDERSTANDING – Понимание Запросов
Система определяет (часто офлайн на основе исторических данных), какие запросы являются Entity Queries. Это используется в методах, основанных на запросах, для поиска кандидатов.

RANKING – Ранжирование (Image Search)
При использовании подхода на основе запросов (Claim 14) система выполняет стандартный или ограниченный поиск по изображениям для сбора кандидатов.

METASEARCH – Метапоиск и Смешивание
На этом этапе система использует результаты офлайн-обработки для формирования элементов SERP. Когда поисковая система определяет необходимость показать информацию о сущности (например, Knowledge Panel), она запрашивает у Image Selection Apparatus заранее выбранное репрезентативное изображение для этой сущности.

На что влияет

  • Конкретные типы контента: Влияет на представление любых сущностей в поиске, включая людей, организации, места, продукты, произведения искусства.
  • Специфические запросы: Наиболее заметно влияние на запросы, где пользователь ищет конкретную сущность (запросы, вызывающие появление Knowledge Panel).
  • Форматы контента: Влияет на выбор изображений для Knowledge Panels, каруселей и других структурированных элементов выдачи.

Когда применяется

Алгоритм применяется во время периодической офлайн-обработки данных для обновления выбора репрезентативных изображений для сущностей в базе данных.

  • Условия фильтрации: В методе, основанном на запросах, изображение остается в рассмотрении, только если по крайней мере пороговое количество (threshold number) ресурсов, на которых оно размещено, имеют Entity-Resource Score, удовлетворяющий пороговому значению (threshold score).

Пошаговый алгоритм

Патент описывает несколько вариантов реализации. Ниже приведены два основных.

Алгоритм А: Анализ всего корпуса (Основан на Claim 1 / FIG. 4)

  1. Сбор данных: Идентификация ресурсов и изображений в индексе.
  2. Расчет тематических оценок (для каждого изображения):
    • Вычисление Entity-Resource Score (насколько страница связана с сущностью).
    • Вычисление Entity-Image Score (насколько изображение связано с сущностью).
    • Вычисление Overall Entity Score путем комбинации (например, взвешенного среднего) предыдущих двух оценок.
  3. Ассоциация изображений: Каждое изображение ассоциируется с той сущностью, для которой его Overall Entity Score максимален.
  4. Группировка: Изображения группируются по назначенным им сущностям.
  5. Расчет Image Rank Score (для каждой группы): Расчет основан на:
    • Визуальных характеристиках (анализ на наличие лиц/флагов/логотипов в зависимости от типа сущности).
    • Технических параметрах (размер, разрешение).
    • Популярности (количестве ресурсов, включающих изображение).
  6. Выбор и Валидация: Выбор изображения с наивысшим Image Rank Score и проверка, что оно не размещено на нежелательных ресурсах (unqualified resources).

Алгоритм Б: Анализ на основе запросов (Основан на Claim 14 / FIG. 2)

  1. Идентификация Entity Queries: Для конкретной сущности определяются её Entity Queries.
  2. Сбор кандидатов: Выполняется поиск изображений по этим запросам, выбираются Топ-N результатов.
  3. Идентификация ресурсов и расчет тематичности: Для каждого изображения определяются хост-ресурсы и вычисляется их Entity-Resource Score.
  4. Фильтрация изображений (Критический шаг): Изображение удаляется из списка кандидатов, если оно не размещено на минимальном количестве тематических ресурсов (ресурсов с Entity-Resource Score выше порога).
  5. Расчет Image Rank Score: Для оставшихся изображений вычисляется Image Rank Score (аналогично Алгоритму А).
  6. Выбор: Выбирается изображение с наивысшим Image Rank Score.

Какие данные и как использует

Данные на входе

Система использует широкий спектр факторов для вычисления различных оценок.

Факторы для Entity-Resource Score (Тематичность страницы):

  • Контентные факторы: Количество упоминаний сущности или ее псевдонимов. Расположение упоминаний (заголовок, тело документа). Форматирование упоминаний (например, полужирный шрифт).
  • Технические факторы: URL ресурса, домен ресурса, метаинформация ресурса.

Факторы для Entity-Image Score (Тематичность изображения):

  • Контентные факторы: Контент, расположенный рядом с изображением на странице (content presented proximal to the image).
  • Технические факторы: URL изображения, имя файла изображения.
  • Структурные факторы: Мета-информация изображения (например, метка/label, заголовок/title изображения).

Факторы для Image Rank Score (Ранжирование изображений):

  • Мультимедиа факторы (Визуальные характеристики):
    • Анализ контента: Наличие лица (depiction of a face) для людей (может включать проверку пола); наличие флага для стран; наличие логотипа (depiction of a logo) для организаций.
    • Технические параметры: Размер изображения (количество пикселей), разрешение, соотношение сторон (aspect ratio).
  • Популярностные факторы: Количество ресурсов, которые включают данное изображение.
  • Системные данные: Может также учитывать Entity-Image Score или Overall Entity Score.

Факторы для определения Entity Queries:

  • Поведенческие факторы: Исторические данные о взаимодействии пользователей с результатами поиска (клики).

Какие метрики используются и как они считаются

  • Entity-Resource Score: Рассчитывается на основе анализа контентных и технических факторов страницы. Чем больше страница сфокусирована на сущности, тем выше балл.
  • Entity-Image Score: Рассчитывается на основе анализа метаданных изображения и окружающего текста.
  • Overall Entity Score: Может рассчитываться как среднее или взвешенное среднее (weighted average) из Entity-Image Score и Entity-Resource Score.
  • Image Rank Score: Комплексная метрика, агрегирующая оценки визуальных характеристик, результаты распознавания контента, популярность изображения и его тематические оценки.
  • Пороги фильтрации: Используются пороговые значения для Entity-Resource Score (порог тематичности) и пороговое количество тематичных ресурсов, необходимых для того, чтобы изображение прошло фильтрацию (в Алгоритме Б).

Выводы

  1. Контекст размещения изображения критически важен: Ключевой вывод патента — Google придает огромное значение тому, ГДЕ размещено изображение. Entity-Resource Score (тематичность хост-страницы сущности) используется либо как компонент для расчета Overall Entity Score (Алгоритм А), либо как жесткий фильтр (Алгоритм Б). Изображения, не размещенные на тематичных страницах, имеют мало шансов стать главным изображением сущности.
  2. Двойная оценка тематичности: Система оценивает тематичность на двух уровнях: самой картинки (Entity-Image Score) и страницы (Entity-Resource Score). Для достижения успеха необходима оптимизация обоих компонентов.
  3. Визуальные характеристики определяют победителя: После того как изображения прошли фильтры тематичности, финальный выбор определяется Image Rank Score, который сильно зависит от визуальных качеств и соответствия типу сущности (лицо для человека, логотип для компании, флаг для страны).
  4. Борьба с манипуляциями и обеспечение релевантности: Механизм фильтрации по Entity-Resource Score направлен на предотвращение ситуаций, когда нерелевантное изображение становится репрезентативным только потому, что оно часто встречается в поиске по имени сущности.
  5. Система стремится к однозначной классификации: В Алгоритме А каждое изображение присваивается только одной, наиболее релевантной сущности (по максимальному Overall Entity Score), что помогает разрешать неоднозначности (например, фото с несколькими людьми).

Практика

Best practices (это мы делаем)

  • Размещайте ключевые изображения на максимально тематичных страницах: Чтобы повлиять на выбор главного изображения для вашего бренда или персоны, убедитесь, что официальное изображение (логотип, портрет) размещено на странице с максимальным Entity-Resource Score. Это, как правило, страница «О нас», биография или главная страница, которая должна быть максимально сфокусирована на этой сущности (упоминания в Title, H1, основном тексте).
  • Оптимизируйте метаданные и окружение изображений: Работайте над повышением Entity-Image Score. Используйте чистые, описательные имена файлов, alt-тексты и заголовки (если применимо), которые четко идентифицируют сущность. Окружающий текст также должен быть релевантен сущности.
  • Используйте изображения, соответствующие типу сущности: Поскольку Image Rank Score учитывает специфические визуальные характеристики, используйте четкие портреты для людей (face detection), официальные логотипы для компаний (logo detection) и флаги для стран (flag detection).
  • Обеспечивайте высокое техническое качество: Используйте изображения высокого разрешения с правильным соотношением сторон, так как это учитывается в Image Rank Score.
  • Консолидируйте использование изображений: Система учитывает количество ресурсов, использующих изображение. Продвигайте использование одного и того же (канонического) файла изображения на разных авторитетных и тематических ресурсах, чтобы повысить его шансы на выбор.

Worst practices (это делать не надо)

  • Размещение важных изображений на нерелевантных страницах: Размещение логотипа компании только в футере или на странице вакансий снижает его шансы быть выбранным, так как эти страницы могут иметь низкий Entity-Resource Score по отношению к сущности «Компания».
  • Игнорирование визуального качества и соответствия типу: Использование маленьких, нечетких изображений или групповых фото вместо портрета приведет к низкому Image Rank Score.
  • Манипуляции с метаданными изображений (Keyword Stuffing): Переспам в alt-текстах не поможет, если хост-страница не является тематичной (низкий Entity-Resource Score). Система использует контекст страницы как основной фильтр или компонент оценки.
  • Использование разных версий логотипа/портрета: Распыление сигналов между разными файлами изображений снижает вероятность выбора любого из них в качестве главного.

Стратегическое значение

Патент подтверждает стратегию Google на использование Topical Authority (тематического авторитета) для оценки контента, включая изображения. Для SEO это означает, что управление представлением бренда в Knowledge Graph напрямую зависит от качества и тематичности контента на сайте. Невозможно оптимизировать изображение в отрыве от страницы, на которой оно размещено. Стратегия должна фокусироваться на создании авторитетных страниц, посвященных ключевым сущностям бизнеса.

Практические примеры

Сценарий: Выбор логотипа компании для Knowledge Panel

  1. Задача: Гарантировать, что Google выберет актуальный логотип компании «ExampleCorp» в качестве репрезентативного изображения.
  2. Анализ текущей ситуации: Google использует старый логотип, взятый со стороннего сайта.
  3. Действия по оптимизации:
    • Повышение Entity-Resource Score: Оптимизировать страницу «О компании» (example.com/about). Убедиться, что название «ExampleCorp» присутствует в Title, H1 и основном тексте. Сделать страницу максимально сфокусированной на компании.
    • Повышение Entity-Image Score: Разместить актуальный логотип на странице /about. Использовать имя файла examplecorp-logo.svg. Прописать alt="Логотип компании ExampleCorp". Окружить логотип текстом о компании.
    • Повышение Image Rank Score: Использовать высококачественный файл. Убедиться, что это четкий логотип (для logo detection).
    • Консолидация: Заменить старые логотипы на сайте на новый канонический файл. Обновить логотип в официальных профилях соцсетей и на авторитетных партнерских сайтах.
  4. Ожидаемый результат: При следующем пересчете оценок система определит, что страница /about имеет высокий Entity-Resource Score для «ExampleCorp», а новый логотип имеет высокий Entity-Image Score и Image Rank Score. Это приведет к его выбору в качестве главного изображения сущности.

Вопросы и ответы

Что важнее для выбора главного изображения сущности: качество самой картинки или авторитетность/тематичность страницы, где она размещена?

Оба фактора критически важны, но они работают на разных этапах. Тематичность страницы (Entity-Resource Score) часто действует как первичный фильтр. Если изображение размещено на нерелевантных страницах, оно, скорее всего, будет исключено из рассмотрения. Среди изображений, прошедших этот фильтр, побеждает то, у которого выше качество и лучше визуальные характеристики (Image Rank Score).

Как рассчитывается Entity-Resource Score (тематичность страницы)?

Патент указывает, что этот балл основан на анализе контента страницы. Ключевые факторы включают количество упоминаний сущности или её псевдонимов, местоположение этих упоминаний (Title, основной контент имеют больший вес), а также форматирование текста. Страница, полностью посвященная сущности, получит более высокий балл, чем страница, где сущность упоминается мимоходом.

Как Google понимает, что изображено на картинке при расчете Image Rank Score?

Система использует технологии компьютерного зрения, адаптированные под тип сущности. Если сущность — человек, активируется распознавание лиц (face detection), и предпочтение отдается четким портретам. Для организаций используется распознавание логотипов (logo detection), а для стран — распознавание флагов (flag detection). Также учитываются базовые визуальные характеристики: размер, разрешение и соотношение сторон.

Мой логотип размещен на главной странице, но Google все равно выбирает другое изображение для Knowledge Panel. Почему?

Это может происходить по нескольким причинам. Возможно, ваша главная страница недостаточно сфокусирована на сущности (низкий Entity-Resource Score) по сравнению со страницей, откуда взято текущее изображение (например, статья в Википедии). Также возможно, что ваш логотип имеет низкие визуальные характеристики (низкий Image Rank Score) или плохо оптимизированные метаданные (низкий Entity-Image Score).

Влияет ли оптимизация изображений (alt, title, имя файла) на этот процесс?

Да, напрямую. Эти элементы используются для расчета Entity-Image Score — показателя тематической связи между изображением и сущностью. Хорошо оптимизированные метаданные повышают этот балл, что, в свою очередь, увеличивает Overall Entity Score и может повлиять на финальный Image Rank Score.

Как система обрабатывает изображения, на которых изображено несколько сущностей (например, групповое фото)?

В подходе, основанном на анализе корпуса (Алгоритм А), система рассчитывает Overall Entity Score для каждой сущности на изображении. Изображение присваивается только той сущности, которая получила максимальную оценку. Эта оценка сильно зависит от контекста страницы: если фото двух людей чаще появляется на страницах про человека А, оно будет присвоено человеку А.

Что такое Entity Queries и как они используются?

Entity Queries — это запросы, которые Google считает однозначными запросами информации о сущности (например, «Apple» как запрос о компании). Они определяются на основе исторического поведения пользователей. В одном из вариантов алгоритма (Алгоритм Б) они используются для первичного сбора изображений-кандидатов путем выполнения поиска по картинкам.

Влияет ли разметка Schema.org (например, свойство logo или image) на этот процесс?

Патент напрямую не упоминает использование структурированных данных Schema.org. Однако он упоминает использование «метаинформации» ресурса и изображения. Логично предположить, что структурированные данные могут служить дополнительным сигналом для расчета Entity-Image Score или Entity-Resource Score, подтверждая связь между контентом и сущностью.

Если одно и то же изображение используется на многих сайтах, это хорошо?

Да, это положительный фактор. Патент указывает, что количество ресурсов, включающих изображение, может использоваться при расчете Image Rank Score. Однако важно, чтобы эти ресурсы были тематически связаны с сущностью (имели высокий Entity-Resource Score). Использование изображения на множестве авторитетных и релевантных сайтов повышает его шансы быть выбранным.

Как бороться с негативным изображением, которое Google выбрал для сущности?

Необходимо сместить фокус системы на более предпочтительные изображения. Для этого нужно создать и продвинуть альтернативные изображения, размещенные на страницах с более высоким Entity-Resource Score, чем у источника негатива. Также эти альтернативы должны обладать лучшими визуальными характеристиками (высокий Image Rank Score). Это требует комплексной работы над контентом и ORM.

Похожие патенты

Как Google выбирает главное (репрезентативное) изображение страницы для показа в результатах поиска
Google использует систему для автоматического выбора наилучшего изображения, представляющего содержание статьи или веб-страницы. Система анализирует все изображения на странице, оценивая их характеристики (размер, формат, расположение, контекст) и присваивая им оценку (Image Data Score). Цель – отличить содержательные фотографии от элементов дизайна или иконок. Изображение с наивысшей оценкой выбирается в качестве репрезентативного для показа в SERP, Новостях или Discover.
  • US7580568B1
  • 2009-08-25
  • Мультимедиа

  • SERP

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google использует Граф Знаний для выбора, группировки и ранжирования связанных сущностей в Knowledge Panel
Google использует этот механизм для определения того, какие группы связанных сущностей (например, "Фильмы", "Члены семьи", "Коллеги") показать в Панели Знаний. Система анализирует пути в Графе Знаний, группирует сущности по типу их связи (Path Type) и ранжирует эти группы по популярности и силе связи (Relationship Strength), основанной на совместном упоминании в вебе и запросах.
  • US9411857B1
  • 2016-08-09
  • Knowledge Graph

  • Семантика и интент

Как Google выбирает лучшую целевую страницу (Landing Page) для результатов поиска по картинкам
Google использует запатентованный метод для выбора наилучшего контекста для изображения в поиске по картинкам. Когда одно и то же или похожее изображение появляется на нескольких сайтах, система оценивает качество и важность каждой веб-страницы (Web Score). Страница с наивысшей оценкой выбирается в качестве официальной целевой страницы (Landing Page), на которую попадает пользователь при клике на результат.
  • US9158857B2
  • 2015-10-13
  • Мультимедиа

  • EEAT и качество

  • SERP

Популярные патенты

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank
Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.
  • US7565630B1
  • 2009-07-21
  • Персонализация

  • SERP

  • Ссылки

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.
  • US8005716B1
  • 2011-08-23
  • Поведенческие сигналы

  • Семантика и интент

  • Антиспам

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google переносит вес поведенческих сигналов (кликов) между связанными запросами для улучшения ранжирования
Google улучшает ранжирование по редким или новым запросам, для которых недостаточно собственных данных, используя поведенческие сигналы (Clickthrough Data) из связанных запросов. Если пользователи часто вводят запросы последовательно, система идентифицирует связь и переносит данные о кликах с одного запроса на другой, позволяя документам с высоким engagement ранжироваться выше по всему кластеру.
  • US7505964B2
  • 2009-03-17
  • Поведенческие сигналы

  • SERP

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
  • US9268880B2
  • 2016-02-23
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

seohardcore