SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей

LINK-BASED RANKING OF OBJECTS THAT DO NOT INCLUDE EXPLICITLY DEFINED LINKS (Ранжирование на основе ссылок для объектов, не включающих явно определенные ссылки)
  • US8732187B1
  • Google LLC
  • 2008-04-08
  • 2014-05-20
  • Ссылки
  • Мультимедиа
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.

Описание

Какую проблему решает

Патент решает проблему объективной оценки качества и ранжирования объектов, которые не имеют явных гиперссылок (например, изображения, видео, аудиофайлы, товары). Традиционные методы ранжирования изображений часто полагаются на окружающий текст, что может быть неточно и приводить к выдаче низкокачественных или нерелевантных изображений. Изобретение предлагает метод применения алгоритмов анализа ссылок (подобных PageRank) к таким объектам для определения их качества на основе самого контента, контекста и взаимодействия пользователей.

Что запатентовано

Запатентована система для генерации оценок ранжирования на основе ссылок (link-based ranking scores) для объектов без явных ссылок. Система создает «виртуальные ссылки» (virtual links), которые представляют собой «Вероятности перехода» (Transitional Probabilities) между объектами. Эти вероятности рассчитываются на основе метрик схожести контента (например, визуальных признаков), данных о поведении пользователей (click-data) и анализа связанных документов.

Как это работает

Система функционирует как Марковская сеть, где объекты являются узлами, а виртуальные ссылки — переходами:

  • Определение схожести или Сбор данных: Рассчитывается метрика схожести (Similarity Metric) между парами объектов на основе их контента, либо собираются данные о кликах (click-data).
  • Расчет Вероятности Перехода: Метрика схожести конвертируется в Transitional Probability P(A→B)P(A\rightarrow B)P(A→B). Ключевой особенностью является использование функции конвертации (Conversion Function), которая штрафует объекты, слишком похожие друг на друга (дубликаты), чтобы избежать избыточности.
  • Модификация Вероятностей: Вероятности модифицируются на основе независимых метрик качества (Quality(A)) и анализа URL/документов (LINKSIM(A,B)).
  • Расчет Ранжирования: Модифицированные Transitional Probabilities используются как виртуальные ссылки в алгоритме анализа ссылок (концептуально – VisualRank) для определения итоговой оценки качества каждого объекта.

Актуальность для SEO

Высокая. Ранжирование в поиске по картинкам, видео и товарам является критически важной задачей для Google. Понимание того, как Google оценивает медиафайлы не только по связанному тексту, но и по их визуальным характеристикам, уникальности, контексту размещения и вовлеченности пользователей, имеет ключевое значение. Описанные концепции лежат в основе современных систем медиа-поиска.

Важность для SEO

Высокое (85/100). Патент имеет критическое значение для специалистов, занимающихся Image SEO, Video SEO и продвижением в E-commerce (Product Search). Он описывает фундаментальный механизм, определяющий «авторитетность» или «качество» медиафайла на основе его визуального содержания, контекста размещения (URL analysis) и того, как пользователи взаимодействуют с ним и похожими объектами. Это напрямую влияет на видимость контента в медиа-вертикалях поиска.

Детальный разбор

Термины и определения

Click-data (Данные о кликах)
Данные, собранные о поведении пользователей, фиксирующие, какие объекты пользователи выбирают или просматривают последовательно в рамках одной сессии.
Content-based Similarity Metric (Метрика схожести контента)
Числовое значение, определяющее степень схожести между двумя объектами на основе их содержания (например, визуальных признаков изображений).
Conversion Function (Функция конвертации)
Функция (например, Бета-распределение), преобразующая Similarity Metric в Transitional Probability. Она разработана так, чтобы увеличивать вероятность перехода при росте схожести, но резко снижать её после определенного порога (Cutoff Point), чтобы штрафовать дубликаты.
Image Features (Признаки изображения)
Характеристики изображения, используемые для сравнения. Включают гистограммы интенсивности, цвета, краев, текстуры, а также инвариантные признаки (например, SIFT).
LINKSIM(A,B) (Hyperlink-induced similarity / Анализ URL)
Метрика схожести между объектами A и B, основанная на анализе URL и связей между веб-страницами (документами), на которых размещены эти объекты (например, с использованием алгоритма SimRank).
Markov Network (Марковская сеть)
Модель, используемая в патенте, где объекты представлены как узлы, а Transitional Probabilities — как связи (виртуальные ссылки) между ними.
Objects (Объекты)
Элементы, подлежащие ранжированию. В первую очередь это изображения, но также упоминаются аудио, видео, книги, товары.
Quality(A) (Query-Independent Measure of Quality)
Независимая от запроса мера качества объекта A. Включает такие метрики, как резкость (focus), количество цветов или насыщенность (saturation) изображения.
Ranking Score (Оценка ранжирования / VisualRank)
Итоговая оценка качества объекта, рассчитанная с помощью алгоритма анализа ссылок на основе Transitional Probabilities. Концептуально можно назвать VisualRank.
Transitional Probability (Вероятность перехода P(A→B)P(A\rightarrow B)P(A→B))
Оценка вероятности того, что пользователь, просматривающий объект A, следующим выберет объект B. Является основой для виртуальных ссылок.
Virtual Links (Виртуальные ссылки)
Связи между объектами, которые не определены явно (как гиперссылки), а рассчитываются на основе схожести контента или поведения пользователей. Представлены в виде Transitional Probabilities.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования изображений.

  1. Система определяет Transitional Probabilities между изображениями (вероятность перехода пользователя от одного к другому).
  2. Эти вероятности основаны на операции конвертации (conversion operation), которая связывает меру схожести с конкретным значением вероятности.
  3. Ключевой шаг: Система модифицирует Transitional Probabilities на основе анализа документов, связанных с изображениями (например, анализ URL-адресов страниц, где размещены изображения).
  4. Система рассчитывает оценки качества (Ranking Scores) для изображений, используя модифицированные вероятности.
  5. Система предоставляет изображения пользователям в порядке, основанном на этих оценках.

Claim 4 (Зависимый от 1): Детализирует критически важный механизм функции конвертации.

Операция конвертации включает функцию, значение которой увеличивается до достижения точки отсечения (cutoff point), а затем уменьшается после этой точки. Это реализация интуиции, что пользователи предпочитают похожие изображения, но игнорируют почти идентичные (избыточные) результаты.

Claim 5 (Зависимый от 1): Уточняет механизм модификации вероятностей из Claim 1.

Модификация Transitional Probabilities основана на анализе URL (URL analysis) документов, связанных с изображениями. Это означает, что контекст размещения (например, на одном сайте или на связанных сайтах) влияет на силу виртуальной ссылки (LINKSIM).

Claim 6 (Зависимый от 1): Добавляет еще один фактор модификации.

Модификация Transitional Probabilities также основывается на независимой от запроса мере качества изображений (query-independent measure of quality).

Claim 9 (Зависимый от 1): Описывает альтернативный источник данных для расчета вероятностей.

Определение Transitional Probabilities может быть основано на данных о кликах (click-data), собранных от пользователей.

Claim 11, 15, 29 (Независимые пункты): Обобщают процесс для различных типов объектов (изображения, аудио, видео, книги, товары) и описывают базовый механизм расчета оценки на основе схожести и конвертации.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, влияя на индексирование, сбор данных и ранжирование медиафайлов.

CRAWLING – Сбор данных (Data Acquisition)
На этом этапе система собирает поведенческие данные (Click-data) из журналов взаимодействия пользователей с поисковой выдачей или другими интерфейсами. Эти данные фиксируют последовательности просмотра объектов.

INDEXING – Индексирование и извлечение признаков
Основная часть предварительных вычислений происходит здесь:

  1. Извлечение признаков: Система анализирует медиафайлы и извлекает Image Features (гистограммы, SIFT и т.д.).
  2. Оценка качества: Рассчитываются независимые от запроса метрики качества Quality(A) (резкость, насыщенность).
  3. Анализ контекста: Проводится анализ URL и структуры ссылок между страницами (документами), содержащими объекты, для расчета LINKSIM(A,B).
  4. Офлайн-расчет VisualRank: Ranking Scores могут быть предварительно рассчитаны для всего корпуса объектов или для отдельных категорий (Query-Independent).

RANKING – Ранжирование
Алгоритм может применяться на этапе ранжирования двумя способами:

  1. Использование офлайн-оценок: Использование предварительно рассчитанных Ranking Scores (VisualRank) в качестве сигнала качества при ранжировании результатов, отобранных по текстовой релевантности.
  2. Динамический расчет (Query-Dependent): Система может динамически рассчитывать Ranking Scores только для набора объектов, отобранных в ответ на конкретный запрос. Это позволяет получить более точную оценку качества в контексте данного запроса.

Входные данные:

  • Набор объектов (изображений).
  • Извлеченные признаки (Image Features) для каждого объекта.
  • (Опционально) Click-data.
  • Метрики Quality(A) и LINKSIM(A,B).

Выходные данные:

  • Ranking Score (VisualRank) для каждого объекта в наборе.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на изображения, видео и аудиофайлы. Также применимо к товарам и книгам.
  • Специфические запросы: Наибольшее влияние оказывается на запросы, где важна визуальная составляющая, а не только текстовое описание (например, поиск товаров, достопримечательностей, произведений искусства).
  • Вертикали поиска: Критически влияет на Google Images, Google Video, Google Shopping (Product Search). Также может использоваться в Google News или основном поиске для выбора наиболее репрезентативного изображения для сниппета.
  • Мобильный поиск: Патент упоминает, что система полезна для мобильных устройств с ограниченным размером экрана, где важно показать самые качественные результаты в топе.

Когда применяется

  • Условия применения: Применяется всякий раз, когда необходимо упорядочить набор медиафайлов по качеству, авторитетности или репрезентативности.
  • Частота применения: Может применяться как офлайн (периодический пересчет для всего индекса или категорий), так и в реальном времени (динамический расчет для результатов конкретного запроса).
  • Пороговые значения: Используется порог (Cutoff Point) в Conversion Function. Если сходство превышает порог (например, 0.8 в примере из патента), вероятность перехода резко снижается для борьбы с дубликатами.

Пошаговый алгоритм

Процесс А: Расчет Ranking Scores на основе схожести контента

  1. Подготовка (Офлайн/Индексирование):
    • Для каждого объекта извлекаются и сохраняются Image Features.
    • Рассчитываются и сохраняются метрики Quality(A) и LINKSIM(A,B).
  2. Получение набора объектов: Система получает набор объектов для ранжирования (например, результаты поискового запроса).
  3. Расчет метрик схожести: Для каждой пары объектов (A, B) в наборе рассчитывается Content-based Similarity Metric путем сравнения их признаков.
  4. Конвертация в Вероятности Перехода:
    • Метрики схожести преобразуются в Transitional Probabilities P(A→B)P(A\rightarrow B)P(A→B).
    • Применяется Conversion Function, которая штрафует значения схожести выше порога (Cutoff Point), чтобы снизить вероятность перехода к дубликатам.
  5. Пост-обработка и Модификация:
    • Вероятности корректируются с учетом Quality(A) и LINKSIM(A,B). Патент предлагает формулу: P(A→B)≈Quality(A)⋅LINKSIM(A,B)⋅SIMILARITY(A,B)P(A\rightarrow B) \approx \text{Quality}(A) \cdot \text{LINKSIM}(A,B) \cdot \text{SIMILARITY}(A,B)P(A→B)≈Quality(A)⋅LINKSIM(A,B)⋅SIMILARITY(A,B).
    • Вероятности нормализуются.
  6. Расчет Ranking Scores (VisualRank): Система использует матрицу модифицированных Transitional Probabilities для расчета итоговых оценок ранжирования. Это делается путем решения Марковской сети (аналогично PageRank), например, путем нахождения главного собственного вектора (dominant eigenvector) матрицы переходов.
  7. Применение оценок: Полученные Ranking Scores используются для упорядочивания объектов при показе пользователю.

Процесс Б: Расчет на основе Click-data

  1. Сбор данных: Система собирает Click-data, фиксируя последовательности кликов пользователей.
  2. Расчет Вероятностей Перехода: Transitional Probabilities рассчитываются напрямую из Click-data. Например, если после просмотра A пользователи перешли к B в 10% случаев, то P(A→B)=0.10P(A\rightarrow B) = 0.10P(A→B)=0.10. (Эти вероятности также могут быть модифицированы, как в шаге 5 Процесса А).
  3. Расчет Ranking Scores: Аналогично шагу 6 Процесса А.

Какие данные и как использует

Данные на входе

  • Мультимедиа факторы (Визуальные признаки): Это основные данные для расчета схожести. Используются Image Features: гистограммы интенсивности, цвета, краев, текстуры; вейвлет-анализ; инвариантные признаки, такие как SIFT (Scale-Invariant Feature Transform).
  • Поведенческие факторы (Click-data): Последовательности кликов и просмотров объектов пользователями в рамках одной сессии. Используются для расчета или корректировки Transitional Probabilities.
  • Технические факторы (Качество): Метрики технического качества изображения: резкость, насыщенность (для Quality(A)).
  • Контекстные и Ссылочные факторы (URL Analysis): URL-адреса страниц, на которых размещены объекты, и структура гиперссылок между этими страницами. Используется для расчета LINKSIM(A,B).

Какие метрики используются и как они считаются

  • Content-based Similarity Metric: Рассчитывается путем сравнения Image Features двух объектов с использованием функций сравнения.
  • Quality(A) (Независимое качество): Метрики, оценивающие техническое качество объекта (резкость, насыщенность).
  • LINKSIM(A,B) (Контекстуальная схожесть): Оценка схожести на основе анализа URL и связей между хост-страницами (документами).
  • Transitional Probability P(A→B)P(A\rightarrow B)P(A→B): Рассчитывается одним из способов или их комбинацией:
    • Из Similarity Metric через Conversion Function (с порогом отсечения дубликатов).
    • Напрямую из Click-data.
    • Путем обязательной модификации базовой вероятности с помощью Quality(A) и LINKSIM(A,B).
  • Ranking Score (VisualRank): Итоговая метрика. Рассчитывается как решение уравнения, где оценки ранжирования являются главным собственным вектором матрицы Transitional Probabilities (аналогично расчету PageRank).

Выводы

  1. VisualRank как аналог PageRank для медиа: Google применяет принципы анализа ссылок для ранжирования объектов без явных ссылок (изображений, видео). Это позволяет определить «авторитетность» медиафайла в сети похожих объектов.
  2. Виртуальные ссылки многофакторны и учитывают контекст: Основой для виртуальных ссылок (Transitional Probabilities) являются не только визуальная схожесть или Click-data. Они обязательно модифицируются с учетом технического качества объекта (Quality(A)) и контекста размещения на сайте/в сети (LINKSIM(A,B) / URL Analysis).
  3. Критический механизм: Штраф за избыточность (Anti-Redundancy): Система намеренно снижает вероятность перехода к объектам, которые слишком похожи (почти дубликаты). Conversion Function с точкой отсечения (Cutoff Point) гарантирует, что предпочтение отдается похожим, но различным результатам.
  4. Поведение пользователей формирует связи: Если пользователи часто просматривают объекты A и B последовательно, между ними формируется сильная виртуальная связь, что делает Click-data мощным сигналом ранжирования.
  5. Контекст размещения критически важен (Claim 1): Объекты, размещенные на авторитетных сайтах или на страницах, тесно связанных ссылками, получают более сильную связь благодаря LINKSIM(A,B). Это подчеркивает важность авторитетности хост-страницы и структуры сайта для Image SEO.

Практика

Best practices (это мы делаем)

  • Создавайте уникальные и разнообразные медиафайлы: Поскольку система штрафует избыточность (дубликаты), крайне важно создавать уникальный визуальный контент. Если вы освещаете продукт, используйте разные ракурсы и детали, а не небольшие вариации одного и того же кадра, чтобы избежать попадания под Cutoff Point.
  • Оптимизируйте техническое качество изображений: Используйте резкие, хорошо экспонированные и насыщенные изображения. Фактор Quality(A) (резкость, насыщенность) напрямую влияет на Transitional Probability и, следовательно, на итоговый VisualRank.
  • Размещайте изображения на авторитетных и связанных страницах: Контекст размещения критичен (LINKSIM / URL Analysis). Размещайте ключевые изображения на сильных страницах сайта и используйте четкую структуру URL и перелинковку. Изображения на тесно связанных страницах усиливают друг друга.
  • Стимулируйте вовлеченность пользователей (Engagement): Поскольку Click-data является источником для расчета виртуальных ссылок, необходимо оптимизировать изображения для получения кликов в поиске (CTR) и стимулировать дальнейшее взаимодействие (например, просмотр связанных изображений в галереях). Последовательности кликов укрепляют виртуальные ссылки.

Worst practices (это делать не надо)

  • Использование стандартных стоковых или чужих изображений: Использование тех же изображений, что и у конкурентов (например, стандартных фотографий товара от производителя), рискованно. Из-за высокой схожести такие изображения могут попасть под штраф за избыточность (Cutoff Point).
  • Создание почти дубликатов: Генерация множества изображений с минимальными изменениями (например, небольшое изменение цвета или размера) неэффективна, так как система идентифицирует их как слишком похожие.
  • Игнорирование технического качества: Размещение размытых, тусклых или плохо обрезанных изображений приведет к низким оценкам Quality(A) и снизит итоговый VisualRank.
  • Изоляция изображений на сайте: Размещение важных изображений на страницах-сиротах, слабых страницах или в глубине структуры сайта ослабляет сигнал LINKSIM(A,B).

Стратегическое значение

Этот патент подтверждает, что ранжирование медиафайлов — это сложный процесс, выходящий далеко за рамки анализа тегов ALT и окружающего текста. Google активно использует машинное зрение, поведенческие данные и анализ контекста размещения (URL analysis) для определения авторитетности изображений и видео. Стратегия SEO должна включать создание уникального, высококачественного визуального контента, его правильное размещение на сайте и оптимизацию пользовательского опыта.

Практические примеры

Сценарий: Ранжирование изображений товара в E-commerce (VisualRank в действии)

  1. Ситуация: 20 интернет-магазинов продают одну модель кроссовок. 18 из них используют стандартные фотографии от производителя. 2 магазина сделали собственные уникальные студийные фотографии высокого качества и разместили их на сильных карточках товара.
  2. Анализ схожести и Конвертация: Система определяет высокую схожесть между 18 стандартными фотографиями и применяет штраф за избыточность (Cutoff Point), ослабляя виртуальные ссылки между ними. Уникальные фото достаточно различны, чтобы избежать штрафа.
  3. Модификация (Quality и LINKSIM): Уникальные фотографии имеют высокое техническое качество (Quality(A)) и размещены на сильных страницах (высокий LINKSIM). Эти факторы значительно усиливают их Transitional Probabilities.
  4. Влияние Click-data: Если пользователи также часто кликают на уникальные фото (Click-data), это дополнительно укрепляет виртуальные ссылки, ведущие к ним.
  5. Результат (VisualRank): Уникальные, высококачественные фотографии с хорошим контекстом размещения получают значительно более высокий Ranking Score и ранжируются выше в Google Images и Product Search, чем стандартные фото.

Вопросы и ответы

Что такое VisualRank, упоминаемый в анализе?

VisualRank — это концептуальный термин, используемый для описания изобретения (сам патент называет это Ranking Score). Это аналог PageRank, но для медиафайлов (изображений, видео). Он измеряет качество и авторитетность изображения на основе «виртуальных ссылок» от других похожих изображений.

Как Google определяет, что изображения похожи?

Google использует методы компьютерного зрения для извлечения визуальных признаков (Image Features). В патенте упоминаются гистограммы интенсивности, цвета, краев, текстуры, а также более сложные методы, такие как SIFT (Scale-Invariant Feature Transform). Схожесть определяется путем сравнения этих признаков.

Патент говорит о штрафе за избыточность (Cutoff Point). Значит ли это, что использование дубликатов вредно для SEO?

Да, это один из ключевых выводов. Система использует Conversion Function, которая резко снижает силу виртуальной ссылки, если изображения слишком похожи (выше порога Cutoff Point). Это означает, что система предпочитает разнообразие и может ранжировать почти идентичные изображения ниже, чем похожие, но уникальные варианты.

Влияет ли авторитет моего сайта или страницы на ранжирование изображений?

Да, напрямую. Claim 1 патента требует модификации виртуальных ссылок на основе анализа связанных документов (URL analysis или LINKSIM). Изображения, размещенные на авторитетных, тематически связанных страницах, получают преимущество в ранжировании.

Как поведение пользователей (Click-data) влияет на ранжирование изображений согласно этому патенту?

Click-data может использоваться напрямую для создания виртуальных ссылок. Если пользователи часто переходят от просмотра изображения A к просмотру изображения B в рамках одной сессии, система увеличивает Transitional Probability между ними. Это делает вовлеченность пользователей (CTR и последующие клики) важным фактором ранжирования в медиа-поиске.

Какие технические характеристики изображения важны для этого алгоритма?

Патент упоминает независимые от запроса меры качества Quality(A). К ним относятся резкость (focus), количество цветов и насыщенность (saturation). Изображения с лучшими техническими характеристиками получают преимущество при расчете виртуальных ссылок.

Применяется ли этот алгоритм к видео?

Да. Хотя основной упор в описании сделан на изображения, патент явно указывает (Claims 11, 15, 29), что система может применяться к другим типам объектов, включая аудио, видео, книги и товары. Для видео, вероятно, анализируются ключевые кадры или видео-признаки.

Этот VisualRank рассчитывается в реальном времени или заранее?

Патент описывает оба варианта. Он может быть рассчитан офлайн для всего индекса или для категорий (Query-Independent). Также он может рассчитываться динамически в реальном времени только для набора результатов, соответствующих конкретному запросу (Query-Dependent).

Что важнее для SEO в контексте этого патента: визуальное сходство, качество или контекст размещения?

Все три фактора критичны и перемножаются для определения силы виртуальной ссылки. Визуальное сходство (SIMILARITY) создает базовую связь, но она модифицируется техническим качеством (Quality(A)) и контекстом размещения (LINKSIM(A,B)). Нельзя игнорировать ни один из этих аспектов.

Как я могу использовать эти знания для оптимизации изображений товаров в интернет-магазине?

Ключевая стратегия — отказаться от стандартных фотографий производителя. Создавайте собственные уникальные, технически качественные фотографии с разных ракурсов и размещайте их на оптимизированных карточках товаров. Это позволит избежать штрафа за избыточность (Cutoff Point) и повысить VisualRank за счет качества (Quality(A)) и контекста (LINKSIM).

Похожие патенты

Как Google использует визуальное сходство и графовый анализ (VisualRank) для валидации и ранжирования меток изображений
Google валидирует текстовые метки изображений (например, Alt-текст или имена файлов) с помощью визуального анализа. Система строит граф, связывающий визуально похожие изображения. Симулируя навигацию пользователя по этому графу (алгоритм, подобный PageRank), Google определяет, какие метки наиболее релевантны фактическому содержанию изображения, отфильтровывая шум и повышая качество поиска по картинкам.
  • US7961986B1
  • 2011-06-14
  • Мультимедиа

  • SERP

Как Google использует визуальное сходство для связывания изображений и видео, кластеризации выдачи и обогащения метаданных
Google анализирует визуальное содержимое изображений и ключевых кадров видео для выявления сходств. Это позволяет связывать разнотипный контент, даже если у него мало текстовых данных. Система использует эти связи для переноса метаданных (например, ключевых слов или геопозиции) от одного ресурса к другому, а также для кластеризации и смешивания изображений и видео в результатах поиска.
  • US9652462B2
  • 2017-05-16
  • Мультимедиа

  • SERP

  • Семантика и интент

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам
Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.
  • US8209330B1
  • 2012-06-26
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Популярные патенты

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент
Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.
  • US9274683B2
  • 2016-03-01
  • SERP

  • Персонализация

  • Поведенческие сигналы

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта
Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.
  • US9348846B2
  • 2016-05-24
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
  • US8656266B2
  • 2014-02-18
  • Ссылки

  • EEAT и качество

  • Свежесть контента

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

seohardcore