SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google объединяет дубликаты изображений в кластеры и индексирует их как единое целое для улучшения визуального поиска

IMAGE RETRIEVAL (Поиск изображений)
  • US8923626B1
  • Google LLC
  • 2012-06-25
  • 2014-12-30
  • Индексация
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google оптимизирует визуальный поиск, группируя почти идентичные изображения (измененный размер, обрезка) в единый кластер. Система индексирует не отдельные картинки, а совокупность всех визуальных признаков ("визуальных слов") из всех вариантов в кластере. Это повышает эффективность индекса и гарантирует согласованность результатов при поиске по изображению.

Описание

Какую проблему решает

Патент решает проблему несогласованности и неэффективности при поиске визуально похожих изображений (Query by Image). Почти идентичные дубликаты (near-duplicate images) — например, изображения с измененным размером, обрезанные или пережатые версии — могут генерировать разные наборы визуальных признаков (Visual Words). Это приводит к тому, что система может найти одну версию изображения, но пропустить другую, или обрабатывать их как разные объекты. Патент направлен на улучшение качества поиска, обеспечение согласованности результатов и повышение эффективности индексации.

Что запатентовано

Запатентована система, которая изменяет процесс индексации изображений, переходя от индексации отдельных файлов к индексации Collections of Near-Duplicate Images (Коллекций почти идентичных изображений). Система объединяет дубликаты в одну коллекцию и вычисляет Union of Visual Words — совокупность всех уникальных визуальных признаков из всех изображений коллекции. Эта коллекция затем индексируется как единое целое на основе этого объединенного набора признаков.

Как это работает

Механизм работает в несколько этапов:

  • Кластеризация: Изображения группируются в коллекции почти идентичных дубликатов.
  • Выравнивание: Изображения внутри коллекции выравниваются по общей системе координат (Common Coordinate Frame), например, с помощью аффинных преобразований (Affine Transformation), чтобы нормализовать геометрические различия (масштаб, обрезка).
  • Определение признаков: Для каждого изображения определяются Visual Words в этой общей системе координат.
  • Объединение (Union): Создается Union of Visual Words, включающий все уникальные признаки из всех изображений коллекции.
  • Индексация: В индекс (Posting Lists) добавляется идентификатор коллекции (а не отдельных изображений), связанный с этим объединенным набором признаков.
  • Поиск: Система ищет совпадения между запросом и коллекциями, используя динамические пороги и геометрическую верификацию.

Актуальность для SEO

Высокая. Дедупликация, кластеризация и эффективное индексирование визуальных признаков являются фундаментальными задачами для любой крупномасштабной системы визуального поиска, такой как Google Images и Google Lens. Описанный подход к агрегации сигналов из дубликатов для создания более надежного и эффективного индекса лежит в основе современных систем визуального поиска.

Важность для SEO

Патент имеет умеренно высокое влияние на стратегию Image SEO (6.5/10). Хотя он описывает инфраструктуру визуального поиска (Query-by-Image) и не вводит традиционных факторов ранжирования, он раскрывает механизм того, как Google воспринимает и индексирует визуальный контент. Понимание того, что Google агрегирует визуальные сигналы из всех дубликатов, позволяет разрабатывать стратегии для максимизации совокупного "визуального веса" ключевых изображений путем обеспечения доступности и качества их вариаций.

Детальный разбор

Термины и определения

Affine Transformation (Аффинное преобразование)
Геометрическое преобразование, используемое для выравнивания изображений в коллекции относительно эталонного изображения. Позволяет нормализовать различия в масштабе, повороте, сдвиге и перекосе.
Collection of Near-Duplicate Images (Коллекция почти идентичных изображений)
Группа изображений, которые являются разными версиями одного и того же исходного изображения (измененный размер, обрезка, сжатие) или разными снимками одного и того же объекта/сцены, которые система считает почти идентичными.
Common Coordinate Frame (Общая система координат)
Единая система координат, к которой приводятся все изображения в коллекции для обеспечения соответствия визуальных признаков. Обычно основана на эталонном изображении (Reference Image) коллекции.
Feature Vector (Вектор признаков)
Числовое представление характеристик определенной области (Feature Region) изображения.
Geometric Mapping (Геометрическое отображение)
Функция, которая преобразует координаты визуальных слов из изображения запроса в координаты коллекции-кандидата. Используется для проверки пространственного соответствия признаков при ранжировании.
Posting List (Список рассылки / Инвертированный индекс)
Структура данных в индексе. Для каждого Visual Word существует свой Posting List, содержащий идентификаторы коллекций (Collection ID), в которых встречается это слово.
RANSAC (Random Sample Consensus)
Алгоритм, упомянутый в описании патента как возможный метод для определения параметров Geometric Mapping, который оптимизирует выравнивание между визуальными словами запроса и коллекции.
Union of Visual Words (Объединение визуальных слов)
Совокупность всех уникальных Visual Words, присутствующих во всех изображениях данной коллекции, приведенных к Common Coordinate Frame. Является основой для индексации коллекции.
Visual Words (Визуальные слова)
Квантованные векторы признаков. Представляют собой дискретные "ячейки" в пространстве признаков, к которым относятся характеристики областей изображения.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс индексирования коллекций изображений.

  1. Система выравнивает каждое изображение в коллекции почти идентичных дубликатов по Common Coordinate Frame.
  2. Система определяет Visual Words для каждого изображения в этой общей системе координат.
  3. Система определяет Union of Visual Words для всей коллекции.
  4. Система добавляет элемент (идентификатор коллекции) в соответствующие Posting Lists для каждого слова из этого объединения.

Claim 2 (Зависимый от 1): Описывает процесс поиска и ранжирования.

  1. Система получает изображение-запрос и определяет его Visual Words.
  2. Система определяет, что коллекция имеет по крайней мере пороговое количество (Threshold Number) общих Visual Words с запросом.
  3. Система вычисляет оценку (Score) для одного или нескольких изображений в этой коллекции.

Claim 4 (Зависимый от 2): Уточняет порог совпадений.

Пороговое количество общих Visual Words, необходимое для признания коллекции релевантной, увеличивается по мере увеличения размера коллекции. Это необходимо, так как большие коллекции естественным образом имеют больше Visual Words в своем объединении, что повышает вероятность случайных совпадений.

Claim 6 (Зависимый от 2): Уточняет механизм расчета оценки.

Расчет оценки включает вычисление оценки для каждого совпадающего Visual Word на основе Geometric Mapping между визуальными словами запроса и визуальными словами коллекции. Это означает, что проверяется не только наличие признаков, но и их пространственное расположение.

Claim 7 (Зависимый от 1): Детализирует механизм выравнивания.

Выравнивание включает выбор эталонного изображения (Reference Image) в коллекции и определение Affine Transformation между эталонным изображением и каждым другим изображением коллекции.

Где и как применяется

Изобретение затрагивает инфраструктуру визуального поиска (Image Search System) и применяется на этапах индексирования и ранжирования.

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Система выполняет кластеризацию изображений, выравнивание дубликатов к Common Coordinate Frame, вычисление Union of Visual Words и построение Index Database (Posting Lists). Ключевой момент: система индексирует идентификаторы коллекций (Collection IDs), а не отдельных изображений (Image IDs).

RANKING – Ранжирование (Retrieval и Scoring)
На этапе отбора кандидатов (Retrieval) система использует созданные Posting Lists для быстрого поиска коллекций, которые имеют достаточное количество общих Visual Words с изображением-запросом (с учетом динамических порогов). На этапе оценки (Scoring) система вычисляет Similarity Score, используя Geometric Mapping для проверки пространственного соответствия признаков между запросом и найденными коллекциями.

Входные данные:

  • (Индексирование): Набор изображений (Image Collection), вычисленные Feature Vectors.
  • (Ранжирование): Изображение-запрос (Image Query) и его Visual Words.

Выходные данные:

  • (Индексирование): Кластеры (Collections of Near-Duplicate Images); Index Database с идентификаторами коллекций и связанными геометрическими данными.
  • (Ранжирование): Отсортированные результаты поиска (Image Search Results).

На что влияет

  • Типы контента: Влияет на все типы изображений в индексе Google Images, особенно там, где существует множество вариаций одного изображения (например, стоковые фотографии, изображения товаров в e-commerce, логотипы, мемы).
  • Специфические запросы: Механизм критически важен для визуального поиска (Query by Image или Reverse Image Search), где пользователь загружает изображение в качестве запроса. Не влияет на поиск по текстовым запросам.

Когда применяется

  • Во время индексирования: Применяется в процессе обработки и индексации новых или обновленных изображений для их кластеризации.
  • Во время поиска: Активируется при выполнении визуального поиска для сопоставления изображения-запроса с индексированными коллекциями.
  • Условия активации (при поиске): Коллекция рассматривается как кандидат, только если количество совпадений Visual Words превышает определенный порог, который динамически зависит от размера коллекции.

Пошаговый алгоритм

Процесс А: Индексация коллекций (INDEXING)

  1. Кластеризация: Исходный набор изображений кластеризуется на коллекции почти идентичных дубликатов. Может устанавливаться максимальный размер кластера.
  2. Выбор эталона: В каждой коллекции выбирается эталонное изображение (Reference Image).
  3. Выравнивание: Все остальные изображения в коллекции выравниваются относительно эталонного с помощью Affine Transformations, создавая Common Coordinate Frame.
  4. Определение признаков: Для всех изображений определяются Visual Words и их координаты в Common Coordinate Frame.
  5. Вычисление объединения: Определяется Union of Visual Words для коллекции.
  6. Индексация: Идентификатор коллекции (Collection ID) и геометрические данные добавляются в Posting Lists для каждого визуального слова из объединения.

Процесс Б: Поиск по изображению (RANKING)

  1. Обработка запроса: Система получает изображение-запрос и вычисляет его Visual Words.
  2. Обход индекса: Система обходит Posting Lists, соответствующие визуальным словам запроса, для идентификации коллекций-кандидатов.
  3. Проверка порога: Проверяется, превышает ли количество совпадений динамический порог (Threshold Number), зависящий от размера коллекции.
  4. Геометрическая верификация и Ранжирование: Для коллекций-кандидатов вычисляется Similarity Score. Это включает поиск оптимального Geometric Mapping (например, с помощью RANSAC) и оценку того, насколько хорошо визуальные слова запроса пространственно совпадают с визуальными словами коллекции.
  5. Выдача результатов: Система может вернуть все изображения из коллекции, назначив им одинаковый Similarity Score, или выбрать одно репрезентативное изображение (например, самое большое).

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке визуальных данных.

  • Мультимедиа факторы: Пиксельные данные изображений. Система идентифицирует области интереса (Feature Regions, например, эллиптические области) и вычисляет для них Feature Vectors.
  • Технические факторы: Размер изображения или его разрешение могут использоваться для выбора репрезентативного изображения из коллекции при выдаче результатов или для выбора эталонного изображения при индексации.

Какие метрики используются и как они считаются

  • Visual Words: Получаются путем квантования Feature Vectors.
  • Geometry Data (Геометрические данные): Координаты (позиция) и масштаб (размер) областей интереса, связанных с каждым Visual Word. Эти данные нормализуются в Common Coordinate Frame.
  • Threshold Number of Matching Visual Words (Порог совпадения): Динамический порог. Патент указывает, что он увеличивается с размером коллекции (например, 5 совпадений для коллекции из одного изображения и 8 совпадений для коллекции из нескольких изображений).
  • Affine Transformation: Используется для выравнивания изображений при индексации.
  • Geometric Mapping: Используется для ранжирования. В описании упоминается функция вида:

Выводы

  1. Индексация Концептов, а не Файлов: Ключевой вывод заключается в том, что в системах визуального поиска Google индексирует не отдельные изображения, а кластеры (коллекции) почти идентичных дубликатов. Это фундаментальный аспект архитектуры поиска изображений.
  2. Агрегация Визуальных Сигналов (Union): Визуальная сигнатура изображения в индексе представляет собой объединение (Union of Visual Words) всех признаков, извлеченных из всех известных его дубликатов. Это делает представление изображения более полным и устойчивым к артефактам отдельных версий (например, обрезке или сжатию).
  3. Нормализация Геометрии: Перед индексацией коллекция проходит процесс выравнивания к Common Coordinate Frame. Это позволяет системе игнорировать различия в масштабе и кадрировании, гарантируя, что геометрические данные (расположение признаков) сопоставимы.
  4. Динамические Пороги Совпадения: Система использует динамические пороги для определения релевантности. Большие коллекции требуют большего количества совпадающих Visual Words, чтобы считаться релевантными. Это механизм защиты от шума и повышения точности (Precision).
  5. Важность Геометрической Верификации: Ранжирование основано не просто на подсчете общих признаков, а на проверке их пространственного соответствия (Geometric Mapping). Это позволяет отличать изображения с одинаковыми объектами, но разной композицией.

Практика

Best practices (это мы делаем)

  • Обеспечение Доступности Вариаций Изображений: Убедитесь, что все версии ключевых изображений (миниатюры, разные размеры, генерируемые CMS или CDN) доступны для сканирования. Это позволяет Google сформировать полную коллекцию и максимизировать Union of Visual Words, усиливая общую визуальную сигнатуру контента.
  • Использование Высокого Разрешения и Качества: Предоставляйте изображения в максимально возможном разрешении и с минимальным сжатием. Система может выбрать наиболее качественное изображение в качестве эталонного (Reference Image) для индексации или в качестве репрезентативного изображения в выдаче.
  • Фокус на Четкости Визуальных Признаков: Качество самого изображения критично. Четкие, контрастные изображения с хорошо различимыми деталями генерируют более надежные Visual Words, что улучшает способность системы кластеризовать их и находить совпадения при поиске.
  • Обеспечение Визуальной Согласованности: Убедитесь, что разные версии одного и того же изображения визуально согласованы (например, нет значительных цветовых искажений в миниатюрах). Это помогает системе корректно идентифицировать их как дубликаты и объединить в одну коллекцию.

Worst practices (это делать не надо)

  • Блокировка Сканирования Вариаций (Thumbnails): Блокировка доступа к версиям изображений (например, через robots.txt) мешает системе сформировать полную коллекцию и вычислить полный Union of Visual Words, что потенциально снижает видимость контента в визуальном поиске.
  • Чрезмерная Обфускация или Изменение Изображений: Добавление сильного шума, очень больших водяных знаков, крупных текстовых блоков или рамок может сильно изменить Visual Words. Это может помешать системе идентифицировать изображение как дубликат, изолируя его от коллекции и уменьшая его совокупный визуальный сигнал.
  • Попытки Манипуляции Псевдо-уникальными Изображениями: Создание множества слегка измененных версий изображения с целью занять больше места в выдаче неэффективно. Система распознает их как near-duplicate images и объединит в одну коллекцию.

Стратегическое значение

Патент подтверждает, что визуальный поиск Google основан на сложных технологиях компьютерного зрения и дедупликации. Стратегическое значение для SEO заключается в понимании того, что Google стремится понять содержание изображения на уровне пикселей и индексирует визуальные концепты, а не файлы. Долгосрочная стратегия в Image SEO должна включать оптимизацию визуальных активов для улучшения их распознавания и кластеризации, рассматривая все вариации изображения как единое целое.

Практические примеры

Сценарий: Оптимизация изображений товара в E-commerce

  1. Ситуация: Интернет-магазин загружает три версии изображения нового смартфона:
    1. Изображение А: Высокое разрешение, полный вид (Признаки: Экран, Камера, Логотип).
    2. Изображение Б: Уменьшенная версия для каталога (Признаки: Экран, Камера; Логотип слишком мал для распознавания).
    3. Изображение В: Обрезанная версия, фокус на камере (Признаки: Камера, Логотип).
  2. Действия SEO: Убедиться, что все три версии доступны для сканирования и имеют хорошее качество.
  3. Обработка Google (согласно патенту):
    1. Кластеризация: Google определяет, что А, Б и В — это near-duplicate images.
    2. Выравнивание: Изображения Б и В выравниваются по Изображению А (Common Coordinate Frame).
    3. Объединение: Система создает Union of Visual Words: {Экран, Камера, Логотип}.
  4. Результат: Когда пользователь ищет изображение, соответствующее признакам {Экран, Камера, Логотип}, система находит всю коллекцию. Даже если бы запрос лучше всего соответствовал Изображению Б (которое само по себе не имело признака «Логотип»), коллекция все равно будет найдена благодаря признакам из А и В.

Вопросы и ответы

Что такое "Визуальные слова" (Visual Words) в контексте этого патента?

Visual Words — это технический термин из компьютерного зрения. Система анализирует изображение, находит ключевые области интереса (Feature Regions) и вычисляет для них числовые характеристики (Feature Vectors). Затем эти векторы квантуются, то есть группируются в ограниченное число категорий. Эти категории и называются "визуальными словами". Они позволяют системе быстро сравнивать изображения, проверяя, какие визуальные слова у них общие.

Почему Google просто не индексирует каждое изображение отдельно?

Индексация каждого изображения отдельно неэффективна и ненадежна. Во-первых, это значительно увеличивает размер индекса и замедляет поиск. Во-вторых, почти идентичные дубликаты (например, обрезанная версия) могут иметь разные наборы Visual Words. Патент предлагает индексировать коллекции дубликатов, используя объединение всех их визуальных слов (Union of Visual Words), что делает поиск более полным, согласованным и быстрым.

Что такое "Объединение визуальных слов" (Union of Visual Words) и как оно помогает в SEO?

Это совокупность всех уникальных визуальных признаков, найденных во всех изображениях, входящих в коллекцию дубликатов. Если версия А имеет признаки {1, 2, 3}, а версия Б имеет признаки {2, 3, 4}, то их объединение будет {1, 2, 3, 4}. Для SEO это означает, что совокупный "визуальный вес" изображения увеличивается за счет агрегации сигналов из всех его вариаций, при условии, что они доступны для сканирования.

Зачем нужно выравнивание изображений по общей системе координат (Common Coordinate Frame)?

Выравнивание необходимо для нормализации геометрических различий между дубликатами. Если одно изображение обрезано или масштабировано, расположение его визуальных признаков смещается. Приведение всех изображений к единой системе координат (например, с помощью Affine Transformation) гарантирует, что одни и те же признаки будут иметь одинаковые координаты. Это критически важно для последующей геометрической верификации при ранжировании.

Что означает динамический порог совпадений, зависящий от размера коллекции?

Патент указывает, что чем больше коллекция изображений, тем больше у нее Visual Words в объединении. Это повышает вероятность случайных совпадений с любым запросом. Чтобы избежать этого, система повышает требования: для большой коллекции требуется большее количество общих Visual Words с запросом, чтобы считать ее релевантной, по сравнению с маленькой коллекцией. Это обеспечивает точность поиска.

Как система использует геометрическое отображение (Geometric Mapping) при ранжировании?

Недостаточно просто найти коллекцию с общими Visual Words. Система проверяет, расположены ли эти слова в той же пространственной конфигурации, что и в запросе. Для этого она ищет оптимальное геометрическое преобразование (например, сдвиг, масштаб), которое наилучшим образом совмещает признаки запроса и коллекции (используя, например, алгоритм RANSAC). Чем точнее пространственное совпадение, тем выше Similarity Score.

Как этот патент влияет на использование водяных знаков?

Влияние зависит от реализации. Небольшие, полупрозрачные водяные знаки вряд ли помешают системе определить дубликаты и сформировать коллекцию. Однако очень большие, непрозрачные водяные знаки, которые сильно изменяют ключевые визуальные признаки изображения, могут привести к тому, что изображение не будет распознано как часть коллекции, что может снизить его видимость в поиске.

Если у меня на сайте много разных размеров одного изображения, это хорошо или плохо согласно патенту?

Это хорошо, при условии, что все они доступны для сканирования и имеют достаточное качество. Наличие разных размеров помогает системе сформировать надежную коллекцию. Все визуальные признаки из этих версий будут объединены в Union of Visual Words, усиливая общую визуальную сигнатуру изображения.

Как система решает, какое изображение показать в выдаче, если найдена целая коллекция?

Патент предлагает несколько вариантов. Система может вернуть все изображения из коллекции, присвоив им одинаковый Similarity Score. Альтернативно, она может выбрать одно репрезентативное изображение. Критерии выбора могут включать размер изображения (выбор самого большого) или популярность (изображение, которое чаще выбирают пользователи).

Применяется ли этот патент к традиционному поиску по текстовым запросам?

Нет. Этот патент описывает инфраструктуру и алгоритмы, специфичные для систем визуального поиска (Query by Image), где запросом является само изображение (например, Google Lens или загрузка файла в Google Images). Он не затрагивает факторы ранжирования изображений по текстовым запросам, такие как alt-текст или контекст страницы.

Похожие патенты

Как Google агрегирует и ранжирует пользовательские метки для идентификации объектов в Визуальном поиске (Google Lens)
Google использует этот механизм для повышения точности идентификации объектов при поиске по изображению. Система находит множество визуально похожих изображений, загруженных пользователями (UGC), и анализирует их текстовые метки. Метки группируются по смыслу, а затем эти группы ранжируются на основе совокупной визуальной релевантности. Это позволяет определить наиболее вероятное название объекта, опираясь на коллективное мнение.
  • US9424279B2
  • 2016-08-23
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google использует "визуальные слова" и геометрические данные для эффективного поиска похожих изображений
Патент Google, описывающий инфраструктуру поиска по изображениям. Система разбивает изображения на "визуальные слова" (признаки) и использует инвертированный индекс (posting lists) для быстрого поиска совпадений. Ключевая особенность — хранение геометрических данных (положение признаков) прямо в индексе, что позволяет быстро рассчитывать визуальное сходство и проверять пространственное расположение элементов на лету.
  • US20150169740A1
  • 2015-06-18
  • Индексация

  • Мультимедиа

Как Google использует компактные дескрипторы и пространственное кодирование для выявления и удаления почти дубликатов изображений из поиска
Google использует систему для эффективного обнаружения изображений-почти дубликатов (измененный размер, обрезка, сжатие). Система анализирует локальные особенности контента ("визуальные слова") и их точное пространственное расположение ("тайлы"), чтобы создать компактные дескрипторы. Сравнивая эти дескрипторы, Google быстро идентифицирует и удаляет дубликаты из результатов поиска для повышения разнообразия выдачи.
  • US9063954B2
  • 2015-06-23
  • Мультимедиа

  • SERP

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует визуальное сходство для связывания изображений и видео, кластеризации выдачи и обогащения метаданных
Google анализирует визуальное содержимое изображений и ключевых кадров видео для выявления сходств. Это позволяет связывать разнотипный контент, даже если у него мало текстовых данных. Система использует эти связи для переноса метаданных (например, ключевых слов или геопозиции) от одного ресурса к другому, а также для кластеризации и смешивания изображений и видео в результатах поиска.
  • US9652462B2
  • 2017-05-16
  • Мультимедиа

  • SERP

  • Семантика и интент

Популярные патенты

Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса
Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов.
  • US10366422B2
  • 2019-07-30
  • Поведенческие сигналы

  • Local SEO

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
  • US9436742B1
  • 2016-09-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования
Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.
  • US10878048B2
  • 2020-12-29
  • EEAT и качество

  • SERP

  • Knowledge Graph

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google проактивно уведомляет пользователей об изменении цен или доступности товаров на основе их предполагаемого намерения покупки
Google анализирует действия пользователя (поисковые запросы, посещения сайтов), чтобы выявить намерение в отношении сущностей (например, продуктов или авиабилетов). Если намерение сильное и происходит значительное изменение (падение цены или изменение доступности), Google проактивно отправляет уведомление со ссылками для завершения действия (например, покупки).
  • US20180357238A1
  • 2018-12-13
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

seohardcore