SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google переводит изображения в текстовые запросы, валидируя метки через веб-поиск

CHOOSING IMAGE LABELS (Выбор меток для изображений)
  • US9218546B2
  • Google LLC
  • 2012-06-01
  • 2015-12-22
  • Мультимедиа
  • Семантика и интент
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует эту систему для определения наилучшего текстового описания (метки) для изображения. Система тестирует различные варианты меток, используя их как поисковые запросы, и проверяет, сколько результатов поиска указывают на веб-страницы, содержащие исходное изображение. Это гарантирует, что выбранная метка точно отражает то, как изображение используется и понимается в интернете.

Описание

Какую проблему решает

Патент решает фундаментальную проблему визуального поиска (например, Google Lens или Поиск по картинке): как найти релевантную информацию об изображении в текстовом индексе. Для этого необходимо определить наилучшую текстовую метку (Image Label), которая точно описывает изображение и может быть использована в качестве эффективного текстового запроса. Система улучшает качество визуального поиска, обеспечивая надежный механизм выбора самой релевантной метки среди множества кандидатов.

Что запатентовано

Запатентована система и метод выбора оптимальной текстовой метки для изображения. Суть изобретения заключается в использовании результатов веб-поиска как механизма обратной связи для валидации и ранжирования кандидатов в метки. Система проверяет, насколько хорошо каждая метка коррелирует с фактическим использованием изображения в интернете.

Как это работает

Система работает итеративно:

  • Генерация кандидатов: Система получает набор потенциальных текстовых меток для изображения (например, от аннотатора или из анализа похожих изображений).
  • Поисковый тест: Каждая метка используется как запрос в стандартной системе веб-поиска (Text Search Apparatus).
  • Фильтрация результатов: Полученные результаты поиска фильтруются. Учитываются только те ресурсы (веб-страницы), которые содержат исходное изображение (или его почти дубликат/визуально похожее изображение).
  • Ранжирование меток: Меткам присваивается оценка (Text Label Ranking Score). Эта оценка зависит от количества отфильтрованных результатов (docs_matched), их релевантности (median_score) и исходной позиции метки.
  • Выбор: Метка с наивысшей оценкой выбирается как лучшее описание изображения.

Актуальность для SEO

Высокая. С ростом популярности визуального поиска и интеграции изображений в основную выдачу, способность точно интерпретировать визуальный контент в текстовые термины является критически важной для Google. Этот патент описывает базовый механизм такой интерпретации и валидации.

Важность для SEO

Патент имеет высокое значение (85/100) для Image SEO и стратегий, связанных с визуальным контентом. Он демонстрирует, что значение изображения определяется не только его визуальными характеристиками, но и тем, как оно используется и описывается на веб-страницах (контекст). Понимание этого механизма критично для оптимизации того, как Google транслирует ваши изображения в ключевые слова.

Детальный разбор

Термины и определения

Image Label (Текстовая метка изображения)
Текстовые данные, указывающие на предмет, к которому относится изображение. Метки могут генерироваться на основе текста рядом с изображением, имени файла, анкорного текста ссылок на изображение или с помощью моделей машинного обучения.
Image Label Apparatus / Image Annotator (Аппарат маркировки изображений / Аннотатор)
Компонент системы, который генерирует исходный набор кандидатов в текстовые метки для заданного изображения.
Image Similarity Apparatus (Аппарат определения сходства изображений)
Компонент, который идентифицирует другие изображения, визуально похожие на исходное (например, Near Duplicate Images или изображения в том же кластере).
Near Duplicate Images (Почти дубликаты изображений)
Изображения, которые идентичны исходному, за исключением различий в обработке (например, разное разрешение, яркость, обрезка).
Image Cluster (Кластер изображений)
Группа изображений в базе данных, объединенных на основе общих визуальных признаков (visual features) и удовлетворяющих определенному порогу сходства.
Text Search Apparatus (Аппарат текстового поиска)
Стандартная поисковая система, выполняющая поиск по текстовому запросу.
Text Label Ranking Score (Оценка ранжирования текстовой метки)
Итоговая оценка, присваиваемая метке-кандидату. Используется для выбора лучшей метки.
docs_matched
Количество результатов поиска (документов), возвращенных по запросу-метке, которые содержат исходное изображение или его аналог (дубликат/кластерный элемент).
median_score
Медианная оценка релевантности среди результатов поиска (search result scores), возвращенных по запросу-метке.
original_rank_position
Исходная позиция метки в списке кандидатов до этапа валидации через веб-поиск.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора метки изображения.

  1. Система получает данные, определяющие первое изображение.
  2. Система получает текстовые метки для этого изображения.
  3. Для каждой метки выполняется цикл:
    1. Выполняется веб-поиск с использованием метки в качестве запроса, получаются результаты поиска (каждый ссылается на веб-ресурс).
    2. Метке присваивается Text Label Ranking Score. Эта оценка основана на количестве ресурсов в результатах поиска, которые включают изображение, соответствующее (matching) первому изображению.
  4. Текстовые метки ранжируются на основе присвоенных Text Label Ranking Scores.
  5. Выбирается метка изображения на основе этого ранжирования.

Claim 2 (Зависимый): Уточняет, что получение текстовых меток может включать запрос меток, связанных с изображениями, идентифицированными как Near Duplicate Images первого изображения.

Claim 3 (Зависимый): Уточняет, что при присвоении оценки метке, оценка может быть увеличена для каждого случая, когда другая текстовая метка идентифицирована как почти дубликат (near duplicate text label) текущей метки (например, объединение "кот" и "коты").

Claim 4 и 5 (Зависимые): Определяют, что такое "соответствующее изображение" (image matching). Ресурсы, включающие соответствующее изображение, могут содержать либо Near Duplicate Image первого изображения (Claim 4), либо изображение, находящееся в том же кластере (Image Cluster) базы данных, что и первое изображение (Claim 5).

Claim 9 (Независимый): Описывает метод, аналогичный Claim 1, но детализирует компоненты расчета Text Label Ranking Score. Ранжирование меток включает расчет оценки для каждой метки на основе:

  • Медианной оценки результатов поиска (median search result score).
  • Количества результатов поиска, возвращенных веб-поиском.
  • Исходной позиции ранжирования (original rank position) полученных текстовых меток.

Claim 10 (Зависимый): Определяет конкретную формулу для расчета Text Label Ranking Score (подробно описана в разделе Метрики).

Где и как применяется

Изобретение применяется на разных этапах поисковой архитектуры, связывая визуальный анализ с текстовым поиском.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных. Image Similarity Apparatus анализирует визуальные признаки изображений, формирует Image Database и группирует похожие изображения в кластеры и идентифицирует дубликаты. Image Label Apparatus может предварительно ассоциировать изображения с метками на основе контекста.

QUNDERSTANDING – Понимание Запросов
Это основная область применения патента. Когда система получает запрос, содержащий изображение (визуальный запрос, например, в Google Lens), активируется описанный механизм. Его цель — транслировать визуальный ввод в наиболее релевантное текстовое представление (Image Label). Это форма переписывания запроса, позволяющая использовать визуальный контент для поиска в текстовом индексе.

RANKING – Ранжирование
Система взаимодействует с этапом ранжирования через Text Search Apparatus. Она отправляет множество запросов (меток-кандидатов) и анализирует полученные результаты ранжирования (в частности, median_score и состав выдачи) для принятия решения о качестве метки.

Входные данные:

  • Исходное изображение (Query Image).
  • Набор кандидатов в текстовые метки (от Image Label Apparatus).
  • Данные о визуальном сходстве и кластеризации (от Image Similarity Apparatus).
  • Результаты веб-поиска и их оценки релевантности (от Text Search Apparatus).

Выходные данные:

  • Оптимальная текстовая метка (Image Label) для исходного изображения.
  • Text Label Ranking Score для этой метки.

На что влияет

  • Типы контента: В первую очередь влияет на изображения. Особенно критично для продуктовых изображений в e-commerce, где точная идентификация модели или типа товара имеет решающее значение.
  • Специфические запросы: Влияет на визуальный поиск (поиск по картинке, Google Lens) и гибридные запросы (текст + изображение). Также влияет на ранжирование в Google Images.
  • Ниши: E-commerce, новости (идентификация людей/мест), искусство, любая ниша с большим объемом визуального контента.

Когда применяется

  • Условия работы: Алгоритм применяется, когда поисковой системе необходимо найти текстовую информацию, релевантную входному изображению, и нужно выбрать наилучшее текстовое описание из нескольких вариантов.
  • Триггеры активации: Получение поискового запроса, включающего изображение (query image). Может также использоваться в офлайн-режиме для аннотирования индекса.

Пошаговый алгоритм

  1. Получение входных данных: Система получает исходное изображение.
  2. Генерация первичных меток: Исходное изображение передается в Image Label Apparatus для получения первого набора меток-кандидатов.
  3. Расширение набора меток (Опционально): Исходное изображение передается в Image Similarity Apparatus для идентификации Near Duplicate Images. Метки, связанные с этими дубликатами, добавляются в пул кандидатов.
  4. Консолидация и предварительное ранжирование:
    1. Наборы меток объединяются.
    2. Система идентифицирует и объединяет почти дубликаты меток (near duplicate text labels), например, разные формы слова или наличие стоп-слов.
    3. Меткам присваиваются предварительные оценки (Label Scores), например, на основе частоты их появления в объединенном наборе.
    4. Метки ранжируются по этим оценкам, формируя original_rank_position.
  5. Выполнение веб-поиска: Объединенный набор меток передается в Text Search Apparatus. Для каждой метки выполняется отдельный поисковый запрос.
  6. Фильтрация результатов поиска: Полученные результаты поиска анализируются. Система фильтрует их, оставляя только те ресурсы, которые содержат исходное изображение, его Near Duplicate Image или изображение из того же Image Cluster.
  7. Расчет метрик для ранжирования меток: Для каждой метки вычисляются:
    1. docs_matched: Количество отфильтрованных результатов.
    2. median_score: Медианная оценка релевантности этих результатов.
  8. Расчет итоговой оценки метки: Для каждой метки рассчитывается Text Label Ranking Score с использованием формулы, учитывающей docs_matched, median_score и original_rank_position.
  9. Финальное ранжирование и выбор: Метки ранжируются по Text Label Ranking Score. Метка с наивысшей оценкой выбирается как лучшая метка для исходного изображения.

Какие данные и как использует

Данные на входе

  • Мультимедиа факторы (Визуальные): Визуальные признаки (visual features) изображения (цвета, формы, края и т.д.). Они используются Image Similarity Apparatus для поиска дубликатов и определения принадлежности к кластерам. Также могут использоваться Image Label Apparatus для генерации меток на основе моделей релевантности (Relevance Models).
  • Контентные и Структурные факторы: Патент явно указывает, что Image Label Apparatus может использовать следующие данные для генерации исходных меток:
    • Текст, расположенный рядом с изображением на веб-странице.
    • Текст, включенный в само изображение (визуально отображаемый, OCR).
    • Текст в имени файла изображения.
    • Местоположение ресурса (URL) изображения.
  • Ссылочные факторы: Анкорный текст (anchor text) ссылок на изображение также упоминается как источник для генерации исходных меток.
  • Пользовательские факторы: Упоминается возможность выбора меток на основе характеристик пользователя (Claim 7), например, предпочитаемого языка или местоположения (для выбора языка меток).

Какие метрики используются и как они считаются

Ключевой метрикой является Text Label Ranking Score.

Патент предлагает конкретную формулу для ее расчета (Claim 10):

Ranking Score=median_score×log⁡(1+max⁡(1,docs_matched))×smoothing_factorsmoothing_factor+original_rank_position\text{Ranking Score} = \text{median\_score} \times \log(1 + \max(1, \text{docs\_matched})) \times \frac{\text{smoothing\_factor}}{\text{smoothing\_factor} + \text{original\_rank\_position}}

Компоненты формулы:

  • median_score: Отражает качество (релевантность) веб-страниц, где найдено изображение при поиске по данной метке.
  • log(1 + max(1, docs_matched)): Отражает широту использования изображения в контексте данной метки (количество найденных документов). Логарифмическая шкала снижает влияние очень больших чисел (закон убывающей отдачи).
  • smoothing_factor / (smoothing_factor + original_rank_position): Понижающий коэффициент, который учитывает исходную уверенность системы в метке. Чем ниже была исходная позиция (выше значение original_rank_position), тем сильнее пессимизация. smoothing_factor — это константа для настройки степени сглаживания.

Эта формула балансирует между качеством контекста, широтой использования и исходной уверенностью в метке.

Выводы

  1. Валидация через веб-консенсус: Google использует коллективный разум интернета для определения значения изображения. То, как владельцы сайтов используют и описывают изображение на своих страницах (контекст), напрямую определяет, какая метка будет ему присвоена.
  2. Контекст критичен: Значение изображения неразрывно связано с контекстом, в котором оно появляется. Система отдает предпочтение меткам, которые соответствуют релевантным веб-страницам (высокий median_score), содержащим это изображение.
  3. Важность визуального сходства: Система не ограничивается точными совпадениями изображения. Использование Near Duplicate Images и Image Clusters позволяет агрегировать данные о значении изображения, даже если используются его разные версии (разный размер, обрезка, качество).
  4. Сбалансированная оценка меток: Формула ранжирования меток сложна и учитывает три ключевых аспекта: качество контекста (median_score), популярность использования (docs_matched) и исходную вероятность (original_rank_position). Ни один из этих факторов не является доминирующим сам по себе.
  5. Традиционные факторы Image SEO как входные данные: Текст вокруг изображения, имена файлов и анкорные тексты явно упоминаются в патенте как источники для генерации исходных меток-кандидатов. Они являются отправной точкой для анализа.

Практика

Best practices (это мы делаем)

  • Обеспечение консистентности контекста: Критически важно, чтобы визуальное содержание изображения строго соответствовало его текстовому окружению на странице (заголовки, окружающий текст, подписи). Это повышает вероятность того, что нужная вам метка получит высокий median_score при валидации.
  • Оптимизация традиционных сигналов: Используйте релевантные и описательные имена файлов и анкорные тексты ссылок на изображение (как указано в патенте). Также используйте атрибуты alt и подписи, так как они коррелируют с окружающим текстом. Это увеличивает шансы, что нужные ключевые слова попадут в исходный набор кандидатов (высокий original_rank_position).
  • Стратегия для продуктовых изображений (E-commerce): Убедитесь, что продуктовые изображения размещены на страницах с четкой и точной информацией о товаре (название, модель, бренд). Это поможет системе связать изображение с коммерчески ценными метками.
  • Оптимизация под визуальную кластеризацию: Используйте высококачественные, четкие изображения. Это поможет Image Similarity Apparatus корректно идентифицировать дубликаты и кластеризовать ваше изображение с похожими изображениями в интернете, увеличивая объем данных для анализа (docs_matched).

Worst practices (это делать не надо)

  • Размещение изображений в нерелевантном контексте: Использование изображений исключительно в декоративных целях на страницах, тематика которых не связана с изображением. Система не сможет валидировать релевантные метки, так как median_score будет низким или docs_matched будет нулевым для нужных запросов.
  • Манипуляция метками (Keyword Stuffing): Попытки перечислить множество ключевых слов вокруг изображения, если они не поддержаны общим контекстом страницы. Хотя эти слова могут попасть в кандидаты, они не пройдут валидацию через веб-поиск, если остальной интернет не использует изображение в таком же контексте.
  • Использование стоковых фото для иллюстрации специфичных концепций: Если используется общее стоковое фото, система, скорее всего, присвоит ему общую метку, основанную на его использовании на тысячах других сайтов в разных контекстах, игнорируя ваш специфический контекст.

Стратегическое значение

Патент подтверждает, что Image SEO — это не изолированная дисциплина. Понимание изображения поисковой системой напрямую зависит от его интеграции в общую структуру и контент сайта, а также от его использования в интернете в целом. Стратегия должна фокусироваться на создании сильной и однозначной связи между визуальным и текстовым контентом. Это также подчеркивает растущую важность оптимизации под системы визуального поиска, такие как Google Lens, где описанный механизм является ключевым для интерпретации запроса пользователя.

Практические примеры

Сценарий: Оптимизация изображения кроссовка в E-commerce

  1. Задача: Гарантировать, что Google выберет метку "Nike Air Max 270 Black" для изображения товара, а не просто "черные кроссовки".
  2. Действия согласно патенту:
    1. Генерация кандидатов: Разместить изображение на странице товара с Title "Nike Air Max 270 Black", H1 с тем же текстом, имя файла nike-air-max-270-black.jpg. Это обеспечит высокий original_rank_position для нужной метки.
    2. Визуальное сходство: Использовать официальное фото производителя. Image Similarity Apparatus свяжет его с тем же фото на сайте Nike и других ритейлеров (кластеризация).
    3. Валидация через поиск: Когда система тестирует метку "Nike Air Max 270 Black", она найдет множество релевантных страниц (включая вашу и конкурентов), содержащих это фото. docs_matched будет высоким. Так как эти страницы релевантны запросу, median_score также будет высоким.
    4. Тест альтернативы: При тесте метки "черные кроссовки" система также найдет много страниц, но median_score может быть ниже (так как запрос общий), а количество других изображений на этих страницах будет огромным.
  3. Результат: Метка "Nike Air Max 270 Black" получает наивысший Text Label Ranking Score и выбирается системой для описания изображения.

Вопросы и ответы

Как этот патент влияет на использование атрибута alt для изображений?

Патент напрямую не упоминает атрибут alt. Однако он явно указывает, что текст, расположенный рядом с изображением, анкорный текст ссылок и имена файлов используются для генерации исходных кандидатов в метки. Поскольку атрибут alt часто совпадает с этими элементами или является важной частью текстового контекста страницы, он косвенно влияет на исходный набор меток и их original_rank_position. Лучшая практика остается неизменной: используйте точные и релевантные атрибуты alt.

Что такое "Near Duplicate Image" согласно патенту?

Это изображения, которые по сути идентичны исходному, но отличаются деталями обработки. Примеры включают изображения с разным разрешением, разной яркостью или контрастностью, а также обрезанные версии (например, удаление рамок) одного и того же изображения. Система рассматривает их как одно и то же изображение при анализе контекста.

Что важнее для выбора метки: количество сайтов, где используется изображение (docs_matched), или качество этих сайтов (median_score)?

Важны оба фактора, так как они перемножаются в формуле ранжирования. Высокий median_score указывает на то, что изображение используется в релевантном контексте на авторитетных/релевантных страницах. Высокий docs_matched указывает на широкое распространение этого контекста. Идеальная ситуация – это высокий median_score и достаточно высокий docs_matched.

Как работает понижающий коэффициент, основанный на original_rank_position?

Он снижает итоговую оценку для меток, в которых система изначально была менее уверена (т.е. они были ниже в списке кандидатов). Это означает, что если метка была сгенерирована случайно или на основе слабого сигнала, ей потребуется значительно более сильное подтверждение через веб-поиск (высокие median_score и docs_matched), чтобы занять первое место.

Применяется ли этот механизм в Google Lens?

Хотя патент не упоминает конкретные продукты, он описывает фундаментальный механизм трансляции визуального ввода в текстовый запрос для поиска информации об изображении. Это именно то, что делает Google Lens и функция "Поиск по картинке". Логично предположить, что этот или подобный механизм лежит в основе этих технологий.

Что произойдет, если мое уникальное изображение используется только на моем сайте?

В этом случае docs_matched будет равен 1 (только ваш сайт). Система будет полностью полагаться на контекст вашего сайта для определения метки. Если ваш сайт предоставляет четкий и релевантный контекст, система выберет правильную метку. Однако, если контекст размыт, точность определения метки может снизиться по сравнению с изображениями, которые валидируются на множестве сайтов.

Как система обрабатывает синонимы или разные формы слов в метках?

Патент предусматривает этап консолидации (Claim 3). Система идентифицирует "почти дубликаты текстовых меток" (near duplicate text labels). Это могут быть слова, отличающиеся на несколько символов (например, множественное число) или содержащие стоп-слова ("картинки кошек" vs "кошки"). Такие метки объединяются, и их предварительные оценки суммируются, что повышает их original_rank_position.

Что такое кластер изображений и как он используется?

Кластер изображений — это группа визуально похожих изображений, собранных вместе в базе данных Google. Они не обязательно являются почти дубликатами (как разные размеры одного фото), но имеют схожие визуальные признаки. При валидации метки система учитывает не только точные совпадения изображения на веб-страницах, но и наличие любых изображений из того же кластера. Это расширяет анализ и помогает понять значение изображения более широко.

Может ли этот механизм помочь в борьбе с неправомерным использованием моих изображений (воровством контента)?

Косвенно да. Если ваше изображение используется на спамных или низкокачественных сайтах в нерелевантном контексте, это может негативно повлиять на median_score при валидации меток. Однако основная цель механизма — понять значение изображения, а не бороться с нарушением авторских прав. Если изображение используется на многих авторитетных сайтах в правильном контексте, его значение будет определено точно.

Влияет ли язык пользователя на выбор метки?

Да, патент упоминает это (Claim 7). Характеристики пользователя, такие как язык или местоположение, могут использоваться для выбора меток на соответствующем языке. Это важно для многоязычных сайтов: контекст изображения должен быть четко определен на каждом языке, чтобы система могла выбрать правильную метку для пользователей, говорящих на этом языке.

Похожие патенты

Как Google конвертирует визуальные характеристики изображений в текстовые ключевые слова для визуального поиска
Google использует механизм для понимания содержания изображений путем анализа их визуальных характеристик (цвет, текстура, края). Система сопоставляет эти характеристики с текстовыми терминами, используя модели машинного обучения, обученные на истории поиска картинок. Это позволяет Google генерировать релевантные текстовые запросы для любого изображения, что является основой работы визуального поиска (например, Google Lens).
  • US8935246B2
  • 2015-01-13
  • Семантика и интент

  • Мультимедиа

  • Индексация

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google объединяет текстовые описания с разных сайтов для улучшения поиска по картинкам
Google улучшает поиск по картинкам, находя дубликаты или похожие изображения на разных сайтах. Система собирает все текстовые метки (из alt-текста, заголовков, окружающего текста), связанные с каждой копией изображения, объединяет их в единый набор и присваивает его всем копиям. Это позволяет находить изображение по любому из описаний, использованных в сети.
  • US7460735B1
  • 2008-12-02
  • Мультимедиа

  • Индексация

  • Семантика и интент

Как Google использует визуальное сходство и графовый анализ (VisualRank) для валидации и ранжирования меток изображений
Google валидирует текстовые метки изображений (например, Alt-текст или имена файлов) с помощью визуального анализа. Система строит граф, связывающий визуально похожие изображения. Симулируя навигацию пользователя по этому графу (алгоритм, подобный PageRank), Google определяет, какие метки наиболее релевантны фактическому содержанию изображения, отфильтровывая шум и повышая качество поиска по картинкам.
  • US7961986B1
  • 2011-06-14
  • Мультимедиа

  • SERP

Как Google агрегирует и ранжирует пользовательские метки для идентификации объектов в Визуальном поиске (Google Lens)
Google использует этот механизм для повышения точности идентификации объектов при поиске по изображению. Система находит множество визуально похожих изображений, загруженных пользователями (UGC), и анализирует их текстовые метки. Метки группируются по смыслу, а затем эти группы ранжируются на основе совокупной визуальной релевантности. Это позволяет определить наиболее вероятное название объекта, опираясь на коллективное мнение.
  • US9424279B2
  • 2016-08-23
  • Мультимедиа

  • Семантика и интент

  • SERP

Популярные патенты

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.
  • US7657520B2
  • 2010-02-02
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google использует генеративный ИИ для создания динамических и гиперперсонализированных бизнес-профилей
Google разрабатывает систему, которая заменяет статические бизнес-профили динамическими «курируемыми профилями», генерируемыми ИИ (например, LLM). Эти профили адаптируются в реальном времени под конкретного пользователя, учитывая его запрос, предпочтения, историю поиска и демографию, чтобы показать наиболее релевантный контент, продукты и описания бренда.
  • US20250054045A1
  • 2025-02-13
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

seohardcore