SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает и показывает изображения людей рядом с ссылками в результатах поиска

PROVIDING IMAGES OF NAMED RESOURCES IN RESPONSE TO A SEARCH QUERY (Предоставление изображений именованных ресурсов в ответ на поисковый запрос)
  • US8538943B1
  • Google LLC
  • 2008-07-24
  • 2013-09-17
  • SERP
  • Мультимедиа
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует запросы, содержащие имена людей. Система изучает изображения на страницах, попавших в топ выдачи, и использует filename, alt-text и метаданные, чтобы найти фотографию именно этого человека. Выбранное изображение затем отображается рядом с соответствующей ссылкой в SERP для улучшения пользовательского опыта.

Описание

Какую проблему решает

Патент решает задачу улучшения пользовательского опыта при поиске информации о конкретных людях. Когда пользователь видит изображение человека рядом со ссылкой в поисковой выдаче (SERP), он может быстрее определить релевантность результата, не переходя на страницу. Это экономит время пользователя и повышает наглядность выдачи.

Что запатентовано

Запатентована система и метод для автоматического выбора и отображения репрезентативного изображения человека в результатах поиска. Если поисковый запрос содержит имя, система анализирует изображения, содержащиеся в найденных ресурсах. Идентификация нужного изображения происходит на основе анализа связанных с ним описаний, таких как имя файла (filename), альтернативный текст (alt-text) или метаданные (image metadata).

Как это работает

Система работает в несколько этапов:

  • Идентификация имени: Определяется, содержит ли поисковый запрос имя человека, используя вероятностные модели.
  • Анализ результатов: Система (называемая Image Search Facility) получает результаты поиска и анализирует изображения, содержащиеся в этих ресурсах.
  • Детекция лиц: Используются алгоритмы для определения, содержит ли изображение лицо (face image). Это может происходить заранее на этапе индексирования.
  • Ассоциация имени: Система проверяет, совпадает ли имя из запроса с именем файла, alt-text или метаданными изображения.
  • Выбор и отображение: Если найдено несколько подходящих изображений, выбирается лучшее на основе оценок качества (размер, разрешение, цветность). Выбранное изображение отображается вместе с результатами поиска, рядом с соответствующей ссылкой.

Актуальность для SEO

Высокая. Отображение изображений рядом со ссылками в SERP, особенно при поиске именованных сущностей (включая людей), является стандартной функцией современного поиска. Описанные в патенте методы идентификации изображений через alt-text и filename остаются фундаментальными для Image SEO и доступности контента.

Важность для SEO

Патент имеет значительное влияние на SEO (7/10). Хотя он не описывает алгоритм ранжирования веб-страниц, он напрямую влияет на внешний вид и кликабельность (CTR) результатов в выдаче. Для сайтов, ранжирующихся по запросам, связанным с именами людей (биографии, новости, корпоративные сайты), правильная оптимизация изображений становится критически важной для получения этого расширенного сниппета и повышения видимости в SERP.

Детальный разбор

Термины и определения

Alt-text (Альтернативный текст)
Текст в HTML-документе, предназначенный для отображения веб-браузером, когда изображение не может быть показано. Используется системой как один из ключевых источников для идентификации содержимого изображения.
Computer-searchable index (Компьютерный поисковый индекс)
Индекс ресурсов. В контексте патента упоминается индекс, который генерирует Image Search Facility для хранения информации об изображениях и результатах их анализа.
Face Detection Algorithms (Алгоритмы детекции лиц)
Программное обеспечение, используемое для определения факта наличия человеческого лица на изображении.
Face Image (Изображение лица)
Изображение, содержащее лицо человека, идентифицированное с помощью Face Detection Algorithms.
Image Metadata (Метаданные изображения)
Дополнительная информация об изображении, например, разрешение, размер, цветовая модель. Используется для оценки качества изображения и его идентификации.
Image Search Facility (Система поиска изображений)
Компонент системы, ответственный за сканирование ресурсов, идентификацию изображений, детекцию лиц, извлечение связанной информации и выбор финального изображения для отображения в SERP.
Probability Model (Вероятностная модель для имен)
Модель, используемая для определения вероятности того, что термин в запросе является именем (первым, средним или фамилией). Строится на основе анализа частотности терминов в запросах и в обучающих данных.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора изображения для отображения в SERP.

  1. Поисковая система определяет, что поисковый запрос включает имя человека на основе терминов запроса.
  2. Идентифицируется конкретный ресурс среди результатов поиска, который содержит несколько изображений.
  3. Из этого ресурса извлекается имя файла (file name), метаданные (image metadata) ИЛИ альтернативный текст (alt-text) конкретного изображения.
  4. Определяется, что извлеченные имя файла, метаданные ИЛИ alt-text включают имя человека из запроса.
  5. На основании этого определения (пункт 4), данное конкретное изображение предоставляется вместе с результатами поиска.

Ядром изобретения является использование file name, image metadata или alt-text как подтверждающего фактора для связи изображения с именем в запросе.

Claim 2 (Зависимый от 1): Уточняет метод определения имени в запросе.

  1. Определение вероятности того, что один или несколько терминов запроса являются именем человека.
  2. Сравнение этих терминов со списком сохраненных терминов, которые не являются именами, и подтверждение, что терминов запроса нет в этом списке (например, исключение фраз типа "Jasmine Rice").

Claim 3 (Зависимый от 1): Добавляет к основному процессу этап определения того, что конкретное изображение включает лицо этого человека. Это подразумевает использование детекции лиц.

Claim 4 (Зависимый от 1): Описывает процесс исключения других изображений.

  1. Если ресурс содержит второе изображение, система определяет, что его имя файла, метаданные или alt-text НЕ включают имя человека из запроса.
  2. Второе изображение исключается из предоставления с результатами поиска.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, используя предварительные вычисления и модифицируя финальную выдачу.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная предварительная обработка (офлайн). Image Search Facility сканирует ресурсы, идентифицирует изображения, запускает алгоритмы детекции лиц и извлекает описательную информацию (filename, alt-text, metadata, окружающий текст). Эта информация сохраняется в Computer-searchable index.

QUNDERSTANDING – Понимание Запросов
Система использует Probability Model для определения того, содержит ли входящий запрос имя человека. Это служит триггером для активации механизма.

RANKING – Ранжирование
Происходит стандартное ранжирование ресурсов по запросу.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Презентация)
Основное применение патента. После получения ранжированных результатов Image Search Facility анализирует изображения в топовых ресурсах (используя данные из индекса). Происходит сверка имени из запроса с дескрипторами изображений. Если найдено несколько кандидатов, они оцениваются по качеству. Лучшее изображение внедряется в финальную SERP рядом со ссылкой на соответствующий ресурс.

Входные данные:

  • Поисковый запрос.
  • Результаты поиска (список ресурсов).
  • Индекс изображений, содержащий данные детекции лиц и дескрипторы (filename, alt-text, metadata).
  • Вероятностная модель имен и списки исключений.

Выходные данные:

  • Модифицированная страница результатов поиска (SERP) с внедренным изображением рядом с одной или несколькими ссылками.

На что влияет

  • Специфические запросы: В первую очередь влияет на информационные запросы, содержащие имена людей (знаменитости, политики, профессионалы, исторические личности).
  • Типы контента: Влияет на отображение ресурсов, богатых изображениями, таких как биографические статьи, новостные материалы, профили в социальных сетях, корпоративные страницы "О команде".

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда система с достаточной степенью уверенности (на основе Probability Model) определяет, что поисковый запрос содержит имя человека.
  • Ограничения: Применяется, если в результатах поиска есть ресурсы, содержащие изображения, и если хотя бы одно из этих изображений может быть ассоциировано с именем в запросе через его дескрипторы. Патент упоминает возможность применения этого механизма только для топовых результатов (например, топ-20) или только для первой страницы выдачи.

Пошаговый алгоритм

Процесс А: Офлайн-индексирование (Выполняется Image Search Facility)

  1. Сканирование ресурсов: Обход ресурсов, размещенных на контент-хостах.
  2. Идентификация изображений: Определение того, является ли ресурс изображением (например, по расширению файла JPG, TIFF, PNG).
  3. Детекция лиц: Применение Face Detection Algorithms для определения, является ли изображение Face Image.
  4. Извлечение информации: Извлечение имени файла, alt-text и метаданных (разрешение, размер, цветность), а также окружающего текста.
  5. Сохранение: Сохранение изображения и извлеченной информации в Computer-searchable index.

Процесс Б: Обработка запроса в реальном времени

  1. Анализ запроса: Определение того, содержит ли поисковый запрос имя человека (используя Probability Model и списки исключений).
  2. Получение результатов: Получение стандартных результатов поиска от поисковой системы.
  3. Анализ ресурсов: Для ресурсов в результатах поиска (например, для Топ-N) определяется, содержат ли они изображения.
  4. Фильтрация изображений: Проверка, является ли изображение Face Image (на основе данных из индекса).
  5. Проверка ассоциации (Ключевой этап): Проверка, соответствует ли лицо на изображении человеку из запроса. Это делается путем сравнения имени из запроса с именем файла, alt-text, метаданными изображения и окружающим текстом. Рассчитывается комбинированная вероятность соответствия.
  6. Оценка и ранжирование кандидатов: Если найдено несколько подходящих изображений, им присваивается оценка (score). Оценка основывается на качестве: размер файла, разрешение, цветность (цветные предпочтительнее ч/б), пропорция лица в кадре, количество лиц (предпочтительнее одно лицо).
  7. Выбор: Выбор изображения с наивысшей оценкой.
  8. Предоставление результатов: Включение выбранного изображения в результаты поиска рядом со ссылкой на соответствующий ресурс.

Какие данные и как использует

Данные на входе

Система использует следующие данные для идентификации и выбора изображений:

  • Мультимедиа факторы: Пиксельные данные изображений (для детекции лиц).
  • Структурные и Контентные факторы:
    • Alt-text: Критически важный дескриптор для ассоциации имени с изображением (Claim 1).
    • Имя файла (Filename): Используется как сигнал для ассоциации имени, например, john-doe.jpg (Claim 1).
    • Окружающий текст: Текст на веб-странице, где встроено изображение, сканируется для подтверждения имени.
  • Технические факторы (Image Metadata):
    • Разрешение изображения (Image resolution).
    • Размер изображения (Image size).
    • Цветовая информация (Colors) (например, цветное или черно-белое).
  • Системные данные:
    • Словари имен (для построения Probability Model).
    • Списки фраз, которые не являются именами (для исключений).

Какие метрики используются и как они считаются

  • Вероятность имени (Name Probability): Рассчитывается с использованием байесовской оценки. Учитывается базовая вероятность появления термина в запросе (P(term|query)) и вероятность того, что этот термин является именем на основе обучающих данных (P(term|name)).
  • Face Detection Confidence: Результат работы алгоритмов детекции лиц, определяющий вероятность наличия лица.
  • Combined Probability (Комбинированная вероятность соответствия): Вероятность того, что изображение лица соответствует имени в запросе. Учитывает совпадение имени в filename, alt-text, окружающем тексте.
  • Image Quality Score (Оценка качества изображения): Используется для ранжирования подходящих изображений. Метрика комбинирует:
    • Вероятность на основе размера изображения (больше размер – выше оценка).
    • Вероятность на основе разрешения.
    • Вероятность на основе цветов (цветные выше ч/б).
    • Размер лица внутри изображения (больше пропорция – выше оценка).
    • Количество лиц на изображении (меньше лиц – выше оценка).

Выводы

  1. Механизм улучшения SERP для запросов о людях: Патент описывает конкретный механизм для улучшения визуального представления результатов поиска при запросах, содержащих имена людей, путем добавления фотографии этого человека рядом со ссылкой.
  2. Критическая роль дескрипторов изображения: Alt-text, filename и image metadata являются основными факторами для подтверждения того, что изображение соответствует имени в запросе (Claim 1). Это подчеркивает важность базовой оптимизации изображений.
  3. Использование Детекции Лиц (Face Detection): Система использует алгоритмы детекции лиц для фильтрации кандидатов (определение наличия лица), но не полагается на Распознавание Лиц (Face Recognition) для идентификации личности. Идентификация основана на текстовых сигналах.
  4. Ранжирование на основе качества изображения: Если найдено несколько подходящих изображений, система выбирает лучшее, используя метрики качества, такие как размер, разрешение, цветность и композиция кадра (пропорция лица, количество людей).
  5. Комбинированный подход (Офлайн и Онлайн): Процесс включает как предварительное индексирование и анализ изображений (офлайн), так и обработку запроса и модификацию SERP в реальном времени.
  6. Вероятностное распознавание имен: Система использует сложную вероятностную модель и списки исключений для точной идентификации того, что запрос содержит имя человека.

Практика

Best practices (это мы делаем)

  • Оптимизация изображений ключевых персон: Для корпоративных сайтов, блогов, новостных порталов необходимо оптимизировать фотографии сотрудников, авторов или упоминаемых лиц.
  • Использование описательных имен файлов: Используйте четкие и релевантные имена файлов, включающие имя человека. Например, john-doe-ceo.jpg вместо IMG1234.jpg. Это напрямую соответствует механизму ассоциации, описанному в Claim 1.
  • Точный и описательный Alt-text: Всегда заполняйте alt-text, точно описывая, кто изображен на фото. Включение полного имени человека критически важно для работы этого алгоритма (Claim 1).
  • Использование высококачественных изображений: Загружайте изображения достаточного размера и разрешения. Система предпочитает более качественные изображения при выборе кандидата для отображения в SERP (Image Quality Score).
  • Предпочтение портретных фото: Используйте изображения, где лицо человека является основным объектом и занимает значительную часть кадра. Система присваивает более высокие оценки таким изображениям по сравнению с групповыми фото.
  • Контекстное окружение: Размещайте изображение рядом с текстом, упоминающим имя человека, так как это также используется для подтверждения ассоциации (Combined Probability).

Worst practices (это делать не надо)

  • Игнорирование Alt-text или его неправильное использование: Оставлять alt-text пустым или использовать его для keyword stuffing'а, не описывающего изображение. Это лишает систему ключевого сигнала для идентификации.
  • Генерические имена файлов: Использование автоматически сгенерированных имен файлов (например, DCIM001.jpg).
  • Использование низкокачественных изображений: Использование очень маленьких изображений или изображений с низким разрешением. Даже если они будут идентифицированы, они проиграют конкуренцию более качественным кандидатам.
  • Использование сложных групповых фото в качестве основного изображения: Попытка использовать групповое фото как репрезентативное изображение для одного человека. Система понижает такие изображения в ранжировании кандидатов.

Стратегическое значение

Патент подтверждает стратегическую важность оптимизации изображений для повышения видимости сущностей (в данном случае, людей). Он демонстрирует, что Google активно использует традиционные сигналы Image SEO (alt-text, filename) в сочетании с продвинутыми технологиями (детекция лиц, вероятностные модели) для формирования финальной выдачи. Достижение такого расширенного визуального представления в SERP может значительно увеличить CTR и узнаваемость бренда или персоны.

Практические примеры

Сценарий: Оптимизация страницы "Наша команда" для отображения фото в SERP

  1. Анализ текущей ситуации: На странице "Наша команда" есть фотографии сотрудников, но при поиске по имени сотрудника в SERP фото не отображается. Изображения имеют имена типа team-member-1.jpg, а alt-text просто "Сотрудник".
  2. Применение рекомендаций патента:
    • Выбираются качественные портретные фото для каждого сотрудника, где лицо хорошо видно.
    • Имена файлов переименовываются: ivan-ivanov-manager.jpg.
    • Alt-text обновляется: "Иван Иванов, менеджер по продажам компании Ромашка".
    • Обеспечивается достаточный размер изображений (например, 800x800px).
  3. Ожидаемый результат: При последующем поиске по запросу

Вопросы и ответы

Насколько важен Alt-text согласно этому патенту?

Alt-text является критически важным элементом. В основном независимом пункте (Claim 1) патента он указан как один из трех основных источников (наряду с именем файла и метаданными) для подтверждения того, что изображение соответствует имени человека в запросе. Без корректного alt-text система может не смочь установить эту связь.

Влияет ли имя файла изображения на его отображение в SERP?

Да, напрямую. Имя файла (filename) явно указано как один из ключевых дескрипторов, используемых для ассоциации изображения с именем в поисковом запросе. Использование описательных имен файлов (например, включающих имя человека) значительно повышает шансы на то, что изображение будет выбрано для отображения.

Как система выбирает между несколькими фотографиями одного и того же человека на странице?

Если несколько изображений соответствуют имени, система присваивает им оценки качества (Image Quality Score) и ранжирует их. Оценка учитывает размер изображения, разрешение, цветность (цветные предпочтительнее), размер лица в кадре и количество лиц. Изображение с наивысшей оценкой будет выбрано для отображения.

Что делать, если на фото изображено несколько человек (групповое фото)?

Система предпочитает изображения с меньшим количеством лиц (в идеале – одно). Групповые фото получают более низкую оценку качества при выборе репрезентативного изображения для конкретного человека. Рекомендуется использовать индивидуальные портретные фото для оптимизации под этот механизм.

Использует ли Google распознавание лиц (Face Recognition) для идентификации личности в этом патенте?

Патент упоминает использование детекции лиц (Face Detection) — определение факта наличия лица на изображении. Он не описывает механизм распознавания лиц (идентификацию конкретного человека по биометрии). Идентификация личности происходит за счет анализа текстовых дескрипторов (alt-text, filename), а не биометрического сравнения.

Как система определяет, что запрос содержит имя человека?

Используется вероятностная модель (Probability Model). Она оценивает вероятность того, что термины в запросе являются именем, на основе статистики использования этих терминов. Также система использует списки исключений — фразы, которые похожи на имена, но ими не являются (например, "Jasmine Rice").

Влияет ли этот патент на ранжирование веб-страниц?

Нет, патент не описывает алгоритм ранжирования веб-страниц. Он описывает механизм постобработки уже сформированной выдачи для улучшения ее визуального представления (SERP Presentation). Однако, улучшенное представление может косвенно повлиять на CTR результата.

Имеет ли значение размер и разрешение изображения?

Да, большое значение. Размер и разрешение изображения являются важными компонентами оценки качества (Image Quality Score). При прочих равных система выберет более крупное и четкое изображение для отображения в результатах поиска.

Работает ли этот механизм только для первой страницы выдачи?

В патенте упоминается, что Image Search Facility может быть настроена на обработку только топовых результатов (например, Топ-20) или только первой страницы поисковой выдачи для оптимизации ресурсов. На практике этот механизм чаще всего наблюдается именно в топе выдачи.

Нужно ли специально размечать изображения (например, Schema.org) для работы этого алгоритма?

Патент не упоминает использование специальной микроразметки. Он полагается на стандартные HTML-атрибуты (alt-text) и технические характеристики (имя файла, метаданные). Однако использование микроразметки в целом полезно для лучшего понимания контента поисковыми системами.

Похожие патенты

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
  • US8775436B1
  • 2014-07-08
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует визуальное сходство и графовый анализ (VisualRank) для валидации и ранжирования меток изображений
Google валидирует текстовые метки изображений (например, Alt-текст или имена файлов) с помощью визуального анализа. Система строит граф, связывающий визуально похожие изображения. Симулируя навигацию пользователя по этому графу (алгоритм, подобный PageRank), Google определяет, какие метки наиболее релевантны фактическому содержанию изображения, отфильтровывая шум и повышая качество поиска по картинкам.
  • US7961986B1
  • 2011-06-14
  • Мультимедиа

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует распознавание лиц и кластеризацию для очистки и переранжирования выдачи в Поиске по Картинкам
Google применяет технологию компьютерного зрения для улучшения поиска изображений по именам людей. Система анализирует топ выдачи, распознает лица и группирует похожие изображения. Определив доминирующий кластер (искомого человека), система переранжирует результаты: визуально похожие изображения повышаются, а "выбросы" (фото других людей) понижаются, игнорируя противоречивые текстовые сигналы.
  • US9268793B2
  • 2016-02-23
  • Мультимедиа

  • SERP

Популярные патенты

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google рассчитывает авторитетность и ранжирует сайты, вычисляя кратчайшие пути до доверенных источников (Seeds) в Веб-графе
Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния используются для расчета метрик авторитетности и ранжирования сайтов: чем ближе сайт к доверенным источникам, тем выше его предполагаемое качество.
  • US8631094B1
  • 2014-01-14
  • EEAT и качество

  • Ссылки

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

seohardcore