SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает изображения с сайта компании для показа в ее бизнес-профиле (Local Pack, Knowledge Panel)

EXTRACTION OF BUSINESS-RELEVANT IMAGE CONTENT FROM THE WEB (Извлечение релевантного для бизнеса графического контента из Интернета)
  • US9645981B1
  • Google LLC
  • 2013-01-18
  • 2017-05-09
  • Local SEO
  • Мультимедиа
  • Краулинг
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует автоматизированную систему для выбора наиболее репрезентативных изображений бизнеса с его официального сайта. Система предпочитает локальные сайты филиалов, а не общие сайты сетей. Она анализирует структуру сайта для поиска разделов с изображениями, а затем оценивает сами изображения, отдавая предпочтение реальным цветным фотографиям высокого разрешения и отфильтровывая графику, баннеры и нежелательный контент.

Описание

Какую проблему решает

Патент решает проблему нерепрезентативных изображений, связанных с бизнес-листингами (например, в Google Maps или Knowledge Panel). Часто изображения, автоматически извлекаемые с сайта компании, могут включать स्टॉक-фотографии, логотипы, баннеры или изображения, не относящиеся к конкретному локальному филиалу (например, общие фото с корпоративного сайта сети). Цель изобретения — улучшить качество и релевантность этих изображений, гарантируя, что они точно представляют конкретное заведение.

Что запатентовано

Запатентована система для интеллектуального извлечения и фильтрации изображений с веб-сайта компании. Ключевыми аспектами являются: (1) фильтрация исходных страниц для фокусировки на локально релевантных сайтах (а не на сайтах сетей с несколькими локациями), (2) сканирование связанных страниц в пределах домена для поиска изображений и (3) аннотирование и оценка извлеченных изображений на основе их характеристик (например, фотография против графики, разрешение, соотношение сторон) для выбора лучших кандидатов.

Как это работает

Система работает в несколько этапов:

  • Фильтрация домашних страниц: Система идентифицирует официальные страницы бизнеса, но отфильтровывает страницы, представляющие сети с множеством локаций, чтобы сосредоточиться на локальном контенте.
  • Сканирование домена: Система сканирует связанные страницы на выбранном домене, используя эвристики, такие как пути URL (например, /gallery) и глубина клика от корня, для поиска потенциальных изображений.
  • Извлечение и Аннотирование: Изображения извлекаются из HTML и CSS. Затем Image Annotator анализирует характеристики каждого изображения: вероятность непристойного контента, является ли оно фотографией или графикой, цветное или черно-белое, его размеры и соотношение сторон.
  • Оценка и Фильтрация: Изображениям присваиваются оценки на основе аннотаций. Система предпочитает цветные фотографии высокого разрешения. Изображения с признаками баннеров (специфическое соотношение сторон), графики или непристойного контента отфильтровываются.
  • Выбор: Лучшие изображения выбираются для отображения в результатах поиска, связанных с этим бизнесом.

Актуальность для SEO

Высокая. Отображение точной и привлекательной визуальной информации о бизнесе критически важно для локального поиска и платформ карт. Механизмы, описанные в патенте, напрямую связаны с тем, как Google выбирает изображения для бизнес-профилей. По мере роста важности визуального поиска и Local SEO, актуальность этого патента сохраняется.

Важность для SEO

Патент имеет высокое значение, особенно для Local SEO и управления репутацией. Он предоставляет прямое руководство к действию относительно того, какие изображения Google стремится использовать для представления бизнеса и где их следует размещать на сайте. Понимание этих механизмов позволяет SEO-специалистам оптимизировать визуальный контент на сайтах клиентов, чтобы контролировать, как бизнес представлен в SERP и на картах.

Детальный разбор

Термины и определения

Annotation (Аннотация)
Данные, сгенерированные для описания характеристик извлеченного изображения. Включает вероятностные оценки (например, вероятность того, что это фотография) и фактические данные (например, размеры, цветность).
Business to homepage mapping (Соответствие бизнеса домашней странице)
База данных или хранилище, которое связывает сущность бизнеса с его официальными веб-страницами (URL).
Image Annotator (Аннотатор изображений)
Компонент системы (внутренний или внешний), который анализирует файл изображения для определения его характеристик (например, обнаружение непристойного контента, классификация фото/графика).
Graphical rendering (Графический рендеринг)
Изображение, созданное компьютером (например, логотип, иконка, иллюстрация, схема), в отличие от фотографии реального объекта.
Web index (Веб-индекс)
Индекс сканирования интернета. Используется для определения структуры сайта, например, для расчета глубины клика (number of clicks) до определенной страницы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс извлечения и выбора изображений для бизнес-заведения.

  1. Система получает набор веб-страниц, соответствующих бизнесу.
  2. Критическое условие фильтрации: Этот набор уже отфильтрован, чтобы исключить домашние страницы бизнесов, представляющих несколько локаций (фокус на локальной релевантности).
  3. Система выбирает одну или несколько страниц из этого набора, которые принадлежат и управляются данным бизнесом (валидация подлинности).
  4. Система извлекает связанные веб-страницы (сканирование внутри сайта).
  5. Извлекается графический контент (изображения).
  6. Генерируются аннотации на основе характеристик изображений. Аннотация связана с вероятностью того, что характеристика удовлетворяет определенному критерию.
  7. Контент фильтруется на основе аннотаций.
  8. Отфильтрованный контент предоставляется для отображения в ответ на поисковый запрос об этом бизнесе.
  9. Спецификация характеристик: Упомянуты конкретные характеристики: вероятность того, что это фотография, а не графика (photograph versus a graphical rendering); индикация цветности (black and white or color); индикация релевантности URL страницы, с которой извлечено изображение.

Claim 3 (Зависимый): Детализирует, как извлекаются связанные страницы.

Извлечение связанных страниц может основываться на: домене, имени пути (path name) веб-страницы или количестве кликов (number of clicks), необходимых для перехода на страницу из корня домена. Количество кликов определяется на основе веб-индекса.

Claim 4 (Зависимый): Детализирует технический аспект извлечения.

Извлечение изображений может происходить из HTML (HyperText Markup Language) или из каскадных таблиц стилей (CSS), которые ссылаются на изображение.

Claim 6 (Зависимый): Добавляет физические размеры (physical dimensions) к характеристикам, используемым для аннотирования.

Claim 7, 8, 9 (Зависимые): Описывают механизм оценки и фильтрации.

Изображениям присваиваются оценки (scores) на основе характеристик. Фильтрация может включать выбор изображений с оценкой выше порога или сортировку изображений по оценке и выбор заданного количества лучших.

Claim 12 (Зависимый): Описывает метод фильтрации.

Фильтрация может включать применение каскада фильтров (cascade of filters), где каждый фильтр учитывает отдельную аннотацию.

Где и как применяется

Изобретение в основном применяется на этапах сбора и индексирования данных для предварительной обработки визуального контента, связанного с сущностями бизнеса.

CRAWLING – Сканирование и Сбор данных
Система активно сканирует веб-сайты бизнеса. Это не просто стандартное сканирование, а целенаправленный сбор данных (Data Acquisition). Используя Business to homepage mapping, система определяет, какие домены сканировать. Затем она выполняет ограниченное сканирование внутри домена (fetch related pages within domain) для поиска изображений, используя эвристики, такие как пути URL и глубина клика.

INDEXING – Индексирование и извлечение признаков
Это основной этап работы системы.

  • Извлечение (Extraction): Изображения извлекаются из HTML и CSS.
  • Аннотирование (Annotation/Feature Extraction): Image Annotator анализирует файлы изображений и генерирует признаки (характеристики): тип (фото/графика), цветность, размеры, соотношение сторон, вероятность непристойности.
  • Оценка и Выбор (Scoring/Selection): Система оценивает изображения на основе признаков и выбирает наиболее репрезентативный набор.
  • Хранение: Выбранные изображения (или ссылки на них) сохраняются и ассоциируются с сущностью бизнеса (например, в Knowledge Graph или индексе локального поиска).

METASEARCH – Метапоиск и Смешивание
Результаты работы системы используются на этом этапе. Когда пользователь ищет бизнес, система формирования выдачи (например, Knowledge Panel или Local Pack) извлекает предварительно обработанные и выбранные изображения, ассоциированные с этим бизнесом.

Входные данные:

  • Идентификатор бизнес-заведения.
  • Business to homepage mapping (список потенциальных официальных URL).
  • Данные веб-индекса (для анализа структуры сайта и глубины клика).

Выходные данные:

  • Набор отфильтрованных, высококачественных и репрезентативных изображений (или ссылок на них), ассоциированных с бизнес-заведением.

На что влияет

  • Конкретные типы контента: Влияет на визуальный контент (изображения), размещенный на официальных сайтах компаний.
  • Конкретные ниши или тематики: Наиболее сильно влияет на локальный бизнес (Local SEO), особенно на сетевые компании (рестораны, отели, ритейл), где существует различие между корпоративным сайтом и сайтом/страницей локального филиала.
  • Определенные форматы контента: Система явно различает фотографии и графические рендеринги (логотипы, иконки), отдавая предпочтение первым.

Когда применяется

  • Триггеры активации: Процесс запускается при необходимости обновить или создать набор репрезентативных изображений для конкретного бизнес-заведения.
  • Условия применения (Фильтрация сайтов): Система активирует процесс извлечения только для тех сайтов, которые идентифицированы как принадлежащие конкретному заведению, и пропускает общие сайты сетей, представляющих множество локаций.
  • Условия применения (Фильтрация изображений): Фильтры активируются для удаления нежелательного контента (непристойные материалы), нерепрезентативного контента (баннеры, графика) и низкокачественного контента (маленькие размеры).

Пошаговый алгоритм

Процесс извлечения и выбора релевантных изображений бизнеса.

  1. Идентификация и Валидация Домашних Страниц:
    • Получение списка потенциальных домашних страниц для бизнеса из Business to homepage mapping.
    • Фильтрация списка: удаление страниц, которые представляют бизнес с множеством локаций (например, главный корпоративный сайт сети).
    • Валидация оставшихся страниц: подтверждение того, что они принадлежат и управляются данным конкретным бизнесом.
  2. Сканирование и Сбор Связанных Страниц:
    • Для каждого валидированного домена система извлекает связанные страницы.
    • Применяются эвристики для определения приоритетов сканирования: предпочтение отдается страницам с релевантными путями URL (например, содержащими "gallery", "photos") и страницам с меньшей глубиной клика от корня домена.
  3. Извлечение Изображений:
    • Анализ HTML и CSS полученных страниц для идентификации файлов изображений (по расширениям, таким как .jpg, .png, .gif).
    • Извлечение идентифицированных файлов изображений.
  4. Аннотирование Изображений:
    • Каждое извлеченное изображение отправляется в Image Annotator.
    • Генерация аннотаций на основе характеристик:
      • Вероятность содержания непристойного материала.
      • Вероятность того, что это фотография, а не графика.
      • Индикация цветности (цветное или черно-белое).
      • Физические размеры (ширина, высота).
      • Соотношение сторон (для выявления баннеров).
      • Релевантность URL источника.
  5. Фильтрация и Оценка (Scoring):
    • Применение каскада фильтров или расчет оценки (score) для каждого изображения на основе аннотаций.
    • Фильтрация: удаление изображений с высокой вероятностью непристойности, графики, черно-белых изображений, изображений с экстремальным соотношением сторон (баннеры).
    • Оценка: предпочтение отдается цветным фотографиям с большими физическими размерами.
  6. Выбор и Предоставление:
    • Сортировка оставшихся изображений по их оценкам.
    • Выбор Топ-N изображений или изображений, превышающих пороговое значение оценки.
    • Предоставление выбранного набора изображений для отображения в поисковых сервисах.

Какие данные и как использует

Данные на входе

  • Технические факторы:
    • URL-структура: Пути URL (path names) анализируются на наличие ключевых слов, указывающих на изображения (например, "gallery", "pictures", "photo").
  • Структурные факторы:
    • Структура сайта (Архитектура): Используется глубина клика (number of clicks) от корневой страницы домена. Страницы, находящиеся глубже в структуре сайта, считаются менее релевантными.
    • HTML/CSS: Анализируются для извлечения ссылок на изображения.
  • Мультимедиа факторы:
    • Файлы изображений: Анализируются пиксельные данные для определения содержания.
    • Размеры и форматы: Физические размеры (physical dimensions) и соотношение сторон (aspect ratio) извлекаются и используются в оценке.
  • Системные данные:
    • Business to homepage mapping: Используется для идентификации официальных сайтов.
    • Web index: Используется для определения структуры сайта и глубины клика.

Какие метрики используются и как они считаются

Система использует ряд метрик и оценок, генерируемых Image Annotator, для расчета итогового score изображения.

  • Вероятность Фотографии (Probability of Photograph): Оценка того, является ли изображение реальной фотографией или графическим рендерингом. Фотографии предпочтительнее.
  • Цветность (Color Indication): Определение, является ли изображение цветным или черно-белым. Цветные предпочтительнее.
  • Физические Размеры (Physical Dimensions): Ширина и высота изображения. Большие размеры предпочтительнее (выше разрешение).
  • Соотношение Сторон (Aspect Ratio): Отношение ширины к высоте. Используется для идентификации баннеров (например, очень широкие и низкие изображения), которые отфильтровываются.
  • Вероятность Непристойного Контента (Probability of Obscene Material): Оценка вероятности содержания нежелательного контента. Изображения с высокой вероятностью отфильтровываются.
  • Релевантность URL (URL Relevance): Оценка на основе текста в URL, указывающая на вероятность наличия релевантных изображений на странице.
  • Глубина Клика (Click Depth): Количество кликов от корня домена. Меньшая глубина предпочтительнее.

Агрегация данных: Метрики могут быть объединены в единый score с использованием весовых коэффициентов для подчеркивания важности определенных характеристик (например, фильтрация непристойного контента может иметь наивысший вес).

Методы фильтрации: Может использоваться каскад фильтров (например, сначала удаление непристойных, затем удаление графики, затем удаление Ч/Б) или фильтрация на основе пороговых значений итогового score.

Выводы

  1. Локальная релевантность приоритетнее корпоративной: Google активно фильтрует общие сайты крупных сетей при поиске изображений для конкретного локального филиала. Система стремится найти сайт или страницу, посвященную именно этой локации.
  2. Аутентичность визуального контента: Система явно предпочитает реальные фотографии (photographs) и пессимизирует графические рендеринги (graphical renderings) — логотипы, иконки, иллюстрации. Это часть стремления Google показать, как бизнес выглядит на самом деле.
  3. Технические характеристики изображений имеют значение: Предпочтение отдается цветным изображениям с большими физическими размерами (высокое разрешение). Соотношение сторон используется для отсеивания баннеров.
  4. Структура сайта влияет на обнаружение изображений: Система использует эвристики для поиска изображений, включая анализ путей URL (наличие слов типа "gallery") и глубину клика. Изображения, размещенные ближе к корню сайта или в специализированных разделах, имеют больше шансов быть найденными и выбранными.
  5. Извлечение из CSS: Система способна извлекать изображения не только из тегов в HTML, но и те, что указаны в CSS (например, фоновые изображения).
  6. Автоматизированная цензура: Встроенный механизм фильтрации непристойного контента (obscene material) является обязательным этапом обработки.

Практика

Best practices (это мы делаем)

  • Создание локальных страниц для филиалов: Для сетевых бизнесов критически важно иметь отдельные страницы или поддомены для каждой локации. Размещайте уникальные изображения конкретного филиала именно там, так как Google может игнорировать главный корпоративный сайт.
  • Использование реальных фотографий: Отдавайте приоритет высококачественным, цветным фотографиям интерьера, экстерьера, товаров и персонала. Избегайте использования стоковых фотографий, иллюстраций или компьютерной графики в качестве основных изображений бизнеса.
  • Оптимизация разрешения и формата: Загружайте изображения с достаточно большими физическими размерами (высоким разрешением). Используйте стандартные соотношения сторон (например, 4:3, 16:9), чтобы избежать классификации изображения как баннера.
  • Оптимизация структуры сайта для изображений:
    • Размещайте важные изображения ближе к главной или локальной посадочной странице (минимизируйте глубину клика).
    • Рассмотрите создание отдельной фотогалереи и используйте в URL понятные пути, такие как /gallery/, /photos/ или /foto/. Патент явно указывает, что такие пути используются как сигнал релевантности.
  • Техническая реализация: Убедитесь, что основные изображения реализованы через стандартные HTML теги , хотя система и может читать CSS. Это обеспечивает максимальную совместимость и ясность для краулеров.

Worst practices (это делать не надо)

  • Использование графики вместо фотографий: Полагаться на логотипы, иконки или иллюстрации для представления бизнеса. Система классифицирует их как graphical renderings и отфильтрует.
  • Размещение только общих изображений на корпоративном сайте: Если у бизнеса несколько филиалов, но все изображения размещены на главном сайте без локальной привязки, система может проигнорировать их при поиске контента для конкретного филиала.
  • Скрытие изображений глубоко в структуре сайта: Размещение фотогалереи на уровне 5-6 кликов от главной страницы снижает вероятность ее обнаружения и использования системой.
  • Использование низкокачественных или Ч/Б изображений: Маленькие, нечеткие или черно-белые фотографии будут пессимизированы по сравнению с цветными изображениями высокого разрешения.
  • Использование изображений в качестве баннеров: Использование важных фотографий в элементах с экстремальным соотношением сторон (например, 10:1) может привести к их фильтрации.

Стратегическое значение

Этот патент подчеркивает важность аутентичности и локальной релевантности в стратегиях Local SEO. Google стремится предоставить пользователям максимально точное визуальное представление о конкретном месте, которое они ищут, а не о бренде в целом. Для SEO-специалистов это означает, что оптимизация визуального контента на уровне локальных посадочных страниц является не менее важной задачей, чем управление отзывами или NAP-данными. Контроль над тем, какие изображения Google выбирает с вашего сайта, напрямую влияет на привлекательность бизнес-профиля и CTR.

Практические примеры

Сценарий: Оптимизация сайта локального ресторана

  1. Анализ текущей ситуации: В бизнес-профиле ресторана отображается логотип и старое фото низкого качества. На сайте ресторана много стоковых фотографий еды.
  2. Применение патента:
    • Замена контента: Заменить стоковые фото и графику на профессиональные цветные фотографии реальных блюд, интерьера и входа в ресторан.
    • Улучшение качества: Загрузить эти фото в высоком разрешении (например, 1200x800px).
    • Реструктуризация: Создать новую страницу /gallery/, доступную в один клик из главного меню. Разместить лучшие фотографии на этой странице. Также разместить 2-3 ключевых фото на главной странице.
  3. Ожидаемый результат: Во время следующего цикла сканирования и индексирования система Google обнаружит новую галерею (благодаря URL и малой глубине клика). Она проанализирует новые изображения, классифицирует их как высококачественные цветные фотографии и присвоит им высокий score. Логотип и старые фото будут вытеснены новыми изображениями в бизнес-профиле.

Вопросы и ответы

Почему Google показывает логотип моей компании в бизнес-профиле вместо фотографий?

Согласно патенту, это может происходить, если система не смогла найти на вашем сайте изображения, которые она классифицирует как реальные фотографии (photographs). Логотипы классифицируются как графика (graphical renderings) и обычно имеют низкий приоритет. Если на сайте нет качественных фотографий или они спрятаны слишком глубоко, система может выбрать логотип как единственное доступное изображение.

Влияет ли название файла изображения или ALT-текст на выбор изображения?

В данном патенте не упоминается анализ ALT-текстов или названий файлов изображений для оценки их релевантности или качества. Система фокусируется в первую очередь на анализе самого изображения (пикселей) для определения его типа, качества и содержания, а также на структурных сигналах сайта (URL, глубина клика).

Как Google определяет, является ли изображение фотографией или графикой?

Патент упоминает использование Image Annotator, который генерирует вероятность того, что изображение является фотографией, а не графическим рендерингом. Это достигается с помощью алгоритмов компьютерного зрения, которые анализируют характеристики изображения, такие как градиенты, текстуры, резкость краев и сложность сцены, чтобы отличить реальные фото от компьютерной графики или иллюстраций.

Что важнее: разместить фото на главной странице или создать раздел "Галерея"?

Оба подхода полезны. Размещение фото на главной странице минимизирует глубину клика, что является позитивным сигналом. Создание раздела с URL типа /gallery/ также является явным позитивным сигналом, описанным в патенте (relevance of a URL). Оптимальная стратегия — разместить несколько ключевых изображений на главной и предоставить ссылку на полноценную галерею в один клик.

Как бороться с тем, что Google выбирает изображения с корпоративного сайта, а не с сайта нашего филиала?

Патент специально разработан для решения этой проблемы путем фильтрации сайтов, представляющих множество локаций. Убедитесь, что сайт вашего филиала четко идентифицируется Google как официальный сайт именно этой локации (например, через привязку в Google Business Profile). Затем наполните этот локальный сайт высококачественными уникальными фотографиями, следуя рекомендациям по структуре и качеству.

Будет ли Google использовать изображения, загруженные через CSS как background-image?

Да, в патенте (Claim 4) явно указано, что система способна извлекать изображения из каскадных таблиц стилей (CSS), которые ссылаются на графический контент. Однако для обеспечения максимальной надежности и контроля лучше использовать стандартные HTML теги для ключевых изображений.

Какие размеры и соотношение сторон изображений предпочтительны?

Патент указывает, что предпочтение отдается большим физическим размерам (высокое разрешение). Конкретные цифры не указаны, но следует ориентироваться на современные веб-стандарты. Соотношение сторон должно быть стандартным; экстремальные соотношения (очень широкие и низкие) могут привести к классификации изображения как баннера и его фильтрации.

Влияет ли скорость загрузки изображений на их выбор?

В данном патенте скорость загрузки изображений или страниц не упоминается как фактор, влияющий на процесс выбора или оценки изображений. Анализ фокусируется на релевантности, аутентичности и качестве самого визуального контента.

Может ли эта система извлекать изображения со сторонних сайтов (например, из отзывов или социальных сетей)?

Нет, данный патент сфокусирован исключительно на извлечении изображений с официальных веб-страниц самого бизнеса, идентифицированных через Business to homepage mapping и валидацию принадлежности сайта. Обработка пользовательского контента (UGC) или контента со сторонних ресурсов регулируется другими системами.

Почему система предпочитает цветные изображения черно-белым?

Патент указывает на предпочтение цветных изображений как на один из критериев выбора. Вероятно, это связано с тем, что цветные фотографии предоставляют более полную, реалистичную и привлекательную информацию о бизнесе для конечного пользователя по сравнению с черно-белыми.

Похожие патенты

Как Google выбирает главное изображение для сущности, анализируя тематичность веб-страниц и визуальные характеристики картинки
Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на которых оно размещено. Изображения с нерелевантных страниц отфильтровываются. Финальный выбор делается на основе визуальных характеристик, таких как распознавание лиц, логотипов или флагов.
  • US9110943B2
  • 2015-08-18
  • Knowledge Graph

  • Мультимедиа

  • Семантика и интент

Как Google выбирает главное (репрезентативное) изображение страницы для показа в результатах поиска
Google использует систему для автоматического выбора наилучшего изображения, представляющего содержание статьи или веб-страницы. Система анализирует все изображения на странице, оценивая их характеристики (размер, формат, расположение, контекст) и присваивая им оценку (Image Data Score). Цель – отличить содержательные фотографии от элементов дизайна или иконок. Изображение с наивысшей оценкой выбирается в качестве репрезентативного для показа в SERP, Новостях или Discover.
  • US7580568B1
  • 2009-08-25
  • Мультимедиа

  • SERP

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
  • US8775436B1
  • 2014-07-08
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google контекстуально выбирает изображения и отзывы для локаций на основе атрибутов запроса пользователя
Google использует машинное обучение для анализа изображений и отзывов о местах (например, ресторанах) и связывания их с конкретными атрибутами (например, "есть детское меню", "вид на горы"). При поиске система динамически ранжирует этот контент, отдавая приоритет тем изображениям и отзывам, которые наиболее релевантны атрибутам, указанным в запросе пользователя.
  • US10671660B2
  • 2020-06-02
  • Семантика и интент

  • Мультимедиа

  • Local SEO

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске
Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").
  • US8782030B1
  • 2014-07-15
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google позволяет вебмастерам управлять весом и интерпретацией исходящих ссылок через атрибуты тега (Основа nofollow)
Google запатентовал механизм, позволяющий вебмастерам добавлять в теги ссылок () специальные пары "параметр=значение" (например, rel=nofollow или linkweight=0.5). Эта информация используется краулером и поисковой системой для изменения способа обработки ссылки, например, для корректировки передаваемого веса (PageRank) или блокировки ее учета.
  • US7979417B1
  • 2011-07-12
  • Ссылки

  • Краулинг

  • Техническое SEO

seohardcore