Google использует машинное обучение для анализа изображений и отзывов о местах (например, ресторанах) и связывания их с конкретными атрибутами (например, «есть детское меню», «вид на горы»). При поиске система динамически ранжирует этот контент, отдавая приоритет тем изображениям и отзывам, которые наиболее релевантны атрибутам, указанным в запросе пользователя.
Описание
Какую задачу решает
Патент решает проблему выбора наиболее релевантной информации (изображений, отзывов, текстовых описаний) о конкретном месте (place of interest) из большого объема доступных данных. Цель — улучшить релевантность отображаемого контента, адаптируя его под специфический контекст запроса пользователя, а не показывая стандартный набор данных.
Что запатентовано
Запатентована система контекстуального ранжирования отображаемого контента (displayable content), такого как фотографии и текст (например, отзывы), связанного с определенным местом. Система использует классификаторы машинного обучения (Machine Learning Classifier) для связывания контента с атрибутами места (Place Attributes). При получении запроса система ранжирует контент, отдавая приоритет тем элементам, чьи атрибуты наиболее соответствуют атрибутам, извлеченным из запроса (Particular Attributes).
Как это работает
Механизм работает в два этапа:
- Офлайн-анализ (Индексирование): Системы машинного обучения анализируют контент (изображения, отзывы). В изображениях распознаются объекты и сцены (например, наличие патио), в текстах анализируются упоминания. Этот контент связывается с соответствующими атрибутами места (например, «столики на улице»).
- Обработка запроса (Ранжирование): Когда пользователь вводит запрос (например, «ресторан со столиками на улице»), система извлекает из него атрибуты. Затем она оценивает весь доступный контент об этом ресторане и вычисляет Relevance Score для каждого элемента. Оценка основана на том, насколько уверенно (Level of Confidence) контент отражает атрибуты из запроса. Контент с наивысшими оценками выбирается для показа.
Актуальность для SEO
Высокая. Контекстуальное понимание и персонализация выдачи являются ключевыми направлениями развития Google, особенно в локальном поиске (Local Search), Картах и Путешествиях. Этот патент описывает фундаментальный механизм, который напрямую влияет на то, как бизнес визуально и текстуально представлен в зависимости от конкретного намерения пользователя.
Важность для SEO
Патент имеет критическое значение (85/100) для локального SEO (Local SEO) и оптимизации сущностей. Он определяет механизм, по которому Google выбирает, какие визуальные активы (фотографии) и текстовые фрагменты (отзывы) будут выделены для бизнеса в ответ на конкретный поисковый интент. Это подчеркивает необходимость оптимизации визуального и пользовательского контента (UGC) для соответствия ключевым атрибутам бизнеса с целью максимизации видимости и конверсии в результатах поиска по сущностям (например, в Google Maps и Knowledge Panels).
Детальный разбор
Термины и определения
- Displayable Content (Отображаемый контент)
- Элементы данных, связанные с местом, которые могут быть показаны пользователю. Включают адреса веб-страниц, контактную информацию, часы работы, отзывы, рейтинги, изображения, аккаунты в социальных сетях.
- Impact Implementation (Реализация воздействия)
- Один из методов расчета Relevance Score. Для визуального контента это произведение уровня уверенности атрибута на его весовой коэффициент. Для текстового контента — произведение количества упоминаний атрибута на его весовой коэффициент.
- Level of Confidence (Уровень уверенности)
- Метрика, определяющая степень уверенности системы в том, что данный элемент контента действительно отражает определенный атрибут.
- Machine Learning Classifier (Классификатор машинного обучения)
- Модель, обученная распознавать признаки в контенте (например, объекты на фото, темы в тексте) и ассоциировать их с Place Attributes.
- Normalization (Нормализация)
- Процесс корректировки Relevance Score для предотвращения искажений в пользу контента с большим количеством признаков (например, более длинных отзывов или изображений с большим количеством тегов).
- Particular Attributes (Конкретные атрибуты)
- Атрибуты, извлеченные из запроса пользователя. Например, из запроса «kid-friendly restaurant» извлекается атрибут «kid-friendly».
- Place Attributes (Атрибуты места)
- Характеристики, связанные с местом (например, «столики на улице», «подходит для детей», «романтичная атмосфера»). Эти атрибуты также ассоциируются с Displayable Content.
- Relevance Score (Оценка релевантности)
- Числовое значение, используемое для ранжирования как самих мест в ответ на запрос, так и для ранжирования Displayable Content, связанного с этим местом.
- Reference Taxonomy (Справочная таксономия)
- Упоминается как структурированный набор предопределенных атрибутов, который может использоваться для обучения моделей машинного обучения и классификации контента.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной процесс контекстуального ранжирования контента для места.
- Система получает запрос о месте интереса.
- Идентифицируется место и набор связанного с ним Displayable Content.
- Определяется подмножество этого контента для показа путем ранжирования всего набора в соответствии с запросом.
- Процесс ранжирования включает в себя:
- Идентификацию Particular Attributes в запросе.
- Определение Place Attributes для каждого элемента контента с использованием Machine Learning Classifier.
- Присвоение Relevance Score каждому элементу контента на основе соответствия его Place Attributes и Particular Attributes запроса.
- Выбор элементов с наивысшими Relevance Scores в качестве подмножества.
- Подмножество контента и информация о месте предоставляются пользователю.
Ядро изобретения заключается в использовании ML-классификатора для определения атрибутов контента (офлайн) и последующем динамическом ранжировании этого контента (онлайн) на основе соответствия атрибутам, извлеченным из конкретного запроса пользователя.
Claim 2 (Зависимый от 1): Детализирует процесс идентификации самого места.
Процесс идентификации места также включает анализ Particular Attributes в запросе, определение Place Attributes для каждого места-кандидата и присвоение Relevance Score местам. Место с наивысшей оценкой выбирается. Это подтверждает, что логика сопоставления атрибутов применяется как для выбора сущности (места), так и для выбора контента об этой сущности.
Claim 4 (Зависимый от 1): Уточняет механизм ранжирования контента.
Ранжирование каждого элемента Displayable Content взвешивается в соответствии с ассоциированными Place Attributes. Это означает, что разные атрибуты могут иметь разную значимость (весовые коэффициенты) при расчете итоговой оценки.
Где и как применяется
Изобретение применяется в системах, отвечающих за локальный поиск и представление информации о сущностях (например, Google Maps, Google Travel, Knowledge Panels).
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная предварительная обработка данных. Machine Learning Classifiers анализируют Displayable Content (изображения, отзывы, веб-страницы). Система распознает признаки в контенте (например, с помощью технологий маркировки изображений – image label technology) и ассоциирует их с Place Attributes. Эти ассоциации сохраняются в базе данных.
QUNDERSTANDING – Понимание Запросов
В реальном времени система анализирует входящий запрос для извлечения Particular Attributes. Например, запрос «outdoor seating restaurants in Mountain View» парсится в атрибуты «restaurant», «has outdoor seating», «in Mountain View».
RANKING – Ранжирование / METASEARCH – Метапоиск и Смешивание
Эти этапы отвечают за выбор места и его контента.
- Выбор места: Система ранжирует места, вычисляя Relevance Score на основе соответствия между Place Attributes места и Particular Attributes запроса.
- Ранжирование контента: Для выбранного места система извлекает связанный Displayable Content. Затем она вычисляет Relevance Score для каждого элемента контента, используя Level of Confidence и весовые коэффициенты атрибутов.
- Выбор подмножества: Выбирается контент с наивысшими оценками для отображения в результатах поиска (например, какие фотографии показать в карусели GBP или какие отзывы выделить).
Входные данные:
- Запрос пользователя.
- База данных мест и их Place Attributes.
- База данных Displayable Content с ассоциированными атрибутами и Level of Confidence.
- Предопределенные весовые коэффициенты (predetermined weighting factor) для атрибутов.
Выходные данные:
- Информация о месте.
- Отранжированное подмножество Displayable Content (изображения, отзывы), контекстуально релевантное запросу.
На что влияет
- Конкретные типы контента: Наибольшее влияние оказывается на изображения, отзывы (UGC) и потенциально на ранжированные списки («Top 10…»), связанные с местом.
- Специфические запросы: Влияет на локальные запросы (информационные и коммерческие), которые содержат уточняющие атрибуты (например, «романтичный отель», «ресторан с живой музыкой»).
- Конкретные ниши или тематики: Критически важно для ниш с высокой визуальной составляющей и зависимостью от атмосферы/удобств: рестораны, отели, туризм, услуги красоты, развлечения.
Когда применяется
- Условия работы алгоритма: Применяется, когда система обрабатывает запрос, касающийся «места интереса» (place of interest).
- Триггеры активации: Активируется, когда из запроса можно извлечь Particular Attributes, которые затем используются для фильтрации и ранжирования контента, связанного с этим местом.
Пошаговый алгоритм
Процесс А: Офлайн-обработка (Индексирование и Обучение)
- Обучение классификаторов: Machine Learning Classifiers обучаются ассоциировать атрибуты с местами и контентом. Используются аннотации из изображений, веб-страниц, отзывов и метаданных.
- Анализ контента: Система анализирует Displayable Content, связанный с местом. Например, в изображениях идентифицируются признаки (патио, детское кресло) с помощью image label technology.
- Ассоциация атрибутов: Признаки в контенте связываются с Place Attributes (например, фото с детским креслом ассоциируется с атрибутом «kid-friendly»). Для каждой ассоциации вычисляется Level of Confidence.
- Сохранение данных: Ассоциации и уровни уверенности сохраняются в базе данных.
Процесс Б: Обработка запроса в реальном времени
- Получение и парсинг запроса: Система получает запрос и извлекает из него Particular Attributes.
- Идентификация места: Система определяет релевантные места путем сопоставления Particular Attributes запроса с Place Attributes мест. Выбирается место с наивысшим Relevance Score.
- Извлечение контента: Для выбранного места извлекается набор Displayable Content.
- Расчет Relevance Score для контента: Для каждого элемента контента вычисляется Relevance Score. Расчет учитывает Level of Confidence ассоциации атрибутов контента и Particular Attributes запроса, а также весовые коэффициенты. (Используются методы: Impact Implementation, Dot Product, Normalization).
- Ранжирование и выбор: Элементы контента ранжируются по Relevance Score. Выбирается подмножество с наивысшими оценками.
- Предоставление результатов: Выбранное место и контекстуально релевантное подмножество контента предоставляются пользователю.
Какие данные и как использует
Данные на входе
- Контентные факторы: Текст отзывов, метаданные, текст веб-страниц, связанный с местом.
- Мультимедиа факторы: Изображения и их признаки, извлеченные с помощью технологий анализа изображений (image label technology).
- Пользовательские данные (UGC): Отзывы, рейтинги, изображения, загруженные пользователями, данные из социальных сетей.
- Системные данные: Предопределенные весовые коэффициенты (predetermined weighting factors) для атрибутов.
Какие метрики используются и как они считаются
Система использует несколько ключевых метрик для ранжирования:
- Level of Confidence: Оценка уверенности ML-классификатора в наличии атрибута в контенте.
- Predetermined Weighting Factor: Заранее заданный вес, определяющий важность конкретного атрибута.
- Relevance Score: Итоговая оценка релевантности контента запросу. В патенте описано несколько методов расчета:
1. Impact Implementation:
- Для визуального контента (изображения):
Выводы
- Контекстуальное ранжирование контента: Google динамически меняет способ представления локации (выбор фото, подсветка отзывов) в зависимости от конкретных атрибутов в запросе пользователя. Статический набор «лучших» фото отсутствует; он формируется на лету.
- Атрибуты как ядро ранжирования: Атрибуты (Place Attributes) являются центральным элементом как для идентификации самой локации, так и для выбора контента о ней. Понимание таксономии атрибутов Google критически важно для локального SEO.
- ML-анализ контента: Система полагается на Machine Learning Classifiers для глубокого понимания содержания изображений и текстов (отзывов) и их сопоставления с атрибутами. Это выходит за рамки простого сопоставления ключевых слов или метаданных.
- Качество и релевантность контента важнее количества: Наличие изображений и отзывов, точно соответствующих ключевым атрибутам, важнее их общего объема. Упомянутые методы нормализации могут нейтрализовать преимущества контента с большим количеством признаков, если эти признаки нерелевантны запросу.
- Учет негативных признаков: Использование метода скалярного произведения (Dot Product) предполагает, что система способна идентифицировать признаки в контенте, которые противоречат атрибуту запроса (negative features), и понижать такой контент в ранжировании.
Практика
Best practices (это мы делаем)
- Комплексное покрытие атрибутов в UGC: Активно мотивируйте клиентов оставлять подробные отзывы, упоминающие конкретные атрибуты вашего бизнеса (атмосфера, конкретные блюда, удобства, подходит ли для детей, качество обслуживания). Это создает пул текстового контента, который может быть высоко ранжирован по соответствующим запросам.
- Разнообразный и качественный визуальный контент: Загружайте (и мотивируйте пользователей загружать) высококачественные изображения, охватывающие все ключевые атрибуты бизнеса. Если вы ресторан, покажите интерьер, экстерьер (если есть патио), популярные блюда, атмосферу, специфические особенности (игровая зона, барная стойка). ML-классификаторы должны иметь возможность идентифицировать эти объекты и сцены.
- Оптимизация под таксономию атрибутов: Изучите, какие атрибуты Google ассоциирует с вашей категорией бизнеса (например, в GBP/GMB). Убедитесь, что ваш контент (как собственный, так и UGC) явно отражает эти атрибуты.
- Мониторинг контекстуальной выдачи: Анализируйте, какие фотографии и отзывы Google показывает для вашего бизнеса по разным типам запросов (например, [ваш бренд] vs [ваш бренд + атрибут]). Это поможет понять, как ML-классификаторы интерпретируют ваш контент.
Worst practices (это делать не надо)
- Однотипные или нерелевантные изображения: Загрузка только фотографий фасада, логотипа или стоковых изображений, не отражающих реальные атрибуты бизнеса. Такой контент будет иметь низкий Relevance Score по специфическим запросам.
- Генерация коротких и общих отзывов: Мотивация клиентов оставлять отзывы типа «Отличное место!» или только ставить оценку. Такой контент не содержит атрибутов и не будет полезен для контекстуального ранжирования.
- Игнорирование визуальных активов: Фокусировка исключительно на текстовой оптимизации (описания, посты) и игнорирование инвентаря фотографий и видео в профиле бизнеса.
Стратегическое значение
Патент подтверждает стратегический сдвиг в сторону поиска по сущностям и важность управления всем цифровым следом локации (GBP, UGC, изображения). Оптимизация визуального поиска становится критически важной для захвата нюансированного локального интента. Способность Google понимать контекст через анализ мультимедиа означает, что SEO-стратегия должна включать в себя не только текст, но и глубокую проработку визуального представления бизнеса, чтобы соответствовать ожиданиям пользователей по различным атрибутивным запросам.
Практические примеры
Сценарий: Оптимизация ресторана для запросов «kid-friendly» (подходит для детей)
- Анализ (Проблема): Пользователь ищет «kid-friendly restaurant nearby». Ресторан А имеет игровую зону, но в выдаче Google показывает фотографии его бара и стейков.
- Применение патента (Действие): SEO-специалист загружает в профиль GBP высококачественные фотографии игровой зоны, детских стульчиков (high-chair), детского меню и семей за столиками. Также запускается кампания по сбору отзывов, мотивирующая родителей описывать свой опыт посещения с детьми.
- Ожидаемый результат: ML-классификаторы Google анализируют новый контент и ассоциируют его с атрибутом «kid-friendly» с высоким Level of Confidence. При следующем поиске «kid-friendly restaurant nearby» система вычисляет высокий Relevance Score для этих новых фото и отзывов и приоритезирует их показ в результатах поиска для Ресторана А.
Вопросы и ответы
Как этот патент влияет на выбор главной фотографии профиля компании (GBP/GMB)?
Патент предполагает, что единой «главной» фотографии может не существовать в контексте поиска. Вместо статического выбора, Google динамически ранжирует все доступные изображения и выбирает то, которое наиболее релевантно конкретному запросу пользователя. Если пользователь ищет «пицца в [Название ресторана]», Google покажет фото пиццы. Если он ищет «интерьер [Название ресторана]», система выберет лучшее фото интерьера.
Как Google определяет атрибуты для изображений?
Система использует классификаторы машинного обучения (Machine Learning Classifiers) и технологии анализа изображений (image label technology). Эти модели обучены распознавать объекты, сцены и признаки на фотографиях (например, наличие детского кресла, вид из окна, блюдо на тарелке) и сопоставлять их с известными атрибутами места (Place Attributes).
Влияет ли количество фотографий или отзывов на ранжирование?
Напрямую – нет. Важнее разнообразие и релевантность атрибутам. В патенте специально упоминаются методы нормализации (Normalization), которые предназначены для предотвращения перекоса в пользу контента с большим количеством признаков (например, очень длинных отзывов). Лучше иметь 10 фотографий, покрывающих 10 разных атрибутов, чем 100 фотографий одного и того же.
Что такое «негативные признаки» (negative features) и как они учитываются?
Патент упоминает использование скалярного произведения (Dot Product) для расчета релевантности, что позволяет учитывать негативные признаки. Это признаки в контенте, которые противоречат атрибуту запроса. Например, если пользователь ищет «тихое кафе», а на фотографии интерьера видна громкая музыкальная установка или толпа людей, система может понизить Relevance Score этого изображения для данного запроса.
Как можно повлиять на весовые коэффициенты (Weighting Factors) атрибутов?
Напрямую повлиять на них нельзя, так как они определены заранее (predetermined weighting factors) системой Google. Однако SEO-специалисты должны понимать, какие атрибуты являются наиболее важными в их нише, и фокусироваться на создании контента, который максимально соответствует этим высоковесомым атрибутам.
Применяется ли этот механизм только к фотографиям?
Нет. Патент явно указывает, что механизм применяется к Displayable Content, который включает как изображения, так и текст, в частности, отзывы, рейтинги, информацию о бизнесе и даже связанные аккаунты в социальных сетях. Текстовый контент ранжируется на основе частоты упоминания атрибутов и их весовых коэффициентов.
Как лучше всего оптимизировать отзывы под этот алгоритм?
Необходимо мотивировать пользователей оставлять детализированные отзывы, которые естественно упоминают ключевые атрибуты бизнеса. Вместо просьбы «Оцените нас», лучше спросить «Понравилась ли вам наша новая летняя терраса?» или «Что вы думаете о нашем детском меню?». Это увеличивает вероятность появления релевантного текстового контента для контекстуального ранжирования.
Влияет ли этот патент на ранжирование самого бизнеса в локальном поиске (Local Pack)?
Да, косвенно. Хотя основное внимание в патенте уделяется ранжированию контента *о* бизнесе, Claim 2 описывает, что аналогичный механизм сопоставления атрибутов и расчета Relevance Score используется и для выбора самого места. Наличие богатого контента, подтверждающего ключевые атрибуты, может улучшить общую релевантность бизнеса запросу.
Что важнее: фотографии, загруженные владельцем, или фотографии пользователей (UGC)?
Патент не делает различий между источниками контента. Важна только способность ML-классификатора идентифицировать атрибуты в контенте и уровень уверенности (Level of Confidence) в этой идентификации. На практике важен баланс: владелец должен предоставить качественные базовые фото, а UGC обеспечивает разнообразие, объем и социальное подтверждение атрибутов.
Как узнать, с какими атрибутами Google связал мои изображения?
Прямого инструмента для этого нет. Однако можно использовать Google Vision AI API для анализа ключевых изображений, чтобы понять, какие объекты и метки распознает система. Также необходимо регулярно анализировать выдачу по различным запросам, чтобы увидеть, какой контент Google выбирает для показа, и делать выводы о том, как интерпретируются ваши активы.