Google использует механизм ранжирования для parameterless search (поиск без запроса, например, Discover). Система оценивает не только релевантность контента контексту пользователя, но и его формат (видео, аудио, текст) и адаптирует выдачу под текущее состояние устройства (заряд батареи, скорость сети, подключенные наушники), чтобы предложить наиболее подходящий для немедленного потребления контент.
Описание
Какую задачу решает
Патент решает проблему несоответствия формата контента, найденного с помощью parameterless search (предиктивный поиск или поиск без запроса, например, Google Discover), текущим возможностям и состоянию устройства пользователя. Цель — избежать ситуаций, когда система предлагает релевантный контент, который пользователь не может комфортно потребить в данный момент (например, предложение потокового видео при медленном интернет-соединении или низком заряде батареи).
Что запатентовано
Запатентована система динамического ранжирования результатов parameterless search. Ключевым элементом изобретения является учет не только релевантности контента контексту пользователя, но и соответствия типа контента (Target Property) текущему состоянию вычислительного устройства (Dynamic Properties). Система стремится повысить в выдаче тот контент, который наиболее подходит для немедленного представления на данном устройстве в текущих условиях.
Как это работает
Система работает следующим образом:
- Parameterless Search: На основе контекста пользователя (время, местоположение, интересы) система выполняет поиск и находит релевантный контент.
- Анализ контента (Target Properties): Для каждого результата определяется его тип (аудио, видео, текст, гаптика) и другие характеристики (вес, требования к сети).
- Анализ устройства (Dynamic Properties): Определяется текущее состояние устройства (скорость сети, уровень заряда батареи, подключение к наушникам или стриминговым устройствам).
- Динамическое ранжирование: Система корректирует ранжирование, повышая результаты, чей формат соответствует состоянию устройства. Например, при подключенных наушниках аудиоконтент получит бустинг; при слабой сети текстовый контент получит приоритет над видео.
- Корректировка Engagement Time: Ранжирование может осуществляться путем корректировки (понижения) прогнозируемого времени взаимодействия (predicted engagement time) с контентом, если он не подходит для текущего состояния устройства.
Актуальность для SEO
Высокая. С ростом значимости Google Discover и других систем предиктивной доставки контента, понимание факторов ранжирования в этих средах критически важно. Этот патент описывает механизм, который напрямую влияет на то, какой контент увидит пользователь в своей ленте рекомендаций, делая формат и техническую доступность контента ключевыми факторами.
Важность для SEO
Патент имеет высокое значение (8.5/10) для SEO-стратегий, ориентированных на Google Discover и аналогичные рекомендательные системы. Он демонстрирует, что для успеха в predictive search недостаточно создать релевантный контент; необходимо учитывать формат этого контента и его пригодность для потребления в различных технических условиях. Это напрямую влияет на стратегию производства контента (мультиформатность) и техническую оптимизацию (скорость загрузки, вес медиафайлов).
Детальный разбор
Термины и определения
- Parameterless Search (Предиктивный поиск / Поиск без параметров)
- Поиск информации, который не требует ввода параметров (поисковых терминов) от пользователя. Также называется «zero input search». Система автоматически инициирует поиск контента, который, по ее прогнозам, будет интересен пользователю, исходя из его текущего контекста (время, место, календарь и т.д.). Пример — Google Discover.
- Contextual Information (Контекстная информация)
- Информация, используемая для определения виртуальных и/или физических условий, в которых находится пользователь и его устройство в конкретный момент времени. Включает данные о местоположении, времени, погоде, а также данные о пользователе (история поиска, календарь, интересы).
- Dynamic Properties (Динамические свойства устройства)
- Характеристики устройства, которые могут меняться со временем. Примеры: скорость и тип сетевого соединения (network connection strength), уровень заряда батареи (battery level), статус зарядки, подключение к внешним устройствам (наушники, колонки, стриминговые устройства), ориентация устройства, скорость движения.
- Static Properties (Статические свойства устройства)
- Характеристики устройства, которые обычно не меняются. Примеры: тип устройства (смартфон, планшет, часы), размер экрана, наличие определенных модулей (дисплей, аудиовыход).
- Target Property (Целевое свойство результата поиска)
- Характеристики контента, связанного с результатом поиска. В первую очередь, это тип контента: аудио, визуальный, аудиовизуальный, гаптический (haptic) или текстовый. Также включает технические характеристики: размер файла (data size), размер изображений, размер интерактивных элементов (touch target size), требования к системе, адаптивность (mobile friendly).
- Dynamic Ranking (Динамическое ранжирование)
- Процесс упорядочивания результатов поиска, который учитывает соответствие между Target Properties контента и Dynamic Properties устройства. Ранжирование может меняться при изменении состояния устройства.
- Predicted Engagement Time (Прогнозируемое время взаимодействия)
- Метрика, оценивающая предполагаемое количество времени, которое пользователь проведет, взаимодействуя с контентом. Используется как базовая оценка для ранжирования, которая затем корректируется (дисконтируется) на основе свойств устройства.
Ключевые утверждения (Анализ Claims)
Примечание: Патент US20200301935A1 является продолжением (Continuation) более ранней заявки. Анализ ниже основан на ключевых механизмах, описанных в патенте (включая описание и пункты из предшествующей заявки, на которую он ссылается и которые детально изложены в разделе «Detailed Description» текущего патента).
Основной механизм (Описан в Clause 1 предшествующей заявки):
- Система выполняет parameterless search query на основе контекста устройства для идентификации релевантных результатов.
- Для каждого результата определяется respective target property (тип контента).
- Определяются dynamic properties устройства (сеть, батарея, подключенные устройства).
- На основе соответствия dynamic properties и target properties определяется dynamic ranking результатов.
- Результаты и ранжирование передаются на устройство.
Механизм обновления (Описан в Clause 2 предшествующей заявки и Claim 2 текущей):
- Система определяет изменение в dynamic properties (например, пользователь подключил наушники или изменился статус сети).
- Система определяет новое (последующее) dynamic ranking, отличающееся от начального.
- Новое ранжирование передается на устройство для обновления отображения.
Механизм ранжирования через Engagement Time (Описан в Clause 4 предшествующей заявки):
- Система предсказывает respective engagement time для каждого результата.
- Ранжирование результатов осуществляется в соответствии с этим engagement time.
Базовое ранжирование основано на прогнозируемом времени взаимодействия. Однако, как описано в патенте, это время затем корректируется (дисконтируется) на основе dynamic properties. Если устройство не подходит для потребления контента (например, видео при слабой сети), прогнозируемое engagement time снижается (применяется discount factor), что понижает результат в ранжировании.
Конкретные правила ранжирования (Описаны в Clauses 7-11 предшествующей заявки):
- Если подключено аудиоустройство, результаты с аудиоконтентом ранжируются выше. Если не подключено — ниже.
- Если dynamic properties указывают на слабую сеть или низкий заряд батареи, результаты с текстовым контентом ранжируются выше других.
- Если сеть сильная и/или батарея высокая, результаты с визуальным или аудиовизуальным контентом могут ранжироваться выше.
Где и как применяется
Изобретение применяется в системах предиктивного поиска (parameterless search), таких как Google Discover, а не в стандартном веб-поиске по запросу.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна извлечь и сохранить Target Properties для контента. Это включает определение типа контента (видео, аудио, текст), его размера, требований к пропускной способности сети и адаптивности.
CRAWLING – Сканирование и Сбор данных (Data Acquisition)
В контексте этого патента, это сбор контекстуальных данных в реальном времени. Система получает информацию о контексте пользователя и текущих Dynamic Properties его устройства (состояние сети, батареи, подключенные устройства).
RANKING – Ранжирование (в рамках Predictive Search Engine)
Система выполняет parameterless search на основе контекста. Рассчитывается базовая релевантность и predicted engagement time для найденного контента.
RERANKING – Переранжирование
Основной этап применения патента. Система применяет Dynamic Ranking. Происходит сравнение Target Properties контента и Dynamic Properties устройства. На основе этого соответствия (или несоответствия) корректируется predicted engagement time, и формируется финальный порядок выдачи.
Входные данные:
- Контекст пользователя (интересы, время, место).
- Dynamic Properties устройства.
- Static Properties устройства.
- База доступного контента с проиндексированными Target Properties.
Выходные данные:
- Динамически отранжированный список результатов (лента рекомендаций), оптимизированный под текущее состояние устройства.
На что влияет
- Типы контента: Влияет на ранжирование всех типов контента в лентах рекомендаций, особенно мультимедийного (видео, аудио) по сравнению с текстовым.
- Специфические запросы: Применяется только к parameterless search (предиктивный поиск), не влияет на стандартный поиск по введенному запросу.
- Устройства: Наибольшее влияние оказывается на мобильные устройства и носимую электронику (смартфоны, часы, планшеты), так как их Dynamic Properties (сеть, батарея) часто меняются.
Когда применяется
- Условия работы: Алгоритм применяется при каждой генерации или обновлении ленты рекомендаций (parameterless search results).
- Триггеры активации: Активируется для адаптации выдачи под текущие Dynamic Properties. Конкретные правила (бустинг аудио, текста или видео) активируются при определенных состояниях устройства (например, подключение наушников, падение скорости сети, низкий заряд батареи).
- Временные рамки: Ранжирование происходит в реальном времени и может динамически обновляться при изменении состояния устройства (subsequent dynamic ranking).
Пошаговый алгоритм
Процесс обработки и ранжирования
- Сбор данных об устройстве: Система определяет текущие Dynamic Properties (сеть, батарея, подключенные устройства) и Static Properties (тип устройства, размер экрана) вычислительного устройства.
- Определение контекста: Система анализирует контекст пользователя для определения его потенциальных интересов.
- Выполнение Parameterless Search: На основе контекста выполняется предиктивный поиск для идентификации релевантного контента.
- Анализ Target Properties: Для каждого найденного результата определяются его Target Properties (тип контента, размер файла и т.д.).
- Расчет базового Engagement Time: Система прогнозирует predicted engagement time для каждого результата, основываясь на интересах пользователя и характеристиках контента.
- Расчет корректировок (Discount Factor): Система использует модель (например, машинно-обученную) для расчета коэффициента дисконтирования (снижения) engagement time. Этот коэффициент основан на (не)соответствии между Target Properties контента и Dynamic/Static Properties устройства. Например, если сеть слабая, а контент — тяжелое видео, коэффициент дисконтирования будет высоким.
- Применение корректировок: Базовый predicted engagement time корректируется (снижается) с использованием рассчитанного коэффициента.
- Динамическое ранжирование: Результаты упорядочиваются на основе скорректированного engagement time. Контент, наиболее подходящий для текущего состояния устройства, получает более высокие позиции.
- Передача результатов: Окончательный список передается на устройство пользователя.
- Мониторинг и обновление: Система отслеживает изменения в Dynamic Properties. При значительном изменении (например, подключение наушников) процесс переранжирования (шаги 6-9) повторяется для генерации subsequent dynamic ranking.
Какие данные и как использует
Данные на входе
Система использует три основные категории данных:
1. Данные об устройстве (Device Properties):
- Технические факторы (Dynamic): Скорость и сила сетевого соединения (network connection strength), тип соединения (Wi-Fi, Cellular), уровень заряда батареи (battery level), статус зарядки, статус подключения к аудиоустройствам (наушники, колонки), статус подключения к мультимедийным стриминговым устройствам.
- Технические факторы (Static): Тип устройства, размер экрана, доступные интерфейсы ввода/вывода.
2. Данные о контенте (Target Properties):
- Мультимедиа и структурные факторы: Тип контента (текст, аудио, видео, гаптика).
- Технические факторы: Размер данных (data size), размер изображений, размер интерактивных элементов (touch target size), требования к системе для воспроизведения, ожидаемое время загрузки, сетевое расположение (например, доступность через firewall).
- Контентные факторы: Адаптивность (mobile friendly), количество контента на странице.
3. Данные о пользователе и контексте (Contextual Information):
- Поведенческие и пользовательские факторы: История поиска, история взаимодействия с контентом, паттерны использования устройств (например, пользователь смотрит видео только на планшете). Используются для определения контекста и расчета базового predicted engagement time.
- Временные и географические факторы: Местоположение, время суток.
Какие метрики используются и как они считаются
- Predicted Engagement Time: Прогнозируемое время взаимодействия пользователя с контентом. Рассчитывается на основе контекста, интересов пользователя и характеристик контента. Является базовой метрикой для ранжирования.
- Discount Factor (Коэффициент дисконтирования) (Подразумевается): Метрика, определяющая, насколько следует снизить predicted engagement time из-за несоответствия свойств устройства свойствам контента. Рассчитывается с помощью модели (например, cross-user model), которая принимает на вход Dynamic/Static Properties и Target Properties.
- Adjusted Engagement Time (Скорректированное время взаимодействия) (Подразумевается): Итоговая метрика для ранжирования. Adjusted Engagement Time = Predicted Engagement Time * (1 — Discount Factor).
- Методы машинного обучения: Патент упоминает использование машинного обучения для изучения связи между свойствами устройства, целевыми свойствами контента и итоговым скорингом (ранжированием). Также используется для персонализации скоринга на основе индивидуальных паттернов поведения пользователя.
Выводы
- Формат контента — критический фактор ранжирования в Predictive Search: Патент четко указывает, что в системах типа Google Discover релевантность контента должна соответствовать техническим возможностям пользователя в данный момент. Формат (текст, аудио, видео) и технические характеристики (вес, скорость загрузки) напрямую влияют на ранжирование.
- Ранжирование основано на корректировке вовлеченности: Ключевым механизмом является расчет predicted engagement time и его последующая корректировка (дисконтирование) в зависимости от состояния устройства (Dynamic Properties). Если контент технически сложно потребить, его прогнозируемая вовлеченность снижается.
- Техническое состояние устройства диктует выдачу: Конкретные состояния устройства (слабая сеть, низкий заряд батареи, наличие/отсутствие наушников) являются триггерами для агрессивного повышения или понижения определенных типов контента.
- Динамическое обновление выдачи: Ранжирование не статично. Оно может меняться в реальном времени, если состояние устройства изменилось (например, пользователь переключился с Wi-Fi на мобильную сеть или подключил наушники).
- Персонализация и контекстуальное поведение: Система учитывает не только текущее состояние устройства, но и индивидуальные паттерны потребления контента пользователем на разных устройствах и в разных ситуациях.
Практика
Best practices (это мы делаем)
- Мультиформатная контент-стратегия: Для максимизации охвата в Google Discover необходимо предоставлять контент в различных форматах. Если есть видео, должна быть качественная текстовая расшифровка или статья на ту же тему. Если есть статья, рассмотрите возможность создания аудиоверсии или краткого видеообзора. Это позволяет ранжироваться в разных контекстах (текст — при слабой сети, аудио — при подключенных наушниках).
- Приоритет технической оптимизации и скорости: Легкий и быстрый контент имеет преимущество, особенно в условиях нестабильной сети или низкого заряда батареи. Использование современных форматов изображений, отложенной загрузки и оптимизация кода критически важны. Data size является Target Property, которую система учитывает.
- Оптимизация под мобильные и носимые устройства: Контент должен быть полностью адаптивным (mobile friendly). Интерактивные элементы должны иметь достаточный размер (touch target size), так как это также является Target Property. Это особенно важно для ранжирования на устройствах с маленькими экранами (смартфоны, часы).
- Использование структурированных данных для медиа: Корректная разметка видео и аудио (VideoObject, AudioObject) помогает системе правильно идентифицировать Target Properties контента и его технические требования.
Worst practices (это делать не надо)
- Создание только «тяжелого» контента: Стратегия, основанная исключительно на тяжелых видео или страницах с большим количеством неоптимизированных изображений, будет проигрывать в условиях ограниченных ресурсов устройства (слабая сеть/батарея).
- Игнорирование текстовой альтернативы: Публикация видео или аудио без сопутствующего текста или резюме лишает контент возможности ранжироваться в контекстах, где мультимедиа не подходит (например, нет наушников или слабая сеть).
- Пренебрежение скоростью загрузки: Медленные страницы будут дисконтироваться системой, так как их Target Properties (большой вес, долгое время загрузки) не соответствуют оптимальным условиям потребления контента в мобильном контексте.
Стратегическое значение
Патент подтверждает, что Google рассматривает Discover (и другие parameterless search системы) как среду, где пользователь ожидает мгновенного доступа к контенту, готовому к потреблению. Стратегически это смещает фокус с традиционного SEO, основанного на ответах на запросы, к «Context-Based Optimization», где формат и техническая доступность контента играют роль, сопоставимую с его содержанием. Долгосрочная стратегия должна включать гибкое производство контента, способного адаптироваться под различные технические сценарии использования.
Практические примеры
Сценарий: Оптимизация новостного контента для Discover
Новостной сайт публикует срочную новость. Цель — получить максимальный охват в Discover у пользователей в разных контекстах.
- Действие 1 (Текстовый формат): Создается оптимизированная, быстро загружающаяся текстовая версия новости (возможно, в формате AMP или аналогичном легком фреймворке).
- Ожидаемый результат: Эта версия будет высоко ранжироваться у пользователей с низким зарядом батареи или медленным интернетом (Dynamic Properties), так как ее Target Property (текст, малый вес) оптимальна для этих условий.
- Действие 2 (Аудиоформат): Генерируется аудиодорожка с кратким изложением новости (например, с помощью TTS или диктора).
- Ожидаемый результат: Эта версия получит бустинг у пользователей, у которых подключены наушники или Bluetooth-гарнитура, так как система распознает готовность к потреблению аудио.
- Действие 3 (Видеоформат): Создается короткий видеорепортаж с места событий, оптимизированный для мобильного просмотра (вертикальный формат, субтитры).
- Ожидаемый результат: Эта версия будет высоко ранжироваться у пользователей с быстрым Wi-Fi соединением, высоким зарядом батареи и, возможно, подключенными аудиоустройствами или стриминговыми девайсами.
Вопросы и ответы
Относится ли этот патент к стандартному поиску Google (Web Search)?
Нет, патент специфичен для систем parameterless search (поиск без параметров), ярким примером которых является Google Discover или ранее Google Now. Механизмы, описанные здесь, предназначены для ситуаций, когда система сама предлагает контент пользователю на основе его контекста, а не в ответ на явно введенный запрос.
Что такое Predicted Engagement Time и как он используется?
Predicted Engagement Time — это метрика, которая оценивает, сколько времени пользователь предположительно потратит на взаимодействие с контентом. В данном патенте это базовая оценка для ранжирования. Однако система корректирует (снижает) это время, если текущее состояние устройства пользователя не подходит для потребления данного типа контента, тем самым понижая его в выдаче.
Какие именно свойства устройства (Dynamic Properties) учитывает система?
Патент явно упоминает следующие динамические свойства: сила и скорость сетевого соединения (network connection strength), уровень заряда батареи (battery level), статус подключения к аудиовыходным устройствам (например, наушникам или колонкам) и статус подключения к мультимедийным стриминговым устройствам. Также могут учитываться скорость движения, ориентация устройства и другие сенсорные данные.
Что важнее для ранжирования в Discover: легкая текстовая страница или качественное видео?
Это полностью зависит от текущего состояния устройства пользователя. Если у пользователя слабая сеть и мало заряда батареи, легкий текст получит значительное преимущество. Если же у пользователя быстрый Wi-Fi, полный заряд и подключены наушники, качественное видео будет ранжироваться выше. Стратегия должна учитывать оба сценария.
Как этот патент влияет на техническое SEO?
Он подчеркивает критическую важность скорости загрузки и веса страниц для ранжирования в предиктивном поиске. Система анализирует Target Properties контента, такие как размер данных (data size) и ожидаемое время загрузки. Тяжелый контент будет пессимизирован в условиях ограниченных ресурсов устройства, что делает оптимизацию производительности ключевой задачей.
Может ли выдача в Discover измениться, если я подключу наушники?
Да, патент описывает механизм subsequent dynamic ranking. Если Dynamic Properties устройства меняются (например, подключаются наушники), система может пересчитать ранжирование в реальном времени. Контент с аудиодорожкой, который ранее был ниже в ленте, может подняться наверх.
Учитывает ли система размер экрана устройства?
Да, размер экрана относится к Static Properties устройства. Патент указывает, что система может понижать контент, если его Target Properties (например, слишком маленькие интерактивные элементы touch target size или слишком большие изображения) не подходят для размера экрана (например, на умных часах).
Как оптимизировать контент под этот алгоритм?
Ключевая стратегия — мультиформатность и техническое совершенство. Создавайте контент в разных форматах (текст, аудио, видео) для покрытия разных контекстов использования. Обеспечьте максимальную скорость загрузки и адаптивность для всех версий. Используйте корректную микроразметку для медиаконтента, чтобы помочь системе правильно определить его свойства.
Использует ли система машинное обучение в этом процессе?
Да. Патент упоминает использование машинного обучения для определения связи между свойствами устройства, свойствами контента и итоговым ранжированием. Также ML используется для персонализации: система изучает, какой тип контента пользователь предпочитает потреблять на конкретных устройствах в конкретных ситуациях.
Влияет ли этот механизм на ранжирование AMP-страниц?
Хотя патент прямо не упоминает AMP, технология AMP идеально соответствует целям этого изобретения. AMP-страницы легкие и быстрые, что делает их предпочтительными в условиях ограниченных ресурсов устройства (слабая сеть, низкий заряд батареи). Можно предположить, что такой контент будет получать преимущество в соответствующих контекстах.