Как Google использует фасетную навигацию для поиска данных на носимых устройствах (HMD)

DYNAMIC DATA ITEM SEARCHING (Динамический поиск элементов данных)

US8745058B1
Google LLC
2012-02-21
2014-06-03

Мультимедиа

Патент Google, описывающий интерфейс для поиска и навигации по большим массивам данных, в частности, контенту, собранному носимыми устройствами (например, HMD). Система организует данные в кластеры на основе общих атрибутов (время, местоположение, тип контента) и позволяет пользователю итеративно уточнять поиск, выбирая дополнительные фильтры (фасеты). Это механизм представления результатов, а не ранжирования веб-страниц.

Какую проблему решает

Патент решает проблему эффективного и интуитивно понятного поиска и навигации в больших объемах хранимой информации, особенно в контексте данных, собранных пользователем с помощью носимых устройств (Head-Mounted Displays, HMD). По мере увеличения объемов собираемых данных (например, фото, видео, аудио, связанных с реальным опытом пользователя) возникает потребность в удобных методах доступа к ним. Изобретение предлагает структурированный интерфейс для навигации по этим данным.

Что запатентовано

Запатентована система и метод для поиска данных, основанные на принципах фасетной навигации (Faceted Search). Система позволяет пользователям итеративно уточнять набор результатов поиска путем последовательного выбора атрибутов (Attributes) и их значений (Attribute Values). Данные группируются в кластеры (Data Item Clusters) на основе общих характеристик, а интерфейс предоставляет визуальные индикаторы этих кластеров и доступных фильтров.

Как это работает

Система поддерживает базу данных, где каждый элемент данных (Data Item) связан с набором атрибутов. Процесс поиска работает следующим образом:

Первичная кластеризация: На основе начального ввода (например, запроса или выбора атрибута) система группирует подмножество данных в первый кластер.
Визуализация: Пользователю предоставляется визуальное представление этого кластера, часто в виде галереи или иконок, представляющих общие атрибуты.
Итеративное уточнение: Пользователь выбирает дополнительный атрибут или значение из представленных вариантов, относящихся к первому кластеру.
Вторичная кластеризация: Система формирует новый, более узкий кластер на основе этого выбора.
Выполнение действия: Процесс повторяется до тех пор, пока пользователь не найдет нужный элемент данных и не выполнит с ним действие (например, просмотр фото, воспроизведение аудио).

Особое внимание в патенте уделяется интерфейсам для HMD, включая навигацию с помощью физиологических данных (движения головы, отслеживание взгляда).

Актуальность для SEO

Средняя. Хотя патент описывает интерфейсы, характерные для устройств типа Google Glass (актуальных на момент подачи заявки), базовый принцип фасетной навигации остается крайне актуальным и широко используется во всех современных поисковых системах (например, фильтры в Google Images, Google Shopping, поиске отелей). Однако специфические UI/UX решения для HMD, описанные в патенте, не получили массового распространения в основном поиске.

Важность для SEO

Влияние на традиционное SEO минимальное (Оценка: 3/10). Патент не описывает алгоритмы ранжирования веб-страниц, оценки качества сайтов или релевантности контента. Он полностью сосредоточен на организации и представлении результатов пользователю после их извлечения (Information Retrieval UI/UX). Однако он косвенно подчеркивает важность структурированных данных: система полагается на четкие Attributes и Attribute Values для организации контента в фасеты. Для SEO-специалистов это служит напоминанием о том, что контент должен быть хорошо структурирован, чтобы поисковые системы могли легко извлекать его атрибуты для использования в подобных интерфейсах.

Термины и определения

Attribute (Атрибут): Характеристика или свойство, связанное с элементом данных. Примеры включают тип данных (data-item-type), местоположение (location attribute), время (time attribute), контакты, погоду и т.д.
Attribute Value (Значение атрибута): Конкретное значение, которое принимает атрибут для данного элемента данных. Например, для атрибута "местоположение" значением может быть "New York City".
Context Signals (Контекстные сигналы): Данные об окружении и состоянии пользователя, используемые для определения атрибутов новых элементов данных. Включают время, дату, местоположение, погоду, данные календаря, информацию из социальных сетей, уровень шума, состояние здоровья пользователя и т.д.
Data Item (Элемент данных): Единица контента в базе данных. Это может быть файл (изображение, видео, аудио, документ, электронное письмо), часто связанный с опытом пользователя и захваченный носимым устройством.
Data Item-Attribute Database (База данных элементов и атрибутов): Хранилище, содержащее элементы данных и связанные с ними метаданные (атрибуты и их значения).
Data Item Cluster (Кластер элементов данных): Группа элементов данных, объединенных на основе одного или нескольких общих атрибутов или значений атрибутов. Результат применения фильтра или фасета.
HMD (Head-Mounted Display): Носимый дисплей, закрепляемый на голове пользователя (например, очки или шлем). Упоминается как основное устройство для реализации описанного интерфейса.
Physiological Data (Физиологические данные): Данные о состоянии пользователя (например, гальваническая реакция кожи, движение глаз, движение головы), которые могут использоваться для управления интерфейсом (прокрутка, выбор) или как триггер для добавления новых данных.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основную систему для динамического поиска данных.

Система поддерживает базу данных Data Item-Attribute Database.
Получается первый ввод, указывающий на выбор одного или нескольких атрибутов.
Система группирует первое подмножество данных в First Data Item Cluster. Каждый элемент в кластере имеет по крайней мере один из выбранных атрибутов.
Система отображает первое визуальное представление кластера, включающее graphical icons, представляющие общие атрибуты элементов в кластере.
Получается второй ввод, указывающий на выбор одного или нескольких из этих графически представленных атрибутов, связанных с элементами в первом кластере.
Система группирует второе подмножество данных в Second Data Item Cluster. Каждый элемент имеет по крайней мере один из атрибутов, выбранных во втором вводе.
Система отображает второе визуальное представление второго кластера.

Это точное определение системы фасетной навигации. Ключевым моментом является итеративный процесс: выбор атрибутов (шаг 2) приводит к формированию набора результатов (шаг 3), интерфейс отображает доступные для дальнейшего уточнения атрибуты/фасеты, релевантные этому набору (шаг 4), пользователь выбирает фасет (шаг 5), и система уточняет набор результатов (шаг 6).

Claim 4 (Зависимый от 3): Детализирует процесс навигации и выбора внутри кластера.

Перед получением второго ввода система получает данные о прокрутке (scrolling input data) для навигации по визуальному представлению первого кластера к конкретному элементу данных.
Затем система получает данные о выборе (selection input data), указывающие на выбор атрибутов этого конкретного элемента.

Описывает взаимодействие пользователя с интерфейсом: прокрутку галереи результатов и выбор элемента или его атрибута для дальнейшего фильтрования.

Claims 5-9 (Зависимые): Уточняют, что ввод для прокрутки и выбора может быть основан на Physiological State пользователя.

Это может быть осевое движение системы (например, поворот головы) (Claim 6).
Это могут быть данные отслеживания взгляда (eye-tracking data) (Claims 7, 9).

Подчеркивает ориентацию патента на носимые устройства (HMD), где традиционные методы ввода (мышь, клавиатура) заменяются отслеживанием движений пользователя.

Claim 14 (Зависимый от 1): Описывает добавление новых данных.

Система получает сенсорные данные (sensory-input data), указывающие на новый элемент данных.
Система ассоциирует новый элемент данных с атрибутами из набора.

Описывает процесс сбора данных (например, захват фото/видео через HMD) и их индексацию путем присвоения метаданных (атрибутов).

Где и как применяется

Этот патент описывает интерфейс и логику представления данных пользователю, а не базовые механизмы сканирования или ранжирования веб-контента.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит извлечение Attributes и Attribute Values из Data Items. Система должна проанализировать контент (будь то пользовательские файлы или данные из сети) и структурировать его метаданные для хранения в Data Item-Attribute Database. Также на этом этапе используются Context Signals для обогащения данных, собранных носимыми устройствами.

QUNDERSTANDING – Понимание Запросов
Если процесс начинается с запроса (как показано в одном из примеров: "What song did I hear in New York last week?"), система должна разобрать запрос, чтобы определить начальный набор атрибутов и значений (например, Тип=Песня, Место=Нью-Йорк, Время=Прошлая неделя) для формирования первого кластера.

METASEARCH – Метапоиск и Смешивание (Presentation Layer)
Основное применение патента. Он описывает логику организации и представления результатов поиска пользователю. Вместо (или в дополнение к) традиционному списку результатов система использует механизм кластеризации и предоставляет интерфейс для фасетной навигации, позволяя пользователю динамически исследовать и уточнять набор результатов.

Входные данные:

База данных Data Item-Attribute Database.
Пользовательский ввод (запрос или выбор атрибута/значения).
Данные управления интерфейсом (включая Physiological Data для HMD).
Sensory-input data и Context Signals (при добавлении новых элементов).

Выходные данные:

Визуальное представление Data Item Cluster (галерея результатов).
Визуальные индикаторы доступных атрибутов/фасетов для уточнения.

На что влияет

Типы контента: Влияет на представление любого типа контента, который может быть структурирован по атрибутам: изображения, аудио, видео, документы, электронные письма, контакты.
Специфические запросы: Наиболее полезен для исследовательских запросов (exploratory search), где пользователь не ищет конкретный документ, а исследует набор данных и сужает его.
Устройства: Патент явно фокусируется на носимых устройствах (HMD) и предлагает специфические для них методы взаимодействия (управление взглядом, движением головы).

Когда применяется

Алгоритм применяется в момент, когда пользователю необходимо представить набор результатов поиска или организовать доступ к базе данных, содержащей большое количество элементов с разнообразными метаданными.

Условия работы: Наличие структурированной базы данных, где элементы размечены атрибутами.
Триггеры активации: Запрос пользователя или активация интерфейса просмотра данных. Механизм фасетной навигации активируется после формирования первичного набора результатов для предоставления возможностей уточнения.

Пошаговый алгоритм

Процесс А: Обработка и навигация (Real-Time)

Инициализация: Система получает первый ввод (запрос или выбор атрибута).
Первичная кластеризация: Система обращается к Data Item-Attribute Database и группирует First Data Item Cluster, выбирая элементы, соответствующие первому вводу.
Визуализация кластера и фасетов: Система генерирует визуальное представление кластера (например, галерею). Одновременно она определяет релевантные атрибуты, общие для элементов кластера, и отображает их как доступные фильтры (фасеты), часто в виде графических иконок.
Получение ввода пользователя: Система ожидает второго ввода. Это может включать:
- Прокрутку (scrolling) галереи для просмотра элементов.
- Выбор (selection) конкретного элемента данных для выполнения действия (Переход к Шагу 7).
- Выбор атрибута/фасета для уточнения поиска.
(Ввод может осуществляться через тачпад, голосовые команды или Physiological Data).
Вторичная кластеризация: Если выбран атрибут/фасет, система формирует Second Data Item Cluster, уточняя предыдущий набор результатов.
Обновление интерфейса: Система обновляет визуальное представление, показывая новый кластер и новый набор доступных фасетов. Процесс возвращается к Шагу 4.
Выполнение действия: При выборе конкретного элемента данных система выполняет связанное с ним действие (например, открывает файл, инициирует звонок, отправляет сообщение).

Процесс Б: Сбор и индексация данных (Offline или Background)

Сбор данных: Система получает sensory-input data (например, с камеры или микрофона HMD). Это может быть инициировано пользователем или автоматически (например, при обнаружении интересного физиологического состояния).
Анализ контекста: Система собирает Context Signals (время, местоположение, погода и т.д.) в момент сбора данных.
Извлечение атрибутов: Система анализирует собранные данные и контекст для определения Attributes и Attribute Values.
Индексация: Новый Data Item и его атрибуты сохраняются в Data Item-Attribute Database.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании метаданных для организации интерфейса.

Структурные/Контентные факторы (Метаданные): Критически важные данные. Система использует Attributes и Attribute Values, связанные с каждым Data Item. Это включает:
- Тип данных: Музыка, Фото, Документ, Контакт, Сообщение.
- Временные факторы: Дата, время, день недели, сезон, связь с событиями календаря.
- Географические факторы: Местоположение (город, адрес, GPS-координаты), связанные с созданием или потреблением контента.
- Контекстуальные факторы: Погода, температура, уровень шума, социальные связи (кто был рядом).
Пользовательские факторы (Взаимодействие):
- Ввод запросов (текстовый или голосовой).
- Данные о взаимодействии с интерфейсом: прокрутка, выбор фильтров, выбор элементов.
- Physiological Data (движение глаз, головы) для управления интерфейсом на HMD.

Какие метрики используются и как они считаются

Патент не описывает метрики ранжирования (например, Ranking Scores). Он описывает логику группировки и представления.

Группировка (Grouping): Процесс выбора элементов из базы данных, которые удовлетворяют выбранному набору атрибутов и значений. Это булева операция фильтрации.
Выбор фасетов (Facet Selection): Алгоритм должен определять, какие атрибуты доступны для дальнейшего уточнения в рамках текущего кластера. Это включает анализ всех элементов в кластере и идентификацию общих атрибутов и их значений.

В патенте не указаны конкретные формулы, пороги или весовые коэффициенты, так как он описывает механизм взаимодействия, а не алгоритм оценки качества или релевантности.

Фокус на UI/UX и носимых устройствах: Патент в первую очередь описывает пользовательский интерфейс для поиска информации на устройствах типа HMD (Google Glass), включая специфические методы ввода (отслеживание взгляда, движения головы). Он не имеет прямого отношения к алгоритмам ранжирования веб-поиска Google.
Фасетная навигация как основа: Ядром изобретения является реализация фасетной навигации (Faceted Search) — метода, позволяющего пользователям исследовать коллекцию информации путем итеративного применения фильтров (атрибутов). Это стандартный и мощный механизм в Information Retrieval.
Организация по атрибутам: Система полностью полагается на способность извлекать и структурировать метаданные (Attributes и Attribute Values) из контента. Без качественных метаданных система работать не сможет.
Контекстуализация данных: Патент подчеркивает важность обогащения данных контекстом (Context Signals), таким как время, место, погода и социальное окружение, что позволяет создавать более богатые возможности для поиска и фильтрации.
Косвенное значение для SEO: Хотя патент не о ранжировании, он подтверждает долгосрочную стратегию Google по пониманию структурированных данных. Для того чтобы контент мог быть представлен в подобных фасетных интерфейсах (которые Google использует в вертикалях, таких как Покупки, Картинки, Локальный поиск), он должен быть размечен так, чтобы его атрибуты были легко извлекаемы.

Best practices (это мы делаем)

Учитывая, что патент описывает механизм представления результатов, а не их ранжирования, прямые SEO-рекомендации ограничены и касаются в основном структурирования данных.

Внедрение детальной микроразметки (Schema.org): Обеспечьте максимально полное и точное описание контента с помощью микроразметки. Это позволяет поисковым системам извлекать Attributes и Attribute Values, которые могут быть использованы для фасетной навигации в различных вертикалях поиска (например, цена и наличие для Product; дата и место для Event; ингредиенты для Recipe).
Структурирование контента для извлечения атрибутов: Даже без микроразметки организуйте контент так, чтобы ключевые характеристики были очевидны. Используйте таблицы, списки и четкую иерархию для представления спецификаций или характеристик. Это облегчает системам извлечение данных для формирования фасетов.
Оптимизация под вертикали с фасетной навигацией: Сосредоточьтесь на предоставлении всех необходимых атрибутов в нишах, где Google активно использует фильтры (E-commerce, Local, Travel, Media). Убедитесь, что данные в фидах (например, Google Merchant Center) полны и точны.

Worst practices (это делать не надо)

Игнорирование структурированных данных: Предоставление информации исключительно в виде неструктурированного текста затрудняет извлечение атрибутов. Это может привести к тому, что ваш контент не будет отображаться при применении пользователем фильтров в поиске.
Предоставление неточных или спамных метаданных: Попытка манипулировать атрибутами (например, указание неверной цены или ложного местоположения) приведет к плохому пользовательскому опыту и потенциальным санкциям, так как контент не будет соответствовать ожиданиям пользователя после применения фильтров.

Стратегическое значение

Стратегическое значение этого патента для SEO заключается в подтверждении того, что организация информации через атрибуты (структурированные данные) является фундаментальным элементом современных поисковых систем. Хотя конкретная реализация в патенте ориентирована на HMD, базовый принцип универсален. SEO-стратегия должна учитывать не только ранжирование по ключевым словам, но и видимость контента при использовании пользователями инструментов уточнения поиска (фильтров). Это требует перехода от оптимизации страниц к оптимизации сущностей и их атрибутов.

Практические примеры

Сценарий: Оптимизация карточки товара для фасетного поиска

Представим, что Google использует механизм, подобный описанному, для организации результатов в Google Shopping.

Задача: Обеспечить видимость товара "Кроссовки Nike Air Max 270" при использовании различных фильтров.
Действия (на основе патента): Необходимо убедиться, что система может извлечь все ключевые Attributes и Attribute Values.
- Микроразметка: Использовать Schema.org/Product, указав brand (Nike), model (Air Max 270), color, size, material. В блоке Offer указать price, availability, condition.
- Фиды данных: Передать эти же атрибуты в Google Merchant Center.
Ожидаемый результат: Когда пользователь ищет "Кроссовки" (Первый кластер), система отображает фасеты: Бренд, Цвет, Размер (Визуализация атрибутов). Если пользователь выбирает фасет "Бренд=Nike" (Второй ввод), товар попадает во Второй кластер и остается видимым в выдаче. Если атрибуты не были бы предоставлены, товар исчез бы из отфильтрованной выдачи.

Описывает ли этот патент новый алгоритм ранжирования Google?

Нет, этот патент не описывает алгоритмы ранжирования. Он не касается того, как Google определяет релевантность или качество веб-страниц в основном индексе Google. Патент сосредоточен исключительно на пользовательском интерфейсе (UI/UX) для поиска и навигации по уже извлеченным данным, используя метод фасетной навигации.

Патент упоминает Head-Mounted Displays (HMD). Значит ли это, что он применим только к устройствам типа Google Glass?

В значительной степени, да. Многие детали патента, особенно касающиеся взаимодействия с помощью физиологических данных (движения головы, отслеживание взгляда), специфичны для HMD. Однако базовая концепция — итеративное уточнение поиска через выбор атрибутов (фасетная навигация) — является универсальной и используется в веб-поиске и мобильных интерфейсах.

Какое значение этот патент имеет для SEO, если он не о ранжировании?

Его значение косвенное, но важное. Он подчеркивает, насколько критично для поисковых систем уметь разбирать контент на Attributes и Attribute Values. Чтобы ваш контент эффективно работал в системах с фасетной навигацией (например, Google Shopping, Local Search), вы должны предоставлять эти атрибуты в структурированном виде, в первую очередь через микроразметку Schema.org и фиды данных.

Что такое «Data Item Cluster» в контексте веб-поиска?

В контексте этого патента Data Item Cluster — это набор результатов, объединенных общим атрибутом. В веб-поиске это эквивалентно результатам поиска после применения фильтра. Например, если вы искали "ноутбуки", а затем применили фильтр "Бренд: Apple", отображаемый список результатов и будет являться кластером, где все элементы имеют атрибут "Бренд" со значением "Apple".

Что такое «Context Signals» и как они влияют на поиск?

Context Signals — это информация о текущей ситуации пользователя: время, местоположение, погода, данные календаря, социальное окружение. В патенте они используются для автоматического присвоения атрибутов контенту, захваченному устройством. В общем поиске Google использует эти сигналы для персонализации и локализации выдачи, адаптируя результаты под текущие нужды пользователя.

Как этот патент связан с Knowledge Graph и сущностями?

Связь концептуальная. И Knowledge Graph, и система, описанная в патенте, основаны на понимании сущностей (Data Items) и их свойств (Attributes). Фасетная навигация — это один из способов организации и представления информации о сущностях. Работа по SEO, направленная на оптимизацию сущностей (Entity Optimization), напрямую поддерживает системы такого типа.

Нужно ли мне менять подход к созданию контента из-за этого патента?

Патент не требует изменения подхода к качеству контента, но настоятельно рекомендует улучшить его структурирование. Убедитесь, что ключевые характеристики вашего продукта, услуги или информации представлены в виде, удобном для извлечения (таблицы, списки, микроразметка), а не спрятаны в сплошном тексте.

Используется ли описанный механизм в Google Поиске сегодня?

Да, базовый механизм фасетной навигации активно используется. Вы видите его каждый раз, когда используете фильтры по времени в Новостях, по цвету или размеру в Картинках, или по цене и бренду в Покупках. Однако специфические интерфейсы для HMD с управлением взглядом, описанные в патенте, в массовом поиске не применяются.

Может ли использование структурированных данных помочь мне ранжироваться выше?

Само по себе наличие структурированных данных не является прямым фактором ранжирования. Однако оно позволяет вашему контенту отображаться в расширенных сниппетах (Rich Snippets) и гарантирует, что ваш контент останется видимым, когда пользователи применяют фильтры (фасеты) в поиске. Это повышает общую видимость и CTR, что косвенно может влиять на позиции.

Описывает ли патент, как именно система определяет атрибуты для элементов данных?

Патент упоминает, что атрибуты определяются при добавлении элемента в базу данных, используя сенсорные данные и контекстные сигналы (время, место и т.д.). Однако он не детализирует конкретные алгоритмы извлечения атрибутов из контента (например, из текста или изображений), фокусируясь на том, как использовать эти атрибуты после их извлечения.

Как Google определяет и предлагает следующие шаги в голосовом поиске для построения разговорного диалога

Патент Google, описывающий механизм для облегчения разговорного поиска, в первую очередь на носимых устройствах. Система анализирует исходный запрос и определяет связанные темы (ключевые слова), основываясь на популярных поисковых запросах и семантических связях. Эти ключевые слова отображаются пользователю и одновременно активируются как голосовые команды для быстрого выполнения следующего связанного поиска.

US9305064B1
2016-04-05

Семантика и интент

Как Google кластеризует результаты поиска по картинкам и выбирает репрезентативное (каноническое) изображение для показа

Google организует результаты поиска изображений в иерархические кластеры на основе визуального сходства. Для каждого кластера выбирается «каноническое изображение» — часто это изображение с самым высоким исходным рейтингом или наиболее визуально авторитетное (с использованием метрик типа VisualRank). Эта структура определяет, как изображения группируются и какое изображение получает максимальную видимость в интерфейсе Google Images.

US8352465B1
2013-01-08

Мультимедиа
SERP

Как Google организует результаты поиска по картинкам в масштабируемый интерфейс с помощью кластеризации по сходству

Google использует систему для визуализации результатов поиска по картинкам. Изображения группируются на основе визуального и семантического сходства и размещаются в двумерной сетке. При уменьшении масштаба система показывает меньше изображений, выбирая одно репрезентативное для каждого кластера. При увеличении масштаба отображается больше детализированных результатов внутри кластера. Это позволяет пользователям эффективно просматривать большие наборы изображений.

US20150170333A1
2015-06-18

Мультимедиа
SERP
Семантика и интент

Как Google News использует расширяемые блоки (Story Clusters) для агрегации разнообразного контента по одной теме

Патент Google описывает интерфейс для агрегации контента (например, Google News). Система группирует связанные документы в кластеры и представляет их в виде сворачиваемых блоков. В развернутом виде блок показывает разнообразные типы контента (статьи, видео, мнения, контекст) из разных источников, помогая пользователю всесторонне изучить тему.

US9678618B1
2017-06-13

Мультимедиа
Семантика и интент

Как Google использует гибридную итеративную кластеризацию для организации документов в системах E-Discovery

Патент Google описывает метод оптимизации для анализа больших наборов документов в системах E-Discovery (юридический анализ). Документы сначала быстро кластеризуются по одному типу данных (например, метаданным), а затем итеративно уточняются с использованием других типов данных (например, основного текста). Это балансирует скорость и точность тематической группировки и не связано с веб-поиском.

US9268844B1
2016-02-23

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки

Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.

US8442984B1
2013-05-14

SERP
EEAT и качество
Поведенческие сигналы

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске

Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).

US8498984B1
2013-07-30

SERP
Поведенческие сигналы

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)

Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.

US9317605B1
2016-04-19

Семантика и интент
SERP
Поведенческие сигналы

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR

Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.

US9569432B1
2017-02-14

SERP
Поведенческие сигналы
Персонализация

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок

Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.

US8260785B2
2012-09-04

Knowledge Graph
Семантика и интент
Ссылки

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов

Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).

US6754873B1
2004-06-22

Ссылки
SERP
Техническое SEO

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных

Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.

US10318581B2
2019-06-11

Поведенческие сигналы
Мультимедиа
Семантика и интент

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса

Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.

US8392443B1
2013-03-05

Семантика и интент
Поведенческие сигналы

Как Google находит, фильтрует и подмешивает посты из блогов, релевантные конкретным результатам поиска

Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих ссылок (out-degree), качество входящих ссылок (Link-based score), возраст поста, его длину и расположение ссылок, чтобы гарантировать качество подмешиваемого контента.

US8117195B1
2012-02-14

EEAT и качество
Антиспам
Ссылки

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий

Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.

US9881077B1
2018-01-30

Семантика и интент
Поведенческие сигналы