Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
Описание
Какую задачу решает
Патент решает проблему неоднозначности поисковых запросов (ambiguous queries), когда один запрос может относиться к разным сущностям (например, «Ягуар» — животное или автомобиль). Если система изначально неверно интерпретирует интент, пользователю приходится просматривать нерелевантные результаты. Изобретение позволяет динамически адаптировать выдачу в реальном времени на основе неявной обратной связи пользователя (действий отклонения), уточняя интент и улучшая релевантность оставшихся результатов.
Что запатентовано
Запатентована система динамической модификации результатов поиска, основанная на кластеризации по сущностям и анализе действий пользователя в интерфейсе. Система группирует результаты, относящиеся к одной и той же сущности (entity). Если пользователь совершает действие отклонения (dismissal action) в отношении результата из определенной группы, система интерпретирует это как незаинтересованность в данной сущности и модифицирует выдачу, понижая или удаляя другие результаты из этой же группы.
Как это работает
Механизм работает в несколько этапов:
- Идентификация сущностей: Для каждого результата поиска определяются связанные с ним сущности.
- Кластеризация: Результаты группируются в наборы (sets of search results) на основе общих сущностей (shared entity).
- Отображение и мониторинг: Пользователю предоставляется начальная выдача. Система (часто через клиентский скрипт на устройстве пользователя) отслеживает взаимодействия.
- Детекция отклонения: Фиксируется dismissal action — например, прокрутка мимо результата (scrolling past) или его смахивание (swiping away).
- Модификация SERP: Если результат отклонен, система идентифицирует его группу (сущность) и применяет модификацию ко всем результатам этой группы. Модификация может включать понижение позиций (demoting), визуальное затемнение (dimming) или полное удаление (omitting) результатов.
Актуальность для SEO
Средняя. Концепция разрешения неоднозначности запросов и уточнения интента критически важна для современного поиска. Однако данный патент описывает специфический интерфейсный механизм (динамическое изменение SERP в ответ на прокрутку/смахивание). Хотя Google активно использует сущности и анализирует поведение пользователей, реализация именно такого динамического интерфейса (например, затемнение результатов при прокрутке) не является стандартом в основной веб-выдаче. Возможно применение в мобильных интерфейсах или специфических поисковых продуктах.
Важность для SEO
Влияние на SEO оценивается как умеренно высокое (7/10). Хотя патент в первую очередь описывает интерфейсное решение, он подчеркивает критическую важность правильной ассоциации контента с сущностями. Для SEO-специалистов это означает, что недостаточно ранжироваться по ключевому слову; необходимо гарантировать, что контент четко соответствует интенту и сущности, интересующей пользователя. Если контент попадет в «неправильный» кластер сущностей для данного запроса, он может быть коллективно понижен или скрыт, если пользователи начнут игнорировать эту тему.
Детальный разбор
Термины и определения
- Dismissal Action (Действие отклонения)
- Действие пользователя, интерпретируемое системой как отсутствие интереса к результату поиска. Примеры включают прокрутку мимо результата (scrolling past), смахивание результата (swiping away) или вербальную команду отклонения.
- Dismissal Threshold (Порог отклонения)
- Минимальное значение Dismissal Value, необходимое для активации модификации результатов поиска.
- Dismissal Value (Значение отклонения)
- Метрика, указывающая на количество отклоненных результатов в рамках одного набора (set of search results).
- Dimming (Затемнение)
- Способ визуального понижения (demoting) результата поиска путем изменения его параметров отображения: осветление цвета контента или увеличение прозрачности (translucency).
- Entity (Сущность)
- Тема дискурsa; человек, место, концепция или объект, который может быть идентифицирован и отличается от других (например, «Пингвин» как птица и «Пингвинз» как хоккейная команда — это разные сущности).
- Entity Cluster Module (Модуль кластеризации сущностей)
- Компонент поисковой системы, отвечающий за определение сущностей, связанных с результатами поиска, и их группировку в наборы.
- Instruction Module (Модуль инструкций)
- Компонент, предоставляющий инструкции (например, клиентский скрипт) для модификации результатов поиска на основе dismissal action.
- Set of Search Results (Набор результатов поиска)
- Группа результатов поиска, которые имеют одну или несколько общих связанных сущностей.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод динамической модификации выдачи на основе сущностей.
- Система предоставляет начальные результаты поиска по запросу.
- Эти результаты включают Первый набор (связанный с Первой сущностью) и Второй набор (связанный со Второй сущностью). Сущности различны.
- Система определяет dismissal action в отношении первого результата из Первого набора (что указывает на отсутствие интереса пользователя).
- На основе этого действия система модифицирует начальную выдачу: понижает (demoting) или удаляет (omitting) как отклоненный результат, так и один или несколько *дополнительных* результатов из Первого набора. Основанием для этой коллективной модификации является их общая принадлежность к Первому набору (т.е. связь с Первой сущностью).
Claim 3, 4, 5 (Зависимые): Детализируют механизм визуального понижения.
- Понижение реализуется через изменение параметров отображения (Claim 3), в частности, через увеличение степени затемнения (amount of dimming) (Claim 4).
- Если фиксируется второе действие отклонения для другого результата из этого же набора, степень затемнения для всего набора дополнительно увеличивается (Claim 5). Это указывает на кумулятивный эффект понижения.
Claim 6 (Зависимый): Вводит пороговое значение для активации модификации.
- Система вычисляет Dismissal Value — количество отклоненных результатов в наборе.
- Система проверяет, удовлетворяет ли это значение Dismissal Threshold.
- Модификация (понижение/удаление) происходит только в том случае, если порог достигнут.
Claim 8, 9, 10 (Зависимые): Определяют типы dismissal action.
- Прокрутка мимо результата так, что он (или его часть) больше не отображается на экране (Claim 8).
- Смахивание результата (swiping away) (Claim 9).
- Для аудио-результатов — вербальный ввод пользователя, отклоняющий результат (Claim 10).
Claim 12 (Зависимый): Описывает техническую реализацию модификации.
- Если результаты предоставлены в виде веб-страницы, модификация включает изменение параметров представления (presentation parameters) этой веб-страницы (например, через клиентский скрипт), а не генерацию новой страницы.
Claim 14 (Зависимый): Описывает обработку результатов, принадлежащих к нескольким наборам (связанных с несколькими сущностями).
- Результаты, принадлежащие только к отклоненному набору, понижаются в первой степени.
- Результаты, принадлежащие как к отклоненному, так и к другому (неотклоненному) набору, понижаются во второй степени.
- Первая степень понижения сильнее второй. Это механизм дифференциального понижения.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, используя данные о сущностях для динамической корректировки финальной выдачи на стороне клиента или сервера.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно ассоциировать документы с одной или несколькими сущностями (entities). Патент упоминает, что эта ассоциация может включать оценку силы связи (strength of the association или entity score) между документом и сущностью. Эти данные сохраняются в индексе.
RANKING – Ранжирование
После получения запроса и отбора кандидатов активируется Entity Cluster Module. Он анализирует результаты-кандидаты, идентифицирует связанные с ними сущности и формирует sets of search results (кластеры). Каждый набор объединяет результаты с общей сущностью.
RERANKING – Переранжирование / Интерфейс пользователя (Client Device)
Это основной этап применения патента. Система предоставляет начальные результаты пользователю вместе с метаданными о принадлежности к наборам (search result set information) и инструкциями (Instruction Module) по модификации (часто в виде клиентского скрипта, например, JavaScript).
- Мониторинг: Клиентское устройство (браузер) отслеживает действия пользователя.
- Детекция: Определяется dismissal action (прокрутка, смахивание).
- Исполнение инструкций: Клиентское устройство исполняет инструкции для модификации SERP в реальном времени. Происходит понижение или удаление результатов, связанных с отклоненной сущностью. В альтернативной реализации сигнал отправляется на сервер для пересчета и предоставления новой выдачи.
Входные данные:
- Начальные результаты поиска.
- Ассоциации между результатами и сущностями.
- Информация о кластеризации (search result set information).
- Инструкции по модификации (скрипт).
- Действия пользователя (ввод для прокрутки, жесты смахивания).
Выходные данные:
- Модифицированное представление результатов поиска (Modified search results) с пониженными или удаленными элементами.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы (ambiguous queries), где одно ключевое слово соответствует нескольким популярным сущностям (например, «Apple», «Washington», «Java»).
- Типы контента: Влияет на все типы контента, которые могут быть ассоциированы с сущностями.
- Интерфейсы: Механизм особенно актуален для интерфейсов, где пространство ограничено и важна быстрая навигация (мобильные устройства, планшеты, устройства с голосовым управлением).
Когда применяется
Алгоритм применяется при выполнении следующих условий:
- Условие кластеризации: В выдаче присутствуют как минимум два различных набора результатов (first set и second set), связанных с разными сущностями. Это означает, что запрос интерпретируется как неоднозначный.
- Триггер активации: Пользователь совершает dismissal action в отношении одного или нескольких результатов из определенного набора.
- Пороговые значения (Опционально): Модификация может активироваться только после того, как количество отклоненных результатов в наборе (Dismissal Value) превысит заданный порог (Dismissal Threshold).
Пошаговый алгоритм
Процесс А: Подготовка выдачи (Search System)
- Получение запроса и идентификация результатов: Система получает запрос и определяет релевантные результаты.
- Идентификация сущностей: Для каждого результата определяются связанные сущности (и, возможно, strength of association).
- Кластеризация: Entity Cluster Module группирует результаты в наборы на основе общих сущностей. Формируется как минимум два набора (Set 1, Set 2).
- Подготовка инструкций: Instruction Module генерирует инструкции (например, скрипт) для модификации выдачи.
- Предоставление данных: Начальная выдача, метаданные о наборах (search result set information) и инструкции передаются на клиентское устройство.
Процесс Б: Обработка взаимодействия (Преимущественно Client Device)
- Отображение: Клиент отображает начальную выдачу.
- Мониторинг действий: Скрипт отслеживает взаимодействия пользователя с результатами.
- Детекция отклонения: Определяется dismissal action (например, пользователь быстро прокрутил мимо результата R1 из набора Set 1).
- Оценка отклонения (Опционально): Обновляется счетчик Dismissal Value для Set 1. Проверяется, превышен ли Dismissal Threshold.
- Идентификация затронутых результатов: Определяются все остальные результаты, принадлежащие к Set 1, используя метаданные.
- Применение модификации: Применяется понижение (demoting) к результатам из Set 1.
- Визуальное понижение: Увеличивается степень затемнения (dimming). Если это повторное отклонение для Set 1, затемнение усиливается (кумулятивный эффект).
- Или Удаление: Результаты из Set 1 скрываются (omitting).
- Или Понижение позиций: Результаты из Set 1 перемещаются вниз в выдаче.
- Дифференциальное понижение (Опционально): Если результат принадлежит к Set 1 (отклоненный) и Set 2 (актуальный), он понижается в меньшей степени, чем результаты, принадлежащие только к Set 1.
- Обновление интерфейса: Пользователю предоставляется модифицированная выдача в реальном времени.
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании данных о сущностях и поведении пользователя в реальном времени для модификации интерфейса.
- Данные о сущностях (Entity Data): Критически важные данные. Используются ассоциации между документами и сущностями, предварительно вычисленные на этапе индексации.
- Метрики сущностей: Оценки силы связи (strength of association или entity score) между сущностью и документом. Используются для определения принадлежности к кластерам и для расчета дифференциального понижения.
- Поведенческие факторы (Real-time User Actions): Действия пользователя в интерфейсе, которые интерпретируются как dismissal action: данные о прокрутке (позиция, возможно скорость), жесты смахивания, голосовые команды.
- Структурные данные SERP: Информация о том, какие результаты отображаются на экране в данный момент, и их принадлежность к кластерам (search result set information).
Какие метрики используются и как они считаются
- Dismissal Value (Значение отклонения): Счетчик количества отклоненных результатов для конкретного набора сущностей. Увеличивается на 1 при каждом dismissal action, связанном с этим набором.
- Dismissal Threshold (Порог отклонения): Предопределенное статическое значение (например, 1, 2 или 3), используемое для сравнения с Dismissal Value для активации модификации.
- Amount of Dimming (Степень затемнения): Параметр визуального отображения. Может увеличиваться кумулятивно с ростом Dismissal Value (Claim 5).
Выводы
- Сущности как основа для разрешения неоднозначности: Патент демонстрирует использование сущностей (Entities) как ключевого механизма для интерпретации интента неоднозначных запросов. Выдача рассматривается не как линейный список, а как набор тематических кластеров, организованных вокруг разных сущностей.
- Неявная обратная связь в реальном времени: Система активно интерпретирует действия пользователя в интерфейсе (прокрутку, смахивание) как неявные сигналы релевантности (implicit feedback). Игнорирование результата (dismissal action) используется для немедленной корректировки выдачи.
- Коллективное понижение (Clustered Demotion): Ключевой механизм — понижение применяется не только к проигнорированному результату, но и ко всем результатам, связанным с той же сущностью. Незаинтересованность в одной ссылке приводит к понижению или исчезновению всего тематического кластера.
- Кумулятивный эффект и пороги: Понижение может быть градуированным. Повторное игнорирование результатов одной темы усиливает понижение (например, увеличивает затемнение). Система может также требовать нескольких сигналов для активации (Dismissal Threshold).
- Дифференциальное ранжирование для сложных документов: Документы, связанные с несколькими сущностями, имеют частичную защиту. Если пользователь отклонил одну из связанных сущностей, документ понижается в меньшей степени (differential demotion), сохраняя видимость за счет других сущностей.
Практика
Best practices (это мы делаем)
- Четкое фокусирование контента на основной сущности: Убедитесь, что каждая страница имеет явно выраженную основную сущность. Это критично для правильной кластеризации контента. Используйте однозначные заголовки и соответствующую микроразметку (Schema.org), чтобы помочь системе правильно ассоциировать страницу.
- Устранение неоднозначности в тексте (Disambiguation): Если вы пишете о сущности, имеющей несколько значений (например, «Java» — остров, кофе или язык программирования), немедленно задавайте контекст. Используйте связанные термины и сущности (например, для языка: «OpenJDK», «programming», «software»), чтобы помочь поисковой системе точно определить тематику.
- Оптимизация сниппетов и заголовков для ясности интента: Заголовок (Title) и сниппет (Description) должны мгновенно сообщать пользователю, о какой именно сущности идет речь. Это снижает вероятность того, что пользователь проигнорирует релевантный результат, что может быть интерпретировано как dismissal action.
- Комплексное освещение темы (Использование дифференциального понижения): Для информационных ресурсов полезно освещать тему, связывая основную сущность с релевантными подсущностями. Согласно патенту (Claim 14), документы, связанные с несколькими сущностями, могут получить меньшее понижение, если одна из них будет отклонена пользователем.
Worst practices (это делать не надо)
- Смешивание несвязанных сущностей (Entity Ambiguity): Создание контента, который пытается охватить несколько слабо связанных или неоднозначных сущностей на одной странице. Если пользователь ищет одну сущность, а ваш контент также сильно связан с другой, которую пользователь активно отклоняет в выдаче, ваша страница рискует быть пониженной вместе с нерелевантным кластером.
- Неоднозначные или кликбейтные заголовки: Использование заголовков, которые не позволяют сразу понять основную сущность страницы. Это провоцирует пользователей быстро прокручивать такие результаты (scrolling past), что система интерпретирует как сигнал отсутствия интереса к этой сущности или результату.
- Игнорирование семантической структуры: Создание контента без четкой семантической структуры затрудняет определение основной сущности страницы, что может привести к неверной кластеризации и последующему понижению.
Стратегическое значение
Этот патент подтверждает стратегический приоритет Google на понимание сущностей и интентов, а не только ключевых слов. Он показывает механизм, с помощью которого Google пытается «очистить» выдачу от неверно интерпретированных интентов в реальном времени на основе поведения пользователя. Для долгосрочной SEO-стратегии это означает необходимость максимальной точности в таргетинге контента на конкретную сущность и связанный с ней интент, а также важность работы над ясностью представления контента в SERP.
Практические примеры
Сценарий: Оптимизация статьи для неоднозначного запроса «Python»
Задача: Написать статью о языке программирования Python и минимизировать риск понижения, если пользователь ищет информацию о змеях.
- Анализ сущностей: Google идентифицирует две основные сущности для запроса «Python»: Язык программирования и Змея (Reptile).
- Действия по оптимизации (Best Practice):
- Использовать Title: «Введение в язык программирования Python (Programming Language)».
- В H1 и первом абзаце использовать связанные сущности и термины: «синтаксис кода», «Django», «machine learning», «Guido van Rossum».
- Применить разметку Schema.org, релевантную ПО или обучению.
- Ошибочные действия (Worst Practice):
- Использовать заголовок «Python: Полное руководство».
- Разместить стоковое изображение питона (змеи) в качестве иллюстрации к статье о программировании.
- Упоминать термины, связанные с биологией или герпетологией.
- Ожидаемый результат: Система четко ассоциирует статью с сущностью «Язык программирования». Если пользователь вводит запрос «Python» и начинает активно прокручивать (dismissal action) результаты о змеях, статья о программировании не будет понижена, так как она принадлежит к другому кластеру сущностей.
Вопросы и ответы
Что такое «действие отклонения» (dismissal action) в контексте этого патента?
Это не клик и не выбор результата. Это действие пользователя в интерфейсе, которое система интерпретирует как отсутствие интереса к данному результату. Патент явно упоминает прокрутку мимо результата (scrolling past) так, что он исчезает с экрана, смахивание результата (swiping away) в интерфейсах (например, мобильных) или голосовую команду отклонения при аудио-поиске.
Как система определяет, к какой группе (сущности) относится мой результат поиска?
Это определяется на этапах индексирования и ранжирования. Система анализирует контент документа и определяет связанные с ним сущности (entities). Затем Entity Cluster Module группирует результаты, которые имеют общие сущности. Для SEO это подчеркивает важность четкого тематического фокуса контента и использования микроразметки для явного указания сущностей.
Что происходит, если пользователь отклоняет один результат? Понижаются ли все остальные результаты этой темы?
Да, это ключевая особенность патента — коллективное понижение. Если пользователь проигнорировал один результат, связанный с Сущностью А, система понижает (затемняет, перемещает вниз или скрывает) все остальные результаты в текущей выдаче, которые также связаны с Сущностью А, предполагая, что пользователя эта интерпретация запроса не интересует.
Всегда ли одно действие отклонения вызывает понижение?
Не обязательно. Патент описывает вариант реализации с использованием Dismissal Threshold (порога отклонения). Система может начать модификацию выдачи только после того, как пользователь отклонил определенное количество результатов (Dismissal Value) из одного и того же набора, например, после игнорирования 2 или 3 ссылок по теме.
Что произойдет, если моя страница релевантна двум разным сущностям для запроса?
Это предусмотрено механизмом дифференциального понижения (Claim 14). Если пользователь отклоняет Сущность А, а ваша страница связана с Сущностью А и Сущностью Б, ваша страница будет понижена. Однако она может быть понижена в меньшей степени, чем страницы, связанные только с Сущностью А, поскольку она все еще релевантна Сущности Б.
Как я могу защитить свой контент от такого понижения?
Ключ к защите — максимальная ясность сниппета и релевантность контента. Убедитесь, что ваши заголовки (Title) и описание (Description) абсолютно точно отражают содержание страницы и связанную с ней сущность. Если пользователь сразу понимает, о чем ваша страница, и она соответствует его интенту, он не совершит dismissal action.
Применяется ли этот механизм в стандартном поиске Google сегодня?
Патент описывает конкретную реализацию интерфейса (динамическое затемнение или скрытие при прокрутке), которая не наблюдается повсеместно в стандартном веб-поиске. Однако базовая технология — кластеризация по сущностям и анализ поведения пользователей для уточнения интента — активно используется Google. Этот конкретный интерфейс может быть реализован в мобильном поиске, поиске по картинкам или других продуктах.
Как технически реализована эта динамическая модификация?
Патент предполагает реализацию преимущественно на стороне клиента (Claim 12). Поисковая система отправляет результаты вместе с инструкциями (например, JavaScript) и данными о кластерах. Браузер пользователя выполняет эти инструкции и изменяет отображение (presentation parameters) уже загруженной страницы SERP при обнаружении dismissal action.
Какое значение этот патент имеет для работы с неоднозначными запросами?
Он критически важен. Для неоднозначных запросов (например, «Ягуар») необходимо максимально быстро дать понять и пользователю (через сниппет), и системе (через контент и разметку), о какой именно сущности идет речь (животное или машина). Если ваш контент нечеткий, он рискует попасть в кластер, который пользователь может коллективно отклонить.
Влияет ли этот механизм на мои позиции в поиске в долгосрочной перспективе?
Патент описывает модификацию в рамках текущей сессии пользователя для уточнения его сиюминутного интента. Он напрямую не описывает, как эти данные используются для глобального ранжирования. Однако сбор данных о том, какие сущности пользователи предпочитают для определенных запросов, несомненно, используется Google для обучения общих моделей ранжирования.