Google собирает и анализирует историю исправлений, которые пользователи вносят в фактические данные (например, характеристики продуктов или биографические данные). Система классифицирует эти исправления по типу (например, было ли исправление подтверждено ссылкой на источник) и использует их для корректировки «оценки уверенности» (Confidence Score) в конкретных фактах. Это напрямую влияет на то, какие данные будут показаны в структурированных результатах поиска, таких как блоки знаний.
Описание
Какую задачу решает
Патент решает проблему неточности фактических данных, извлекаемых поисковой системой. Автоматические алгоритмы могут ошибаться при определении значений (Values) для атрибутов (Attributes) сущностей (Instances) — например, неверно указывать дату рождения человека или характеристики продукта. Изобретение направлено на улучшение точности этих данных путем использования коллективной обратной связи от пользователей.
Что запатентовано
Запатентована система, которая собирает, классифицирует и использует историю пользовательских исправлений (User Correction History) для корректировки ранжирования фактических данных. Когда пользователь исправляет факт, система не просто принимает исправление, а анализирует его контекст (например, подтвердил ли пользователь исправление ссылкой на источник) и присваивает ему вес. Эта история используется для изменения Confidence Parameter (оценки уверенности) в различных вариантах фактов, что влияет на результаты будущих поисковых запросов.
Как это работает
Система работает в двух основных режимах: сбор исправлений и их применение.
- Сбор исправлений: Пользователи взаимодействуют со структурированными данными (например, таблицами, карточками) и вносят исправления. Система (Correction Tracker) фиксирует исходное значение (Uncorrected Value), новое значение (Corrected Value) и действия пользователя (например, переходы по ссылкам для верификации).
- Классификация и Взвешивание: Каждое исправление классифицируется. Исправления, подтвержденные источником, получают больший вес, чем не подтвержденные.
- Применение при поиске: В ответ на запрос система генерирует набор кандидатов (Value Result Set) с исходными оценками уверенности. Затем она обращается к истории исправлений и корректирует эти оценки (применяя Delta Value) на основе агрегированных взвешенных данных о прошлых исправлениях.
- Ранжирование: Кандидаты переранжируются на основе скорректированных оценок уверенности.
Актуальность для SEO
Высокая. Точность фактических данных и работа с сущностями (Knowledge Graph) являются центральными элементами современного поиска. Механизмы обратной связи (например, «Предложить исправление» в Панелях Знаний или Google Maps) являются видимым проявлением принципов, заложенных в этом патенте. Система управления качеством фактов на основе обратной связи критически важна для Google.
Важность для SEO
Патент имеет важное значение для управления сущностями (Entity Management) и работы со структурированными данными. Он описывает механизм, с помощью которого Google валидирует и выбирает факты для отображения в структурированных блоках (Knowledge Panels, Сравнение продуктов и т.д.). Для SEO это означает, что точность и консистентность фактической информации о бренде, продукте или персоне критичны, и что система может обучаться на основе обратной связи пользователей для определения истины.
Детальный разбор
Термины и определения
- Instance (Сущность/Экземпляр)
- Индивидуально идентифицируемая сущность. Примеры: «Honda Civic», «Франция», конкретный человек.
- Attribute (Атрибут)
- Свойство, особенность или характеристика сущности. Примеры: «MPG» (расход топлива), «Столица», «Дата рождения».
- Value (Значение)
- Данные, характеризующие атрибут конкретной сущности. Примеры: «35», «Париж», «1 января 1980».
- User Correction (Пользовательское исправление)
- Действие пользователя по изменению или попытке изменения значения атрибута сущности. Включает удаление, редактирование, замену или подтверждение значения.
- User Correction History (История пользовательских исправлений)
- Хранилище записей о прошлых пользовательских исправлениях.
- Confidence Parameter (Параметр уверенности)
- Метрика, отражающая вероятность того, что данное Значение корректно характеризует Атрибут Сущности. Может быть представлен как Scaled Confidence Rating (шкалированная оценка) или Delta Value (изменение оценки).
- Value Result Set (Набор результирующих значений)
- Коллекция значений-кандидатов для характеристики атрибута сущности в ответ на поисковый запрос.
- Structured Presentation (Структурированное представление)
- Организованное отображение данных, связывающее сущности, атрибуты и значения. Примеры: таблицы, электронные таблицы (spreadsheet), коллекция карточек (deck of cards).
- Uncorrected Value (Неисправленное значение)
- Значение до того, как пользователь внес исправление.
- Corrected Value (Исправленное значение)
- Значение после того, как пользователь внес исправление.
- Correction Classes (Классы исправлений)
- Категоризация действий пользователя при внесении исправления. Ключевой фактор – проверял ли пользователь информацию по источнику (confirmation with a source).
- Correction Tracker (Трекер исправлений)
- Компонент системы, отслеживающий и записывающий действия пользователя при исправлении данных.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод использования истории исправлений при обработке запроса.
- Система получает Value Result Set (набор значений-кандидатов для атрибута сущности).
- Система обращается к историческим записям пользовательских исправлений (historical records of user corrections).
- Определяется, что конкретное значение из набора результатов участвовало в прошлом исправлении (либо как исправленное, либо как неисправленное значение).
- Система изменяет Confidence Parameter (параметр уверенности) для этого значения.
Claim 2 (Зависимый): Уточняет использование измененного параметра уверенности.
- Значения в Value Result Set ранжируются в соответствии с измененным Confidence Parameter.
- По крайней мере часть ранжированного набора отображается пользователю.
Claim 3 (Зависимый): Уточняет формат отображения.
- Отображение происходит в виде Structured Presentation (например, таблица).
- Это представление заполняется значением, которое имеет наивысший Confidence Parameter (т.е. наиболее вероятно является корректным).
Claim 5 (Зависимый): Детализирует механизм изменения параметра уверенности.
Изменение Confidence Parameter включает применение Delta Value (значения изменения) к Scaled Confidence Rating (шкалированной оценке уверенности).
Claim 6 и 7 (Зависимые): Детализируют расчет Delta Value.
Генерация Delta Value включает категоризацию (categorizing) пользовательского исправления и взвешивание (weighting) категории этого исправления. Это означает, что разные типы исправлений по-разному влияют на итоговую уверенность.
Claim 8 (Независимый пункт): Описывает метод с точки зрения обработки одного исправления и его влияния на ранжирование.
- Получение описания пользовательского исправления значения.
- Изменение Confidence Parameter этого значения.
- Ранжирование коллекции значений-кандидатов (включая это значение) на основе соответствующих Confidence Parameters.
Claim 13, 14, 15 (Зависимые): Детализируют процесс взвешивания.
Влияние исправления взвешивается в зависимости от его категории. Исправления, сделанные после подтверждения источником (confirmation from a source), взвешиваются сильнее, чем исправления без подтверждения. Более свежие исправления могут взвешиваться сильнее, чем старые (Claim 15).
Где и как применяется
Изобретение применяется на этапах, связанных с выбором и ранжированием фактических данных для ответа на запрос пользователя.
INDEXING – Индексирование и извлечение признаков
На этом этапе система извлекает факты из контента и присваивает им исходные Confidence Parameters (Initial Confidences), основанные на анализе источников, контекста и т.д.
RANKING / RERANKING / METASEARCH
Основное применение патента происходит на финальных стадиях ранжирования или при формировании структурированных ответов (Metasearch).
- Получение кандидатов: Система получает набор значений-кандидатов с их исходными оценками уверенности.
- Корректировка оценок: Система обращается к User Correction History. Для каждого кандидата вычисляется Delta Value на основе агрегированной и взвешенной истории исправлений.
- Переранжирование: Исходные оценки корректируются с помощью Delta Value. Набор кандидатов переранжируется.
- Выбор и Отображение: Значение с наивысшей итоговой оценкой выбирается для отображения, часто в Structured Presentation.
Входные данные:
- Поисковый запрос (часто подразумевающий пару Сущность:Атрибут).
- Исходный Value Result Set с начальными Confidence Parameters.
- User Correction History (Лог исправлений).
Выходные данные:
- Скорректированный и переранжированный Value Result Set.
- Выбранное значение для отображения пользователю.
На что влияет
- Типы контента и форматы: В первую очередь влияет на фактические данные и их отображение в структурированных форматах: Панели Знаний (Knowledge Panels), таблицы сравнения, блоки ответов (Featured Snippets), отображающие конкретные факты (например, характеристики товара, даты, локации). Не влияет напрямую на ранжирование традиционных «синих ссылок».
- Специфические запросы: Информационные запросы, направленные на получение конкретного факта (например, «высота Эйфелевой башни», «расход топлива Honda Civic»).
- Ниши и тематики: Любые тематики, где важна фактическая точность, включая продукты (E-commerce), биографии, географию, и YMYL-темы, где точность данных критична.
Когда применяется
- Условия работы: Алгоритм применяется, когда поисковый запрос направлен на получение значения для атрибута сущности.
- Триггеры активации: Активируется при наличии в User Correction History записей, релевантных значениям-кандидатам, которые рассматриваются в текущем запросе. Если истории нет, используются исходные оценки уверенности.
Пошаговый алгоритм
Алгоритм состоит из двух параллельных процессов: логирование исправлений и их использование при поиске.
Процесс А: Логирование пользовательских исправлений (Офлайн или Реал-тайм)
- Получение исправления: Система получает описание пользовательского исправления (Сущность, Атрибут, Старое значение, Новое значение).
- Классификация исправления: Система анализирует действия пользователя во время сессии и классифицирует исправление (например, по 7 классам, описанным в патенте). Ключевой момент — была ли проверка источника (confirmation with a source).
- Логирование: Запись сохраняется в User Correction History с указанием всех деталей и класса исправления.
- Агрегация (Периодически): Данные из лога могут агрегироваться для быстрого доступа, формируя сводную информацию о том, какие исправления (и каких классов) применялись к конкретным значениям.
Процесс Б: Использование исправлений при поиске (Реал-тайм)
- Получение исходных данных: Система получает запрос, генерирует Value Result Set (кандидатов) и их начальные оценки уверенности (Initial Confidences).
- Доступ к истории исправлений: Система обращается к User Correction Log или агрегированным данным.
- Проверка наличия исправлений: Определяется, есть ли в истории исправления, затрагивающие кандидатов из Value Result Set.
- Взвешивание категорий: Если исправления есть, система применяет предопределенные веса к различным классам исправлений. (Например, Класс 2 весит больше, чем Класс 1).
- Агрегация весов: Для каждого значения-кандидата суммируются веса всех связанных с ним исправлений.
- Расчет влияния (Impact Assignment): Агрегированный вес преобразуется в итоговое влияние на оценку уверенности. Это может быть нелинейное преобразование (например, с использованием сигмоидной функции, описанной как Equation 1), чтобы сгладить влияние экстремальных значений.
- Изменение уверенности: Рассчитанное влияние (Delta Value) применяется к начальной оценке уверенности для получения скорректированной оценки.
- Ранжирование: Значения в Value Result Set ранжируются в соответствии со скорректированными оценками уверенности.
- Отображение: Результаты предоставляются пользователю, часто в Structured Presentation.
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании поведенческих данных и данных обратной связи от пользователей.
- Поведенческие факторы (User Behavior/Feedback): Это основной тип данных. Система отслеживает:
- Сам факт внесения исправления (замена, удаление, редактирование).
- Действия пользователя по верификации: переходил ли пользователь по ссылкам на источники для подтверждения данных перед исправлением (confirmation with a source).
- Подтверждение без изменения: фиксируется, если пользователь проверил источник, но решил не менять исходное значение.
- Системные данные:
- Initial Confidence Scores: Исходные оценки уверенности, рассчитанные поисковой системой до применения пользовательских исправлений.
- Временные факторы: В патенте упоминается возможность взвешивания более свежих исправлений сильнее, чем старых (Claim 15).
Какие метрики используются и как они считаются
- Correction Class (Класс исправления): Категоризация действия пользователя. В патенте приводится пример 7 классов (Table 1), основанных на типе действия (выбор из списка, ручной ввод, удаление) и факте верификации источника.
- Weighting Parameters (Параметры взвешивания): Числовые значения, присваиваемые каждому классу исправлений. Определяют силу и направление влияния исправления на уверенность.
- Aggregated Weights (Агрегированные веса): Сумма весов всех исправлений, связанных с конкретным значением.
- Delta Value (Значение изменения): Величина, на которую изменяется исходная оценка уверенности. Рассчитывается на основе Aggregated Weights.
- Impact Assignment (Назначение влияния): Процесс преобразования агрегированного веса в Delta Value. Может использоваться нелинейная функция для нормализации влияния. Упоминается сигмоидная функция: F(s) = 1 / (1 + e^(-s/k)), где s — агрегированный вес.
- Confidence Parameter / Scaled Confidence Rating: Итоговая оценка уверенности после применения Delta Value. Используется для финального ранжирования значений-кандидатов.
Выводы
- Фактическая точность через краудсорсинг: Патент описывает механизм использования коллективного разума для валидации и корректировки фактических данных (Knowledge Graph). Это позволяет Google улучшать точность данных за пределами возможностей автоматических алгоритмов.
- Взвешенное доверие к обратной связи: Система не принимает все исправления слепо. Ключевым элементом является классификация исправлений (Correction Classes). Исправления, сделанные после проверки источника, имеют значительно больший вес, чем спонтанные правки.
- Учет подтверждения (Confirmation): Система явно учитывает ситуации, когда пользователь проверил данные, но решил их не менять (Class 5). Это служит сильным сигналом подтверждения исходного значения и увеличивает его Confidence Parameter.
- Нелинейное влияние агрегированных данных: Использование сигмоидной функции для расчета влияния агрегированных весов предполагает, что система стремится к стабильности и защищена от резких изменений оценок из-за небольшого количества правок или скоординированных атак.
- Фокус на структурированных данных: Весь механизм ориентирован на работу с тройками Сущность-Атрибут-Значение и их отображение в Structured Presentations. Это подчеркивает стратегическую важность управления сущностями и структурированными данными в SEO.
Практика
Best practices (это мы делаем)
- Обеспечение точности и консистентности фактов (Source of Truth): Убедитесь, что фактическая информация на вашем сайте (характеристики продуктов, данные о компании, биографии) абсолютно точна и консистентна. Ваш сайт должен быть авторитетным источником, который пользователи будут использовать для верификации данных.
- Использование структурированных данных (Schema.org): Размечайте фактические данные с помощью микроразметки. Это помогает Google корректно извлекать значения и присваивать им высокие исходные Initial Confidence Scores.
- Мониторинг и корректировка Панелей Знаний: Активно отслеживайте информацию, которую Google показывает о ваших сущностях (бренд, продукты, ключевые сотрудники) в Панелях Знаний.
- Качественные исправления (Suggest an Edit): Если вы обнаружили ошибку в данных Google, используйте функцию «Предложить исправление». В контексте патента, при внесении исправления важно предоставить (или хотя бы самостоятельно проверить) авторитетный источник. Это соответствует высоко взвешенным классам исправлений (Class 2/4) и увеличивает вероятность принятия правки системой.
- Построение авторитетности в сущностях (Entity Authority): Работайте над тем, чтобы ваша сущность и связанные с ней факты часто упоминались на авторитетных ресурсах. Это увеличивает вероятность того, что пользователи будут подтверждать корректные данные, связанные с вашей сущностью (Class 5).
Worst practices (это делать не надо)
- Публикация неточных или противоречивых данных: Размещение разной фактической информации на разных страницах сайта или в разных источниках снижает исходную уверенность Google и провоцирует пользователей на внесение исправлений, что может привести к нежелательным изменениям Confidence Parameter.
- Игнорирование ошибок в выдаче: Если Google показывает неверные факты о вашем бренде или продукте, игнорирование этого приведет к тому, что пользователи могут закрепить эту ошибку через свои взаимодействия или исправления.
- Попытки манипуляции через спам исправлениями: Попытки скоординированно вносить ложные исправления (например, для нанесения ущерба конкурентам) могут быть неэффективны. Система взвешивает качество исправлений, и правки без верификации источника (Class 1/3) имеют меньший вес. Агрегация весов через сигмоидную функцию также защищает от резких скачков.
Стратегическое значение
Патент подтверждает, что Google активно использует поведенческие сигналы и прямую обратную связь для управления качеством фактических данных (Knowledge Graph). Для SEO это означает, что управление сущностями (Entity Management) является критически важной дисциплиной. Недостаточно просто оптимизировать страницы под ключевые слова; необходимо обеспечить, чтобы Google ассоциировал с вашими сущностями точные, консистентные и высокодоверенные факты. Стратегия должна быть направлена на становление «источником истины» для связанных с бизнесом сущностей.
Практические примеры
Сценарий: Корректировка характеристик продукта в выдаче
- Ситуация: Google отображает устаревшую характеристику (например, расход топлива) для модели автомобиля вашего клиента в блоке сравнения (Structured Presentation). Исходное значение (Uncorrected Value) – 26 MPG.
- Действие пользователя (Идеальное): Пользователь видит ошибку, переходит на официальный сайт производителя (источник), убеждается, что актуальное значение – 35 MPG, возвращается и предлагает исправление на 35 MPG.
- Действие системы: Google классифицирует это исправление как высокодоверенное (например, Class 4 – ручной ввод после подтверждения источником). Этому исправлению присваивается высокий вес.
- Результат: Confidence Parameter для значения «26 MPG» снижается, а для «35 MPG» (Corrected Value) значительно увеличивается. При последующих запросах система с большей вероятностью будет ранжировать «35 MPG» выше.
Сценарий: Подтверждение корректных данных
- Ситуация: Google отображает корректную цену на продукт вашего интернет-магазина.
- Действие пользователя: Пользователь хочет убедиться в цене, переходит на сайт магазина, видит ту же цену, возвращается в выдачу и продолжает взаимодействие, не внося изменений.
- Действие системы: Google может классифицировать это как Class 5 (пользователь не изменил значение после подтверждения источником).
- Результат: Это действие увеличивает вес и Confidence Parameter исходного значения (цены), укрепляя его позицию в ранжировании фактов.
Вопросы и ответы
Относится ли этот патент к ранжированию обычных веб-страниц (синих ссылок)?
Нет, напрямую не относится. Патент сфокусирован на ранжировании Values (фактов), которые являются кандидатами для характеристики Attributes (свойств) Instances (сущностей). Это касается точности данных, отображаемых в структурированных представлениях, таких как Панели Знаний, таблицы сравнения или фактические блоки ответов, а не общего ранжирования документов в веб-поиске.
Как этот патент связан с Knowledge Graph (Сетью Знаний)?
Связь прямая. Knowledge Graph — это база данных, хранящая факты в формате Сущность-Атрибут-Значение. Этот патент описывает механизм для определения того, какие значения являются наиболее точными, используя историю пользовательских исправлений для расчета Confidence Parameter. Это механизм самокоррекции и валидации данных в Knowledge Graph.
Что такое «Структурированное представление» (Structured Presentation) в контексте патента?
Это любой организованный способ отображения данных, такой как таблицы, электронные таблицы (spreadsheets) или «колода карточек» (deck of cards). В реальной выдаче Google это может соответствовать Панелям Знаний, блокам сравнения товаров, локальной выдаче или другим элементам SERP, где данные представлены в формате ключ-значение.
Все ли пользовательские исправления учитываются одинаково?
Категорически нет. Это ключевой момент патента. Система классифицирует исправления (Correction Classes) и взвешивает их по-разному. Исправления, сделанные после того, как пользователь проверил информацию по авторитетному источнику (confirmation from a source), имеют значительно больший вес, чем спонтанные правки.
Что такое «Класс 5» исправления и почему он важен?
Класс 5 описывает ситуацию, когда пользователь проверил источник, но решил НЕ менять исходное значение. Это интерпретируется системой как подтверждение корректности исходных данных. Такие действия увеличивают Confidence Parameter текущего значения и помогают системе защититься от ненужных или ошибочных правок.
Могут ли конкуренты использовать этот механизм для нанесения ущерба, внося ложные исправления?
Теоретически могут попытаться, но система имеет защитные механизмы. Спонтанные правки без верификации имеют низкий вес. Кроме того, использование сигмоидной функции для расчета влияния агрегированных весов сглаживает эффект от скоординированных атак и требует значительного объема качественных исправлений для существенного изменения Confidence Parameter.
Как SEO-специалист может повлиять на этот механизм?
Основной способ влияния — обеспечение абсолютной точности и консистентности фактических данных на собственном сайте и других авторитетных площадках. Также важно активно использовать функцию «Предложить исправление» при обнаружении ошибок в Knowledge Graph, стараясь действовать как пользователь, который проверил источник (Class 2/4).
Что такое Confidence Parameter и Delta Value?
Confidence Parameter (или Scaled Confidence Rating) — это итоговая оценка уверенности Google в том, что факт верен. Delta Value — это изменение этой оценки, рассчитанное на основе истории пользовательских исправлений. Система берет исходную оценку уверенности и применяет к ней Delta Value, чтобы получить итоговую оценку.
Учитывает ли система авторитетность пользователя, внесшего исправление?
В патенте прямо не описано использование авторитетности пользователя (например, истории его прошлых корректных правок), но упоминается, что это возможно [0118]. Основной акцент сделан на качестве самого исправления — его классе и факте верификации источника во время сессии.
Влияет ли свежесть исправлений на их вес?
Да, в патенте (Claim 15) явно указано, что система может быть настроена так, чтобы более свежие пользовательские исправления (more recent user corrections) взвешивались сильнее, чем более старые. Это позволяет системе адаптироваться к изменениям фактов во времени.