Анализ патента Google, описывающего метод определения характеристик онлайн-сущностей (сайтов, авторов, организаций) путем анализа характеристик связанных с ними сущностей. Система сравнивает профиль связей сущности с эталонными профилями, чтобы вывести недостающую информацию (например, тематику или авторитетность) или проверить достоверность заявленных данных (например, экспертизу).
Описание
Какую задачу решает
Патент решает проблему неопределенности и недостоверности информации об онлайн-сущностях (online entities), таких как веб-сайты, авторы или пользователи. Он предлагает механизмы для двух ключевых задач:
- Валидация (Validation): Проверка правдивости (truthfulness) информации, которую сущность заявляет о себе (self-declared characteristics), например, заявленная экспертиза автора или тематика сайта.
- Вывод (Inference): Определение неизвестных или отсутствующих характеристик (aspect values) сущности.
Это позволяет системе лучше понимать природу сущностей и оценивать их надежность.
Что запатентовано
Запатентован метод определения или проверки характеристики (aspect value) сущности путем анализа характеристик связанных с ней сущностей. Система строит профиль (profile или distribution), отражающий характеристики связей сущности, и сравнивает его с эталонными профилями (reference profiles) сущностей с известными характеристиками. На основе этого сравнения делается вывод о характеристиках целевой сущности или оценивается достоверность ее заявлений.
Как это работает
Механизм основан на принципе «авторитетности через ассоциацию» (Скажи мне, кто твой друг, и я скажу, кто ты).
- Идентификация связей: Система определяет набор сущностей, связанных с целевой сущностью. Связи могут быть явными (гиперссылки, друзья) или неявными (со-цитирование, общие интересы).
- Построение профиля связей: Анализируются характеристики (например, тематика, авторитетность) этих связанных сущностей и строится распределение этих характеристик (profile).
- Сравнение с эталонами: Этот профиль сравнивается с reference profiles (типичные профили связей для сущностей с известными характеристиками).
- Результат:
- Валидация: Если профиль соответствует эталону для заявленной характеристики, она считается достоверной. Если нет – ставится под сомнение.
- Вывод: Если характеристика неизвестна, ей присваивается значение того эталона, который наиболее близок к профилю сущности.
Актуальность для SEO
Критически высокая. Понимание сущностей (Entity Understanding) и оценка их достоверности и экспертизы (E-E-A-T) являются ядром современного поиска. Описанные методы анализа графа связей для вывода и валидации характеристик сущностей напрямую связаны с тем, как Google алгоритмически оценивает авторитетность, экспертность и надежность контента и его авторов в 2025 году.
Важность для SEO
Патент имеет фундаментальное значение для SEO (9/10). Он описывает механизм, с помощью которого Google может алгоритмически оценивать E-E-A-T. Патент показывает, что авторитетность и тематика сайта определяются не только его контентом, но и в значительной степени характеристиками сайтов и авторов, которые с ним связаны (ссылаются, цитируют). Это подчеркивает критическую важность качества и релевантности сетевого окружения.
Детальный разбор
Термины и определения
- Aspect / Attribute (Аспект / Атрибут)
- Характеристика сущности. Например, ‘тематика’, ‘экспертиза’, ‘возраст’, ‘местоположение’.
- Aspect Value (Значение аспекта)
- Конкретное значение атрибута. Например, ‘Медицина’ для атрибута ‘Тематика’.
- Entity (Сущность)
- Любой объект в онлайн-среде: веб-сайт, автор контента, организация, пользователь.
- Connection (Связь)
- Отношение между двумя сущностями. Патент выделяет два типа:
- Local Link (Локальная связь): Явная связь (например, гиперссылка, добавление в друзья).
- Global Connection (Глобальная связь): Неявная связь (например, общий интерес, общий автор, пересечение аудиторий (overlapping visitors), совместное цитирование (cited by another resource)).
- Distribution / Profile (Распределение / Профиль)
- Статистическое описание значений атрибутов набора связанных сущностей. Например, профиль связей Сайта А может показывать, что 70% ссылающихся сайтов имеют Тематику X, а 30% – Тематику Y.
- Reference Distribution / Reference Profile (Эталонный профиль)
- Заранее определенный профиль, характерный для сущностей с известным и подтвержденным значением атрибута. Например, типичный ссылочный профиль авторитетного медицинского сайта.
- Truthfulness (Достоверность)
- Мера соответствия заявленной сущностью характеристики ее реальной характеристике, выведенной алгоритмически.
- Probability Value (Значение вероятности)
- Оценка уверенности системы в достоверности заявленного значения или в корректности выведенного значения.
Ключевые утверждения (Анализ Claims)
Патент содержит два основных независимых пункта, описывающих два разных процесса: Валидацию (Claim 1) и Вывод (Claim 10).
Claim 1 (Независимый пункт): Валидация заявленной характеристики.
Метод проверки, является ли заявленное значение атрибута достоверным (truthful).
- Система получает первое значение (first value) для первого атрибута (first attribute) аккаунта пользователя. (Например, автор заявляет, что он эксперт).
- Идентифицируется первый набор связанных аккаунтов (first set of accounts). (Например, кто его цитирует).
- Определяется профиль (profile), отражающий распределение значений второго атрибута (second attribute) для этого набора. (Например, распределение уровня экспертизы цитирующих). Примечание: Первый и второй атрибуты могут быть одинаковыми или разными (Claims 6 и 8).
- Идентифицируется эталонный набор аккаунтов (second set of accounts), которые достоверно обладают первым значением (группа подтвержденных экспертов).
- Определяется эталонный профиль (reference profile) для этого набора (как выглядит типичный профиль цитирования эксперта).
- Профиль пользователя сравнивается с эталонным профилем.
- На основе сравнения определяется, является ли заявленное значение достоверным.
Claim 10 (Независимый пункт): Вывод отсутствующей характеристики.
Метод определения значения атрибута, если оно неизвестно.
- Система определяет, что у аккаунта отсутствует значение для первого атрибута. (Например, тематика сайта неизвестна).
- Идентифицируется первый набор связанных аккаунтов. (Например, ссылающиеся сайты).
- Определяется профиль, отражающий распределение значений второго атрибута для этого набора. (Например, распределение тематик ссылающихся сайтов).
- Идентифицируется множество эталонных наборов (plurality of second sets), каждый из которых соответствует определенному значению первого атрибута (например, эталоны для Спорта, Новостей, Медицины).
- Для каждого набора определяется эталонный профиль (reference profile).
- Профиль пользователя сравнивается с этими эталонными профилями.
- Значение первого атрибута определяется на основе наилучшего совпадения.
Где и как применяется
Изобретение затрагивает этапы, связанные с пониманием и оценкой сущностей.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения. Система собирает данные о сущностях и их связях (веб-граф, граф знаний).
- Анализ связей: Идентифицируются Local Links и Global Connections.
- Предварительные вычисления: Система рассчитывает Reference Profiles на основе доверенных данных (ground truth). Также рассчитываются и сохраняются профили связей (Profiles) для отдельных сущностей.
- Обогащение данных: Применяются алгоритмы Валидации и Вывода для определения атрибутов сущностей и оценки их достоверности. Эти данные сохраняются в индексе сущностей (например, Knowledge Graph).
RANKING / RERANKING – Ранжирование и Переранжирование
Выведенные или проверенные характеристики используются как сигналы ранжирования.
- Оценка E-E-A-T: Если алгоритм используется для валидации заявленной экспертности или вывода авторитетности, результаты напрямую влияют на ранжирование. Сущностям с низкой достоверностью (truthfulness) может быть понижен рейтинг.
Входные данные:
- Целевая сущность и ее заявленные атрибуты (если есть).
- Данные о связях (Граф).
- Значения атрибутов связанных сущностей.
- Эталонные профили (Reference Profiles).
Выходные данные:
- Выведенное значение атрибута.
- Оценка достоверности (Truthfulness) или Probability Value для заявленного атрибута.
На что влияет
- E-E-A-T и YMYL-тематики: Критически важен для оценки экспертизы и авторитетности авторов и сайтов в YMYL-нишах. Система проверяет, соответствует ли сетевое окружение сущности заявленному уровню экспертности.
- Определение тематики (Topical Authority): Позволяет определить тематическую направленность и авторитетность ресурса на основе анализа тематик связанных с ним ресурсов.
- Обнаружение спама: Может использоваться для выявления манипуляций (например, PBN или фейковых профилей экспертов) путем обнаружения аномальных структур связей, не соответствующих эталонам.
Когда применяется
- Триггеры Валидации: Когда сущность предоставляет self-declared информацию, особенно критичную для оценки качества (например, экспертиза автора в YMYL).
- Триггеры Вывода: Когда ключевая информация о сущности отсутствует, но необходима для ранжирования или классификации (например, определение тематики нового сайта).
- Пороги: Валидация может завершиться неудачей, если Probability Value ниже определенного порога (probability criterion).
Пошаговый алгоритм
Процесс А: Валидация заявленной характеристики (Claim 1)
- Инициализация: Получение заявленного значения (V1) для атрибута (A1) сущности (E1).
- Сбор данных о связях: Идентификация набора связанных сущностей (S1).
- Построение профиля связей (P1): Расчет распределения значений атрибута A2 (может быть равен A1) среди сущностей в S1.
- Выбор эталона: Идентификация эталонного профиля (P_Ref), соответствующего значению V1 (построенного на основе доверенных данных).
- Сравнение: Сравнение P1 с P_Ref. Вычисление степени сходства.
- Определение достоверности: Расчет Probability Value на основе сходства. Если сходство ниже порога, V1 считается недостоверным.
- Действие (Опционально): Принятие мер в отношении E1 при низкой достоверности (например, игнорирование заявленного атрибута при ранжировании).
Процесс Б: Вывод отсутствующей характеристики (Claim 10)
- Инициализация: Определение, что у сущности (E1) отсутствует значение для атрибута (A1).
- Сбор данных о связях и Построение профиля (P1): Аналогично Процессу А.
- Идентификация эталонов: Загрузка множества эталонных профилей (P_Ref1, P_Ref2…), соответствующих возможным значениям A1 (V1, V2…).
- Сравнение: Сравнение P1 с каждым из эталонных профилей (P_RefN).
- Выбор наилучшего соответствия: Идентификация эталонного профиля с наибольшим сходством с P1.
- Присвоение значения: Присвоение сущности E1 значения атрибута (VN), соответствующего наилучшему эталонному профилю.
Какие данные и как использует
Данные на входе
Алгоритм использует данные о структуре графа и атрибутах узлов этого графа.
- Структурные / Ссылочные факторы (Connections): Данные о связях между сущностями.
- Явные (Local Links): Гиперссылки (hyperlink), связи в социальных сетях.
- Неявные (Global Connections): Совместное цитирование (cited by another resource), общий автор (common author), пересечение аудиторий (overlapping visitors), критерии схожести (similarity criterion).
- Атрибутивные данные (Aspect Values): Известные или заявленные характеристики сущностей (тематика сайта, экспертиза автора, интересы). Используются как для построения профиля связей, так и для создания эталонов.
Какие метрики используются и как они считаются
- Profile (Профиль): Метрика, описывающая распределение значений атрибутов в наборе связанных сущностей. Может быть выражена в виде частот, процентов или статистических моделей.
- Reference Profile (Эталонный профиль): Усредненный или типичный профиль для доверенной группы сущностей.
- Метрики сходства: Используются для сравнения профиля сущности с эталонными профилями. Патент не детализирует методы, но они необходимы для определения совпадения (matching).
- Probability Value: Количественная оценка достоверности или уверенности, основанная на степени сходства профилей.
- Probability Criterion: Пороговое значение для Probability Value.
Выводы
- E-E-A-T оценивается через сетевое окружение: Патент предоставляет алгоритмическую основу для оценки E-E-A-T через анализ графа связей. То, кто ссылается на сайт или связан с автором, используется для определения его характеристик (тематики, авторитетности) и для проверки достоверности его заявлений.
- Валидация заявленной экспертности (Claim 1): Если сайт или автор позиционирует себя как эксперта, система проверяет это. Она сравнивает профиль его связей с эталонным профилем известного эксперта. Несоответствие ставит под сомнение заявленную экспертность (Truthfulness).
- Вывод тематической авторитетности (Claim 10): Если характеристики сайта неясны, система может вывести их, анализируя характеристики связанных ресурсов. Сайт становится авторитетным в той теме, профиль которой наиболее соответствует его окружению.
- Качество и релевантность связей критичны: Важны не количество связей, а характеристики (Aspect Values) связанных сущностей. Связи с нерелевантными или низкокачественными ресурсами формируют профиль, который не будет соответствовать эталонам высококачественных сайтов.
- Учет неявных связей (Global Connections): Система анализирует связи за пределами прямых гиперссылок. Совместное цитирование, общий автор или пересечение аудитории также формируют связи, используемые для анализа профиля.
Практика
Best practices (это мы делаем)
- Построение высококачественного и релевантного ссылочного профиля: Активно работайте над получением ссылок и упоминаний от сайтов, которые уже являются авторитетными в вашей нише. Это помогает сформировать Profile, соответствующий эталонам качества, что критично для валидации вашего E-E-A-T (Claim 1).
- Развитие связей авторов (Author E-E-A-T): Убедитесь, что авторы контента имеют видимые связи (публикации на авторитетных площадках, цитирования, совместные работы) с другими признанными экспертами. Система использует эти связи для валидации или вывода уровня экспертности автора.
- Четкое тематическое позиционирование через связи: Обеспечьте, чтобы ссылочное окружение сайта соответствовало его контенту. Это облегчает системе вывод правильной тематики (Claim 10) и подтверждение тематической авторитетности.
- Стратегическое использование исходящих ссылок: Ссылайтесь на авторитетные, релевантные источники. Анализ исходящих связей также формирует ваш профиль и может использоваться для определения характеристик вашего сайта.
Worst practices (это делать не надо)
- Массовая закупка нерелевантных или низкокачественных ссылок: Это формирует «шумный» или низкокачественный профиль связей. Это может привести к неправильному определению тематики (Claim 10) или к провалу валидации E-E-A-T (Claim 1), так как профиль не будет соответствовать эталонам качества.
- Заявление недостоверной информации (Фальсификация E-E-A-T): Создание поддельных авторов или заявление о несуществующей экспертности рискованно. Система алгоритмически проверяет достоверность (truthfulness) этих заявлений через анализ связей. Если профиль связей не соответствует заявленному уровню, это приведет к потере доверия.
- Изоляция от сообщества: Отсутствие естественных связей (ссылок, упоминаний) с авторитетными ресурсами в нише затрудняет системе построение надежного профиля и вывод положительных характеристик.
- Ассоциация со спамом: Связи (входящие или исходящие) с ресурсами, классифицированными как спам, могут привести к тому, что ваш ресурс также будет классифицирован аналогично по ассоциации.
Стратегическое значение
Этот патент подтверждает стратегию SEO, ориентированную на сущности (Entity-Oriented SEO) и E-E-A-T. Он демонстрирует, что Google стремится понять и проверить характеристики сущностей, используя структуру сети как источник истины. Долгосрочная стратегия должна фокусироваться на построении реальной авторитетности и интеграции сайта и его авторов в профессиональную экосистему (граф знаний). Качество ссылочного профиля является инструментом верификации сущности.
Практические примеры
Сценарий 1: Валидация E-E-A-T медицинского сайта (Применение Claim 1)
- Ситуация: Сайт (E1) позиционирует себя как экспертный ресурс по кардиологии (Заявленное значение V1 = «Эксперт по кардиологии»).
- Анализ связей: Google анализирует ссылающиеся сайты (S1). Большинство ссылок идет с блогов о стиле жизни и низкокачественных каталогов.
- Построение профиля (P1): Профиль P1 характеризуется низкой авторитетностью и отсутствием медицинской тематики.
- Эталонный профиль (P_Ref): Google использует эталонный профиль известного кардиологического центра (например, Mayo Clinic). Его P_Ref включает ссылки с медицинских университетов, научных журналов (PubMed) и государственных организаций (NIH).
- Сравнение: P1 радикально отличается от P_Ref.
- Результат: Система определяет заявленную экспертность (V1) как недостоверную (not truthful). Сайт будет испытывать трудности с ранжированием по YMYL-запросам.
Сценарий 2: Определение тематики многопрофильного блога (Применение Claim 10)
- Ситуация: Блог (E1) пишет о технологиях, маркетинге и кулинарии. Основная тематика неясна (Атрибут «Тематика» отсутствует).
- Анализ связей: Google анализирует ссылающиеся сайты (S1). 80% качественных входящих ссылок идет от известных технологических изданий и блогов разработчиков.
- Построение профиля (P1): Профиль P1 имеет сильный уклон в сторону технологий.
- Сравнение с эталонами: Google сравнивает P1 с эталонными профилями для «Маркетинг», «Кулинария» и «Технологии».
- Результат: P1 наиболее близок к эталону «Технологии». Система присваивает блогу E1 основную тематику «Технологии» и повышает его авторитетность именно в этой области.
Вопросы и ответы
Как этот патент связан с E-E-A-T?
Патент описывает механизм, который может использоваться для алгоритмической оценки E-E-A-T. Система может проверить заявленную экспертность (Claim 1), анализируя, соответствует ли профиль связей сайта или автора эталонному профилю признанного эксперта. Также она может вывести уровень авторитетности (Claim 10) на основе авторитетности связанных сущностей. Это делает E-E-A-T измеряемой величиной, основанной на анализе графа.
Что такое «Эталонный профиль» (Reference Profile) в контексте SEO?
Это модель типичного ссылочного окружения для сайта определенной тематики и уровня авторитетности. Например, эталонный профиль авторитетного медицинского сайта включает ссылки с университетов, научных журналов и правительственных ресурсов. Система сравнивает ссылочный профиль вашего сайта с этими эталонами, чтобы определить его тематику, авторитетность или достоверность.
Означает ли это, что количество ссылок больше не важно?
Это означает, что качество и характеристики ссылающихся сайтов имеют приоритетное значение. Большое количество ссылок с нерелевантных или низкокачественных сайтов сформирует профиль, который не соответствует эталонам качества. Это может помешать системе подтвердить авторитетность сайта, что негативно скажется на ранжировании.
Учитывает ли система только входящие ссылки?
Патент описывает анализ «связей» (Connections), который не ограничивается входящими гиперссылками. Исходящие ссылки также формируют профиль сайта и могут использоваться для определения его характеристик. Кроме того, учитываются неявные связи (Global Connections), такие как совместное цитирование или общее авторство.
Как система определяет эталонные профили?
Система идентифицирует наборы сущностей, о которых достоверно известно, что они обладают определенной характеристикой (например, сайты из доверенных списков, верифицированные эксперты). Затем анализируется структура и характеристики их связей, чтобы вывести типичный профиль для этой группы. Этот процесс может быть итеративным и использовать машинное обучение.
Что такое неявные связи (Global Connections) и как они влияют на SEO?
Неявные связи возникают, когда две сущности связаны через общий контекст, а не напрямую. Патент упоминает общий автор, пересечение аудитории или совместное цитирование. В SEO это означает, что упоминание вашего бренда или сайта рядом с авторитетными источниками (даже без гиперссылки) может сформировать связь, которая будет учтена при анализе вашего профиля и оценке авторитетности.
Как использовать этот патент для улучшения SEO локального бизнеса?
Для локального бизнеса важно формировать профиль связей, соответствующий его типу и геолокации. Необходимо получать ссылки и упоминания от других локальных организаций, местных СМИ и городских порталов. Это поможет системе валидировать тип бизнеса и его местоположение, сравнивая его профиль с эталонами других локальных компаний в этом регионе.
Может ли этот механизм использоваться для выявления PBN или сеток сайтов?
Да. Сетки сайтов часто имеют аномальную структуру связей, которая отличается от естественных эталонных профилей авторитетных сайтов. Анализируя распределение характеристик внутри сетки и ее связи с внешним миром, система может идентифицировать такие структуры как манипулятивные.
Применяется ли этот механизм для оценки авторов контента?
Да, авторы являются сущностями (Entities). Система может оценивать экспертность автора, анализируя его связи: где он публикуется, кто его цитирует, с кем он работает в соавторстве. Если профиль связей автора не соответствует профилю признанного эксперта в заявленной области, его E-E-A-T будет считаться низким или недостоверным.
Что происходит, если система определяет заявленную характеристику как недостоверную?
Система рассчитывает низкий Probability Value для этой характеристики. Патент упоминает, что в этом случае могут быть предприняты действия (taking an action). В контексте поиска это может означать игнорирование заявленной характеристики (например, не учитывать заявленную экспертизу при оценке E-E-A-T) или понижение общего доверия к сущности.