Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google идентифицирует и ранжирует ближайших соавторов и коллег эксперта для построения профилей авторитетности

    ASSOCIATING ENTITIES BASED ON RESOURCE ASSOCIATIONS (Ассоциация сущностей на основе ассоциаций ресурсов)
    • US9336330B2
    • Google LLC
    • 2016-05-10
    • 2013-07-17
    2013 EEAT и качество Knowledge Graph Патенты Google

    Google использует систему для анализа общих ресурсов (например, научных публикаций) с целью определения и ранжирования связей между сущностями (например, экспертами). Система рассчитывает «оценку соавторства», учитывая количество общих работ, их свежесть, популярность и уникальность авторского состава. Это позволяет определить наиболее значимых коллег эксперта и обогатить его профиль авторитетности.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает две основные задачи в области поиска и управления сущностями. Во-первых, это точная и полная идентификация ресурсов (например, научных статей), принадлежащих конкретной сущности (например, автору), несмотря на неоднозначность имен. Во-вторых, это количественная оценка силы взаимосвязей между сущностями на основе общих ресурсов. Система позволяет определить, кто является наиболее значимым коллегой или соавтором эксперта.

    Что запатентовано

    Запатентована система и метод для автоматического построения и обогащения профилей сущностей (Profiles) и выявления связей между ними. Система кластеризует ресурсы в группы (Resource Groups), ассоциирует эти группы с сущностями и анализирует общие ресурсы между профилями. Ключевым элементом является расчет оценки взаимосвязи (Relationship Score, в частности Co-author Score) для ранжирования связанных сущностей по степени их значимости для основной сущности.

    Как это работает

    Система работает в несколько этапов:

    • Кластеризация: Ресурсы (например, статьи) анализируются по признакам (авторы, заголовки, аффилиации) и объединяются в Resource Groups, предположительно принадлежащие одному автору.
    • Создание/Обновление Профилей: Resource Groups сопоставляются с существующими профилями сущностей. При высоком уровне соответствия (Correspondence Score) ресурсы из группы добавляются в профиль.
    • Идентификация Связей: Анализируются ресурсы в профиле сущности для выявления других связанных сущностей (например, соавторов).
    • Оценка Связей: Рассчитывается Co-author Score для каждой связанной сущности. Оценка учитывает количество общих работ, их свежесть (Recency), популярность (Popularity) и уникальность авторского состава (Author Uniqueness).
    • Ранжирование и Ассоциация: Связанные сущности ранжируются по их оценкам и добавляются в профиль основной сущности (например, список топ-соавторов).

    Актуальность для SEO

    Высокая. Учитывая фокус Google на E-E-A-T и построение Knowledge Graph, механизмы для точного определения авторства, экспертности и взаимосвязей между авторитетными источниками критически важны. Поскольку одним из изобретателей является Anurag Acharya (один из основателей Google Scholar), вероятно, описанные методы лежат в основе работы Google Scholar и систем управления профилями экспертов.

    Важность для SEO

    Патент имеет высокое стратегическое значение для SEO, особенно в контексте E-E-A-T и продвижения экспертов. Он раскрывает конкретный механизм, с помощью которого Google количественно оценивает «авторитет по ассоциации». Понимание факторов, влияющих на Co-author Score, позволяет разрабатывать стратегии для усиления авторитетности через целенаправленное сотрудничество и соавторство с признанными экспертами в нише.

    Детальный разбор

    Термины и определения

    Author Uniqueness Measure (Мера уникальности авторства)
    Метрика, оценивающая эксклюзивность сотрудничества. Основана на общем количестве соавторов ресурса. Чем меньше авторов у общей работы, тем сильнее сигнал о связи между конкретными двумя авторами.
    Co-author Score (Оценка соавторства)
    Частный случай Relationship Score. Количественная мера, определяющая, насколько тесно связаны два автора как соавторы. Используется для ранжирования соавторов.
    Combination Function (Функция комбинирования)
    Функция или модель, используемая для объединения различных сигналов (количество, свежесть, популярность, уникальность) в единую оценку (например, Co-author Score).
    Correspondence Score (Оценка соответствия)
    Метрика, определяющая уровень соответствия между ресурсами в Resource Group и ресурсами в существующем Profile. Используется для автоматического обновления профилей (описано в Description патента).
    Entity (Сущность)
    Представление одного или нескольких людей (например, конкретный человек, автор, группа людей, организация).
    Entity Query (Запрос сущности)
    Запрос, который идентифицирует как минимум одну сущность (например, по имени автора).
    Popularity Measure (Мера популярности)
    Метрика, оценивающая влиятельность ресурса. Например, количество просмотров видео или количество цитирований (citation counts) для научной статьи.
    Profile (Профиль)
    Коллекция ресурсов, ассоциированная с конкретной сущностью (например, профиль автора в Google Scholar).
    Recency Measure (Мера свежести)
    Метрика, измеряющая, как недавно произошло событие, связанное с ресурсом (например, дата публикации статьи или дата последнего просмотра видео).
    Relationship Score (Оценка взаимосвязи)
    Общий термин для оценки меры взаимосвязи между двумя сущностями на основе общих ресурсов.
    Resource (Ресурс)
    Любой тип цифровой информации, доступной по сети (например, документ, научная статья, веб-страница, видео).
    Resource Group (Группа ресурсов)
    Кластер ресурсов, сгруппированных на основе схожести признаков и предположительно принадлежащих одной и той же сущности.

    Ключевые утверждения (Анализ Claims)

    Основная часть патента (Description) описывает общий механизм кластеризации ресурсов и обновления профилей, в то время как Формула изобретения (Claims 1-15) фокусируется исключительно на механизме идентификации и ранжирования соавторов.

    Claim 1 (Независимый пункт): Описывает метод идентификации и ранжирования соавторов для профиля автора.

    1. Система получает первый профиль (first profile) для первого автора, который содержит ссылки на документы этого автора.
    2. Идентифицируются вторые авторы (second authors), которые являются соавторами одного или нескольких из этих документов.
    3. Для каждого второго автора рассчитывается Co-author Score. Эта оценка является мерой того, насколько тесно связаны второй автор и первый автор как соавторы.
    4. Вторые авторы ранжируются на основе их Co-author Scores.
    5. Вторые авторы ассоциируются с первым профилем.
    6. При запросе доступа к профилю первого автора система предоставляет его для отображения. Профиль включает список ресурсов автора и список вторых авторов, упорядоченный в соответствии с их ранжированием (по Co-author Score).

    Claim 2 (Зависимый от 1): Детализирует расчет Co-author Score, определяя четыре ключевых компонента:

    1. Количество (Count): Определение количества совместно написанных документов (co-authored documents).
    2. Свежесть (Recency Measure): Определение меры свежести для каждого совместного документа (как недавно он был написан или опубликован).
    3. Популярность (Popularity Measure): Определение меры популярности для каждого совместного документа.
    4. Уникальность (Author Uniqueness Measure): Определение меры уникальности авторства для каждого совместного документа на основе общего числа соавторов этого документа.
    5. Итоговый Co-author Score рассчитывается на основе этих четырех компонентов.

    Claim 3 (Зависимый от 2): Уточняет, что расчет оценки происходит путем комбинирования четырех компонентов с использованием Combination Function.

    Claim 5 (Зависимый от 1): Указывает на дополнительный шаг: идентификация существующих профилей для вторых авторов и обновление списка соавторов, чтобы включить ссылки на эти профили.

    Где и как применяется

    Изобретение применяется на нескольких этапах поисковой архитектуры, преимущественно в процессах, связанных с обработкой сущностей и построением Knowledge Graph.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходят ключевые офлайн-процессы:

    1. Извлечение признаков: Из ресурсов (например, научных статей) извлекаются метаданные: имена авторов, аффилиации, заголовки, даты публикации, цитаты.
    2. Кластеризация (Resource Clustering): Алгоритмы кластеризации анализируют эти признаки и формируют Resource Groups. Это процесс разрешения неоднозначности авторства.
    3. Обновление профилей: Система рассчитывает Correspondence Score между новыми Resource Groups и существующими Profiles для автоматического обновления профилей авторов (как описано в Description патента).

    RANKING / RERANKING (Обработка сущностей)
    Этот этап больше относится не к ранжированию веб-страниц, а к ранжированию сущностей и их атрибутов. Он также может выполняться офлайн для обогащения данных в Knowledge Graph.

    1. Расчет взаимосвязей: Система анализирует профили и вычисляет Co-author Scores между связанными сущностями.
    2. Ранжирование связанных сущностей: Соавторы ранжируются для определения наиболее значимых коллег.

    QUNDERSTANDING – Понимание Запросов
    Система обрабатывает Entity Query (например, поиск по имени автора) для извлечения или отображения соответствующего профиля.

    Входные данные:

    • Корпус ресурсов (например, база данных научных статей).
    • Метаданные ресурсов (авторы, даты, цитаты).
    • Существующие профили сущностей (Profiles).

    Выходные данные:

    • Обновленные профили сущностей.
    • Ранжированный список связанных сущностей (соавторов) с их Co-author Scores.
    • Ассоциации между сущностями (связи в Knowledge Graph).

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на контент, где авторство и сотрудничество четко определены: научные статьи (Google Scholar), патенты, книги, а также потенциально новости и авторитетный контент в YMYL-тематиках.
    • Сущности и Knowledge Graph: Напрямую влияет на построение и обогащение профилей экспертов (Entity Profiles) и связей в Графе Знаний. Определяет, кто будет показан как ключевой коллега авторитетного лица.
    • E-E-A-T: Механизм предоставляет конкретные сигналы для оценки Авторитетности (Authority) и Доверия (Trustworthiness) путем анализа сети сотрудничества эксперта.

    Когда применяется

    • Триггеры активации: Алгоритм кластеризации и обновления профилей активируется при индексации новых ресурсов или периодически. Алгоритм расчета взаимосвязей активируется при обновлении профиля или при пересчете связей в Knowledge Graph.
    • Временные рамки: Большинство процессов (кластеризация, расчет Co-author Score) выполняются офлайн, что позволяет быстро предоставлять готовые данные при запросе профиля пользователя.

    Пошаговый алгоритм

    Процесс, описанный в Claims: Ранжирование соавторов (Entity Association).

    1. Получение профиля: Система выбирает профиль Первой Сущности (Автор А) для анализа. Профиль содержит список ресурсов, автором которых является Автор А.
    2. Идентификация связанных сущностей: Система анализирует ресурсы в профиле Автора А и идентифицирует все Вторые Сущности (Соавторы B, C, D…), которые также ассоциированы с этими ресурсами (являются соавторами).
    3. Сбор данных для оценки (Итерация по каждой связанной сущности): Для пары (Автор А, Соавтор B) система собирает данные по общим ресурсам:
      • Подсчитывает общее количество совместных работ (Count).
      • Для каждой совместной работы определяет Recency Measure (например, дату публикации).
      • Для каждой совместной работы определяет Popularity Measure (например, количество цитирований).
      • Для каждой совместной работы определяет Author Uniqueness Measure (например, общее число авторов этой работы).
    4. Расчет оценки взаимосвязи: Система применяет Combination Function к собранным данным для расчета итогового Co-author Score для Соавтора B. (Например, более свежие, популярные работы с меньшим числом соавторов дают больший вклад в оценку).
    5. Проверка пороговых значений (Опционально): Система может отфильтровать Соавторов, чьи Co-author Score не удовлетворяют определенному порогу (Claim 4).
    6. Ранжирование: Все Вторые Сущности (B, C, D…) ранжируются в порядке убывания их Co-author Score по отношению к Автору А.
    7. Ассоциация и обновление профиля: Ранжированный список Соавторов ассоциируется с профилем Автора А. Система также может проверить наличие профилей у Соавторов и добавить ссылки на них (Claim 5).
    8. Предоставление данных: При запросе профиля Автора А отображается список его работ и ранжированный список его ключевых соавторов.

    Какие данные и как использует

    Данные на входе

    Система использует метаданные, извлеченные из ресурсов, для кластеризации и расчета взаимосвязей.

    • Контентные и Структурные факторы:
      • Заголовки ресурсов (Titles).
      • Имена авторов (Proper names of the authors).
      • Аффилиации авторов (Affiliations).
      • Email-адреса авторов.
      • Места публикации (Places of publication).
    • Ссылочные факторы:
      • Ссылки на другие документы из ресурса (References).
      • Ссылки на ресурс из других документов (Citations). Используются как мера популярности.
    • Временные факторы:
      • Даты публикации или создания ресурса. Используются для оценки свежести.

    Какие метрики используются и как они считаются

    Ключевая метрика, описанная в Claims, — это Co-author Score. Она рассчитывается как функция следующих сигналов:

    1. Count of co-authored documents (Количество совместных работ): Прямой подсчет ресурсов, общих для двух сущностей.
    2. Recency Measure (Мера свежести): Измеряет, как недавно был создан/опубликован ресурс. В контексте авторитетности свежее сотрудничество обычно важнее.
    3. Popularity Measure (Мера популярности): Измеряет влиятельность общих ресурсов. Для научных статей это, как правило, количество цитирований (citation counts). Чем популярнее совместная работа, тем выше оценка.
    4. Author Uniqueness Measure (Мера уникальности авторства): Измеряет эксклюзивность связи. Рассчитывается на основе общего числа сущностей, ассоциированных с ресурсом. Если статью написали 100 человек, связь между любыми двумя из них слабее, чем если бы они написали ее вдвоем.

    Методы вычислений:

    • Combination Function: Патент не дает конкретной формулы, но указывает, что эти четыре сигнала комбинируются для получения итоговой оценки. Это может быть взвешенная сумма или более сложная модель машинного обучения.
    • Кластеризация: Для группировки ресурсов используются стандартные алгоритмы кластеризации, основанные на схожести признаков (features).
    • Correspondence Score: Используется для сопоставления кластеров и профилей. Патент предлагает пример функции в Description: CS=C1*X1 — C2*X2 — C3*X3, где X1 – число общих ресурсов, X2 – число ресурсов из группы, удаленных из профиля (негативный сигнал), X3 – число новых ресурсов в группе.

    Выводы

    1. Квантификация взаимосвязей сущностей: Google активно рассчитывает силу взаимосвязей между сущностями (экспертами). Это не бинарная связь (связан/не связан), а взвешенная оценка (Co-author Score), позволяющая ранжировать коллег по значимости.
    2. Авторитет по ассоциации (Authority by Association) — это измеримый механизм: Патент подтверждает, что сотрудничество с авторитетными сущностями является фактором, который система может измерить и использовать. Это ключевой компонент E-E-A-T.
    3. Многофакторная оценка сотрудничества: Для оценки связи важен не только факт соавторства. Система учитывает комплекс сигналов:
      • Объем (Count): Сколько работ написано вместе.
      • Влиятельность (Popularity): Насколько важны эти работы (цитируемость).
      • Актуальность (Recency): Как давно это было.
      • Эксклюзивность (Uniqueness): Сколько еще людей участвовало в работе.
    4. Важность эксклюзивности: Author Uniqueness Measure является важным фактором. Работа, написанная вдвоем с топовым экспертом, дает гораздо более сильный сигнал связи, чем участие в большом коллективе авторов.
    5. Динамические профили сущностей: Профили авторов (и, вероятно, данные в Knowledge Graph) формируются путем автоматической кластеризации ресурсов и постоянного обновления на основе анализа соответствия (Correspondence Score).

    Практика

    Best practices (это мы делаем)

    • Стратегическое соавторство: Для усиления E-E-A-T необходимо целенаправленно сотрудничать с признанными экспертами в вашей области. Публикация совместных работ (статей, исследований) напрямую влияет на то, как Google воспринимает ваши связи и авторитет.
    • Фокус на влиятельности и эксклюзивности: Приоритезируйте создание высококачественного, цитируемого контента (Popularity) в небольших авторских коллективах (Uniqueness). Одна значимая работа вдвоем с экспертом может быть ценнее десяти поверхностных статей в большом коллективе.
    • Поддержание актуальности сотрудничества: Сигнал свежести (Recency) играет роль. Необходимо поддерживать профессиональные связи и периодически публиковать новые совместные работы, чтобы поддерживать высокий Co-author Score.
    • Управление профилями экспертов: Активно управляйте профилями авторитетности (например, Google Scholar Profile, если применимо). Убедитесь, что все релевантные работы корректно атрибутированы, так как эти профили являются источником данных для анализа взаимосвязей.
    • Четкая атрибуция авторства: При публикации контента (на сайте, в блогах, во внешних источниках) убедитесь, что авторство и соавторство указаны четко и в формате, который поисковые системы могут легко распознать и извлечь (например, используя Schema.org).

    Worst practices (это делать не надо)

    • Поверхностное или фиктивное соавторство: Попытки манипулировать авторитетом путем включения известных экспертов в список авторов без их реального вклада будут иметь ограниченный эффект. Если работа не набирает популярности или имеет слишком много авторов, сигнал связи будет слабым.
    • Участие в «братских могилах» авторов: Участие в публикациях с десятками соавторов дает очень слабый сигнал связи из-за низкого показателя Author Uniqueness Measure.
    • Игнорирование цитируемости совместных работ: Создание совместного контента низкого качества, который никто не использует и не цитирует (низкая Popularity), не приведет к значительному увеличению авторитетности по ассоциации.

    Стратегическое значение

    Этот патент является фундаментальным для понимания того, как Google строит Граф Знаний об экспертах и оценивает E-E-A-T. Он подтверждает, что для Google важны реальные, доказуемые и влиятельные профессиональные связи. Долгосрочная SEO-стратегия в конкурентных и YMYL-нишах должна включать не только создание контента, но и построение реального авторитета и сети сотрудничества в индустрии. Авторитет передается через совместную деятельность, и этот патент описывает, как это измеряется.

    Практические примеры

    Сценарий: Повышение авторитетности молодого врача (YMYL)

    1. Цель: Усилить E-E-A-T сигналы для молодого врача (Доктор А), работающего в клинике.
    2. Анализ текущих связей: Доктор А часто работает с главным врачом клиники (Доктор B), признанным экспертом в кардиологии.
    3. Действие (Основанное на патенте): Доктор А и Доктор B публикуют совместное исследование о новом методе лечения в авторитетном медицинском журнале.
      • Count: +1 совместная работа.
      • Recency: Работа свежая.
      • Uniqueness: Только 2 автора (высокая уникальность).
      • Popularity: Исследование качественное и начинает цитироваться другими врачами.
    4. Ожидаемый результат: Система Google рассчитывает высокий Co-author Score между Доктором А и Доктором B. В профиле Доктора B (например, в Google Scholar или Knowledge Panel) Доктор А появляется как значимый соавтор. Авторитет Доктора B частично переносится на Доктора А через эту сильную связь, улучшая восприятие E-E-A-T Доктора А.

    Вопросы и ответы

    Как Google определяет популярность (Popularity Measure) совместной работы?

    Патент явно упоминает citation counts (количество цитирований) как меру популярности для документов (научных статей). Для других типов контента могут использоваться иные метрики: количество просмотров, шеров, ссылок или упоминаний в авторитетных источниках. Ключевым является то, насколько влиятельной является совместная работа в своей области.

    Что такое «Мера уникальности авторства» (Author Uniqueness Measure) и почему она важна?

    Эта метрика оценивает, сколько всего авторов у конкретной работы. Если работу написали двое, связь между ними считается очень сильной и эксклюзивной. Если работу написал коллектив из 50 человек, связь между любыми двумя авторами значительно слабее. Это позволяет Google отличать тесное сотрудничество от формального участия в больших проектах.

    Насколько важна свежесть (Recency) сотрудничества?

    Свежесть является одним из четырех ключевых компонентов Co-author Score. Хотя одна очень влиятельная старая работа может давать значительный вклад, система учитывает актуальность взаимосвязей. Регулярное и недавнее сотрудничество с экспертом будет поддерживать более высокую общую оценку связи, чем однократное взаимодействие много лет назад.

    Применяется ли этот патент только к научным статьям и Google Scholar?

    Хотя примеры в патенте и бэкграунд изобретателей (Anurag Acharya) явно указывают на Google Scholar как основную область применения, описанные принципы являются общими (Associating Entities Based on Resource Associations). Механизм оценки связей на основе общих ресурсов (количество, популярность, свежесть, уникальность) может применяться к любым сущностям и типам контента, где есть четкая атрибуция и сотрудничество.

    Как этот патент влияет на E-E-A-T?

    Он напрямую влияет на оценку Авторитетности (Authority) и Экспертизы (Expertise). Если система идентифицирует сильную связь (высокий Co-author Score) между вашим автором и признанным авторитетом в нише, это служит мощным сигналом подтверждения квалификации вашего автора. Это механизм передачи авторитета через ассоциацию.

    Что делать, если в нашей нише нет практики публикаций научных статей?

    Используйте другие формы доказуемого сотрудничества. Это могут быть совместные выступления на авторитетных конференциях, совместное ведение вебинаров, публикация совместных отчетов, исследований или даже гостевых постов на очень авторитетных ресурсах. Важно, чтобы факт сотрудничества был публичным, атрибуция была четкой, а результат был влиятельным (популярным).

    Как система определяет, какие ресурсы принадлежат автору (Процесс кластеризации)?

    Хотя это не является фокусом Claims, в описании патента указано, что система кластеризует ресурсы (создает Resource Groups) на основе анализа схожести признаков (features). Эти признаки включают заголовки статей, места публикации, имена авторов, а также аффилиации и email-адреса авторов. Это позволяет системе разрешать неоднозначность имен.

    Может ли система автоматически обновлять профиль автора новыми работами?

    Да, в описании патента (Description) раскрывается механизм автоматического обновления. Система рассчитывает Correspondence Score между кластером новых ресурсов и существующим профилем. Если оценка превышает порог, система автоматически добавляет ресурсы из кластера в профиль. Это обеспечивает актуальность данных о сущности.

    Что дает наличие ссылки на профиль соавтора в моем профиле?

    Это обеспечивает связанность данных (Linked Data). Это не только улучшает пользовательский опыт (позволяя перейти к профилю коллеги), но и укрепляет связи в Knowledge Graph, явно указывая, что обе сущности распознаны системой и имеют собственные профили авторитетности.

    Если я напишу статью с 5 известными экспертами, получу ли я много авторитета?

    Вы получите определенный уровень авторитета, но он будет «размыт». Из-за Author Uniqueness Measure, сигнал связи с каждым из этих 5 экспертов будет слабее, чем если бы вы написали статью только с одним из них. Необходимо балансировать между авторитетностью соавторов и эксклюзивностью сотрудничества.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.