SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент

SYSTEM AND METHOD FOR DETERMINING TOPIC AUTHORITY (Система и метод определения тематического авторитета)
  • US8458196B1
  • Google LLC
  • 2012-01-31
  • 2013-06-04
  • EEAT и качество
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.

Описание

Какую проблему решает

Патент решает задачу идентификации и количественной оценки экспертности (авторитетности) пользователей или авторов в разрезе конкретных тем (Topics). Он предлагает масштабируемый механизм для определения того, кто из авторов является экспертом в определенной области, основываясь на анализе контента, который они создали или в создании которого участвовали.

Что запатентовано

Запатентован метод расчета и обновления кумулятивного показателя экспертности автора, называемого Authority Signature (Сигнал Авторитета). Этот показатель вычисляется путем агрегации вклада автора в раскрытие конкретных тем во всех документах, которые он создал или редактировал. Система предназначена для выявления тематических экспертов.

Как это работает

Система работает в несколько этапов:

  • Анализ документа: Определяется тематический профиль документа (Document Signature), включающий список тем (Topics) и вес (Weight) каждой темы, показывающий, насколько сильно тема представлена в документе.
  • Определение вклада авторов: Для каждой темы определяется, какой процент контента был создан каждым из соавторов (Authorship Percentage).
  • Расчет вклада: Вычисляется вклад автора в тему в данном документе как произведение веса темы на процент авторства.
  • Обновление авторитета: Рассчитанный вклад добавляется к общему Authority Signature автора по данной теме. Этот процесс повторяется для всех документов автора, формируя кумулятивную оценку его экспертности.

Актуальность для SEO

Высокая. В контексте E-E-A-T (Expertise, Authoritativeness, Trustworthiness) важность авторской экспертности постоянно подчеркивается Google. Этот патент описывает конкретный, вычисляемый алгоритм для определения тематического авторитета на уровне автора, что соответствует современным концепциям «Author Rank» и является ключевым элементом оценки качества контента.

Важность для SEO

Патент имеет критическое значение для SEO (9/10). Он напрямую связан с реализацией E-E-A-T и предоставляет механизм для алгоритмической оценки «Expertise» и «Authoritativeness». Понимание того, как Google может количественно оценивать авторитет авторов, критично для разработки контент-стратегий, особенно в YMYL-нишах. Это подчеркивает необходимость инвестирования в реальных экспертов и четкую атрибуцию контента.

Детальный разбор

Термины и определения

Authority Signature (Сигнал Авторитета)
Кумулятивное значение (также упоминается как Expertise Signature Value), представляющее уровень экспертности или авторитета автора по конкретной теме. Вычисляется путем суммирования вклада автора в эту тему по всем проанализированным документам.
Authorship Information (Информация об авторстве)
Данные, указывающие, кто является автором контента в документе. Включает идентификацию авторов и их Authorship Percentage для каждой темы.
Authorship Percentage (Процент Авторства)
Метрика (например, от 0 до 1.0 или 0% до 100%), указывающая долю вклада конкретного автора в контент, относящийся к определенной теме в документе. Также называется Topic Authorship Percentage.
Document Signature (Сигнатура Документа)
Тематический профиль документа. Включает список тем (Topics), к которым относится контент, и вес (Weight) для каждой темы.
Topic (Тема)
Категория, концепция или предметная область, к которой относится контент документа. Может быть абстрактной и не обязательно присутствовать в тексте в виде термина.
Weight (Вес Темы)
Метрика (также Topic Weight или Confidence Score), количественно определяющая, насколько сильно тема связана с документом или насколько значительная часть документа посвящена этой теме. Сумма весов всех тем в документе обычно равна 1.0 или 100%.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод определения тематического авторитета, подчеркивая его кумулятивный характер.

  1. Система получает информацию о теме для первого документа (темы и веса).
  2. Система получает информацию об авторстве для первого документа (авторы и Authorship Percentage для каждой темы).
  3. Генерируется первое обновление Authority Signature для первого автора по первой теме. Обновление основано на произведении Authorship Percentage автора и Weight темы в первом документе.
  4. Система получает информацию о теме для второго документа.
  5. Система получает информацию об авторстве для второго документа.
  6. Генерируется второе обновление того же Authority Signature для первого автора по первой теме. Оно основано на произведении Authorship Percentage автора и Weight темы во втором документе.

Ядро изобретения — это формула расчета вклада (Процент Авторства * Вес Темы) и механизм кумулятивного обновления Authority Signature автора при обработке множества документов.

Claim 3 (Зависимый от 1): Уточняет, что механизм применяется к соавторам.

Система также генерирует обновление Authority Signature для второго автора первой темы на основе его процента авторства и веса темы в документе. Это подтверждает, что система корректно обрабатывает документы с несколькими авторами, распределяя авторитет между ними.

Claim 5 (Зависимый от 1): Описывает применение рассчитанных сигнатур.

  1. Множество Authority Signatures сохраняется в базе данных.
  2. В ответ на запрос, касающийся определенной темы (query topic), система извлекает и отображает информацию об одном или нескольких авторах, имеющих предопределенный ранг или значение Authority Signature для этой темы.

Это указывает на то, что рассчитанные сигнатуры используются для идентификации и, вероятно, продвижения экспертов по запрошенным темам.

Claim 14 (Независимый пункт, на носителе): Повторяет логику Claim 1, подтверждая процесс обновления сигнатур при обработке нескольких документов.

Система обновляет Authority Signature автора на основе его вклада в первом документе, а затем дополнительно обновляет эту же сигнатуру на основе его вклада во втором документе.

Где и как применяется

Изобретение применяется на этапах индексирования для расчета сигналов и на этапах ранжирования для их использования.

INDEXING – Индексирование и извлечение признаков
Это основной этап работы алгоритма. При индексации нового или обновленного документа система выполняет следующие действия:

  1. NLP-анализ: Обработка контента для определения тем (Topics) и их весов (Weights), формируя Document Signature.
  2. Анализ авторства: Определение авторов документа и расчет их вклада (Authorship Percentage) в каждую тему. Это может потребовать анализа истории редактирования или взаимодействия пользователя с документом.
  3. Расчет и обновление сигнатур: Вычисление вклада авторов и обновление их Authority Signatures. Эти данные сохраняются в индексе авторов или базе данных экспертов.

RANKING – Ранжирование / RERANKING – Переранжирование
Рассчитанные Authority Signatures могут использоваться как фактор ранжирования.

  • Система может повышать в выдаче контент, созданный авторами с высоким Authority Signature по темам, релевантным запросу пользователя.
  • Система может использовать эти данные для отображения информации об экспертах (как указано в Claim 5).

Входные данные:

  • Контент документа.
  • Данные об авторах (идентификаторы пользователей).
  • Данные о взаимодействии авторов с документом (например, история правок, объем добавленного текста), необходимые для расчета Authorship Percentage.

Выходные данные:

  • Обновленные Authority Signatures для всех авторов документа (маппинг Автор -> Тема -> Оценка Авторитета).

На что влияет

  • Конкретные ниши или тематики: Наибольшее влияние ожидается в YMYL-тематиках (медицина, финансы, юриспруденция) и других областях, где экспертность автора критически важна для качества и достоверности информации.
  • Специфические запросы: Информационные запросы, где пользователь ищет экспертное мнение или глубокий анализ.
  • Конкретные типы контента: Статьи, лонгриды, исследования, руководства — контент, где авторская позиция и экспертиза имеют значение.

Когда применяется

  • Временные рамки: Расчет Authority Signature происходит в процессе индексации или обновления документа. Использование сигнатуры происходит в реальном времени во время ранжирования.
  • Условия применения: Алгоритм применяется, когда система может надежно идентифицировать автора(ов) документа и определить тематику контента.

Пошаговый алгоритм

Процесс обновления тематического авторитета:

  1. Получение документа: Система получает новый или обновленный документ для анализа.
  2. Генерация Document Signature:
    1. Идентифицируются темы (Topics), присутствующие в документе.
    2. Для каждой темы рассчитывается её вес (Weight), отражающий степень её представленности в документе.
  3. Получение Authorship Information:
    1. Идентифицируются все авторы (или редакторы) документа.
    2. Для каждой темы определяется процент вклада (Authorship Percentage) каждого автора в контент, относящийся к этой теме.
  4. Итеративный расчет вклада: Система перебирает каждую тему в Document Signature.
  5. Расчет обновления сигнатуры: Для каждого автора, внесшего вклад в тему, вычисляется значение обновления: Обновление=Weight×Authorship Percentage\text{Обновление} = \text{Weight} \times \text{Authorship Percentage}Обновление=Weight×Authorship Percentage.
  6. Кумулятивное обновление Authority Signature: Рассчитанное значение обновления добавляется к текущему значению Authority Signature автора по данной теме. Если сигнатуры не существовало, она создается.
  7. Сохранение: Обновленные Authority Signatures сохраняются в базе данных.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме расчета авторитета и использует следующие типы данных:

  • Контентные факторы: Текст документа является основой для определения тем (Topics) и их весов (Weights) с помощью NLP-анализа.
  • Пользовательские факторы (Авторские): Идентификаторы авторов (User IDs). Данные о взаимодействии пользователя с документом (например, объем набранного текста, правки), которые используются для определения Authorship Percentage.

Какие метрики используются и как они считаются

  • Weight (Вес Темы): Степень представленности темы в документе. Патент указывает, что это может быть процент (0-100%) или числовое значение (0-1.0), и что сумма весов для документа равна 1.0.
  • Authorship Percentage (Процент Авторства): Доля вклада автора в контент по конкретной теме. Сумма процентов всех авторов для одной темы равна 1.0 или 100%. Рассчитывается на основе взаимодействия автора с частью документа, связанной с темой.
  • Authority Signature Value (Значение Сигнала Авторитета): Кумулятивный показатель экспертности.

Формулы и алгоритмы расчета:

Расчет вклада автора в тему в рамках одного документа:

ВкладАвтор,Тема,Документ=WeightТема,Документ×Authorship PercentageАвтор,Тема,Документ\text{Вклад}_{\text{Автор}, \text{Тема}, \text{Документ}} = \text{Weight}_{\text{Тема}, \text{Документ}} \times \text{Authorship Percentage}_{\text{Автор}, \text{Тема}, \text{Документ}}ВкладАвтор,Тема,Документ=WeightТема,Документ×Authorship PercentageАвтор,Тема,Документ

Расчет кумулятивного Сигнала Авторитета (Claim 1 и 14):

Authority SignatureАвтор,Тема=∑d∈ДокументыВкладАвтор,Тема,d\text{Authority Signature}_{\text{Автор}, \text{Тема}} = \sum_{d \in \text{Документы}} \text{Вклад}_{\text{Автор}, \text{Тема}, d}Authority SignatureАвтор,Тема=∑d∈Документы​ВкладАвтор,Тема,d

Authority Signature представляет собой сумму произведений веса темы и процента авторства по всем документам, созданным автором.

Выводы

  1. Алгоритмический расчет «Author Rank»: Патент описывает конкретный механизм для количественной оценки авторитета автора (Authority Signature), что является реализацией концепции «Author Rank».
  2. Тематическая специфика авторитета: Авторитет не является глобальным показателем. Он рассчитывается строго в разрезе конкретных тем (Topics). Автор может иметь высокий авторитет в одной теме и нулевой в другой.
  3. Кумулятивный характер авторитета: Authority Signature накапливается по мере создания автором контента. Чем больше документов автор создает по определенной теме, тем выше потенциал роста его авторитета.
  4. Важность глубины контента (Topic Weight): Для накопления авторитета важно не просто упоминание темы, а её глубокое раскрытие. Если документ лишь поверхностно затрагивает тему (низкий Weight), вклад в Authority Signature будет минимальным.
  5. Обработка соавторства: Система явно учитывает вклад нескольких авторов (Authorship Percentage), распределяя авторитет пропорционально их участию в создании контента по теме.
  6. Идентификация экспертов: Основная цель системы — создать базу данных экспертов по темам, которую можно использовать для ответа на запросы (Claim 5), что подразумевает использование этих данных в ранжировании или для формирования специальных блоков выдачи.

Практика

Best practices (это мы делаем)

  • Четкая атрибуция контента: Необходимо обеспечить надежную идентификацию авторов контента. Используйте разметку Schema.org (Person, author), создавайте качественные страницы авторов и связывайте их с профилями в авторитетных источниках. Это необходимо для корректного расчета Authorship Information.
  • Специализация авторов: Поощряйте авторов фокусироваться на их ключевых областях экспертизы. Поскольку Authority Signature рассчитывается по темам и является кумулятивной, специализированный автор быстрее накопит значительный авторитет в своей нише, чем автор, пишущий на множество разных тем.
  • Создание глубокого и всестороннего контента: Фокусируйтесь на создании контента, который полностью раскрывает тему. Это максимизирует Topic Weight для целевых тем в документе, что, в свою очередь, увеличивает вклад в Authority Signature автора.
  • Регулярность публикаций: Поскольку авторитет накапливается, важна регулярная публикация качественного контента по профильным темам для постоянного увеличения Authority Signature.
  • Привлечение реальных экспертов: Инвестируйте в создание контента реальными экспертами. Их предыдущие работы (даже на других площадках, если Google может их связать) могут способствовать формированию высокого начального Authority Signature.

Worst practices (это делать не надо)

  • Анонимный или псевдонимный контент: Публикация контента без четкой атрибуции реальному автору не позволяет накапливать Authority Signature и снижает потенциал ранжирования в контексте E-E-A-T.
  • Распыление тематик: Использование одного автора для покрытия широкого спектра несвязанных тем. Это затрудняет формирование сильного тематического авторитета в какой-либо конкретной области.
  • Поверхностный контент (Thin Content): Создание контента, который лишь затрагивает множество тем без их глубокого раскрытия. Это приводит к низким Topic Weights и минимальному вкладу в авторитет автора.
  • Использование «фейковых» авторов: Создание вымышленных персон авторов без реальной истории публикаций и подтвержденной экспертизы. Такие авторы будут иметь нулевой или низкий Authority Signature.

Стратегическое значение

Этот патент подтверждает, что E-E-A-T — это не абстрактная концепция, а набор алгоритмически вычисляемых сигналов. Authority Signature является ключевым компонентом для оценки «Expertise» и «Authoritativeness». Стратегически, это означает, что SEO должно выходить за рамки традиционной оптимизации текста и включать построение и продвижение авторитета авторов. Долгосрочная стратегия должна быть направлена на превращение авторов сайта в признанных экспертов в своей нише.

Практические примеры

Сценарий: Построение авторитета медицинского автора

  1. Задача: Продвинуть сайт клиники по запросам, связанным с кардиологией.
  2. Действия:
    • Привлекается врач-кардиолог (Доктор Х) для написания статей.
    • Создается страница автора с подтверждением квалификации.
    • Доктор Х пишет первую глубокую статью (Документ 1) по теме «Ишемическая болезнь сердца» (ИБС).
  3. Анализ системой (предположение):
    • Тема: «ИБС». Вес: 0.9 (статья глубокая).
    • Автор: Доктор Х. Процент авторства: 1.0 (единственный автор).
    • Вклад в Authority Signature по теме «ИБС»: 0.9 * 1.0 = 0.9.
  4. Последующие действия: Доктор Х пишет вторую статью (Документ 2) — обзор методов лечения сердечных заболеваний, где ИБС является одной из секций.
  5. Анализ системой (предположение):
    • Тема: «ИБС». Вес: 0.3 (только часть статьи).
    • Автор: Доктор Х. Процент авторства: 1.0.
    • Вклад: 0.3 * 1.0 = 0.3.
  6. Результат: Новый Authority Signature Доктора Х по теме «ИБС» становится 0.9 + 0.3 = 1.2. По мере роста этого показателя, контент Доктора Х по теме ИБС получает преимущество в ранжировании.

Вопросы и ответы

Что важнее для накопления Authority Signature: количество статей или их глубина?

Важны оба фактора, но глубина (Topic Weight) играет решающую роль в рамках одного документа. Одна глубокая статья (например, Вес темы 0.9) внесет больший вклад в авторитет, чем три поверхностные статьи, где целевая тема имеет вес 0.2 (суммарный вклад 0.6). Стратегия должна сочетать глубину проработки темы в каждом документе с регулярностью публикаций для максимизации кумулятивного эффекта.

Как Google определяет процент вклада (Authorship Percentage) при соавторстве?

Патент не детализирует точный механизм, но указывает, что Authorship Percentage основан на взаимодействии пользователя с документом. Это может включать анализ истории правок, объем добавленного/измененного текста, количество времени, потраченного на редактирование определенных секций, или данные из систем совместной работы (например, Google Docs). Для стандартных веб-страниц без доступа к истории правок это может быть сложнее и может основываться на разметке или явном указании ролей авторов.

Как система определяет Темы (Topics) документа?

Патент предполагает использование Natural Language Processing (NLP) для анализа контента. Темы могут быть абстрактными концепциями, а не просто ключевыми словами. Вероятно, используются модели тематического моделирования и извлечения сущностей (Entity Extraction) для понимания семантики текста и его связи с графом знаний (Knowledge Graph), что позволяет определить, о чем на самом деле этот документ.

Влияет ли этот патент на анонимный контент?

Да, косвенно. Контент без четко идентифицируемого автора не может способствовать накоплению Authority Signature. В тематиках, где авторская экспертность важна (например, YMYL), анонимный контент будет проигрывать контенту, созданному авторами с высоким Authority Signature. Это делает анонимность контента стратегическим недостатком.

Как этот патент связан с E-E-A-T?

Этот патент напрямую реализует механизм для алгоритмической оценки «Expertise» (Экспертиза) и «Authoritativeness» (Авторитетность) на уровне автора. Authority Signature является количественным выражением того, насколько автор компетентен в определенной теме, основываясь на истории его публикаций. Это один из ключевых сигналов, формирующих общую оценку E-E-A-T.

Может ли автор иметь высокий авторитет в нескольких темах?

Да. Система рассчитывает Authority Signature независимо для каждой темы. Если автор регулярно создает глубокий контент по нескольким различным темам, он может накопить высокий авторитет в каждой из них. Однако на практике специализация обычно позволяет быстрее достичь высокого уровня авторитета в конкретной нише.

Учитывается ли качество сайта, на котором публикуется контент?

Патент фокусируется исключительно на связи между автором, контентом и темой, не упоминая качество сайта-источника как фактор в формуле расчета Authority Signature. Однако логично предположить, что в реальной поисковой системе сигналы качества сайта и авторитет автора взаимодействуют на этапе ранжирования. Публикация на авторитетном сайте может косвенно улучшать восприятие контента.

Что делать, если автор публикуется на разных сайтах?

Если Google может надежно идентифицировать автора на разных площадках (например, через общие идентификаторы, профили, ссылки или семантический анализ стиля письма), то Authority Signature, вероятно, агрегируется из всех источников. SEO-специалистам следует обеспечить максимальную связанность профилей автора на разных сайтах, чтобы консолидировать его авторитет.

Как быстро обновляется Authority Signature?

Согласно патенту, обновление происходит при обработке документа (индексации). Это означает, что Authority Signature обновляется по мере того, как Google сканирует и индексирует новый или измененный контент автора. Изменения в ранжировании, связанные с обновлением сигнатуры, могут проявляться после завершения этих процессов.

Как лучше поступить: один автор пишет всю статью или несколько экспертов пишут по секции?

С точки зрения накопления авторитета, оба варианта рабочие, так как система учитывает Authorship Percentage. Если несколько экспертов пишут секции по своим узким специализациям, каждый из них получит значительный вклад в свою Authority Signature, а статья в целом может выиграть от более высокого суммарного уровня экспертизы. Важно, чтобы вклад каждого автора был существенным и глубоким.

Похожие патенты

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.
  • US8892549B1
  • 2014-11-18
  • EEAT и качество

  • Семантика и интент

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google определяет оригинальность контента для расчета Авторского Ранга (Author Rank) и влияния на ранжирование
Google использует систему для идентификации оригинального контента и повышения авторитета его создателей. Система разбивает документы на фрагменты (content pieces) и отслеживает их первое появление. Авторы (включая домены) ранжируются на основе количества созданного ими оригинального контента и частоты его копирования другими. Ранг автора затем используется для повышения в выдаче документов этого автора, особенно свежих публикаций.
  • US8983970B1
  • 2015-03-17
  • EEAT и качество

  • Свежесть контента

  • SERP

Как Google вычисляет семантическую схожесть контента с помощью векторов тем и косинусного сходства
Google использует механизм для эффективного определения семантической схожести документов. Система генерирует «Сигнатуру Документа» — вектор, состоящий из абстрактных тем (Topics) и весов (Weights), показывающих значимость каждой темы. Схожесть вычисляется путем сравнения этих векторов с использованием Косинусного Сходства (Cosine Similarity), что позволяет системе понимать тематические взаимосвязи в масштабе.
  • US8886648B1
  • 2014-11-11
  • Семантика и интент

  • Индексация

Как Google использует верифицированные данные об авторе (Credibility Factor) для ранжирования контента
Google патентует метод оценки авторитетности автора («Credibility Factor»). Он основан на комбинации онлайн-репутации автора и верифицированной информации о его реальных достижениях (образование, работа, награды, членство в организациях). Этот фактор используется для влияния на ранжирование контента автора в результатах поиска.
  • US8126882B2
  • 2012-02-28
  • EEAT и качество

  • SERP

Популярные патенты

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников
Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.
  • US8745067B2
  • 2014-06-03
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google автоматически изучает синонимы, анализируя последовательные запросы пользователей и вариации анкорных текстов
Google использует методы для автоматического определения синонимов, акронимов и эквивалентных фраз. Система анализирует логи запросов: если пользователь быстро меняет запрос, сохраняя часть слов (например, с «отели в париже» на «гостиницы в париже»), система учится, что «отели» и «гостиницы» эквивалентны. Также анализируются вариации анкорных текстов, указывающих на одну и ту же страницу.
  • US6941293B1
  • 2005-09-06
  • Семантика и интент

  • Ссылки

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore