SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента

RANKING EXPERTISE (Ранжирование экспертизы)
  • US8892549B1
  • Google LLC
  • 2007-06-29
  • 2014-11-18
  • EEAT и качество
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.

Описание

Какую проблему решает

Патент решает задачу автоматической и объективной идентификации экспертов и ранжирования их уровня знаний в конкретных темах. Он предлагает метод, основанный на анализе фактического вклада авторов в корпус документов, устраняя необходимость полагаться на субъективные или устаревшие профили навыков. Система количественно оценивает экспертизу, учитывая как количество релевантных документов, так и качество вклада автора (например, авторство ценится выше упоминания).

Что запатентовано

Запатентована система и метод для расчета оценок экспертности. Система идентифицирует Identities (экспертов) и Topics (темы) в корпусе документов. Для каждого документа вычисляются две ключевые метрики: Identity Score (степень связи эксперта с документом) и Topic Score (релевантность документа теме). Эти оценки агрегируются по всему корпусу для создания Composite Score, который определяет итоговый рейтинг экспертности конкретной личности в конкретной теме.

Как это работает

Механизм работает в несколько этапов:

  • Идентификация: Система определяет Identities (включая псевдонимы, такие как имена и email) и Topics (например, с помощью анализа n-грамм и IDF).
  • Оценка Документа: Для каждого документа вычисляется Identity Score (Wi), отражающий уровень вовлеченности автора (авторство, редактирование, упоминание), и Topic Score (Wt), отражающий центральность темы для документа (упоминание в заголовке, URL, тексте).
  • Агрегированная Оценка: Вычисляется Aggregate Score для документа путем перемножения Wi и Wt (Wi∗WtWi * Wt).
  • Композитная Оценка: Composite Score (общий рейтинг экспертности) вычисляется путем суммирования Aggregate Scores по всем документам корпуса для данной пары Автор-Тема.

Актуальность для SEO

Критически высокая. Несмотря на дату подачи (2007 г.), этот патент описывает фундаментальный механизм для алгоритмической оценки Экспертизы (Expertise) в рамках E-E-A-T. Автоматическое определение авторитетности авторов на основе их работ является центральным элементом современных поисковых систем, особенно для ранжирования контента в YMYL-нишах.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO-стратегии. Он предоставляет конкретную математическую модель того, как Google может измерять и ранжировать экспертизу авторов. Это напрямую влияет на контент-стратегию, подчеркивая необходимость создания четких авторских профилей, ясной атрибуции контента и последовательного создания высококачественных публикаций по конкретным темам для повышения авторитетности и видимости в поиске.

Детальный разбор

Термины и определения

Identity (Идентичность / Автор / Эксперт, i)
Сущность (человек или организация), которая может обладать экспертизой. Каждая Identity может иметь несколько Aliases.
Topic (Тема, t)
Слово или фраза (N-грамма), описывающая релевантную информацию о документе и помогающая отличить его от других. Область экспертизы.
Identity Score (Оценка Идентичности, WiW\_i)
Метрика, определяющая степень связи между Identity и конкретным документом. Основана на характере участия (автор, редактор, упоминание), расположении и частоте вхождений.
Topic Score (Оценка Темы, WtW\_t)
Метрика, определяющая степень релевантности конкретного документа определенной Topic. Основана на расположении (заголовок, URL, аннотация, текст) и частоте вхождений темы.
Aggregate Score (Агрегированная оценка, Si,tS\_{i,t})
Оценка связи между Identity и Topic на уровне одного документа. Вычисляется как произведение Identity Score и Topic Score (Wi∗WtWi * Wt).
Composite Score (Композитная оценка, Score(i,t)Score(i,t))
Итоговая оценка экспертизы Identity в Topic. Вычисляется как сумма Aggregate Scores по всем документам корпуса.
Alias (Псевдоним)
Различные способы обращения к Identity (имя, email, логин, никнейм).
IDF (Inverse Document Frequency) (Обратная частота документа)
Статистическая мера, используемая для автоматического выявления потенциальных Topics. Термины с высоким IDF считаются более описательными.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс анализа корпуса и расчета экспертизы (офлайн).

  1. Идентификация наборов Identities и Topics.
  2. Обработка каждого документа в корпусе:
    1. Идентификация вхождений Identities и Topics.
    2. Определение Identity Score (Wi) для каждой Identity (степень релевантности между Identity и документом).
    3. Определение Topic Score (Wt) для каждой Topic (степень релевантности между Topic и документом).
    4. Идентификация комбинаций (пар) Identity-Topic.
    5. Определение Aggregate Score для документа на основе Wi и Wt для каждой комбинации.
  3. Агрегация Aggregate Scores по всем документам для определения итогового Composite Score для каждой комбинации Identity-Topic.

Claim 3, 4, 5 (Зависимые): Детализируют расчет Identity Score (Wi).

Wi определяется на основе "признаков ссылки" (features of a reference) на Identity. Эти признаки включают расположение ссылки в документе (например, метаданные автора, тело текста), типографские свойства и частоту ссылок.

Claim 6, 7 (Зависимые): Детализируют расчет Topic Score (Wt).

Wt определяется на основе "признаков вхождения" (features of occurrence) Topic. Эти признаки включают расположение вхождения (например, заголовок, URL) и типографские свойства.

Claim 40 (Зависимый от 1): Ключевое уточнение механизма расчета.

Aggregate Score вычисляется путем перемножения Identity Score и Topic Score. Это устанавливает мультипликативную модель оценки.

Claim 8 и 11 (Независимые пункты): Описывают процесс ответа на запрос (онлайн).

  • Claim 8: Если запрос – это Identity, система извлекает связанные Topics и ранжирует их по Composite Score (поиск областей экспертизы человека).
  • Claim 11: Если запрос – это Topic, система извлекает связанные Identities и ранжирует их по Composite Score (поиск экспертов по теме).

Где и как применяется

Изобретение охватывает процессы как на этапе индексирования (офлайн-анализ), так и на этапе обработки запросов (онлайн-использование).

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Здесь происходит вся аналитическая работа:

  • Распознавание Identities (и их псевдонимов) и Topics (используя IDF).
  • Анализ документов: извлечение признаков (местоположение упоминаний, метаданные авторства, история правок).
  • Вычисление Identity Scores (Wi) и Topic Scores (Wt) для каждого документа.
  • Вычисление и агрегация Composite Scores.
  • Результаты (рейтинги экспертизы) сохраняются для последующего использования (например, как аннотации сущностей в Knowledge Graph или отдельном индексе экспертов).

QUNDERSTANDING – Понимание Запросов
Система классифицирует запрос, определяя, соответствует ли он известной Identity или Topic, чтобы активировать поиск по базе экспертизы.

RANKING – Ранжирование / RERANKING – Переранжирование
Рассчитанные Composite Scores могут использоваться как мощный сигнал ранжирования (реализация E-E-A-T). Если для запроса важна экспертность (например, YMYL), система может повышать контент от авторов с высоким Composite Score по релевантной теме.

На что влияет

  • Конкретные ниши или тематики: Критически важно в YMYL-тематиках (медицина, финансы, право), а также в академических и технических областях, где подтвержденная экспертиза автора является ключевым сигналом качества.
  • Типы контента: Влияет на контент, предполагающий наличие автора-эксперта: статьи, исследования, лонгриды, аналитические обзоры.
  • Специфические запросы: Информационные запросы, направленные на получение экспертного мнения или глубоких знаний, а также запросы по поиску экспертов.

Когда применяется

  • Временные рамки: Расчет Composite Scores происходит офлайн во время индексирования и обновляется по мере изменения корпуса документов. Использование оценок происходит в реальном времени при обработке запросов.
  • Условия применения: Применяется, когда система может идентифицировать авторов (Identities) и связать их с контентом. Используется как сигнал ранжирования, когда алгоритмы определяют важность экспертности для запроса.

Пошаговый алгоритм

Фаза А: Подготовка (Индексирование)

  1. Распознавание Идентичностей: Сбор данных из репозиториев. Идентификация всех псевдонимов (Aliases) для каждой Identity.
  2. Распознавание Тем: Анализ корпуса документов. Выделение N-грамм и расчет IDF. Выбор терминов с высокими показателями IDF в качестве Topics.

Фаза Б: Анализ Документа (Индексирование)

  1. Идентификация и Оценка Идентичностей (Wi): Поиск псевдонимов в документе (текст, метаданные автора, история изменений). Расчет Identity Score (Wi) на основе признаков вхождения. (Например, авторство оценивается выше, чем редактирование или упоминание).
  2. Идентификация и Оценка Тем (Wt): Поиск Topics в документе (текст, заголовок, URL). Расчет Topic Score (Wt) на основе признаков вхождения. (Например, вхождение в заголовок оценивается выше, чем в тексте).
  3. Расчет Агрегированной Оценки: Для каждой пары (Identity i, Topic t) в документе вычисляется Aggregate Score по формуле: Si,t=(Wi)(Wt)S_{i,t} = (W_i)(W_t).

Фаза В: Агрегация (Индексирование)

  1. Расчет Composite Score: Для каждой пары (Identity i, Topic t) суммируются Aggregate Scores по всем документам корпуса: Score(i,t)=∑doc(Wi)(Wt)Score(i,t) = \sum_{doc} (W_i)(W_t).
  2. Хранение: Сохранение Composite Scores в базе данных ассоциаций.

Фаза Г: Поиск (Во время запроса)

  1. Получение и Классификация Запроса: Определение, является ли запрос Topic или Identity.
  2. Поиск и Ранжирование: Извлечение связанных сущностей (Авторов для Темы или Тем для Автора) и их ранжирование по убыванию Composite Score.

Какие данные и как использует

Данные на входе

Система активно использует следующие типы данных для расчета оценок:

  • Контентные факторы: Заголовок (Title), основной текст (Body), аннотация (Abstract). Вхождения Topics и Identities в заголовках и аннотациях имеют больший вес.
  • Технические факторы:
    • Метаданные документа: Поля автора (Author), редактора (Editor). Указание Identity как автора дает наивысший вес для Wi.
    • Идентификатор расположения (URL): Вхождение Topic в URL учитывается при расчете Wt.
  • Структурные и Типографские факторы: Местоположение (location) текста в документе и типографическое форматирование (typographical properties) используются для оценки Wi и Wt.
  • Временные факторы: История редактирования и ревизий (Revision history). Используется для расчета Wi на основе количества и размера внесенных изменений.
  • Данные о Личностях: Данные из справочников или баз данных, включая псевдонимы (Aliases): полное имя, email, логин, никнейм.

Какие метрики используются и как они считаются

  • IDF (Inverse Document Frequency): Используется для определения значимости термина и его выбора в качестве Topic.
  • Identity Score (Wi): Рассчитывается путем взвешивания и суммирования вхождений Identity на основе их признаков. Патент приводит иллюстративные примеры весов:
    • Метаданные автора: 1.0
    • Упоминание в теле рядом с заголовком: 0.6
    • Упоминание в теле: 0.25
    • История ревизий: вес зависит от количества и размера правок.
  • Topic Score (Wt): Рассчитывается путем взвешивания и суммирования вхождений Topic. Иллюстративные примеры весов из патента:
    • Заголовок/Метаданные: 1.0
    • URL: 0.5
    • Тело документа: 0.25
  • Aggregate Score: Мультипликативная модель для оценки на уровне документа. Формула: Si,t=(Wi)(Wt)S_{i,t} = (W_i)(W_t).
  • Composite Score: Суммарная оценка экспертности по всему корпусу. Формула: Score(i,t)=∑doc(Wi)(Wt)Score(i,t) = \sum_{doc} (W_i)(W_t).

Выводы

  1. Алгоритмическая основа E-E-A-T (Expertise): Патент предоставляет конкретный механизм для количественной оценки экспертизы автора в определенной теме. Composite Score можно рассматривать как измеримую метрику компонента "Expertise" в E-E-A-T.
  2. Мультипликативная модель (Wi * Wt): Использование умножения критически важно. Высокий рейтинг экспертности требует ОБОИХ компонентов: сильной связи автора с документом (высокий Wi) И высокой релевантности документа теме (высокий Wt). Авторство общей статьи (низкий Wt) или простое упоминание в профильной статье (низкий Wi) дадут низкий результат.
  3. Иерархия вклада и важность местоположения: Система четко разграничивает типы вклада. Авторство в метаданных имеет наивысший вес. Аналогично, для тем критично расположение в заголовках и URL.
  4. Экспертиза накапливается через контент: Composite Score является суммой, поэтому для демонстрации высокой экспертизы необходим корпус работ. Чем больше документов связывают Identity с Topic с высокими оценками, тем выше итоговый рейтинг.
  5. Резолюция сущностей (Aliases): Способность системы объединять различные псевдонимы (имя, email, логин) в единую Identity критически важна для создания полного профиля экспертизы человека.
  6. Объективность и масштабируемость: Экспертиза выводится автоматически из анализа документов (с использованием IDF для определения тем), что делает систему масштабируемой и менее зависимой от ручной разметки.

Практика

Best practices (это мы делаем)

  • Максимизация Identity Score (Wi) через явное авторство: Всегда четко указывайте авторов контента, особенно в YMYL-тематиках. Используйте микроразметку Schema.org (author) и видимые блоки авторства. Указание авторства в метаданных (или эквивалентных зонах) дает наивысший балл для Wi.
  • Максимизация Topic Score (Wt) через оптимизацию ключевых зон: Убедитесь, что основная тема (Topic) четко отражена в Title, H1, аннотации и URL. Согласно патенту, эти зоны имеют значительно больший вес при расчете Wt.
  • Построение Topical Authority через экспертов: Развивайте конкретных авторов в узких темах. Автор должен последовательно создавать высококачественный, сфокусированный контент по своей специализации. Это увеличивает количество документов с высокими Aggregate Scores, тем самым повышая итоговый Composite Score.
  • Консистентная идентификация авторов (Aliases): Используйте единое написание имени автора и связывайте его профили (биография на сайте, соцсети) с помощью разметки sameAs. Это упрощает для Google процесс резолюции сущности и объединения псевдонимов в единую Identity.
  • Учет обновлений контента (Revision History): Патент упоминает использование истории ревизий для расчета Wi. Регулярное обновление и редактирование контента экспертом может положительно влиять на его оценку экспертизы.

Worst practices (это делать не надо)

  • Анонимный или слабо атрибутированный контент: Публикация контента без указания автора или под общим именем ("Администратор") не позволяет рассчитать Wi (Wi≈0) и не способствует накоплению сигналов экспертизы.
  • Поверхностный или обобщенный контент: Создание статей, затрагивающих множество тем без глубокого фокуса, приводит к низкому Wt для целевой темы, что минимизирует вклад в Composite Score из-за мультипликативной модели.
  • Изолированные упоминания без авторства: Полагаться на то, что простое упоминание имени эксперта в статье значительно повысит его экспертность. Вес таких упоминаний значительно ниже, чем у авторства или редактирования.
  • Распыление фокуса авторов: Если эксперт пишет на слишком много не связанных между собой тем, это может помешать достижению высокого Composite Score в приоритетных областях.

Стратегическое значение

Патент подтверждает стратегический приоритет Google на оценку реальной экспертизы авторов как ключевого фактора ранжирования. Он демонстрирует, что E-E-A-T имеет под собой алгоритмическую основу. Долгосрочная SEO-стратегия должна фокусироваться не только на качестве контента, но и на развитии и правильной презентации профиля экспертов, создающих этот контент (Author SEO). Построение авторитета автора (Identity) становится центральной задачей для успеха в авторитетных нишах.

Практические примеры

Сценарий: Построение экспертности финансового аналитика

Цель: Добиться высокого Composite Score для аналитика Джона Смита (Identity) по теме «Инвестиции в ETF» (Topic).

Стратегия А (Эффективная, основанная на патенте):

  1. Действие: Публикация 10 глубоких аналитических статей. Джон Смит указан как единственный автор в метаданных и Schema.org.
  2. Расчет (условный): Wi = 1.0 (за авторство).
  3. Действие: Каждая статья четко сфокусирована на «Инвестициях в ETF», термин присутствует в Title и URL.
  4. Расчет (условный): Wt = 1.5 (за фокус в Title (1.0) + URL (0.5)).
  5. Результат: Aggregate Score за статью = 1.0 * 1.5 = 1.5. Composite Score = 10 * 1.5 = 15.0.

Стратегия Б (Неэффективная):

  1. Действие: Публикация 10 общих статей о финансах, где Джон Смит упоминается в тексте как один из сотрудников.
  2. Расчет (условный): Wi = 0.25 (за упоминание в теле).
  3. Действие: Статьи обобщенные, «Инвестиции в ETF» упоминаются мимоходом в тексте.
  4. Расчет (условный): Wt = 0.25 (за упоминание в теле).
  5. Результат: Aggregate Score за статью = 0.25 * 0.25 = 0.0625. Composite Score = 10 * 0.0625 = 0.625.

Вывод: Стратегия А значительно эффективнее для построения измеримой экспертности согласно модели патента.

Вопросы и ответы

Как этот патент связан с E-E-A-T?

Этот патент напрямую связан с компонентом "Expertise" (Экспертиза). Он описывает конкретный алгоритмический и масштабируемый метод для количественного измерения того, насколько автор (Identity) является экспертом в определенной теме (Topic), основываясь на его публикациях. Composite Score можно рассматривать как программную оценку уровня экспертизы автора.

Что важнее: Identity Score (Wi) или Topic Score (Wt)?

Оба критически важны из-за мультипликативной модели (Wi∗WtWi * Wt). Если один из множителей близок к нулю (например, автор написал статью не по теме (низкий Wt), или эксперт лишь упомянут в профильной статье (низкий Wi)), итоговый вклад в рейтинг экспертности будет минимальным. Необходимо максимизировать оба показателя.

Как рассчитывается Identity Score (Wi) и что дает наибольший вес?

Identity Score (Wi) определяет связь автора с документом. Он рассчитывается на основе признаков упоминания. Наибольший вес дает указание в метаданных автора (Author field). Также учитывается история редактирования (количество и размер правок). Упоминания в теле документа имеют наименьший вес.

Как рассчитывается Topic Score (Wt) и что дает наибольший вес?

Topic Score (Wt) определяет релевантность документа теме. Наибольший вес имеют упоминания темы в заголовке (Title) и метаданных. Упоминания в URL также имеют значительный вес, превышающий вес упоминаний в основном тексте. Также учитываются частота и типографическое форматирование.

Как система справляется с разными написаниями имени автора или псевдонимами?

Система использует концепцию Aliases (псевдонимов). Она идентифицирует различные формы обращения к Личности (имя, email, имя пользователя, никнейм) и объединяет их в единый профиль (Identity). Это позволяет корректно суммировать экспертность, накопленную под разными идентификаторами.

Как система определяет Темы (Topics) для анализа?

Темы определяются автоматически путем анализа корпуса документов. Система выделяет N-граммы (слова и фразы) и рассчитывает для них IDF (Обратную частоту документа). Термины, которые являются достаточно описательными (хорошо характеризуют и различают документы), выбираются в качестве Topics.

Влияет ли обновление или редактирование контента на оценку экспертности?

Да. Патент явно упоминает использование истории ревизий (revision history) при расчете Identity Score. Участие в редактировании документа учитывается, и оценка может зависеть от количества или размера внесенных изменений. Это подчеркивает ценность поддержания актуальности контента экспертами.

Что лучше для демонстрации экспертизы: один большой документ или много небольших?

Важен баланс. Composite Score — это сумма оценок по всем документам, поэтому количество важно. Однако каждый документ должен иметь высокие Identity Score и Topic Score. Много сфокусированных документов с четким авторством увеличат Composite Score эффективнее, чем множество поверхностных статей.

Стоит ли использовать анонимных авторов или общее имя (например, «Редакция»)?

С точки зрения построения экспертности, это неэффективно. Если Identity не может быть четко идентифицирована и связана с документом, Identity Score (Wi) будет низким. Это не позволит накапливать Composite Score и сигнализировать об экспертизе поисковой системе.

Может ли этот механизм применяться к организациям, а не только к людям?

Да. Термин Identity определяется как сущность, которая может включать индивидуумов или организации. Механизм может аналогичным образом рассчитывать экспертизу бренда или компании на основе документов, которые они публикуют или в создании которых участвуют.

Похожие патенты

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

Как Google ранжирует документы, используя качество источника, свежесть, оригинальность и кластеризацию контента
Google оценивает документы, анализируя авторитетность и экспертизу источника публикации, свежесть контента и его оригинальность. Документы группируются в кластеры по темам (например, новостные сюжеты). Оценка кластера (например, разнообразие и важность источников внутри него) также влияет на ранжирование отдельных документов.
  • US8090717B1
  • 2012-01-03
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Как Google использует оценку новизны (Novelty Score) для ранжирования новостей и блогов, отдавая приоритет первоисточникам
Google анализирует темпоральную последовательность документов (например, новости по одной теме) для выявления нового контента. Система идентифицирует «информационные фрагменты» (сущности, факты) и их взаимодействия. Документы, которые первыми вводят важные фрагменты или значительно дополняют существующие, получают более высокую оценку новизны (Novelty Score) и ранжируются выше, вытесняя вторичный контент.
  • US7451120B1
  • 2008-11-11
  • Свежесть контента

  • SERP

  • Семантика и интент

Как Google вычисляет схожесть документов, используя значимость слов, их описательность и распознавание фраз
Google использует алгоритм для определения схожести документов, который превосходит традиционный TF-IDF. Система вычисляет Оценку Значимости (Prominence Score) и Оценку Описательности (Descriptiveness Score) для отдельных слов и фраз. Учитывается, где именно на странице расположены термины и насколько информативными они являются в целом. Это позволяет точнее определять релевантность и тематическую близость контента.
  • US7958136B1
  • 2011-06-07
  • Семантика и интент

Популярные патенты

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
  • US7296016B1
  • 2007-11-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
  • US8423538B1
  • 2013-04-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования
Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.
  • US7454417B2
  • 2008-11-18
  • Персонализация

  • Поведенческие сигналы

  • SERP

seohardcore