SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников

PRESENTING COMMENTS FROM VARIOUS SOURCES (Представление комментариев из различных источников)
  • US8745067B2
  • Google LLC
  • 2009-08-12
  • 2014-06-03
  • EEAT и качество
  • Свежесть контента
  • Семантика и интент
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.

Описание

Какую проблему решает

Патент решает проблему поиска, агрегации и представления релевантной информации (мнений, отзывов, обсуждений), относящейся к конкретному документу (веб-странице), но разбросанной по различным внешним источникам, таким как блоги, сайты отзывов, новостные обсуждения и специализированные системы комментирования.

Что запатентовано

Запатентована система агрегации, обработки и ранжирования комментариев из разнородных источников для их отображения вместе с целевым документом. Система объединяет комментарии, созданные через функциональность браузера, с комментариями из внешних баз данных (отзывы о товарах, бизнесе, новостях, блогах). Ключевым элементом является механизм обработки и ранжирования этого контента для обеспечения качества и релевантности.

Как это работает

Система работает на двух уровнях: офлайн-обработка и работа в реальном времени.

  • Офлайн-обработка: Специализированные процессоры (например, Blog Processor) анализируют контент (например, блоги). Если пост в блоге содержит ссылки, система определяет, какая из них является основной темой поста, используя такие сигналы, как CTR ссылок и тематическое соответствие. Затем этот пост сохраняется как комментарий к целевому документу.
  • Реальное время: Когда пользователь посещает страницу, система запрашивает комментарии из нескольких баз данных (Comments DB, Product Reviews DB и т.д.). Полученные комментарии ранжируются на основе многофакторной модели (авторитетность автора, свежесть, обратная связь пользователей, качество языка) и представляются пользователю в унифицированном формате.

Актуальность для SEO

Средняя/Высокая. Описанный механизм доставки (отображение комментариев поверх страницы через браузер, напоминающий Google Sidewiki) устарел. Однако запатентованные алгоритмы оценки качества, ранжирования и определения релевантности комментариев, отзывов и упоминаний в блогах крайне актуальны. Эти механизмы лежат в основе понимания Google сигналов E-E-A-T, анализа репутации и оценки качества User-Generated Content (UGC).

Важность для SEO

Патент имеет значительное влияние на SEO (8/10). Он детально раскрывает механизмы, которые Google использует для оценки сторонних мнений, упоминаний и UGC. Это напрямую влияет на стратегии управления репутацией (SERM), построения E-E-A-T и линкбилдинга, поскольку патент описывает, какие факторы делают внешний отзыв или упоминание в блоге авторитетным и релевантным в глазах поисковой системы.

Детальный разбор

Термины и определения

Comment (Комментарий)
Любой контент (текст, аудио, видео, изображение), который содержит мнение или замечание о документе или его части. Включает посты в блогах, новостные статьи, отзывы о продуктах или бизнесе.
Comments Server (Сервер комментариев)
Сервер (или система), который собирает, обрабатывает и предоставляет комментарии из различных источников по запросу клиента.
Comments Database (База данных комментариев)
Основное хранилище комментариев, включая те, что созданы пользователями напрямую, и те, что были обработаны из других источников (например, из блогов).
Blog Processor (Процессор блогов)
Компонент, который анализирует посты в блогах, определяет, к каким документам они относятся (анализируя ссылки), и сохраняет их как комментарии.
Link Selection Factors (Факторы выбора ссылки)
Метрики, используемые для определения основной темы поста в блоге, если он содержит несколько ссылок. Включают CTR ссылки, длину URL, популярность документа и тематическое соответствие.
Comment Scoring Factors (Факторы оценки комментария)
Метрики, используемые для ранжирования комментариев при их отображении. Включают рейтинг автора, свежесть, обратную связь пользователей, качество языка и авторитетность источника комментария.
Document (Документ)
Любой адресуемый контент, например, веб-страница, файл, новостная статья, бизнес-листинг.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс агрегации и ранжирования комментариев.

  1. Система поддерживает несколько структур данных (баз данных), хранящих комментарии разных типов.
  2. Получается запрос на комментарии, относящиеся к определенному документу (третьему документу).
  3. Выполняется поиск в этих базах данных для идентификации релевантных комментариев.
  4. Для каждого найденного комментария генерируется оценка (score).
  5. Критически важно: Оценка генерируется на основе комбинации как минимум трех из следующих факторов:
    • Обратная связь пользователя (User feedback).
    • Ранг автора комментария (Author rank).
    • Дата/время создания или изменения (Timestamp).
    • Мера релевантности структуры данных, хранящей комментарий (Database relevance).
    • Язык, используемый в комментарии (Language signals).
    • Ранг документа-источника, содержащего комментарий (Source document rank).
  6. На основе этой оценки принимается решение, предоставлять ли комментарий клиенту.
  7. Отобранные комментарии предоставляются для отображения вместе с третьим документом.

Claim 5 (Зависимый от 3): Описывает офлайн-обработку.

Система выполняет офлайн-обработку для сохранения комментариев (из блогов, новостей, отзывов о продуктах или бизнесе) в определенной структуре данных. Эта обработка происходит независимо от запроса пользователя на комментарии.

Claim 15 (Независимый пункт, Computer-Readable Medium): Описывает систему хранения и извлечения.

  1. Хранение комментариев из Источника 1 в первой структуре данных.
  2. Хранение комментариев из Источника 2 во второй структуре данных.
  3. Получение запроса на комментарии для документа из Источника 3.
  4. Поиск в первой и/или второй структуре.
  5. Генерация оценки (score) на основе комбинации как минимум трех факторов (перечисленных в Claim 1).
  6. Определение группы комментариев на основе оценок.
  7. Форматирование группы комментариев в единый формат (particular format).
  8. Предоставление группы комментариев клиенту.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, хотя его основная функция связана с обработкой и представлением данных, а не с основным веб-ранжированием.

CRAWLING & INDEXING – Сканирование, Индексирование и Извлечение признаков
На этих этапах происходит сбор и обработка данных, которые система использует:

  • Сбор и индексация блогов, сайтов отзывов, новостных комментариев.
  • Офлайн-обработка (Offline processing): Анализ блогов для определения целевых ссылок (Link Selection).
  • Расчет признаков качества: Оценка авторитетности авторов комментариев (Author Rank) и ранга документов-источников (Source Document Rank).

METASEARCH – Метапоиск и Смешивание
Когда поступает запрос на комментарии к определенному URL, система выполняет метапоиск по нескольким специализированным базам данных (Бизнес, Продукты, Новости, Блоги, Общие комментарии) и агрегирует результаты.

RERANKING – Переранжирование
Основной этап применения алгоритмов ранжирования, описанных в патенте. Агрегированные комментарии оцениваются с использованием Comment Scoring Factors для определения их порядка и того, какие из них следует показать.

Входные данные:

  • URL документа, просматриваемого пользователем.
  • Данные из различных баз комментариев (блоги, отзывы и т.д.).
  • Предварительно рассчитанные метрики авторов и источников.
  • Логи поведения пользователей (CTR ссылок в блогах, обратная связь по комментариям).

Выходные данные:

  • Отранжированный список релевантных комментариев в унифицированном формате.

На что влияет

  • Конкретные типы контента и ниши: Наибольшее влияние оказывается на контент, где важны мнения и репутация: страницы товаров (e-commerce), услуги, профили компаний (Local SEO), информационные статьи, особенно в YMYL-тематиках.
  • Специфические запросы: Влияет на восприятие пользователем контента после перехода на страницу.

Когда применяется

  • Условия работы: При просмотре пользователем документа в браузере, если система комментирования активна.
  • Триггеры активации: Запрос пользователя на показ комментариев или автоматическая активация, если существуют комментарии с рейтингом выше определенного порога.

Пошаговый алгоритм

Алгоритм разделен на два основных процесса: Офлайн-обработка (на примере блогов) и Извлечение комментариев в реальном времени.

Процесс А: Офлайн-обработка блогов (Blog Processing)

  1. Идентификация контента: Система идентифицирует пост в блоге, содержащий как минимум одну ссылку.
  2. Анализ ссылок: Определяется количество ссылок в посте.
  3. Оценка релевантности ссылок (если ссылок больше одной): Для каждой ссылки вычисляется оценка (Link Score) на основе факторов выбора ссылки (CTR, длина URL, тематическое соответствие и т.д.).
  4. Выбор целевой ссылки: Выбирается ссылка с наивысшей оценкой. Могут применяться пороги (например, оценка должна превышать порог, или разрыв между лучшей и следующей ссылкой должен быть значительным).
  5. Ассоциация и сохранение: Пост в блоге сохраняется в Comments Database как комментарий, ассоциированный с документом, на который указывает выбранная ссылка. Данные форматируются (Автор блога, Дата поста, Контент поста).

Процесс Б: Извлечение и ранжирование комментариев (Real-Time)

  1. Получение запроса: Пользователь просматривает документ и запрашивает комментарии (или запрос происходит автоматически).
  2. Маршрутизация запроса: Front End системы определяет, какие базы данных релевантны (например, если это страница товара, запрос направляется в Product Reviews DB и общую Comments DB).
  3. Извлечение кандидатов: Релевантные процессоры извлекают комментарии, ассоциированные с документом или сущностью (товаром, бизнесом), связанной с документом.
  4. Расчет оценки комментария (Comment Scoring): Для каждого кандидата вычисляется оценка на основе комбинации как минимум трех факторов (Author Rank, Timestamp, User Feedback, Language signals и т.д.).
  5. Отбор и ранжирование: Комментарии отбираются (например, по порогу оценки) и сортируются по убыванию оценки.
  6. Форматирование и представление: Отобранные комментарии форматируются в унифицированный вид и отправляются клиенту для отображения.
  7. Сбор обратной связи: Регистрируется обратная связь пользователя (рейтинги, время просмотра), которая будет использована для будущих ранжирований.

Какие данные и как использует

Данные на входе

Патент описывает использование широкого спектра данных для ассоциации и ранжирования комментариев.

  • Ссылочные факторы:
    • Ссылки внутри постов в блогах (используются для определения темы поста).
    • URL целевых документов.
    • Длина URL (address length) – короткие URL (например, главные страницы) считаются менее вероятными темами обсуждения.
  • Контентные факторы:
    • Контент комментариев, отзывов, постов в блогах.
    • Языковые сигналы (Language signals): грамматика, использование сленга, формальность языка, капитализация.
    • Теги, присвоенные комментариям.
  • Поведенческие факторы (Implicit и Explicit):
    • CTR (Click through rate) ссылок внутри постов в блогах (используется для определения главной темы поста).
    • Явная обратная связь (Explicit user feedback): рейтинги комментариев пользователями (полезно/не полезно).
    • Неявная обратная связь (Implicit user feedback): время, проведенное за просмотром комментария, запрос полного текста комментария.
  • Временные факторы:
    • Дата и время создания или изменения комментария/поста (Timestamp).
  • Пользовательские и Авторитетные факторы:
    • Информация об авторе комментария.
    • Ранг автора (Author Rank), основанный на количестве комментариев и обратной связи о его предыдущих комментариях.
    • Ранг документа-источника (Source Document Rank) – авторитетность сайта, где изначально был размещен комментарий или отзыв.
    • Популярность документа (document popularity) – очень популярные документы менее вероятно являются конкретной темой обсуждения в блоге.

Какие метрики используются и как они считаются

Система использует две основные группы метрик:

1. Link Score (Оценка ссылки для ассоциации блогов)

Вычисляется для определения основной темы поста в блоге. Это функция от нескольких факторов:

F(CTR,UserFeedback,AddressLength,DocPopularity,TopicInfo)F(CTR, User Feedback, Address Length, Doc Popularity, Topic Info)

  • Методы анализа текста (NLP): Используются для определения тем (Topic information) поста в блоге и целевых документов для оценки их соответствия.

2. Comment Score (Оценка комментария для ранжирования)

Вычисляется для определения качества и релевантности комментария. Согласно Claim 1 и 15, это функция, основанная на комбинации как минимум трех из следующих факторов:

  • Rating (Явная обратная связь пользователей).
  • Author Rank (Ранг автора).
  • Timestamp (Свежесть).
  • Database Relevance (Вероятность того, что конкретная база данных содержит релевантные комментарии для данного документа).
  • Language signals (Качество языка).
  • Source Document Rank (Ранг источника).
  • Implicit feedback (Неявная обратная связь).

Выводы

  1. Google активно агрегирует мнения из разнородных источников: Система не полагается только на один тип UGC, а стремится собрать мнения из блогов, новостей, сайтов отзывов о продуктах и бизнесе, унифицируя их представление.
  2. Сложный механизм определения основной темы внешних публикаций (Link Selection): Для SEO критически важно понимать, что Google анализирует контекст упоминаний и ссылок. Если статья содержит несколько ссылок, система пытается определить ее основную тему, используя поведенческие сигналы (CTR по ссылкам), структурные (длина URL) и семантические (NLP анализ тем).
  3. Многофакторная оценка качества UGC (Comment Scoring): Патент детально описывает, как ранжируются отзывы и комментарии. Авторитетность автора (Author Rank), качество текста (Language signals) и реакция пользователей (User Feedback) являются ключевыми компонентами. Это не просто анализ тональности, а комплексная оценка качества.
  4. Актуальность для E-E-A-T и Репутации: Хотя конкретная реализация (типа Google Sidewiki) устарела, описанные механизмы оценки сторонних мнений и авторитетности их авторов напрямую связаны с тем, как Google сегодня оценивает репутацию сайтов и авторов в рамках E-E-A-T.
  5. Приоритет качества и полезности: Система использует сложные метрики и пороги, чтобы отфильтровать низкокачественный или нерелевантный UGC, предпочитая комментарии от авторитетных авторов или с высоким уровнем вовлеченности пользователей.

Практика

Best practices (это мы делаем)

  • Стратегия линкбилдинга и PR (Определение темы публикации): При размещении гостевых постов или PR-материалов убедитесь, что ссылка на ваш сайт является семантически и контекстуально центральной в публикации. Структурируйте внешний контент так, чтобы максимизировать вероятность того, что система ассоциирует публикацию именно с вашим документом, а не с другими исходящими ссылками.
  • Стимулирование поведенческих сигналов на внешних площадках: Поощряйте вовлеченность с вашими внешними публикациями. Высокий CTR по вашей ссылке внутри статьи на стороннем сайте увеличивает вероятность того, что Google признает вашу ссылку основной темой этой статьи (Link Selection Factor).
  • Управление репутацией и E-E-A-T (Авторитетность источников): Стимулируйте появление отзывов и обсуждений на авторитетных площадках. Source Document Rank (ранг документа-источника комментария) является фактором ранжирования мнений. Отзыв на трастовом сайте имеет больший вес.
  • Качество UGC на собственном сайте: Применяйте строгую модерацию и поощряйте качественные комментарии. Факторы Language signals (грамматика, отсутствие спама, формальный язык) и Author Rank (развитие сообщества авторитетных комментаторов) используются Google для оценки UGC.

Worst practices (это делать не надо)

  • Нерелевантный линкбилдинг: Размещение ссылок в статьях, где они не являются основной темой, теряются среди множества других ссылок или ведут на общие страницы (например, только на главную, если обсуждается конкретный продукт). Система может не ассоциировать такую статью с вашим сайтом.
  • Накрутка отзывов низкого качества: Генерация большого количества отзывов от неавторитетных авторов (низкий Author Rank), с плохим качеством текста (низкие Language signals) или без реального вовлечения пользователей (низкий User Feedback) будет отфильтрована системой.
  • Игнорирование UGC на внешних площадках: Отсутствие мониторинга и работы с отзывами и упоминаниями в блогах/новостях, особенно на авторитетных ресурсах, лишает сайт важных сигналов репутации.

Стратегическое значение

Патент подтверждает стратегическую важность сторонних сигналов и User-Generated Content для оценки авторитетности и репутации (E-E-A-T). Он демонстрирует, что Google не просто учитывает факт наличия упоминаний или отзывов, но и глубоко анализирует их качество, контекст, источник и авторитетность автора. Для долгосрочной SEO-стратегии критически важно управлять всем спектром упоминаний бренда/продукта в сети, фокусируясь на качестве и контекстуальной релевантности.

Практические примеры

Сценарий: Оптимизация гостевого поста для правильной ассоциации (Link Selection)

  1. Ситуация: Вы публикуете гостевой пост на авторитетном блоге о путешествиях. Статья посвящена вашему новому приложению для поиска отелей. В статье есть ссылка на ваше приложение, а также ссылки на Википедию, сайт авиакомпании и исследование рынка.
  2. Действия согласно патенту:
    • Тематическое соответствие: Убедитесь, что текст статьи максимально сфокусирован на приложении, чтобы NLP-анализ определил его как основную тему.
    • Длина URL: Ссылка должна вести на глубокую страницу приложения (например, страницу загрузки или обзор функций), а не просто на главную страницу компании (фактор Address Length).
    • CTR Оптимизация: Разместите ссылку на приложение на видном месте с четким призывом к действию, чтобы стимулировать клики реальных читателей блога. Это повысит Click through rate для вашей ссылки по сравнению с другими ссылками в статье.
  3. Результат: Blog Processor анализирует статью, видит высокий CTR на вашей ссылке и хорошее тематическое соответствие. Система ассоциирует этот авторитетный пост именно с вашим приложением, усиливая его E-E-A-T.

Вопросы и ответы

Как Google определяет, какая ссылка является основной темой статьи, если в ней несколько исходящих ссылок?

Патент описывает несколько факторов (Link Selection Factors). Ключевыми являются: поведенческие сигналы (CTR – на какую ссылку чаще кликают читатели статьи), длина URL (предпочтение более длинным, специфическим URL перед короткими, как главная страница), популярность целевого документа (слишком популярные сайты могут игнорироваться) и тематическое соответствие (NLP-анализ текста статьи и целевой страницы).

Какое значение этот патент имеет для E-E-A-T?

Значение высокое. Патент описывает механизмы сбора и оценки сторонних мнений о документе/сайте. Это напрямую связано с оценкой репутации и авторитетности (Authority/Trust). Система оценивает, кто говорит (Author Rank), где говорит (Source Document Rank) и что говорит (Language signals), что является основой для оценки E-E-A-T на основе внешних сигналов.

Что делает отзыв или комментарий «качественным» согласно этому патенту?

Качество определяется комбинацией как минимум трех факторов. Наиболее важные: положительная обратная связь от других пользователей (User Feedback), высокий ранг автора комментария (Author Rank), свежесть (Timestamp), хорошее качество текста (грамотность, формальность языка) и публикация на авторитетном источнике (Source Document Rank).

Использует ли Google эти механизмы сегодня, учитывая, что Google Sidewiki закрыт?

Хотя механизм отображения (Sidewiki) устарел, базовые алгоритмы обработки и ранжирования UGC и сторонних упоминаний остаются актуальными. Эти же принципы могут применяться для ранжирования отзывов в Google Maps, Google Shopping, оценки упоминаний в блогах для E-E-A-T или даже для ранжирования сниппетов из форумов в основной выдаче.

Как этот патент влияет на стратегию линкбилдинга и гостевого постинга?

Он подчеркивает важность контекста и релевантности. Недостаточно просто получить ссылку. Нужно убедиться, что система ассоциирует статью именно с вашим сайтом. Для этого ваша ссылка должна быть контекстуально самой важной в статье и, в идеале, собирать наибольшее количество кликов (CTR) по сравнению с другими ссылками в материале.

Стоит ли фокусироваться на получении отзывов на собственном сайте или на внешних площадках?

Патент предполагает агрегацию из разных источников. Внешние площадки важны, так как Source Document Rank (авторитетность источника отзыва) является фактором ранжирования. Однако качественный UGC на собственном сайте также ценен, если он соответствует критериям качества (автор, язык, вовлеченность).

Как система определяет ранг автора комментария (Author Rank)?

Ранг автора определяется на основе нескольких сигналов: количества созданных им комментариев и совокупной обратной связи пользователей на его предыдущие комментарии. Также может учитываться история поведения пользователя (например, насколько его прошлые оценки совпадали с оценками большинства).

Влияет ли качество языка (грамматика, стиль) в отзывах на их ранжирование?

Да, напрямую. Патент упоминает Language signals как один из факторов ранжирования комментариев. Использование ненормативной лексики, сленга, плохое форматирование (например, все заглавными буквами) или грамматические ошибки могут понизить рейтинг комментария.

Как система обрабатывает отзывы о товаре, если я нахожусь на информационной странице об этом товаре?

Система использует маппинг между идентификатором документа (URL информационной страницы) и сущностью (товаром). Она определяет, о каком товаре идет речь на странице, а затем ищет отзывы, связанные с этой сущностью в базе данных Product Reviews, даже если эти отзывы не ссылаются напрямую на данную информационную страницу.

Учитывает ли система неявные сигналы поведения пользователей при оценке комментариев?

Да. Помимо явных рейтингов, система учитывает Implicit user feedback. К таким сигналам относятся: время, которое пользователь потратил на просмотр комментария, и действия пользователя (например, запрос полного текста комментария). Это помогает оценить реальную полезность контента.

Похожие патенты

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию
Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.
  • US8321463B2
  • 2012-11-27
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google находит, извлекает и объединяет отзывы о товарах из интернета для создания агрегированных рейтингов и выявления частых фраз
Патент описывает систему Google для сбора отзывов о товарах из интернета. Система использует селективное сканирование сайтов, извлекает текст отзывов, рейтинги и авторов. Затем она автоматически определяет, к какому именно продукту относится отзыв (даже при разных названиях), и создает сводную информацию: общий рейтинг, распределение оценок и список часто упоминаемых фраз. Эта система позволяет пользователям искать информацию внутри отзывов о конкретном товаре.
  • US7962461B2
  • 2011-06-14
  • Краулинг

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
  • US8656266B2
  • 2014-02-18
  • Ссылки

  • EEAT и качество

  • Свежесть контента

Как Google реконструирует дискуссионные треды для обогащения поисковой выдачи
Google идентифицирует, когда результат поиска является частью дискуссионного треда (форума, блога). Система реконструирует весь тред, находя другие его страницы, даже если они не попали в выдачу. Затем извлекается агрегированная статистика (количество постов, авторов, дата последней активности), которая отображается в сниппете, предоставляя пользователю интегрированное представление дискуссии.
  • US8402021B2
  • 2013-03-19
  • SERP

  • Индексация

  • Краулинг

Как Google агрегирует новости, блоги и форумы в «Кластеры историй» и ранжирует комментарии на основе аккредитации и экспертности авторов
Патент Google, описывающий систему агрегации новостного контента из разных жанров (СМИ, блоги, форумы) в единые «Кластеры историй». Система ранжирует эти кластеры, учитывая жанр источника, и применяет сложный алгоритм для ранжирования комментариев, отдавая приоритет «аккредитованным» экспертам и лицам, непосредственно упомянутым в новостях.
  • US9760629B1
  • 2017-09-12
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Популярные патенты

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
  • US8583675B1
  • 2013-11-12
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
  • US8195654B1
  • 2012-06-05
  • Поведенческие сигналы

  • SERP

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

seohardcore