SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph

ANCHOR TEXT SUMMARIZATION FOR CORROBORATION (Суммаризация анкорного текста для подтверждения фактов)
  • US9208229B2
  • Google LLC
  • 2006-03-31
  • 2015-12-08
  • Knowledge Graph
  • Ссылки
  • EEAT и качество
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).

Описание

Какую проблему решает

Патент решает задачу обеспечения точности и достоверности фактов, собираемых из интернета для наполнения базы знаний (Fact Repository, аналог Knowledge Graph). Ключевая проблема — как эффективно идентифицировать независимые, авторитетные документы, которые действительно релевантны конкретной сущности (Object), чтобы использовать их для верификации (Corroboration) или опровержения собранных данных, минимизируя влияние противоречивой или ненадежной информации.

Что запатентовано

Запатентована система и метод использования анкорного текста (Anchor Text) входящих ссылок как ключевого сигнала для определения релевантности документа конкретной сущности. Система анализирует и суммаризирует (находит консенсус) все анкорные тексты, указывающие на документ. Если этот консенсусный текст совпадает с названием сущности (Object Name), документ признается авторитетным источником для проверки фактов об этой сущности.

Как это работает

Механизм работает на этапе обработки индекса (Janitors):

  • Агрегация Анкоров: Для документа собираются все анкорные тексты из входящих ссылок.
  • Суммаризация (Консенсус): Используя метод кластеризации (N-gram clustering), система определяет «центр масс» (Center of Mass) анкорных текстов, взвешивая их по частоте. Это позволяет найти наиболее репрезентативное описание.
  • Сравнение с Сущностью: Консенсусный анкорный текст сравнивается с именем сущности в базе знаний.
  • Валидация Документа: Если есть совпадение, система проверяет, что анкорный текст не является шумом («click here») и что имя сущности или анкорный текст действительно присутствует в самом документе (например, в заголовке <TITLE>).
  • Подтверждение Фактов: Если все проверки пройдены, документ используется для валидации (Corroboration) фактов об этой сущности.

Актуальность для SEO

Высокая. Построение, валидация и обновление Knowledge Graph является критически важной задачей для Google. Использование анкорного текста как сигнала авторитетности и тематичности остается фундаментальным принципом. Описанные механизмы, направленные на определение консенсуса и фильтрацию шума (включая защиту от манипуляций с анкорами), крайне актуальны для понимания E-E-A-T и того, как Google определяет авторитетные источники.

Важность для SEO

Патент имеет высокое стратегическое значение (85/100). Он детально описывает, как Google использует анкорные тексты не только для ранжирования, но и для определения фундаментальной темы страницы в контексте извлечения знаний (Information Extraction) и Entity SEO. Чтобы сайт был признан авторитетным источником для сущности, критически важно, чтобы консенсус входящих анкорных текстов четко соответствовал имени сущности и заголовку <TITLE> целевой страницы.

Детальный разбор

Термины и определения

Anchor Text (Анкорный текст)
Видимый пользователю текст ссылки, ведущей на целевой документ. Используется как ключевой сигнал для определения релевантности и темы целевого документа.
Center of Mass (Центр масс)
В контексте патента — это точка в n-мерном пространстве, представляющая собой взвешенный консенсус всех анкорных текстов, указывающих на документ. Отражает коллективное мнение веба о содержании документа.
Corroboration (Подтверждение, Корроборация)
Процесс проверки точности фактов, хранящихся в базе знаний, путем сравнения их с информацией из независимых авторитетных источников.
Corroboration Janitor (Агент подтверждения)
Программный модуль (Janitor), отвечающий за поиск релевантных документов и выполнение процесса подтверждения фактов.
Fact Repository (Репозиторий фактов)
База данных, хранящая извлеченные факты, организованные по сущностям (Objects). Аналог Google Knowledge Graph.
Importer (Импортер)
Модуль, который обрабатывает документы, извлекает из них факты и определяет, к каким сущностям они относятся.
Janitor (Агент очистки/обработки)
Программные модули, которые обрабатывают факты после извлечения: нормализуют данные, удаляют дубликаты, объединяют сущности и подтверждают факты.
Known Noise (Известный шум)
Анкорные тексты, которые не несут семантической нагрузки о целевом документе (например, «click here», «more info»).
N-gram Clustering (N-граммная кластеризация)
Метод, используемый для группировки анкорных текстов на основе их сходства в n-мерном пространстве для определения Center of Mass.
Object (Объект, Сущность)
Представление реальной сущности в Fact Repository. Состоит из набора фактов, связанных общим идентификатором (Object ID) и имеющих название (Object Name).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод подтверждения набора фактов в репозитории.

  1. Система идентифицирует набор фактов, связанных с объектом (сущностью), у которого есть имя. Факты были извлечены ранее из нескольких документов.
  2. Система получает новый (первый) документ и ссылку на него. Ссылка содержит видимый пользователю анкорный текст (user-viewable anchor text), извлеченный из второго документа.
  3. Определяется, соответствует ли анкорный текст имени сущности.
  4. Определяется, появляется ли имя сущности И/ИЛИ анкорный текст в первом документе.
  5. Если (3) и (4) истинны, первый документ используется для подтверждения (corroborating) набора фактов.
  6. Подтверждение включает сравнение фактов из документа с существующим набором фактов и обновление набора (добавление новых фактов или корректировка статуса существующих).

Ядро изобретения — это использование комбинации двух сигналов для определения пригодности документа к верификации фактов: совпадение входящего анкорного текста с названием сущности И присутствие этого названия/текста в самом документе.

Claim 2 и 4 (Зависимые): Уточняют обработку множественных анкоров.

Если получено множество кандидатов в анкорные тексты, система сначала выбирает один репрезентативный анкорный текст. Этот выбор осуществляется с помощью N-gram clustering (Claim 4).

Claims 7 и 9 (Зависимые): Уточняют место проверки наличия имени/анкора в документе (пункт 4 из Claim 1).

Если первый документ является HTML, анализ включает поиск имени сущности (Claim 7) или анкорного текста (Claim 9) в заголовке (header) HTML-документа (например, в теге Title).

Claim 11 (Зависимый): Описывает фильтрацию шума.

Анализ анкорного текста включает сравнение его со списком известного шумового текста (known noise text), чтобы определить, содержит ли документ релевантные данные.

Где и как применяется

Изобретение применяется в инфраструктуре построения и валидации базы знаний (Knowledge Graph).

CRAWLING – Сканирование и Сбор данных
На этом этапе собираются данные, необходимые для работы алгоритма: контент документов и граф ссылок, включая анкорные тексты.

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента.

  • Information Extraction: Importers извлекают факты из документов и создают Objects (сущности).
  • Data Processing/Validation: Corroboration Janitor запускается для валидации этих фактов. Он использует данные веб-графа (анкорные тексты) и контент проиндексированных страниц для поиска авторитетных источников (corroborating documents).

Алгоритм не влияет напрямую на ранжирование в реальном времени (RANKING), но повышает качество данных в Fact Repository, которые затем используются системами ранжирования и для генерации SERP features.

Входные данные:

  • Сущность (Object) и её имя (Name).
  • URL и содержимое потенциального подтверждающего документа.
  • Набор всех анкорных текстов, указывающих на этот URL.
  • Список известного шума (Known Noise).

Выходные данные:

  • Обновленный статус фактов сущности (например, повышение показателя уверенности для подтвержденных фактов).
  • Потенциально новые факты, извлеченные из подтверждающего документа.

На что влияет

  • Конкретные типы контента: Наибольшее влияние оказывается на страницы, которые являются авторитетными источниками информации о конкретных сущностях (официальные сайты, авторитетные биографии, профили продуктов).
  • Специфические запросы: Влияет на точность ответов на фактоидные запросы и качество информации, отображаемой в Панелях Знаний (Knowledge Panels).
  • Конкретные ниши или тематики: Критически важно для всех тематик, где важна точность фактов, включая YMYL, данные о компаниях, людях, продуктах и т.д.

Когда применяется

  • Условия работы: Алгоритм применяется в процессе построения или обновления Fact Repository, когда системе необходимо проверить точность извлеченных фактов для конкретной сущности.
  • Триггеры активации: Активируется, когда Corroboration Janitor ищет авторитетные источники для валидации фактов сущности.

Пошаговый алгоритм

Процесс определения авторитетного источника для подтверждения фактов сущности.

  1. Инициализация: Corroboration Janitor идентифицирует сущность и потенциальный подтверждающий документ.
  2. Агрегация анкорных текстов: Система собирает все анкорные тексты из входящих ссылок на этот документ и подсчитывает частоту каждого уникального анкора.
  3. Маппинг и Кластеризация (N-gram Clustering): Уникальные анкорные тексты маппируются в n-мерное пространство на основе их сходства.
  4. Расчет Центра Масс: Система вычисляет Center of Mass (консенсусное описание), где каждый анкорный текст взвешивается по его частоте.
  5. Выбор Репрезентативного Анкора: Выбирается анкорный текст, находящийся ближе всего к Center of Mass.
  6. Сравнение с Сущностью: Система сравнивает выбранный репрезентативный анкорный текст с именем сущности.
    • Если НЕТ совпадения: Процесс останавливается.
    • Если ЕСТЬ совпадение: Переход к валидации документа.
  7. Валидация (Фильтрация шума): Система проверяет, содержит ли выбранный анкорный текст известный шум (например, «click here»).
    • Если ДА: Возвращается индикация шума. Процесс останавливается.
  8. Валидация (Проверка контента): Система проверяет, присутствует ли имя сущности И/ИЛИ выбранный анкорный текст внутри самого документа (например, в HTML <TITLE> или заголовках).
    • Если НЕТ: Возвращается индикация шума (защита от манипуляций анкорами). Процесс останавливается.
    • Если ДА: Возвращается индикация валидных данных.
  9. Подтверждение Фактов (Corroboration): Документ используется для подтверждения фактов сущности. Факты в базе сравниваются с данными в документе, и их статус обновляется.

Какие данные и как использует

Данные на входе

Алгоритм использует следующие типы данных для определения авторитетности источника:

  • Ссылочные факторы (Критически важно): Входящие анкорные тексты (Anchor Text). Анализируется полный набор анкоров, указывающих на документ. Также может учитываться авторитетность источника ссылки (например, PageRank) при взвешивании.
  • Контентные факторы: Содержимое целевого документа, в частности, текст внутри HTML заголовков (Header) или тега <TITLE>. Используется для валидации релевантности документа.

Какие метрики используются и как они считаются

  • Частота анкорного текста (Frequency): Количество повторений конкретного анкорного текста. Используется как вес при расчете Center of Mass.
  • Сходство анкорных текстов (Similarity): Метрика, определяющая расстояние между анкорными текстами в n-мерном пространстве при кластеризации.
  • Center of Mass (Центр масс): Вычисляемая метрика, представляющая консенсус анкорных текстов. Рассчитывается как средневзвешенное положение агрегированных анкорных текстов в пространстве сходства.
  • Совпадение (Match Score): Метрика сравнения (может быть пороговой) между консенсусным анкорным текстом и именем сущности.

Выводы

  1. Анкорный текст как идентификатор сущности: Патент демонстрирует, что Google использует анкорный текст не просто как сигнал релевантности запросу, а как прямое указание на то, какой именно сущности (Entity/Object) посвящена страница.
  2. Важность консенсуса (Center of Mass): Google не полагается на отдельные анкоры. Система агрегирует все анкорные тексты, взвешивает их и использует сложные методы кластеризации (N-gram clustering) для определения «центра масс». Это позволяет найти наиболее репрезентативное описание страницы, основанное на коллективном мнении веба.
  3. Обязательная валидация на странице (Anti-Manipulation): Патент включает критически важный механизм защиты от манипуляций (например, Google bombing). Недостаточно иметь релевантные входящие анкоры; целевая страница должна подтвердить свою релевантность, упоминая имя сущности или консенсусный анкор в своем контенте (в частности, в <TITLE>).
  4. Фильтрация шума: Система активно игнорирует неинформативные анкорные тексты («click here»), что подчеркивает необходимость использования семантически значимых анкоров.
  5. Цель – найти канонический источник для фактов: Весь процесс направлен на идентификацию авторитетных документов в вебе для проверки фактов в Knowledge Graph. Статус «подтверждающего источника» (corroborating source) является сильным сигналом доверия.

Практика

Best practices (это мы делаем)

  • Стратегия анкорных текстов (Entity-Focused): При построении ссылочного профиля для ключевых страниц (бренды, продукты, авторы) стремитесь к тому, чтобы консенсус (Center of Mass) анкорных текстов точно соответствовал имени целевой сущности.
  • Согласованность сигналов (On-page и Off-page): Обеспечьте четкое соответствие между названием основной сущности на странице, тегом <TITLE> и анкорными текстами входящих ссылок. Согласно патенту, это соответствие является обязательным условием для того, чтобы страница использовалась Google для подтверждения фактов.
  • Стимулирование описательных анкоров: Привлекайте ссылки с четкими, семантически значимыми анкорами. Избегайте генерации большого количества ссылок с «шумовыми» анкорами, так как они фильтруются.
  • Мониторинг анкорного профиля: Регулярно анализируйте профиль входящих анкоров. Убедитесь, что «центр масс» вашего анкорного профиля соответствует целевой сущности, а не размыт побочными темами или спамными конструкциями.

Worst practices (это делать не надо)

  • Игнорирование профиля анкорных текстов: Отсутствие четкого консенсуса в анкорных текстах или доминирование нерелевантных анкоров приведет к тому, что система не сможет связать вашу страницу с целевой сущностью для целей проверки фактов.
  • Манипуляции с анкорами без подтверждения на странице: Использование агрессивных тактик построения ссылок с оптимизированными анкорами, если целевая страница не подтверждает эту релевантность (например, анкор и <TITLE> не совпадают). Страница не пройдет валидацию контента.
  • Использование шумовых анкоров: Активное использование анкоров типа «здесь», «сайт», «подробнее» (Known Noise) неэффективно для установления тематической авторитетности по этому алгоритму.

Стратегическое значение

Этот патент подтверждает стратегическую важность интеграции Off-Page и On-Page SEO в эпоху семантического поиска (Entity-Based Search). Он предоставляет четкий механизм того, как Google связывает внешние сигналы (анкорные тексты) с внутренними сигналами (<TITLE>/контент) для определения авторитетности источника в контексте Knowledge Graph. Для долгосрочной стратегии, особенно в области E-E-A-T, необходимо целенаправленно формировать ссылочный профиль так, чтобы он соответствовал модели Corroboration.

Практические примеры

Сценарий: Установление авторитетности сайта компании «Acme Corp»

  1. Цель: Сделать сайт Acme.com каноническим источником для сущности «Acme Corp» в Knowledge Graph.
  2. Анализ текущего состояния: SEO-специалист обнаруживает, что 40% анкоров – это «click here» (Шум), 30% – «лучшие виджеты» (Нерелевантно сущности), и только 30% – «Acme Corp».
  3. Действия (Off-Page): Запускается кампания по линкбилдингу и PR для увеличения доли ссылок с анкорным текстом «Acme Corp». Цель – сместить Center of Mass к точному названию компании.
  4. Действия (On-Page): Проверяется, что тег <TITLE> главной страницы четко указывает «Acme Corp». Это гарантирует прохождение валидации контента.
  5. Ожидаемый результат: При следующей итерации Corroboration Janitor, консенсус анкоров совпадет с именем сущности «Acme Corp», и сайт пройдет валидацию. Google начнет использовать Acme.com как эталонный источник для проверки фактов о компании.

Вопросы и ответы

Что такое «Center of Mass» (Центр масс) в контексте анкорных текстов?

Это консенсусное мнение веба о содержании страницы. Система анализирует все входящие анкорные тексты, группирует их по схожести (используя N-gram clustering) и взвешивает по частоте. Center of Mass — это наиболее репрезентативное описание, которое отражает как тематику, так и популярность различных вариантов анкоров. Система выбирает анкор, ближайший к этому центру.

Как этот патент влияет на стратегию выбора анкорных текстов при линкбилдинге?

Стратегия должна фокусироваться на формировании четкого консенсуса. Это означает приоритет анкорных текстов, которые точно соответствуют имени сущности, которую представляет страница (например, название бренда или продукта). Необходимо минимизировать долю шумовых анкоров («здесь», «ссылка»), так как они фильтруются системой.

Почему важна проверка контента страницы (например, Title), если входящие анкоры уже релевантны?

Это механизм защиты от манипуляций (например, Google Bombing). Система должна убедиться, что анкорный текст не вводит в заблуждение и что целевая страница действительно посвящена данной теме. Если имя сущности или консенсусный анкор отсутствуют на странице, она не будет использоваться для подтверждения фактов.

Как этот патент связан с E-E-A-T и Knowledge Graph?

Он напрямую связан. Патент описывает механизм, с помощью которого Google идентифицирует авторитетные источники (Authority в E-E-A-T) для валидации данных в Fact Repository (Knowledge Graph). Если ваш сайт признан «подтверждающим источником» (corroborating document) согласно этому патенту, это является мощным сигналом авторитетности и доверия (Trust) для систем Google.

На каком этапе поиска работает этот механизм?

Он работает на этапе индексирования и обработки данных (INDEXING). Это не алгоритм ранжирования в реальном времени, а механизм валидации данных в базе знаний, который выполняется агентами обработки (Janitors) после извлечения фактов импортерами (Importers).

Что важнее согласно патенту: разнообразие анкорных текстов или их частота?

Важен баланс, но частота играет роль веса в алгоритме Center of Mass. Цель состоит в том, чтобы наиболее частые и схожие между собой анкорные тексты точно соответствовали имени сущности. Редкие или сильно отличающиеся анкоры меньше влияют на итоговый результат кластеризации.

Если я изменю <TITLE> страницы, как это повлияет на работу этого алгоритма?

Это может иметь критическое влияние. Если новый <TITLE> перестанет совпадать с именем сущности или консенсусным анкорным текстом, страница может не пройти этап валидации контента. В результате она перестанет считаться авторитетным источником для подтверждения фактов об этой сущности.

Как система определяет, что является «шумом» в анкорных текстах?

Патент упоминает использование списка Known Noise (известного шума). Это предопределенные списки неинформативных фраз, таких как «click here», «more info», «visit website», которые система автоматически игнорирует при определении тематики целевого документа.

Использует ли система авторитетность ссылающихся сайтов при анализе анкоров?

В основном описании алгоритма кластеризации вес анкорного текста определяется его частотой. Однако в патенте (Description) упоминается возможность использования различных метрик для взвешивания, например, PageRank источника ссылки. Логично предположить, что анкоры с более авторитетных сайтов могут иметь больший вес.

Может ли этот механизм извлекать новые факты или только подтверждать существующие?

Основная цель, описанная в патенте (Claim 1), — это подтверждение (Corroboration) существующего набора фактов и обновление этого набора. Обновление включает как корректировку статуса существующих фактов, так и добавление (storing) пар атрибут-значение из подтверждающего документа в набор фактов сущности.

Похожие патенты

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует консенсус между сайтами для валидации ключевых слов и ранжирования изображений и видео
Google агрегирует описания (метки) изображения или видео со всех сайтов, где этот контент размещен. Чтобы метка была принята как надежная («Final Label») и использовалась для ранжирования, она должна подтверждаться несколькими независимыми группами источников (консенсус). Этот механизм двойной группировки (по домену и по смыслу) снижает влияние спама и значительно повышает релевантность поиска медиаконтента.
  • US8275771B1
  • 2012-09-25
  • Антиспам

  • Семантика и интент

  • Мультимедиа

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Популярные патенты

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)
Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
  • US8065316B1
  • 2011-11-22
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами
Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.
  • US8819004B1
  • 2014-08-26
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google решает, показывать ли прямой ответ, анализируя частоту использования естественного языка в исторических запросах о факте
Google анализирует исторические данные о том, как пользователи ищут конкретный факт. Если они часто используют естественный язык (например, «какая высота у Эйфелевой башни»), система считает, что пользователи действительно ищут этот факт. На основе этого рассчитывается «Оценка поиска фактов» (Fact-Seeking Score). Эта оценка используется как сигнал ранжирования, чтобы решить, нужно ли показывать прямой ответ (Factual Answer) и насколько высоко его разместить в результатах поиска.
  • US9396235B1
  • 2016-07-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

seohardcore