SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google проверяет, выбирает и подтверждает факты из интернета для своей базы знаний (Knowledge Graph)

CORROBORATING FACTS EXTRACTED FROM MULTIPLE SOURCES (Подтверждение фактов, извлеченных из нескольких источников)
  • US8682913B1
  • Google LLC
  • 2005-03-31
  • 2014-03-25
  • Knowledge Graph
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует многоэтапную систему для проверки фактов, извлеченных из интернета. Чтобы факт попал в базу знаний, он должен быть подтвержден несколькими независимыми источниками. Система оценивает распространенность атрибута и достоверность значения, учитывая авторитетность (например, PageRank) источников. Если источник доказал свою надежность, требования к другим его фактам снижаются или отменяются.

Описание

Какую проблему решает

Патент решает проблему обеспечения качества и достоверности данных в автоматизированной базе фактов (Fact Repository, аналог Knowledge Graph), которая наполняется путем извлечения информации из множества веб-источников. Он устраняет риск включения в базу ошибочных, устаревших, тривиальных или намеренно ложных фактов ("gaming"). Цель — создать механизм, который подтверждает (corroborates) факты, основываясь на консенсусе и авторитетности источников.

Что запатентовано

Запатентована система и метод подтверждения фактов, представленных в виде пар атрибут-значение (A-V pairs). Система использует двухуровневую модель проверки: сначала оценивается значимость атрибута на основе его распространенности в источниках (First Corroboration Requirement), а затем определяется наиболее достоверное значение для этого атрибута (Second Corroboration Requirement), учитывая количество и авторитетность (Page Importance Metric, например, PageRank) подтверждающих источников. Также запатентован механизм "бутстрэппинга" доверия: источники, предоставившие много подтвержденных фактов, признаются надежными, и требования к другим их фактам снижаются.

Как это работает

Система работает в несколько этапов:

  • Извлечение и группировка: Факты (A-V pairs) извлекаются из веб-документов и группируются по общему субъекту (common subject).
  • Проверка Атрибута (Уровень 1): Система подсчитывает, сколько независимых источников упоминают определенный атрибут (например, "Дата рождения"). Если количество превышает порог N, атрибут проходит дальше.
  • Проверка Значения (Уровень 2): Для прошедших атрибутов система анализирует значения. Для каждого значения подсчитывается количество источников и вычисляется взвешенная оценка авторитетности (page importance-weighted score).
  • Выбор победителя: Значение принимается, только если его оценка значительно (на predefined margin) превышает оценки конкурентных значений, обеспечивая четкий консенсус.
  • Бутстрэппинг доверия: Если источник уже предоставил много принятых фактов, он считается надежным, и его оставшиеся факты могут быть приняты по сниженным требованиям или автоматически.

Актуальность для SEO

Высокая. Описанные механизмы являются фундаментальными для построения и поддержания качества Knowledge Graph. В условиях роста объемов контента и дезинформации, системы автоматизированной проверки фактов на основе консенсуса и авторитетности источников критически важны для Google.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO, особенно в области Entity SEO и управления информацией в Knowledge Panel. Он демонстрирует, что Google не полагается на один источник (даже официальный сайт), а ищет подтверждение фактов в независимых и авторитетных источниках. Это подчеркивает критическую важность последовательного распространения точной информации об организации на авторитетных сторонних ресурсах.

Детальный разбор

Термины и определения

Accepted A-V pair (Принятая пара A-V)
Пара атрибут-значение, которая удовлетворила всем требованиям подтверждения и была принята в базу фактов.
Attribute-Value Pair (A-V Pair) (Пара Атрибут-Значение)
Структура данных для представления факта. Например, Атрибут="Столица", Значение="Варшава".
Common Subject (Общий субъект)
Сущность (человек, место, организация), к которой относятся извлеченные факты.
Corroboration Requirement (Требование подтверждения)
Критерии, которым должен удовлетворять факт для его принятия в базу. Включает First Corroboration Requirement (для атрибута) и Second Corroboration Requirement (для значения).
Fact Repository (База фактов)
Хранилище подтвержденной фактической информации (аналог Knowledge Graph). Сущности представлены как Objects.
Page Importance Metric (Метрика важности страницы)
Оценка авторитетности, популярности или репутации исходного документа. Патент явно упоминает PageRank в качестве примера.
Page importance-weighted score (Оценка, взвешенная по важности страницы)
Метрика для оценки достоверности значения. Рассчитывается как сумма или среднее значение Page Importance Metrics источников, поддерживающих данное значение.
Predefined Margin (Предопределенный отрыв)
Минимальная разница в оценках между лучшим значением и его конкурентами, необходимая для принятия лучшего значения. Обеспечивает "однобокий" (lopsided) консенсус.
Source (Источник)
Документ (например, веб-страница), из которого был извлечен факт.
Source Count Score (Оценка количества источников)
Количество независимых источников, подтверждающих атрибут (First Source Count Score) или конкретное значение (Second Source Count Score).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод подтверждения фактов.

  1. Система идентифицирует множество исходных документов, содержащих факты об общем субъекте.
  2. Из них извлекаются пары атрибут-значение (A-V pairs).
  3. Происходит подтверждение факта путем определения, соответствует ли конкретная пара A-V предопределенным требованиям.
  4. В ответ на подтверждение обновляется статус этой пары в Fact Repository.
  5. Ключевой аспект: Подтверждение включает в себя определение того, что атрибут пары соответствует First Corroboration Requirement, И что сама пара (атрибут+значение) соответствует Second Corroboration Requirement.

Это определяет двухуровневую систему проверки: сначала проверяется атрибут, затем значение.

Claim 7 (Независимый пункт): Описывает метод подтверждения с акцентом на механизм оценки.

  1. Идентифицируются источники и извлекаются A-V pairs.
  2. Процесс подтверждения включает:
    • Идентификацию кандидата в атрибуты.
    • Вычисление первой оценки (first score) на основе атрибута.
    • Определение, что первая оценка превышает первый порог.
    • Идентификацию кандидата в значения для этого атрибута.
    • Вычисление второй оценки (second score) на основе атрибута и значения.
    • Определение, что вторая оценка превышает вторые оценки других кандидатов в значения по крайней мере на predefined margin.
  3. В ответ на подтверждение обновляется статус соответствующей пары A-V в Fact Repository.

Этот пункт детализирует, как работают требования подтверждения: через сравнение оценок с порогами и обеспечение значительного отрыва победителя.

Где и как применяется

Изобретение применяется на этапе обработки данных для наполнения базы знаний (Knowledge Graph).

CRAWLING – Сканирование и Сбор данных
На этом этапе собираются исходные документы (Sources) и вычисляются их метрики авторитетности (Page Importance Metric, например, PageRank).

INDEXING – Индексирование и извлечение признаков
Основное применение патента. Это не стандартное индексирование веб-страниц, а процесс обработки данных для Fact Repository.

  1. Извлечение фактов: Импортер (Importer) извлекает A-V pairs из документов.
  2. Группировка: Факты группируются по общему субъекту (Common Subject).
  3. Подтверждение (Corroboration): Менеджер репозитория (Repository Manager) применяет описанный алгоритм для проверки фактов с использованием Source Count Scores и Page Importance Metrics.
  4. Сохранение: Подтвержденные факты (Accepted A-V pairs) сохраняются в Fact Repository и индексируются в Fact Index.

RANKING / METASEARCH
Подтвержденные факты из Fact Repository используются на этих этапах для формирования ответов на фактические запросы и отображения Knowledge Panels.

Входные данные:

  • Извлеченные A-V pairs.
  • Идентификаторы источников (URL).
  • Page Importance Metrics (например, PageRank) для каждого источника.

Выходные данные:

  • Набор подтвержденных фактов (Accepted A-V pairs) в Fact Repository.
  • Обновленный статус фактов (принято/отклонено).

На что влияет

  • Типы контента и форматы: Наибольшее влияние оказывается на структурированные и полуструктурированные данные, а также текст, из которого можно извлечь четкие фактические утверждения (пары атрибут-значение).
  • Специфические запросы: Влияет на информационные запросы, где пользователь ищет конкретный факт (например, "возраст Илона Маска", "столица Польши", "дата основания Google").
  • Конкретные ниши: Влияет на все тематики, представленные в Knowledge Graph, включая бренды, локальный бизнес, биографии, продукты, медиа. Критически важно для YMYL-тематик, где точность фактов имеет первостепенное значение.

Когда применяется

  • Временные рамки: Алгоритм применяется в процессе импорта новых фактов в Fact Repository или при периодической переоценке уже хранящихся фактов для поддержания их актуальности и точности.
  • Условия работы: Применяется, когда система обнаруживает факты об одном и том же субъекте в нескольких источниках, что делает возможным процесс подтверждения через сравнение.

Пошаговый алгоритм

Процесс подтверждения фактов можно разделить на три фазы.

Фаза 1: Первичное подтверждение (Initial Corroboration)

  1. Идентификация источников и субъекта: Определяются источники, содержащие факты об общем субъекте.
  2. Извлечение фактов: Извлекаются пары атрибут-значение (A-V pairs).
  3. Оценка Атрибутов (Уровень 1): Для каждого атрибута вычисляется First Source Count Score (количество независимых источников, упоминающих этот атрибут).
  4. Фильтрация Атрибутов: Отбираются атрибуты, чья оценка превышает первый порог (N).
  5. Оценка Значений (Уровень 2): Для отобранных атрибутов анализируются их значения. Для каждого значения вычисляется Second Source Count Score и Page importance-weighted score (на основе PageRank источников).
  6. Фильтрация Значений: Отбираются значения, чья Second Source Count Score превышает второй порог (M).
  7. Выбор Победителя: Среди отобранных значений выбирается то, чья Page importance-weighted score превышает оценки конкурентов на predefined margin (например, по формуле

Выводы

  1. Консенсус как основа истины: Google не полагается на один источник для определения фактов. Факт должен быть подтвержден несколькими независимыми источниками (Source Count Score), чтобы считаться достоверным.
  2. Авторитетность определяет вес голоса: При наличии противоречивых фактов система отдает предпочтение тому значению, которое поддерживается более авторитетными источниками. Page Importance Metric (PageRank) используется для взвешивания голосов.
  3. Требование явного консенсуса (Lopsided Consensus): Недостаточно просто иметь большинство голосов. Победившее значение должно значительно опережать конкурентов (predefined margin). Это защищает систему от принятия фактов в спорных или неоднозначных ситуациях.
  4. Двухуровневая проверка: Система сначала проверяет, достаточно ли распространен сам атрибут (Уровень 1), и только потом проверяет его значение (Уровень 2). Это позволяет отсеивать тривиальные или слишком редкие атрибуты.
  5. Бутстрэппинг доверия (Trust Bootstrapping): Доверие можно заслужить. Источники, которые постоянно предоставляют точные и подтвержденные факты, классифицируются как надежные. В дальнейшем факты из этих источников могут приниматься автоматически или по упрощенной процедуре. Это позволяет масштабировать сбор фактов.
  6. Защита от манипуляций ("Anti-Gaming"): Требование независимости источников и учет PageRank направлены на борьбу с попытками манипулирования базой фактов через создание множества низкокачественных страниц.

Практика

Best practices (это мы делаем)

Рекомендации направлены на оптимизацию сущностей (Entity SEO) и обеспечение корректного попадания информации в Knowledge Graph.

  • Обеспечение абсолютной консистентности ключевых фактов: Убедитесь, что основные данные о вашей сущности (Название, Адрес, Телефон (NAP), дата основания, ключевые лица и т.д.) абсолютно идентичны на всех платформах: официальный сайт, Google Business Profile, Wikipedia, крупные каталоги, социальные сети, отраслевые ресурсы. Это помогает максимизировать Source Count Scores.
  • Распространение фактов на авторитетных ресурсах (Digital PR): Активно работайте над тем, чтобы ключевые факты о компании (например, запуск нового продукта, смена CEO, финансовые показатели) публиковались на сайтах с высоким Page Importance Metric (PageRank). Пресс-релизы в авторитетных СМИ, интервью, авторитетные отраслевые обзоры имеют больший вес в подтверждении фактов.
  • Использование структурированных данных (Schema.org): Внедряйте разметку Schema.org на официальном сайте, чтобы четко определить пары атрибут-значение. Это облегчает извлечение фактов (работу Importer) и позиционирует ваш сайт как надежный источник данных о себе.
  • Мониторинг и исправление внешних данных: Регулярно отслеживайте информацию о вашей компании на сторонних сайтах (особенно авторитетных). При обнаружении ошибок стремитесь их исправить, так как неверные данные на авторитетном сайте могут перевесить правильные данные на менее авторитетных ресурсах.
  • Построение репутации источника: Если ваш сайт является источником уникальных фактических данных (например, отраслевой портал, база данных), сосредоточьтесь на качестве и точности. Достижение статуса "высоконадежного источника" позволит вашим фактам попадать в Knowledge Graph автоматически (Фаза 3 алгоритма).

Worst practices (это делать не надо)

  • Несогласованность данных: Наличие разных адресов, дат или названий на разных платформах затрудняет подтверждение фактов, так как система не может достичь явного консенсуса (predefined margin).
  • Манипуляция фактами через спам-сайты: Попытки создать искусственный консенсус путем публикации фактов на множестве низкокачественных сайтов или PBN неэффективны. Алгоритм учитывает Page Importance Metric (PageRank) и требует независимости источников.
  • Игнорирование ошибок в авторитетных источниках: Оставление без внимания неверной информации в Wikipedia, крупных СМИ или государственных реестрах может привести к тому, что Google примет именно эту информацию как факт из-за высокого авторитета источника.

Стратегическое значение

Патент подтверждает стратегию Google по построению семантической сети знаний, основанной на машинном анализе веба, но с сильным акцентом на авторитетность и консенсус. Для SEO это означает, что управление сущностью (Entity Management) выходит за рамки оптимизации собственного сайта. Digital PR и работа с внешними авторитетными площадками становятся не просто инструментом построения ссылок, а критически важным механизмом для валидации фактов о бизнесе в глазах Google.

Практические примеры

Сценарий: Подтверждение даты основания компании

Компания "Ромашка" хочет, чтобы в Knowledge Panel отображалась дата основания: 1995 год.

  1. Извлечение: Google извлекает атрибут "Дата основания" из 10 источников (Порог N пройден).
  2. Анализ значений и источников:
    • Значение "1995": 5 источников. Средний PageRank низкий (официальный сайт, 2 блога, 2 каталога).
    • Значение "2001": 3 источника. Средний PageRank высокий (статья в Forbes, отраслевой реестр, Wikipedia).
  3. Расчет оценок: Система рассчитывает Page importance-weighted score. Несмотря на меньшее количество источников, оценка для "2001" оказывается значительно выше из-за высокого PageRank источников.
  4. Результат: Google принимает "2001" как дату основания.
  5. Действия SEO-специалиста: Необходимо не просто добавить "1995" на большее количество сайтов, а исправить информацию в Forbes, Wikipedia и реестре, или добиться публикации корректной даты (1995) в источниках сопоставимого авторитета, чтобы изменить баланс взвешенных оценок.

Вопросы и ответы

Как Google определяет, какой факт верный, если источники противоречат друг другу?

Google использует систему взвешенных оценок. Он не просто считает количество источников, поддерживающих тот или иной факт, но и учитывает их авторитетность (Page Importance Metric, например, PageRank). Факт, поддержанный меньшим количеством, но более авторитетных источников, может победить. Кроме того, для принятия факта требуется, чтобы его оценка значительно превышала оценки конкурентов (predefined margin).

Имеет ли значение PageRank в 2025 году в контексте этого патента?

Да, имеет. Патент явно указывает PageRank как пример Page Importance Metric, используемой для взвешивания голосов источников при подтверждении фактов. Хотя внутренние механизмы Google эволюционировали, базовая концепция использования метрики авторитетности источника для оценки достоверности извлеченных из него фактов остается критически важной для Knowledge Graph.

Может ли информация с моего официального сайта попасть в Knowledge Panel, если ее нет больше нигде?

Это маловероятно для большинства сайтов. Патент описывает, что для подтверждения факта требуется несколько независимых источников (преодоление порогов N и M). Исключение составляют только сайты, которые уже классифицированы как "высоконадежные источники" (Фаза 3 алгоритма), например, крупные государственные порталы или мировые базы данных, чьи факты могут приниматься автоматически.

Что такое "бутстрэппинг доверия" (Trust Bootstrapping) в этом патенте?

Это механизм повышения доверия к источнику на основе его предыдущей точности. Если система приняла много фактов из определенного источника (превышен порог P), она начинает считать этот источник высоконадежным. После этого оставшиеся факты из данного источника могут приниматься автоматически, без стандартной процедуры подтверждения.

Как этот патент влияет на локальное SEO и Google Business Profile (GBP)?

Он напрямую влияет на данные, которые Google считает достоверными для локального бизнеса. GBP является одним из источников, но не единственным. Для подтверждения NAP (Name, Address, Phone), часов работы и других атрибутов Google ищет подтверждение в каталогах, СМИ, на картах и других сайтах. Несоответствия между GBP и другими авторитетными источниками могут привести к игнорированию данных из GBP.

Что важнее: количество сайтов, упоминающих факт, или их качество?

Важны оба аспекта. Необходимо преодолеть пороговые значения по количеству источников (пороги N и M), чтобы факт вообще рассматривался. Однако при разрешении конфликтов и финальном выборе значения решающую роль играет качество (авторитетность) источников, выраженное через Page importance-weighted score.

Как бороться с неверной информацией о моем бренде в Knowledge Panel?

Необходимо определить источник, который Google использует для этого факта. Затем нужно либо исправить информацию в этом источнике (если он авторитетный), либо обеспечить публикацию корректной информации на множестве других сайтов, чей суммарный авторитет значительно превысит авторитет источника ошибки, чтобы сместить консенсус.

Что означает требование "предопределенного отрыва" (predefined margin)?

Это означает, что Google ищет явный, "однобокий" консенсус. Если оценки двух разных значений близки (например, 51% против 49%), система, скорее всего, не примет ни одно из них, так как отрыв недостаточен. Это защищает базу фактов от включения спорной или неоднозначной информации.

Учитывает ли система синонимы при подсчете фактов?

Да, патент упоминает возможность идентификации синонимичных или эквивалентных атрибутов (например, "Дата рождения" и "День рождения") и значений. При расчете Source Count Scores они могут группироваться вместе, что подчеркивает важность семантического понимания данных.

Какова роль Schema.org в контексте этого патента?

Schema.org помогает системе на этапе извлечения фактов (Importer) более точно идентифицировать пары атрибут-значение на вашем сайте. Хотя сама по себе разметка не гарантирует принятие факта (так как требуется подтверждение из нескольких источников), она повышает вероятность того, что ваш сайт будет корректно учтен в процессе оценки консенсуса.

Похожие патенты

Как Google динамически выбирает и ранжирует факты об объектах в зависимости от запроса пользователя (Основы Knowledge Graph)
Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а динамически выбирает и ранжирует наиболее релевантные факты для каждого объекта, основываясь на конкретном запросе пользователя, а также метриках достоверности и важности.
  • US7774328B2
  • 2010-08-10
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google ранжирует сущности в Knowledge Graph, используя адаптивные веса для метрик вклада, известности и наград
Google использует систему для ранжирования сущностей, извлеченных из Knowledge Graph. Система рассчитывает четыре ключевые метрики: связанность, значимость типа, вклад и награды. Затем она применяет весовые коэффициенты, которые адаптируются в зависимости от типа сущности (например, «Фильм» или «Человек»), чтобы определить итоговый рейтинг. Это влияет на то, какие сущности будут показаны в каруселях, панелях знаний и других функциях поиска, связанных с сущностями.
  • US10235423B2
  • 2019-03-19
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Популярные патенты

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
  • US9165040B1
  • 2015-10-20
  • Ссылки

  • EEAT и качество

  • Антиспам

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.
  • US8612411B1
  • 2013-12-17
  • Ссылки

  • SERP

Как Google использует историю уточнений запросов для выявления и повышения авторитетных сайтов по широким запросам
Google анализирует последовательности запросов пользователей, чтобы понять, как они уточняют свои поисковые намерения. Если пользователи часто переходят от широкого или неточного запроса к более конкретному, который ведет на авторитетный ресурс, Google связывает этот ресурс с исходным широким запросом. Это позволяет показывать авторитетный сайт выше в выдаче, даже если пользователь сформулировал запрос неточно.
  • US8326826B1
  • 2012-12-04
  • Семантика и интент

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google персонализирует Sitelinks и сниппеты, используя интересы пользователя и тренды для прямого перехода на нужные страницы
Google использует механизм для динамического обогащения результатов поиска, особенно при навигационных запросах. Система анализирует сущности (продукты, категории) на целевом сайте и сравнивает их с известными интересами пользователя и текущими трендами. При совпадении Google отображает персонализированные прямые ссылки (например, динамические Sitelinks) на эти конкретные разделы или товары прямо в выдаче.
  • US20140188927A1
  • 2014-07-03
  • Персонализация

  • SERP

  • Ссылки

seohardcore