SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует официальный сайт компании как эталон для проверки точности данных (NAP) в каталогах и Local SEO

USING AUTHORITY WEBSITE TO MEASURE ACCURACY OF BUSINESS INFORMATION (Использование авторитетного веб-сайта для измерения точности бизнес-информации)
  • US20130282699A1
  • Google LLC
  • 2011-01-14
  • 2013-10-24
  • EEAT и качество
  • Local SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google автоматически верифицирует данные о локальных компаниях (адрес, телефон, часы работы), сравнивая информацию из сторонних каталогов и агрегаторов с данными, извлеченными с официального сайта компании («Authority Website»). Официальный сайт считается эталоном истины. На основе сравнения рассчитывается «Оценка Точности» (Accuracy Score) для каждого источника. Финальный профиль компании формируется с приоритетом данных с официального сайта и источников с высокой оценкой точности.

Описание

Какую проблему решает

Патент решает проблему недостоверности, противоречивости и нестабильного качества данных о локальных компаниях (NAP – Name, Address, Phone; часы работы), получаемых из различных агрегированных источников (Aggregate Information Sources), таких как бизнес-каталоги и сайты отзывов. Изобретение предлагает автоматизированный метод верификации этой информации, заменяя субъективное доверие к источникам объективным измерением точности.

Что запатентовано

Запатентована система и метод для измерения точности бизнес-информации путем использования официального сайта компании (Authority Website) в качестве эталона достоверности (ground truth). Система автоматически извлекает данные с официального сайта и сравнивает их с данными от сторонних агрегаторов. На основе этого сравнения вычисляется Accuracy Score для каждой пары «компания-источник», что позволяет системе консолидировать наиболее точную информацию.

Как это работает

Система (Business Information Management Server) работает следующим образом:

  • Сбор данных: Информация о компании собирается из множества Aggregate Information Sources.
  • Определение эталона: Идентифицируется Authority Website компании.
  • Извлечение данных: Система сканирует ключевые страницы сайта (например, «Контакты») и автоматически извлекает NAP-данные.
  • Сравнение и Оценка: Данные от каждого агрегатора сравниваются с эталоном. Совпадение повышает Accuracy Score источника для данной компании, несовпадение — понижает.
  • Расчет репутации: Агрегируя Accuracy Scores, система рассчитывает общую оценку надежности источника (Reputation Score или Trustworthy Score).
  • Консолидация: Формируется итоговый профиль компании. Данные с официального сайта имеют приоритет. Для остальных атрибутов выбираются данные из источника с наивысшим Accuracy Score.

Актуальность для SEO

Высокая. Точность и согласованность данных (NAP Consistency) являются фундаментальными аспектами локального поиска (Google Maps, Local Pack) и управления сущностями (Entity Management). Описанный механизм валидации сущностей и разрешения конфликтов данных (Data Fusion) критически важен для поддержания качества и достоверности данных в экосистеме Google.

Важность для SEO

Патент имеет критическое значение для Local SEO. Он подтверждает, что официальный сайт компании является главным источником истины для Google при верификации NAP-данных. Несоответствие информации на сайте и в каталогах может привести к снижению доверия системы к профилю компании. Это подчеркивает важность наличия точной и доступной для сканирования (crawlable) контактной информации на официальном сайте.

Детальный разбор

Термины и определения

Accuracy Score (Оценка точности)
Метрика, измеряющая точность информации о конкретной компании, предоставленной конкретным агрегатором. Рассчитывается путем сравнения с данными Authority Website. Может быть значением от 0 до 1.
Aggregate Information Source (Агрегированный источник информации)
Сторонние ресурсы, предоставляющие данные о различных компаниях (например, бизнес-каталоги, сайты отзывов, онлайн-карты).
Authority Page (Авторитетная страница)
Страница на Authority Website, содержащая ключевую информацию о компании (например, главная страница или страница «Контакты»/«Contact Us»).
Authority Website (Авторитетный веб-сайт)
Официальный веб-сайт компании (также home website). Предполагается, что он контролируется самой компанией и содержит наиболее точные данные. Используется как эталон (ground truth).
Business Information Management Server (Сервер управления бизнес-информацией)
Центральная система, выполняющая сбор, извлечение, сравнение и консолидацию данных о компаниях.
Information Extraction Module (Модуль извлечения информации)
Компонент, который анализирует Authority Pages для извлечения структурированных данных (адресов, телефонов). Использует такие технологии, как сопоставление с образцом (pattern matching), распознавание тегов (tag recognition) и обработка естественного языка (NLP).
Reputation Score / Trustworthy Score (Оценка репутации / Оценка достоверности)
Метрика, измеряющая общую надежность Aggregate Information Source. Рассчитывается на основе агрегированных Accuracy Scores этого источника по всем компаниям. (В Claim 6 используется термин Reputation Score).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации точной бизнес-информации.

  1. Система получает бизнес-информацию о множестве компаний от одного или нескольких Aggregate Information Sources.
  2. Система получает Authority Page с Authority Website одной из этих компаний.
  3. Происходит сравнение данных об этой компании, полученных от агрегаторов, с информацией, извлеченной из Authority Page.
  4. На основе результата сравнения генерируется Accuracy Score для комбинации «компания + агрегатор».
  5. На основе этого Accuracy Score генерируется коллекция точной бизнес-информации для данной компании.

Claim 2 (Зависимый от 1): Уточняет процесс консолидации.

Система сравнивает Accuracy Scores разных агрегаторов для данной компании и включает в коллекцию информацию на основе результатов этого сравнения (т.е. предпочтение отдается источнику с более высоким баллом).

Claim 3 (Зависимый от 1): Уточняет использование эталонных данных.

Информация, извлеченная непосредственно с Authority Page, также включается в коллекцию точной информации. Это подтверждает приоритет официального сайта.

Claim 5 (Зависимый от 1): Детализирует расчет Accuracy Score.

  1. Если данные от агрегатора совпадают с информацией с Authority Page, генерируется высокий Accuracy Score.
  2. Если данные не совпадают, генерируется низкий Accuracy Score.

Claim 6 (Зависимый от 1): Описывает расчет репутации источника и его использование в особых случаях (Fallback).

  1. Система генерирует Reputation Score для агрегатора на основе его Accuracy Scores.
  2. Этот Reputation Score используется для генерации коллекции точной информации для компании, у которой отсутствует Authority Website.

Где и как применяется

Патент описывает инфраструктурные процессы, критичные для управления данными о локальных сущностях (Local Entity Management) и обеспечения работы локального поиска (Google Maps, Local Pack).

CRAWLING – Сканирование и Сбор данных
Система активно сканирует как Aggregate Information Sources (каталоги, сайты отзывов), так и идентифицированные Authority Websites (официальные сайты компаний) для сбора исходных данных.

INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Происходит обработка и консолидация данных:

  • Извлечение признаков (Feature Extraction): Information Extraction Module анализирует контент Authority Pages для извлечения структурированных NAP-данных, используя NLP и распознавание паттернов.
  • Валидация и Оценка Качества: Происходит сравнение данных из разных источников с эталоном, расчет Accuracy Scores и Reputation Scores.
  • Консолидация данных (Data Fusion): Формирование эталонной коллекции данных о компании (консолидация сущности), которая сохраняется в базе данных (Data Store).

METASEARCH – Метапоиск и Смешивание / RANKING – Ранжирование
Консолидированные и верифицированные данные используются поисковой системой для ответов на локальные запросы и отображения информации в Knowledge Panels и Local Pack. Точность данных (NAP Consistency) является фактором доверия в локальном поиске.

Входные данные:

  • Структурированные данные о компаниях от Aggregate Information Sources.
  • URL и неструктурированный контент (HTML) страниц Authority Websites.

Выходные данные:

  • Accuracy Scores для пар компания-источник.
  • Reputation Scores (Trustworthy Scores) для источников.
  • Консолидированная коллекция точных данных о компании.

На что влияет

  • Конкретные типы контента и ниши: Влияет на все компании с физическими адресами (Local Business Entities) — магазины, рестораны, услуги, медицинские учреждения. Критично для всех ниш в локальном поиске.
  • Специфические запросы: Влияет на локальные запросы (например, «ресторан рядом»), гео-зависимые запросы и брендовые запросы, связанные с поиском контактов компании.

Когда применяется

  • Временные рамки и частота: Процесс выполняется периодически в рамках конвейера обработки локальных данных. Верификация происходит при обнаружении новых данных от агрегаторов или при пересканировании официальных сайтов.
  • Триггеры активации: Поступление новых или измененных данных; обнаружение противоречий (неконсистентности) между данными из разных источников.
  • Исключения: Если Authority Website не найден или не может быть определен, система полагается на Reputation Scores агрегаторов (Claim 6).

Пошаговый алгоритм

  1. Сбор данных от агрегаторов: Система получает бизнес-информацию (адрес, телефон, часы работы) о компании из различных Aggregate Information Sources (Источник А, Источник Б).
  2. Идентификация и сканирование авторитетного сайта: Для компании определяется её Authority Website. Система сканирует ключевые Authority Pages (например, главную, «Контакты»).
  3. Извлечение эталонных данных: Information Extraction Module извлекает NAP-данные с Authority Pages.
  4. Нормализация данных: Данные от агрегаторов и с сайта приводятся к единому формату (например, удаление форматирования из номеров телефонов, стандартизация адресов).
  5. Сравнение: Система сопоставляет нормализованные данные от каждого агрегатора с эталонными данными.
  6. Расчет Accuracy Score: Для каждой пары «компания-источник» генерируется Accuracy Score. При совпадении оценка повышается, при несовпадении – понижается.
  7. Расчет Reputation Score (Фоновый процесс): Система агрегирует Accuracy Scores по всем компаниям для каждого источника, чтобы вычислить общий Reputation Score этого источника.
  8. Консолидация данных: Формирование единой коллекции точной информации. Применяется иерархия доверия:
    • Приоритет 1: Данные, извлеченные с Authority Website (например, телефон, адрес).
    • Приоритет 2: Для атрибутов, не найденных на сайте (например, часы работы), выбираются данные от источника с наивысшим Accuracy Score для этой компании.
    • Приоритет 3 (Fallback): Если Authority Website не найден, выбираются данные от источника с наивысшим общим Reputation Score.
  9. Вывод данных: Предоставление консолидированной коллекции в ответ на запросы пользователей.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст на Authority Pages. Система анализирует контент (особенно на страницах типа «Contact Us» и главной странице) для извлечения контактных данных.
  • Структурные факторы (Внешние данные): Информация, предоставляемая Aggregate Information Sources: названия компаний (business names), телефонные номера (telephone numbers), адреса (addresses), часы работы (business hours).
  • Технические факторы: URL официального сайта (Authority Website), необходимый для доступа к эталонным данным.

Какие метрики используются и как они считаются

  • Accuracy Score: Рассчитывается для пары «Сущность-Источник». Основан на сравнении нормализованных данных от агрегатора и с официального сайта. Патент указывает, что это может быть непрерывное значение от 0 до 1. Логика расчета: совпадение ведет к высокому баллу, несовпадение – к низкому.
  • Reputation Score (Trustworthy Score): Рассчитывается для Источника в целом. Является агрегацией (например, среднее, медиана) всех Accuracy Scores, полученных этим источником по всем проверенным компаниям.
  • Методы анализа текста: Для извлечения данных из Authority Pages используются pattern matching (сопоставление с образцом), tag recognition (распознавание тегов) и/или natural language processing (NLP).
  • Нормализация: Приведение данных к единому формату перед сравнением (например, удаление символов форматирования из телефонов, приведение регистра символов в адресах).

Выводы

  1. Официальный сайт как Ground Truth (Источник Истины): Патент четко устанавливает, что Google рассматривает официальный сайт компании (Authority Website) как эталон для валидации локальных данных (NAP). Он имеет приоритет над любыми сторонними каталогами и агрегаторами.
  2. Автоматическая оценка надежности каталогов: Google не доверяет всем агрегаторам одинаково. Система автоматически и непрерывно оценивает точность каждого источника через Accuracy Score (для конкретной компании) и общую надежность через Reputation Score (в целом).
  3. Иерархия доверия при консолидации данных (Data Fusion): Установлена четкая иерархия при разрешении конфликтов: Приоритет отдается данным с официального сайта, затем источнику с лучшим Accuracy Score для этой компании, и только в крайнем случае — источнику с лучшим общим Reputation Score.
  4. Критичность доступности и извлекаемости данных (Crawlability): Чтобы система могла использовать сайт как эталон, контактная информация должна быть доступна для автоматического извлечения (текстовый формат, понятная структура).
  5. Важность согласованности данных (NAP Consistency): Несоответствие между официальным сайтом и каталогами снижает Accuracy Score. Это подтверждает, что согласованность данных критически важна для доверия системы к информации о бизнесе.

Практика

Best practices (это мы делаем)

  • Абсолютная точность и актуальность данных на сайте: Обеспечение 100% точности NAP-данных (Название, Адрес, Телефон) и часов работы на вашем Authority Website является приоритетом №1. Это эталон, по которому Google валидирует все остальные источники.
  • Доступность контактной информации для сканирования: Контактная информация должна размещаться на видном месте (футер, страница «Контакты») и быть представлена в текстовом формате. Избегайте использования изображений для адреса или телефона, так как это затрудняет работу Information Extraction Module.
  • Внедрение микроразметки Schema.org: Используйте разметку LocalBusiness для однозначного указания адреса, телефона и часов работы. Это помогает системе корректно извлекать эталонные данные с сайта.
  • Консистентность NAP во всех источниках (NAP Consistency): Поддерживайте строгое соответствие между данными на официальном сайте, в Google Business Profile (GBP) и во всех ключевых Aggregate Information Sources (каталоги, карты, отзовики).
  • Наличие официального сайта: Для локального бизнеса критически важно иметь официальный сайт. Без него система не может верифицировать данные напрямую и вынуждена полагаться на репутацию сторонних источников.

Worst practices (это делать не надо)

  • Различия в данных между сайтом и каталогами: Наличие разных адресов или телефонов на сайте и в каталогах создает конфликт данных. Система может посчитать источники ненадежными или выбрать неверный вариант при консолидации.
  • Скрытие контактов или использование нетекстовых форматов: Размещение контактов в изображениях, сложных скриптах или iFrames мешает системе использовать сайт как эталон.
  • Устаревшая информация на официальном сайте: Если информация на сайте устарела, она будет использоваться как ложный эталон, что приведет к выбору неверных данных при консолидации и пессимизации источников с правильными данными.
  • Использование подменных номеров без четкой стратегии: Если основной номер на сайте отличается от номеров в публичных каталогах (например, для коллтрекинга), это может быть интерпретировано как несовпадение данных, что приведет к снижению Accuracy Score.

Стратегическое значение

Патент подтверждает фундаментальную роль официального сайта в экосистеме Local SEO и процессе управления сущностями (Entity Management). Сайт является ядром идентификации бизнеса для поисковых систем. Долгосрочная стратегия должна фокусироваться на поддержании идеальной точности данных на сайте и обеспечении максимальной консистентности этих данных во всех внешних авторитетных источниках. Это является необходимым условием для формирования сильной и однозначной сущности в Knowledge Graph.

Практические примеры

Сценарий: Разрешение конфликта данных ресторана

  1. Сбор данных: Google получает данные о ресторане «Ромашка».
    • Источник А (Каталог 1): телефон 555-1111, часы работы 9:00-21:00.
    • Источник Б (Каталог 2): телефон 555-2222, часы работы 10:00-22:00.
  2. Извлечение эталона: Система сканирует официальный сайт romashka.com (Authority Website) и извлекает телефон 555-1111. Часы работы извлечь не удалось.
  3. Сравнение и Оценка:
    • Источник А совпадает с эталоном (телефон). Accuracy Score высокий (например, 0.9).
    • Источник Б не совпадает с эталоном (телефон). Accuracy Score низкий (например, 0.3).
  4. Консолидация:
    • Телефон: Используется эталон 555-1111 (Приоритет 1, согласно Claim 3).
    • Часы работы: Система сравнивает Accuracy Score Источника А (0.9) и Источника Б (0.3). Выбираются данные из Источника А (9:00-21:00) (Приоритет 2, согласно Claim 2).
  5. Результат: В Google Maps будет отображаться телефон 555-1111 и часы работы 9:00-21:00.

Вопросы и ответы

Что Google считает «Авторитетным сайтом» (Authority Website) компании?

Патент определяет его как официальный веб-сайт (home website), который контролируется самой компанией и поэтому считается наиболее надежным источником информации о ней (ground truth). На практике это чаще всего сайт, указанный в Google Business Profile, или сайт, который система алгоритмически идентифицировала как официальное представительство.

Что произойдет, если информация на моем официальном сайте устарела или неверна?

Это критическая проблема. Система будет считать устаревшую информацию на вашем сайте эталоном. Это приведет к тому, что каталоги с правильной, новой информацией получат низкий Accuracy Score, а в консолидированном профиле (например, в Google Maps) будут отображаться устаревшие данные с вашего сайта. Всегда поддерживайте актуальность данных на сайте.

Как система извлекает адреса и телефоны с официального сайта?

Система использует Information Extraction Module, который сканирует ключевые страницы (главную, «Контакты»). Для извлечения применяются методы сопоставления с образцом (поиск форматов телефонных номеров), распознавание HTML-тегов и обработка естественного языка (NLP). Поэтому важно наличие контактов в виде crawlable текста, а не изображений.

В чем разница между «Accuracy Score» и «Reputation Score»?

Accuracy Score измеряет точность данных для одной конкретной компании от одного конкретного источника (например, насколько точны данные Ресторана А в Каталоге Б). Reputation Score (или Trustworthy Score) измеряет общую надежность источника (например, насколько надежен Каталог Б в целом, основываясь на данных всех компаний, которые он предоставляет).

Что делать, если у компании нет официального сайта?

В этом случае система не имеет эталона для расчета Accuracy Score. Согласно патенту (Claim 6), система будет полагаться на общие Reputation Scores агрегаторов. Она выберет данные из того источника, который исторически показал наибольшую точность по другим компаниям. Это делает присутствие бизнеса в поиске менее контролируемым.

Как этот патент влияет на стратегию работы с цитированием (Citations/Listings Management)?

Он подтверждает важность управления листингами, но смещает фокус с количества на качество и согласованность. Ключевая задача — обеспечить, чтобы данные во всех каталогах точно соответствовали данным на официальном сайте (эталону). Это помогает максимизировать Accuracy Scores и гарантировать корректное отображение информации.

Влияет ли этот патент на ранжирование в локальном поиске?

Патент напрямую описывает процесс верификации и консолидации данных, а не ранжирование. Однако точность и согласованность данных (NAP Consistency) являются известными факторами доверия в локальном SEO. Система, которая не может надежно верифицировать базовую информацию о бизнесе, с меньшей вероятностью будет высоко ранжировать его в Local Pack или на Картах.

Может ли использование микроразметки Schema.org помочь этому процессу?

Да, это настоятельно рекомендуется. Использование разметки LocalBusiness для адреса, телефона и часов работы значительно облегчает задачу Information Extraction Module. Это помогает системе однозначно и точно извлечь эталонные данные с вашего сайта, снижая риск ошибок при парсинге.

Как система обрабатывает разные форматы адресов и телефонных номеров?

В патенте упоминается, что система нормализует информацию перед сравнением. Это включает удаление символов форматирования (например, скобок, тире в телефонах) и приведение регистра символов к единому виду. Это позволяет системе распознавать совпадения, даже если форматирование отличается.

Что произойдет, если данные в Google Business Profile (GBP) отличаются от данных на сайте?

Это создает конфликт данных. Согласно логике патента, система стремится использовать сайт как эталон для проверки других источников (включая GBP). Если система уверена в данных сайта, она может предпочесть их и даже инициировать обновление информации в GBP. Частые несоответствия снижают общее доверие к профилю компании.

Похожие патенты

Как Google автоматически извлекает и анализирует отзывы о компаниях из интернета
Google использует систему для автоматического поиска и анализа отзывов о сущностях (например, компаниях) на веб-страницах. Система идентифицирует информацию о компании (название, адрес), извлекает текст рядом с ней и применяет анализ тональности (Sentiment Analysis), чтобы определить, является ли этот текст отзывом и какова его эмоциональная окраска.
  • US20150112981A1
  • 2015-04-23
  • Local SEO

  • Семантика и интент

  • EEAT и качество

Как Google использует авторитетность в веб-поиске для определения порядка ранжирования в Локальном поиске (Local Pack)
Google использует механизм объединения результатов из Универсального (веб) и Локального поиска. Система идентифицирует авторитетные бизнес-сайты в веб-выдаче и оценивает их по локальным критериям. Затем Локальный блок (Local Pack) переранжируется так, чтобы порядок результатов соответствовал их авторитетности в Универсальном поиске. Это подтверждает, что авторитетность сайта в вебе напрямую влияет на его позиции в Локальном поиске.
  • US8392394B1
  • 2013-03-05
  • Local SEO

  • EEAT и качество

  • SERP

Как Google использует отзывы пользователей для обнаружения спама и фейковых компаний в локальном поиске (Google Maps)
Google анализирует текст отзывов о компаниях для выявления спама в бизнес-листингах. Система ищет стоп-слова (например, "фейк", "не существует"), выявляет нерелевантные термины для категории бизнеса и сравнивает отзывы с базой известного спама. При превышении порога подозрительных сигналов листинг помечается как спам.
  • US8621623B1
  • 2013-12-31
  • Антиспам

  • Local SEO

  • EEAT и качество

Как Google использует упоминания бренда в вебе (Webscore) для определения популярности и ранжирования локальных бизнесов
Google рассчитывает метрику «Webscore» для локальных компаний, основанную на количестве упоминаний их названия в интернете. Эта оценка используется для определения «Популярности» (Prominence) бизнеса и влияет на ранжирование в локальном поиске, часто отдавая предпочтение известным компаниям перед теми, что просто находятся ближе. Алгоритм учитывает длину названия и корректирует оценки для сетевых бизнесов.
  • US8122013B1
  • 2012-02-21
  • Local SEO

  • EEAT и качество

  • SERP

Как Google определяет 'эталонное расстояние' для локальных бизнесов, чтобы сбалансировать релевантность и близость похожих мест
Google использует механизм для определения списка похожих локальных бизнесов. Система агрегирует несколько списков похожих мест, ранжированных по разным сигналам (например, по типу кухни, по отзывам). Затем вычисляется 'эталонное расстояние' на основе того, как далеко находятся наиболее похожие бизнесы. Это расстояние используется для корректировки финального списка: слишком далекие места понижаются, даже если они очень похожи по тематике.
  • US10025830B1
  • 2018-07-17
  • Local SEO

Популярные патенты

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2015-11-24
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

seohardcore