SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени

DISCOVERING ENTITY ACTIONS FOR AN ENTITY GRAPH (Обнаружение действий сущностей для графа сущностей)
  • US9235653B2
  • Google LLC
  • 2013-06-26
  • 2016-01-12
  • Knowledge Graph
  • Свежесть контента
  • Семантика и интент
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.

Описание

Какую проблему решает

Патент решает проблему несвоевременности и неполноты данных в Графе Знаний (Graph-based Data Store, например, Google Knowledge Graph). Традиционные методы обновления графа могут пропускать недавние (recent) или эфемерные (ephemeral) события (например, запуск продукта, свадьба знаменитости, корпоративное слияние). Изобретение обеспечивает механизм для быстрого обнаружения и интеграции актуальной информации.

Что запатентовано

Запатентована система для автоматического обнаружения действий (actions) или событий, связанных с сущностями. Механизм использует анализ журналов поисковых запросов (Search Records) для выявления аномального роста интереса (всплеска) к сущности. Этот всплеск служит триггером для анализа свежего контента, опубликованного в соответствующий период времени, с целью извлечения новых фактов о сущности.

Как это работает

Ключевой механизм работы системы (Action Discovery Engine):

  • Мониторинг интереса: Анализируются логи запросов для выявления периода времени (Window of Interest), когда количество запросов о сущности превысило пороговое значение (всплеск).
  • Выборка контента: Отбираются документы (новости, блоги), релевантные сущности и опубликованные вблизи этого временного окна.
  • Синтактико-семантический анализ: Syntactic-Semantic Parsing Engine анализирует контент с помощью NLP для извлечения фактов в формате Субъект-Глагол-Объект (SVO Triples).
  • Нормализация и Кластеризация: Извлеченные глаголы могут нормализовываться к предопределенным «целевым действиям» (Target Actions). Триплеты кластеризуются для выявления консенсуса между источниками.
  • Валидация и Применение: Если кластер достигает порогового значения (threshold cluster score), система генерирует факт. Он используется для обновления Графа Знаний или для генерации текстового описания в поисковой выдаче (например, в блоке «Недавно»).

Актуальность для SEO

Высокая. Оперативное обновление Графа Знаний и предоставление самой свежей информации о сущностях является критически важной задачей для Google в 2025 году. Описанный механизм напрямую связан с концепцией QDF (Query Deserves Freshness) применительно к графу знаний и обеспечивает актуальность данных в Панелях Знаний и других SERP-функциях.

Важность для SEO

Влияние на SEO значительно (8/10). Патент критически важен для News SEO, управления репутацией (ORM) и продвижения сущностей (брендов/персон). Он демонстрирует конкретный механизм, как Google валидирует и принимает новые факты во время пиков общественного интереса. Это подчеркивает важность скорости публикации, точности информации и четкой структуры контента (SVO) для того, чтобы стать источником фактов для Графа Знаний.

Детальный разбор

Термины и определения

Action Discovery Engine (Механизм обнаружения действий)
Компонент системы, отвечающий за выявление недавних событий, связанных с сущностью, путем анализа всплесков запросов и соответствующего контента.
Cluster Score (Оценка кластера)
Метрика для определения значимости и консенсуса группы извлеченных триплетов. Если оценка превышает порог, генерируется факт.
Entity Graph / Graph-based Data Store (Граф сущностей / Графовое хранилище)
База знаний (например, Google Knowledge Graph), хранящая информацию в виде узлов (сущностей) и ребер (отношений).
Search Records (Журналы поисковых запросов)
Логи запросов, содержащие данные о времени и поисковых терминах. Используются для выявления трендов и всплесков интереса.
Spike (Всплеск)
Временное увеличение количества запросов о сущности, превышающее пороговое значение (например, выше среднего уровня).
SVO Triple (Subject-Verb-Object Triple) (Триплет Субъект-Глагол-Объект)
Структура данных, извлекаемая из текста для представления факта (Кто-Что сделал-С кем/Чем). Например, (Tom Cruise, Stars in, Oblivion).
Syntactic-Semantic Parsing Engine (Механизм синтактико-семантического анализа)
NLP-компонент, выполняющий анализ текста: разметку частей речи (POS tagging), анализ зависимостей (dependency parsing), извлечение именных групп и разрешение кореференции.
Target Action (Целевое действие)
Предопределенная категория для нормализации различных глаголов. Например, глаголы "женился", "вышла замуж" могут быть приведены к целевому действию "Брак".
Window of Interest (Окно интереса)
Период времени, в течение которого наблюдался всплеск поисковых запросов. Используется для фильтрации документов по дате публикации.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обновления графа знаний на основе анализа запросов и контента.

  1. Система определяет поисковый термин для первой сущности в графе знаний.
  2. Определяется период времени, когда количество запросов по этому термину достигло порогового значения (всплеск).
  3. Отбираются документы, релевантные термину и связанные с этим периодом времени.
  4. Документы анализируются для обнаружения действия. Анализ включает:
    • Идентификацию глаголов в контенте.
    • Генерацию триплета (Субъект, Глагол, Объект), где Субъект или Объект является первой сущностью.
  5. Определяется вторая сущность, связанная с действием (вторая часть триплета).
  6. Система предоставляет обновление для графа знаний на основе триплета (Первая сущность, Действие, Вторая сущность).

Claim 8 (Независимый пункт): Описывает схожий процесс, но с акцентом на верификацию факта (консенсус).

Ключевое отличие от Claim 1: система анализирует документы для определения действия, которое появляется в минимальном количестве документов (minimum number of the documents). Это указывает на необходимость подтверждения факта из нескольких источников.

Claim 15 (Зависимый от 8): Описывает механизм кластеризации для верификации.

  1. Система генерирует множество триплетов из разных документов.
  2. Триплеты кластеризуются в группы на основе глаголов (или их соответствия Target Actions).
  3. Определяется, достигает ли хотя бы одна группа пороговой оценки кластера (threshold cluster score).
  4. Обновление предоставляется только в том случае, если порог достигнут.

Claim 5 и 12 (Зависимые): Уточняют механизм нормализации.

Система проверяет, соответствует ли извлеченный глагол предопределенному Target Action. Если да, то Target Action используется в качестве глагола в триплете. Это позволяет системе группировать синонимичные события.

Claim 19 (Независимый пункт): Описывает использование механизма для обогащения поисковой выдачи (SERP Enhancement).

Процесс аналогичен Claim 8 (включая требование консенсуса), но финальным шагом является генерация текста, описывающего триплет, для включения в результаты поиска по запросу, связанному с сущностью (например, в блоке "Недавно").

Где и как применяется

Изобретение работает на стыке нескольких этапов поиска, используя данные из индекса и логи запросов для обновления Knowledge Graph и формирования выдачи.

CRAWLING и INDEXING – Сканирование и Индексирование
Система полагается на наличие проиндексированных и датированных документов (Crawled Documents). Syntactic-Semantic Parsing Engine применяется для анализа контента и извлечения признаков.

QUNDERSTANDING – Понимание Запросов (Анализ логов)
Система постоянно анализирует Search Records (логи запросов) для выявления статистически значимых всплесков (spikes) интереса к конкретным сущностям. Это анализ глобальных трендов, который служит триггером для Action Discovery Engine.

INDEXING (Обновление Графа Знаний)
Основная цель патента. Action Discovery Engine использует данные из логов и индекса контента для генерации новых фактов и предоставляет обновления для Graph-based Data Store.

METASEARCH – Метапоиск и Смешивание
Результаты работы алгоритма напрямую влияют на формирование SERP. Система может генерировать текст о недавних событиях для включения в поисковую выдачу (например, в Knowledge Panel), смешивая его с результатами из графа знаний и веб-индекса.

Входные данные:

  • Сущность (из Графа Знаний).
  • Журналы поисковых запросов (Search Records).
  • Корпус проиндексированных документов с временными метками (Crawled Documents).
  • Список предопределенных Target Actions (опционально).

Выходные данные:

  • Новые триплеты (факты) для обновления Графа Знаний.
  • Текстовые описания недавних событий для включения в SERP.
  • Возможно, новые сущности, ранее не известные графу (Claim 6).

На что влияет

  • Конкретные типы контента: Наибольшее влияние оказывается на новостной контент, блоги, пресс-релизы – источники, которые оперативно освещают события.
  • Специфические запросы: Запросы о сущностях (людях, компаниях, продуктах), особенно в контексте недавних событий или трендов.
  • Конкретные ниши: Развлечения, спорт, политика, бизнес (M&A, запуски продуктов) – тематики, где часто происходят значимые события, вызывающие всплеск интереса.

Когда применяется

  • Триггеры активации: Ключевой триггер — обнаружение всплеска (spike) в частоте запросов по терминам, связанным с сущностью. Объем запросов должен превысить определенный порог (threshold), который выше среднего объема за предыдущий и последующий периоды.
  • Временные рамки: Алгоритм фокусируется на документах, опубликованных в пределах Window of Interest (периода всплеска) или в непосредственной близости от него (temporal distance). Эта близость может варьироваться в зависимости от размера всплеска или времени, прошедшего с момента события.
  • Альтернативный режим: В патенте также упоминается, что система может работать в пакетном режиме для поиска недавних событий для набора популярных сущностей, используя фиксированный недавний период времени, даже без обнаружения явного всплеска.

Пошаговый алгоритм

Процесс обнаружения действий сущности:

  1. Генерация поисковых терминов: Система преобразует сущность (например, "Барак Обама") в набор поисковых терминов (например, "Барак Обама", "Президент Обама", опционально с добавлением глаголов: "Обама сделал").
  2. Обнаружение всплеска (Spike Detection): Анализ Search Records для идентификации периода времени (Window of Interest), когда частота запросов по этим терминам резко возросла и превысила порог.
  3. Выборка контента: Отбор документов из Crawled Documents, релевантных поисковым терминам и имеющих дату публикации, темпорально близкую к Window of Interest.
  4. Синтактико-семантический анализ: Обработка отобранных документов с помощью NLP:
    • Анализ текста на наличие глаголов, связанных с сущностью.
    • Выполнение разметки частей речи, анализа зависимостей и разрешения кореференции.
  5. Извлечение и нормализация триплетов:
    • Генерация SVO triples, где сущность является Субъектом или Объектом.
    • Попытка сопоставить глагол с предопределенным списком Target Actions. Если сопоставление успешно, глагол в триплете может быть заменен на Target Action.
  6. Кластеризация действий: Группировка извлеченных триплетов из разных документов на основе сходства глаголов (или Target Actions) и объектов для выявления консенсуса.
  7. Оценка и Валидация: Расчет Cluster Score для каждого кластера. Проверка, превышает ли оценка пороговое значение (threshold cluster score).
  8. Генерация факта: Если порог превышен, система генерирует факт. Это может быть новый триплет для графа или текстовое описание (например, предложение, наиболее центральное для кластера).
  9. Применение: Выбранный факт используется для обновления Entity Graph (автоматически, если Confidence Score высок) или для обогащения SERP текстовым описанием.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Ключевые): Search Records (журналы запросов). Анализируется частота и временное распределение запросов для обнаружения Spikes и определения Window of Interest.
  • Контентные факторы: Текст из Crawled Documents (веб-страницы, новости). Анализируются заголовки и основной текст для извлечения SVO triples.
  • Временные факторы: Даты публикации или обнаружения документов. Критически важны для сопоставления контента с периодом всплеска интереса.
  • Структурные данные (Граф Знаний): Существующие данные в Entity Graph используются для идентификации сущностей и интеграции новых фактов. Список Target Actions используется для нормализации глаголов.

Какие метрики используются и как они считаются

  • Порог всплеска (Spike Threshold): Метрика для определения аномальной активности. Рассчитывается как превышение среднего количества запросов за аналогичные периоды времени до и после всплеска.
  • Temporal Distance (Временная дистанция): Параметр, определяющий, насколько близко к Window of Interest должен быть опубликован документ. Может быть функцией от размера всплеска или времени, прошедшего с момента события.
  • Cluster Score (Оценка кластера): Метрика для валидации факта. Рассчитывается на основе количества триплетов в кластере (консенсус источников). Может также учитывать популярность связанных терминов в поиске во время Window of Interest.
  • Confidence Score (Оценка достоверности): Метрика для принятия решения об автоматическом обновлении графа. Может повышаться, если извлеченный глагол соответствует предопределенному Target Action.
  • Методы анализа текста (NLP): Используются стандартные NLP-методы (Part-of-Speech Tagging, Dependency Parsing, Coreference Resolution) для извлечения структурированных триплетов SVO из неструктурированного текста.

Выводы

  1. Всплеск запросов как триггер для извлечения знаний: Google активно использует поведение пользователей (поисковые тренды) как сигнал для активации механизмов извлечения знаний. Рост интереса к сущности инициирует поиск причин этого роста в свежем контенте.
  2. QDF для Графа Знаний: Патент описывает механизм реализации Query Deserves Freshness для Графа Знаний. Система специально ищет самую свежую информацию в период пикового интереса для обновления базы фактов.
  3. Важность NLP и структуры SVO: Система полагается на синтактико-семантический анализ для извлечения фактов в формате Субъект-Глагол-Объект. Четкость формулировок в контенте критически важна для корректного извлечения.
  4. Верификация через консенсус (Кластеризация): Google не полагается на один источник. Для подтверждения факта требуется, чтобы схожие триплеты были обнаружены в нескольких документах (Cluster Score должен превысить порог).
  5. Нормализация данных через Target Actions: Использование предопределенных Target Actions позволяет стандартизировать информацию из разных источников, использующих разные формулировки, что упрощает обновление Графа Знаний.
  6. Два типа вывода: Система может как обновлять основную структуру Knowledge Graph, так и оперативно добавлять информацию в SERP (например, блок "Недавно"), что особенно важно для эфемерных событий.

Практика

Best practices (это мы делаем)

  • Скорость реакции (News SEO): Для новостных сайтов и PR-служб критически важно публиковать информацию о событии как можно быстрее, чтобы попасть в Window of Interest, когда Google активно ищет новые факты.
  • Четкая структура контента (SVO): Оптимизируйте тексты (особенно заголовки и первые абзацы) для легкого извлечения SVO triples. Используйте прямой порядок слов, активный залог и четко указывайте действующие лица (Субъект) и объект действия. Пример: "Компания А приобрела Компанию Б", а не "Было достигнуто соглашение о приобретении".
  • Согласованность информации (Consensus Building): При запуске инфоповодов (пресс-релизы, новости компании) необходимо обеспечить широкое и согласованное освещение в авторитетных источниках. Чем больше качественных источников напишут об одном и том же факте, тем выше будет Cluster Score и вероятность попадания в Граф Знаний.
  • Точные временные метки: Убедитесь, что у всех публикаций есть четкие и точные даты публикации (в метаданных, Sitemap и видимой части страницы), так как система использует темпоральную близость для отбора контента.
  • Стимулирование поискового интереса: Маркетинговые и PR-активности, которые генерируют резкий всплеск брендовых запросов или запросов о персоне, могут служить триггером для активации этого механизма и обновления информации о сущности в Google.

Worst practices (это делать не надо)

  • Использование сложных и неоднозначных формулировок: Витиеватые предложения, пассивный залог, опущение главных членов предложения затрудняют работу Syntactic-Semantic Parsing Engine и снижают вероятность корректного извлечения SVO triple.
  • Запоздалая публикация: Публикация контента о событии спустя значительное время после того, как всплеск интереса прошел. Система фокусируется на документах, темпорально близких к Window of Interest.
  • Распространение противоречивой информации: Публикация разных версий события в разных источниках помешает системе сформировать кластер с высоким Cluster Score, и факт не будет принят.
  • Кликбейт без фактов: Генерация всплеска интереса с помощью кликбейтных заголовков при отсутствии четких фактов в тексте не приведет к обновлению Графа Знаний, так как система не сможет извлечь валидные триплеты.

Стратегическое значение

Патент подтверждает стратегию Google на построение поисковой выдачи на основе фактов и сущностей (Граф Знаний) и поддержание их максимальной актуальности. Он демонстрирует, как Google решает проблему свежести данных, используя поведенческие сигналы (всплеск интереса) и анализ свежего контента. Для SEO это означает, что управление информацией о сущности (бренде, персоне) требует не только статической оптимизации, но и динамической работы с инфоповодами, новостями и PR для оперативного обновления данных в графе знаний.

Практические примеры

Сценарий: Обновление информации о запуске продукта

  1. Событие: Компания Apple анонсирует новый iPhone.
  2. Всплеск интереса: Миллионы пользователей начинают искать "новый iPhone", "Apple анонс". Система фиксирует Spike для сущностей Apple и iPhone. Определяется Window of Interest.
  3. Действия SEO/PR команды: Немедленно публикуется пресс-релиз и рассылается ведущим СМИ. В заголовке четко указано: "Apple представила iPhone 16". В тексте используются четкие SVO.
  4. Обработка Google: Action Discovery Engine активируется и анализирует свежие статьи (TechCrunch, The Verge) и пресс-релиз.
  5. Извлечение и Кластеризация: Извлекаются триплеты: (Apple, представила, iPhone 16), (Apple, выпустила, iPhone 16). Глаголы мапятся на Target Action "Запуск продукта". Кластер достигает порога.
  6. Результат: В Панели Знаний Apple появляется блок "Недавно: Запуск iPhone 16". В Граф Знаний добавляется новая сущность "iPhone 16" и связь с Apple.

Вопросы и ответы

Как система определяет, что произошел "всплеск" (Spike) интереса?

Система анализирует Search Records и сравнивает текущий объем запросов о сущности с историческими данными. Всплеск фиксируется, если количество запросов превышает пороговое значение (threshold), которое обычно выше среднего объема запросов за периоды до и после события. Это указывает на аномальный интерес.

Что такое "Target Action" и почему это важно?

Target Action – это нормализованная категория действия, используемая для стандартизации данных. Например, глаголы "купила", "приобрела", "поглотила" могут быть смаплены на Target Action "Приобретение". Это позволяет системе агрегировать факты, описанные разными словами в разных источниках, и повышает достоверность для автоматического обновления Графа Знаний.

Как этот патент влияет на новостное SEO (News SEO)?

Он имеет прямое влияние. Новостные сайты являются основными источниками свежих фактов. Чтобы быть источником для Графа Знаний, новостной контент должен быть опубликован оперативно (во время Window of Interest) и иметь четкую структуру (SVO), позволяющую извлекать триплеты. Скорость и ясность становятся ключевыми факторами.

Как система проверяет достоверность извлеченных фактов?

Система использует механизм кластеризации для поиска консенсуса. Она извлекает триплеты из множества документов и группирует их по схожести. Факт считается достоверным, только если кластер достигает пороговой оценки (Cluster Score) или минимального количества упоминаний. Это требует подтверждения из разных источников.

Как лучше структурировать контент, чтобы он был оптимизирован под этот механизм извлечения?

Необходимо использовать четкие, фактологические утверждения в формате Субъект-Глагол-Объект (SVO), особенно в заголовках и первых абзацах. Избегайте сложных синтаксических конструкций и пассивного залога. Пример хорошей структуры: "[Бренд А] (Субъект) запускает (Глагол) [Новую Услугу] (Объект)".

Может ли этот механизм добавить в Граф Знаний совершенно новую сущность?

Да. Патент (Claim 6) описывает, что система может обнаруживать новые сущности (second entity), которые ранее не были идентифицированы в графе знаний, если они являются частью извлеченного и подтвержденного триплета (например, название нового продукта или имя супруга).

Что такое "Window of Interest" и какова его продолжительность?

Window of Interest – это период времени, когда наблюдался всплеск запросов. Патент не указывает фиксированную продолжительность. Упоминается, что временная дистанция (temporal distance) для отбора документов может зависеть от размера всплеска или времени, прошедшего с момента события (чем старше событие, тем шире может быть окно).

Влияет ли этот патент на управление репутацией (ORM/SERM)?

Да, критически. Во время репутационного кризиса происходит всплеск запросов. Система будет активно искать факты о происходящем. Если в этот момент доминируют негативные источники с четкими SVO, эта информация быстро попадет в SERP (блок "Недавно") и Граф Знаний. Необходимо оперативно реагировать и публиковать официальную позицию с четкой структурой.

Что происходит, если система извлекает противоречивые факты из разных источников?

Механизм кластеризации направлен на разрешение таких конфликтов. Система выберет тот факт, чей кластер имеет наивысший Cluster Score (т.е. поддерживается наибольшим количеством источников). Факты с недостаточной поддержкой или противоречащие консенсусу будут отброшены.

Обязательно ли должен произойти всплеск запросов для активации этого механизма?

Всплеск является основным триггером, описанным в патенте. Однако упоминается, что система может также работать в режиме поиска недавних событий для популярных сущностей (в рамках запланированного процесса), используя просто недавний период времени, даже если явного аномального всплеска не было зафиксировано.

Похожие патенты

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google визуализирует эволюцию новостных сюжетов и классифицирует типы контента во времени
Google использует систему визуализации результатов поиска по историческим новостям. Она строит график, показывающий развитие новостных сюжетов (кластеров) во времени, включая их разделение и слияние. Система также использует различные маркеры для идентификации типов контента, таких как оригинальные статьи, дубликаты и редакционные материалы, в рамках каждого сюжета.
  • US8131702B1
  • 2012-03-06
Как Google оценивает качество новостных источников, кластеризует статьи и ранжирует новости на основе свежести, оригинальности и авторитетности
Детальный разбор основополагающего патента Google News. Система оценивает источники по скорости реакции на события, оригинальности контента и авторитетности (ссылки, просмотры). Новостные сюжеты (кластеры) ранжируются по свежести и качеству источников. Статьи внутри сюжета сортируются с использованием «Модифицированной оценки свежести», которая дает значительное преимущество авторитетным изданиям.
  • US7568148B1
  • 2009-07-28
  • Свежесть контента

  • EEAT и качество

Как Google выявляет всплески поискового интереса и определяет тренды в реальном времени
Google использует систему для определения "Исключительных запросов" — тем, интерес к которым резко и неожиданно возрастает в короткий промежуток времени (менее 30 минут). Система сравнивает текущую частоту запроса с прогнозируемой моделью, основанной на исторических данных. Если фактическая активность значительно превышает прогноз, запрос помечается как трендовый. Это позволяет выявлять актуальные события, а не просто самые популярные запросы.
  • US8140562B1
  • 2012-03-20
  • Свежесть контента

  • Поведенческие сигналы

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Популярные патенты

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
  • US8041568B2
  • 2011-10-18
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google объединяет разные стратегии и поведенческие данные для генерации и выбора лучших альтернативных запросов
Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей (например, длительности кликов) и критериях разнообразия. Лучшие альтернативы предлагаются пользователю, часто с превью результатов, чтобы помочь уточнить поиск.
  • US7565345B2
  • 2009-07-21
  • Поведенческие сигналы

  • SERP

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента
Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.
  • US9098511B1
  • 2015-08-04
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах
Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.
  • US20180113919A1
  • 2018-04-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

seohardcore