SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует Knowledge Graph для автодополнения фактов и проверки точности информации при создании контента

PROVIDING FACTUAL SUGGESTIONS WITHIN A DOCUMENT (Предоставление фактических подсказок в документе)
  • US20150324339A1
  • Google LLC
  • 2014-05-12
  • 2015-11-12
  • Knowledge Graph
  • Семантика и интент
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Система анализирует вводимый текст в редакторах (например, Google Docs или Gmail), распознает сущности и их атрибуты, автоматически запрашивает факты у поисковой системы (Knowledge Graph) и предлагает их для вставки. Также она способна проверять уже введенные факты на точность и предлагать исправления в реальном времени.

Описание

Какую проблему решает

Патент решает проблему повышения эффективности и точности при создании контента. Он позволяет пользователям включать в документ фактическую информацию (даты, цифры, имена), не покидая редактор для ручного поиска данных. Кроме того, система обеспечивает автоматическую проверку фактов (fact-checking), выявляя фактически неверные утверждения во вводимом тексте и предлагая исправления.

Что запатентовано

Запатентована система подсказок (Suggestion System), интегрированная с приложением для редактирования документов и поисковой системой (Search System). Система анализирует вводимый пользователем текст в реальном времени, идентифицирует Сущности (Entities) и их Атрибуты (Attributes). На основе этой информации она генерирует внутренний запрос к Search System (например, Knowledge Graph) для получения фактического значения атрибута (Result Value) и предоставляет его пользователю.

Как это работает

Механизм работает следующим образом:

  • Анализ ввода: Система получает Textual Input (вводимый текст) из редактора документов.
  • Триггер: Система определяет намерение указать факт. Это может происходить автоматически или явно, если пользователь вводит специальный Query Indicator (например, «??»).
  • Извлечение: Идентифицируется Сущность (например, «Углерод») и Атрибут (например, «атомная масса»).
  • Запрос к поиску: Формируется внутренний запрос и отправляется в Search System.
  • Обработка результата: Система получает Result Value (например, «12») вместе с Confidence Score (оценкой достоверности).
  • Действие: Система либо предлагает факт для вставки, либо, если пользователь уже ввел значение, проверяет его точность и предлагает исправление, если Confidence Score результата достаточно высок.

Актуальность для SEO

Высокая. Описанные механизмы лежат в основе функций интеллектуальной помощи при вводе текста, таких как Smart Compose в Gmail и Google Docs. Патент напрямую отражает возможности базовых технологий Google – Knowledge Graph и моделей NLP – в части понимания языка, извлечения фактов и оценки их достоверности.

Важность для SEO

(7/10). Патент не описывает алгоритмы ранжирования веб-страниц. Однако он имеет высокое стратегическое значение для SEO. Он детально демонстрирует, как Google извлекает факты (Entity-Attribute-Value), связывает атрибуты с сущностями и, что критически важно, использует оценки достоверности (Confidence Score) для верификации информации. Это подтверждает необходимость фокусироваться на фактической точности и четком структурировании данных для наполнения Knowledge Graph.

Детальный разбор

Термины и определения

Attribute (Атрибут)
Характеристика или свойство сущности (например, «столица» для сущности «Канада»).
Confidence Score (Оценка Достоверности)
Метрика, указывающая на уверенность системы в том, что Result Value является корректным значением для атрибута сущности.
Document Editing Application (Приложение для редактирования документов)
Программное обеспечение, используемое для создания контента (например, текстовый процессор, почтовый клиент, блог-платформа).
Entity (Сущность)
Тема дискурса; концепт или объект, отличимый от других. Часто соответствует узлу в графе знаний (Knowledge Graph).
Entity Text (Текст Сущности)
Текст во входных данных, который используется для идентификации сущности. Может включать местоимения.
Qualification / Restriction (Уточнение / Ограничение)
Текст, который ограничивает потенциальные значения атрибута (например, «скорость звука в воде»).
Query Indicator (Индикатор Запроса)
Один или несколько предопределенных символов (например, «??»), ввод которых явно запускает процесс поиска подсказки.
Result Value (Результирующее Значение)
Фактическое значение атрибута сущности, возвращаемое поисковой системой (например, «Оттава»).
Search System (Поисковая Система)
Источник фактических данных. Может быть интернет-поисковиком, базой данных или Knowledge Graph.
Suggestion System (Система Подсказок)
Компонент, который анализирует ввод, формирует запросы и предоставляет подсказки.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления фактических предложений во время редактирования документа.

  1. Получение текстового ввода (textual input) в приложении для редактирования.
  2. Идентификация сущности (Entity) на основе Entity Text.
  3. Идентификация атрибута (Attribute) на основе Attribute Text.
  4. Генерация запроса (Query), указывающего сущность и атрибут.
  5. Отправка запроса в Search System и получение Result Value.
  6. Предоставление Result Value пользователю как предложения для включения в документ.

Claim 2 и 3 (Зависимые): Детализируют механизм проверки фактов (Fact-Checking).

  1. Система идентифицирует первое значение (first value), введенное пользователем для атрибута.
  2. На основе Result Value (полученного из Search System) определяется, что у первого значения есть альтернативное значение (alternate value). Это означает, что введенное пользователем значение неверно или неоптимально.
  3. Пользователю предоставляется индикация альтернативного значения, или (Claim 3) система заменяет first value на Result Value.

Claim 4 и 5 (Зависимые): Описывают использование Confidence Score для контроля качества.

  • (Claim 4) Решение о показе Result Value принимается на основе его Confidence Score (например, при превышении порога).
  • (Claim 5) Если получено несколько Result Values, система генерирует список, упорядоченный по Confidence Score, и представляет его пользователю.

Claim 6 (Зависимый): Уточняет обработку местоимений (Coreference Resolution).

Если Entity Text является местоимением (pronoun), идентификация сущности происходит путем анализа другого текста в документе (контекста), к которому относится это местоимение.

Claim 7 (Зависимый): Описывает обработку уточнений.

Система идентифицирует Qualification (ограничение) в тексте и включает его в запрос к Search System для получения более точного факта.

Claim 8 (Независимый пункт): Описывает альтернативный режим работы, активируемый явным запросом пользователя.

Весь процесс (идентификация сущности/атрибута, генерация запроса и т.д.) выполняется только в ответ на обнаружение в тексте Query Indicator (например, "??").

Где и как применяется

Этот патент описывает технологию, применяемую на уровне приложений для создания контента (Google Docs, Gmail и т.д.), а не непосредственно в основном конвейере ранжирования веб-поиска. Однако он активно использует инфраструктуру и технологии поиска Google.

INDEXING – Индексирование (Knowledge Graph)
Search System, упомянутая в патенте, полагается на обширную базу знаний о сущностях и их атрибутах. Это, по сути, Knowledge Graph, который формируется на этапе индексирования интернета. Система использует эти данные для поиска Result Values и получения Confidence Scores.

QUNDERSTANDING – Понимание Запросов
Suggestion System выполняет функции, аналогичные пониманию запросов, но в контексте редактируемого документа. Она использует NLP в реальном времени для распознавания Entity Text и Attribute Text. Это требует сложных NLU-механизмов, включая разрешение кореференции (понимание местоимений). Затем она генерирует внутренний запрос к Search System.

Входные данные:

  • Текстовый ввод пользователя (Textual Input).
  • Предшествующий текст документа (Prior Text), используемый для контекста и разрешения местоимений.
  • Данные пользователя (опционально, для персонализированных фактов, например, данные календаря для уточнения рейса).

Выходные данные:

  • Result Value (факт), предоставляемый пользователю как предложение или исправление в интерфейсе редактора.

На что влияет

  • Типы контента и приложения: Патент напрямую влияет на процесс создания контента в текстовых процессорах, почтовых клиентах, электронных таблицах, блогах.
  • Качество контента: Косвенно влияет на качество контента, создаваемого с помощью этих инструментов, способствуя его большей фактической точности.
  • Ранжирование: Не влияет напрямую на алгоритмы ранжирования сайтов.

Когда применяется

Алгоритм применяется во время сеанса редактирования документа.

  • Триггеры активации: Система может активироваться тремя способами:
    1. Автоматически, если система распознает контекст, указывающий на потребность в факте (наличие сущности и атрибута без значения).
    2. При обнаружении потенциальной фактической ошибки (введенное значение не совпадает с данными Search System).
    3. По явному запросу пользователя с помощью Query Indicator (например, ввод символов "??").
  • Пороговые значения: Ключевым порогом является Confidence Score. Предложение показывается или исправление предлагается, только если система достаточно уверена в найденном Result Value.

Пошаговый алгоритм

  1. Получение ввода: Система получает текстовый ввод от пользовательского устройства через приложение для редактирования документа.
  2. Анализ триггеров: Система определяет необходимость поиска подсказки. Проверяется наличие Query Indicator или анализируется контент для автоматической активации.
  3. Идентификация Сущности: Анализ текста для поиска Entity Text. Если текст является местоимением, используется предшествующий текст (Prior Text) для его разрешения (Pronoun Resolution) и определения сущности.
  4. Идентификация Атрибута: Анализ текста для поиска Attribute Text, связанного с идентифицированной сущностью.
  5. Идентификация Уточнений (Опционально): Поиск Qualifications или Restrictions (например, дата или местоположение), которые сужают область поиска факта.
  6. Идентификация Значения (Опционально, для Fact-Checking): Определение, ввел ли пользователь значение для атрибута (first value).
  7. Генерация Запроса: Формирование внутреннего запроса, включающего Сущность, Атрибут и Уточнения.
  8. Выполнение Поиска: Отправка запроса в Search System.
  9. Обработка Результатов: Получение одного или нескольких Result Values с соответствующими Confidence Scores.
  10. Выбор Подсказки: Фильтрация результатов по порогу Confidence Score. Если результатов несколько, они ранжируются.
  11. Применение:
    • Если инициирована подсказка: Предоставление лучшего Result Value пользователю (например, в виде списка или автозамены).
    • Если инициирована проверка фактов: Сравнение введенного пользователем first value с Result Value. Если они различаются и Confidence Score высок, система помечает введенное значение как неверное и предлагает Result Value в качестве замены.

Какие данные и как использует

Данные на входе

  • Контентные факторы:
    • Textual Input: Текущее предложение или фраза, вводимая пользователем. Это основной источник для извлечения Entity Text и Attribute Text.
    • Prior Text: Существующий текст документа. Критически важен для понимания контекста и разрешения местоимений (определения, к какой сущности относится "он", "она", "это").
  • Пользовательские факторы: В патенте упоминается возможность использования данных, связанных с пользователем. Например, система может использовать информацию из календаря или предыдущих писем пользователя для разрешения таких сущностей, как "мой рейс".

Какие метрики используются и как они считаются

  • Confidence Score (Оценка Достоверности): Ключевая метрика патента. Представляет собой уверенность системы в корректности факта (Result Value). Патент не описывает расчет этой метрики, но указывает, как она используется для фильтрации и принятия решений.
  • Пороговые значения (Thresholds): Система использует пороги Confidence Score для определения, следует ли предоставлять предложение или исправление пользователю.
  • Методы анализа текста (NLP/NLU): Система использует модели машинного обучения для распознавания именованных сущностей (entity identification model) и идентификации атрибутов (attribute identification model). Также применяются методы разрешения кореференции (Coreference Resolution) для обработки местоимений.

Выводы

  1. Глубокое понимание сущностей и атрибутов: Патент демонстрирует продвинутые возможности Google в области NLP для идентификации не только сущностей, но и их конкретных атрибутов в неструктурированном тексте в реальном времени.
  2. Knowledge Graph как «Источник Истины»: Система полагается на Search System (функционально эквивалентный Knowledge Graph) как на арбитра для верификации и предоставления фактов. Это подтверждает центральную роль Knowledge Graph в экосистеме Google.
  3. Достоверность как измеримая метрика (Confidence Score): Google активно рассчитывает и использует Confidence Score для оценки достоверности информации. Эта метрика является ключевой для принятия решений о вмешательстве системы (подсказка или исправление).
  4. Автоматизированная проверка фактов: Описан конкретный механизм для автоматического выявления фактических ошибок в тексте путем сравнения утверждений пользователя с данными из базы знаний.
  5. Важность контекста (Coreference Resolution): Способность системы разрешать местоимения, анализируя предыдущий текст, подтверждает, что Google анализирует контент на уровне дискурса и контекста, а не только на уровне отдельных предложений или ключевых слов.

Практика

Best practices (это мы делаем)

Хотя патент не описывает алгоритмы ранжирования, он дает критически важные инсайты о том, как Google обрабатывает и верифицирует фактическую информацию.

  • Фокус на фактической точности и достоверности (E-E-A-T): Убедитесь, что все факты на сайте точны, верифицируемы и соответствуют авторитетным источникам. Предоставление точной информации повышает вероятность того, что ваш контент станет источником для Knowledge Graph и получит высокий Confidence Score.
  • Оптимизация под извлечение фактов (E-A-V): Структурируйте контент так, чтобы явно указывать отношения между сущностями (Entity), их атрибутами (Attribute) и значениями (Value). Используйте ясные формулировки (например, «Столица Канады – Оттава»), которые облегчают извлечение фактов.
  • Использование структурированных данных и семантической верстки: Активно используйте микроразметку Schema.org, а также семантическую верстку (таблицы, списки определений <dl>) для четкого представления фактов. Это помогает Google извлекать информацию и повышать Confidence Score для нее.
  • Четкая структура текста и разрешение неоднозначности: Пишите текст так, чтобы NLP-модели могли легко его интерпретировать. Следите за тем, чтобы местоимения четко ссылались на конкретные сущности (антецеденты), так как патент явно описывает механизм разрешения кореференции.

Worst practices (это делать не надо)

  • Фактические неточности и вводящие в заблуждение данные: Публикация неверной или непроверенной информации. Механизмы, описанные в патенте, показывают, что Google имеет инструменты для автоматизированной проверки фактов. Неточный контент будет иметь низкий Confidence Score.
  • Отсутствие структуры для фактических данных: Предоставление спецификаций или характеристик сплошным неструктурированным текстом. Это затрудняет извлечение атрибутов и значений.
  • Двусмысленность и сложность изложения: Использование синтаксиса, который затрудняет для NLP-систем извлечение триплетов Сущность-Атрибут-Значение, или чрезмерное использование местоимений без четкого контекста.

Стратегическое значение

Стратегическое значение патента заключается в подтверждении курса Google на семантический поиск (Entity-Based Search) и критическую роль достоверности информации (Confidence Score). Google все больше оперирует фактами, а не ключевыми словами. Долгосрочная SEO-стратегия должна быть направлена на то, чтобы сайт стал авторитетным и легко обрабатываемым источником фактов о сущностях в своей нише.

Практические примеры

Сценарий: Оптимизация страницы продукта в E-commerce для извлечения фактов

  1. Задача: Улучшить представление характеристик смартфона (Сущность), чтобы Google мог легко извлечь спецификации (Атрибуты и Значения) с высоким Confidence Score.
  2. Действие (Плохо): Описать характеристики в виде абзаца: "Новый смартфон Модель X имеет экран 6.7 дюймов, работает на процессоре Snapdragon 8 Gen 3 и оснащен батареей 5000 мАч".
  3. Действие (Хорошо):
    1. Организовать характеристики в виде списка определений (<dl>) или таблицы (<table>):
      Экран: 6.7 дюймов
      Процессор: Snapdragon 8 Gen 3
      Батарея: 5000 мАч
    2. Добавить разметку Schema.org/Product, используя additionalProperty для каждой спецификации.
  4. Ожидаемый результат: Поисковая система с большей легкостью и более высоким Confidence Score извлекает точные характеристики. Эти данные используются в Knowledge Graph, товарных сниппетах и могут служить источником для систем, подобных описанной в патенте.

Вопросы и ответы

Описывает ли этот патент алгоритм ранжирования в поиске Google?

Нет, этот патент не описывает, как Google ранжирует веб-страницы. Он описывает систему помощи при создании контента в приложениях типа Google Docs или Gmail. Однако он дает представление о базовых технологиях (NLP, Knowledge Graph, оценка достоверности), которые также используются в основном поиске.

Что такое «Confidence Score» и почему он важен для SEO?

Confidence Score — это мера уверенности Google в достоверности конкретного факта. Для SEO это критически важно, потому что Google стремится использовать только те данные, в которых он уверен. Предоставление точной, верифицируемой и четко структурированной информации помогает повысить Confidence Score ваших данных в Knowledge Graph, что повышает авторитетность вашего сайта как источника данных.

Как работает механизм проверки фактов, описанный в патенте?

Система анализирует введенный текст и определяет, что пользователь указал факт (например, «атомная масса углерода равна 6»). Она самостоятельно запрашивает этот факт у Search System (Knowledge Graph). Если полученный ответ («12») отличается от введенного пользователем и имеет высокий Confidence Score, система помечает ввод пользователя как ошибку и предлагает правильное значение.

Означает ли это, что Google знает, если мой контент фактически неверен?

Да, этот патент демонстрирует технологическую возможность автоматизированной проверки фактов путем сравнения утверждений в тексте с базой знаний Google. Если факт в вашем контенте противоречит данным, которым Google доверяет (высокий Confidence Score), система может идентифицировать это как неточность, что может повлиять на оценку E-E-A-T.

В патенте упоминается обработка местоимений (Claim 6). Что это значит для создания контента?

Это означает, что система анализирует контекст всего документа, чтобы понять, к какой сущности относится местоимение (например, "он", "это") – это называется Coreference Resolution. Для SEO это подчеркивает важность ясного и логичного изложения. Контент должен быть структурирован так, чтобы алгоритму было очевидно, о чем идет речь в каждом предложении, избегая двусмысленности.

Что такое «Search System» в контексте этого патента?

Search System — это источник достоверных фактов. Хотя в патенте упоминаются интернет-поисковики и базы данных, наиболее вероятной реализацией в экосистеме Google является Knowledge Graph или аналогичная структурированная база знаний, содержащая сущности, атрибуты и их значения.

Как SEO-специалист может помочь Google извлекать факты (атрибуты и значения) с сайта?

Необходимо фокусироваться на ясности и структуре. Используйте семантическую верстку (таблицы, списки определений) для представления фактических данных. Внедряйте микроразметку Schema.org для явного указания сущностей и их свойств. Пишите однозначно, чтобы избежать неправильной интерпретации данных NLP-моделями.

Что такое «Query Indicator» ("??")?

Query Indicator — это специальная последовательность символов (в примере патента — "??"), которую пользователь может ввести в документе, чтобы явно запросить у системы фактическое предложение. Это один из способов активации описанного механизма, помимо автоматического.

Может ли система обрабатывать сложные, уточненные факты?

Да. Патент предусматривает идентификацию уточнений (Qualifications или Restrictions) (Claim 7). Например, система должна уметь обработать запрос не просто о "населении города", а о "населении города в 2020 году", включив это ограничение в запрос к поисковой системе.

Каков главный вывод для SEO-специалиста из этого патента?

Главный вывод заключается в том, что Google обладает высокоточными инструментами для извлечения и верификации фактов на гранулярном уровне (Сущность-Атрибут-Значение). SEO-стратегия должна быть направлена на предоставление четкой, структурированной и фактически точной информации для наполнения и подтверждения данных в Knowledge Graph.

Похожие патенты

Как Google динамически выбирает и ранжирует факты об объектах в зависимости от запроса пользователя (Основы Knowledge Graph)
Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а динамически выбирает и ранжирует наиболее релевантные факты для каждого объекта, основываясь на конкретном запросе пользователя, а также метриках достоверности и важности.
  • US7774328B2
  • 2010-08-10
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google использует Knowledge Graph для выбора формата отображения и ранжирования ответов на запросы с модификаторами (например, «лучший», «самый высокий»)
Google использует этот механизм для ответов на запросы, содержащие сущности и модификаторы (например, «самые высокие здания» или «лучшие фильмы»). Система анализирует запрос, извлекает данные из Knowledge Graph и автоматически определяет, как ранжировать результаты (например, по высоте или рейтингу) и в каком формате их представить (например, в виде списка, карты, временной шкалы или диаграммы) на основе свойств сущностей.
  • US9390174B2
  • 2016-07-12
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует базу данных сущностей (Knowledge Graph) для формирования прямых ответов на вопросы о фактах
Google использует систему для идентификации запросов, направленных на получение фактов о конкретной сущности (Entity-Triggering Questions). Система анализирует топовые результаты поиска, определяет, какие сущности чаще всего ассоциируются с этими документами, и выбирает наиболее релевантную сущность. Затем система извлекает запрошенный атрибут (например, адрес, дату рождения) из своей базы данных сущностей или находит лучший сниппет, содержащий этот факт, чтобы предоставить прямой ответ пользователю.
  • US9081814B1
  • 2015-07-14
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google оценивает отсутствующие факты для Knowledge Graph и объясняет, на чем основана эта оценка
Google использует статистические модели для заполнения пробелов в Knowledge Graph, когда информация о сущности отсутствует. Система вычисляет недостающий факт (например, дату рождения), анализируя связанные данные (например, возраст супруга). Чтобы повысить доверие к этой оценке, Google показывает пользователю объяснение, основанное на наиболее влиятельных фактах, использованных при расчете.
  • US9659056B1
  • 2017-05-23
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Популярные патенты

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования
Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.
  • US7454417B2
  • 2008-11-18
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google использует анализ сущностей в результатах поиска для подтверждения интента и продвижения авторитетного контента
Google анализирует сущности (Topics/Entities) и их типы, общие для топовых результатов поиска, чтобы определить истинный интент запроса. Если интент подтверждается этим тематическим консенсусом выдачи, система продвигает "авторитетные кандидаты" (например, полные фильмы). Если консенсуса нет, продвижение блокируется для предотвращения показа нерелевантных результатов.
  • US9213745B1
  • 2015-12-15
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.
  • US8892549B1
  • 2014-11-18
  • EEAT и качество

  • Семантика и интент

Как Google использует тематические списки предпочтительных и нежелательных сайтов (Editorial Opinion) для корректировки ранжирования
Google может заранее определять "Темы запросов" (Query Themes) и назначать для них списки "Предпочтительных" (Favored) и "Нежелательных" (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники и понижает нежелательные, используя "Параметр редакторского мнения" (Editorial Opinion Parameter).
  • US7096214B1
  • 2006-08-22
  • EEAT и качество

  • Антиспам

  • SERP

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.
  • US12353458B2
  • 2025-07-08
  • Ссылки

  • Семантика и интент

  • SERP

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
  • US8732187B1
  • 2014-05-20
  • Ссылки

  • Мультимедиа

  • Поведенческие сигналы

seohardcore