Как Google эффективно обновляет Граф Знаний в реальном времени при изменении фактов

REAL-TIME SAVED-QUERY UPDATES FOR A LARGE GRAPH (Обновление сохраненных запросов в реальном времени для большого графа)

US9626407B2
Google LLC
2014-06-17
2017-04-18

Патент Google описывает инфраструктурный механизм для поддержания актуальности Графа Знаний. Когда в базу добавляется или удаляется факт (связь между сущностями), система мгновенно определяет, какие сохраненные запросы (коллекции) затронуты, и эффективно пересчитывает результаты, минимизируя нагрузку на базу данных.

Какую проблему решает

Патент решает проблему "устаревания" (staleness) предварительно рассчитанных результатов для больших графовых баз данных, таких как Граф Знаний (Knowledge Graph). Запрос к большому графу в реальном времени требует значительных вычислительных ресурсов. Поэтому результаты для частых запросов (Saved Queries или Коллекции) сохраняются заранее. Однако, когда базовые данные в графе меняются (добавляются или удаляются факты/связи), эти сохраненные результаты становятся неактуальными. Патент предлагает механизм для эффективного обновления этих результатов в реальном времени без необходимости полного пересчета всего графа.

Что запатентовано

Запатентована система для инкрементального обновления результатов сохраненных запросов (Saved Query Results) в реальном времени при обновлении графовой базы данных. Система использует индекс (Query Edge Index) для быстрого определения того, какие сохраненные запросы затрагивает конкретное изменение в графе (добавление или удаление связи). Ключевой особенностью является оптимизированный метод оценки затронутых ограничений (Constraints), который минимизирует количество необходимых обходов графа за счет приоритизации коротких путей и кэширования промежуточных результатов.

Как это работает

Система активируется при обновлении графа (например, добавлении факта):

Идентификация влияния: Система использует Query Edge Index, чтобы определить, какие Saved Queries содержат ограничения (Target Constraints), использующие только что измененную связь (Edge).
Интеллектуальная оценка: Система оценивает состояние (State) этих ограничений (TRUE, FALSE или UNKNOWN). Для оптимизации она сначала проверяет самые короткие пути и использует кэшированные результаты предыдущих обходов (Temporary Lookup Results). Более длинные и дорогие для вычисления пути изначально помечаются как UNKNOWN.
Свертывание (Collapsing): Система применяет булеву логику для "свертывания" определения запроса (Collapsed Definition). Например, если запрос это (A OR B), и короткий путь A уже оценен как TRUE, весь запрос разрешается в TRUE без необходимости вычислять длинный путь B.
Итеративное разрешение: Если запрос не разрешен, система итеративно вычисляет ранее отложенные ограничения (UNKNOWN).
Обновление результатов: Если итоговое состояние запроса изменилось, система обновляет список участников (Membership) в Saved Query Results.

Актуальность для SEO

Высокая (Инфраструктура). Поддержание актуальности и свежести Графа Знаний является критически важной задачей для Google. Учитывая огромный объем данных и частоту изменений в мире, эффективный механизм обновления, описанный в этом патенте, вероятно, является фундаментальной частью инфраструктуры управления Графом Знаний.

Важность для SEO

Влияние на SEO минимальное (3/10). Это сугубо инфраструктурный патент, описывающий внутренние процессы оптимизации баз данных Google. Он не описывает сигналы ранжирования, методы оценки качества контента или способы попадания в Граф Знаний. Патент объясняет механику того, как Google поддерживает свежесть данных в графе, но не дает прямых рекомендаций для SEO-стратегий.

Термины и определения

Collapsed Definition (Свернутое определение): Промежуточное состояние определения запроса, в котором известные состояния (TRUE/FALSE) заменяют соответствующие ограничения. Используется для определения, можно ли разрешить запрос без дальнейших вычислений.
Constraint (Ограничение): Условие, которому должна удовлетворять нода, чтобы попасть в результаты запроса. Ограничение определяет путь в графе (например, alumni.parent.occupation=="President").
Constraint Expression (Выражение ограничения): Определение сохраненного запроса, состоящее из одного или нескольких ограничений, соединенных булевыми операторами (AND, OR).
Data Graph (Граф данных): База данных, хранящая информацию в виде узлов (сущностей) и ребер (отношений), например, Граф Знаний Google.
Edge (Ребро/Связь): Отношение между двумя узлами в графе (например, 'occupation', 'parent').
Member Node (Узел-участник): Узел в графе, который потенциально удовлетворяет ограничению и может быть включен в результаты сохраненного запроса.
Node/Entity (Узел/Сущность): Объект в графе данных (например, человек, место, концепция).
Query Edge Index (Индекс ребер запросов): Структура данных, которая индексирует ограничения сохраненных запросов по ребрам. Позволяет быстро найти все ограничения, использующие конкретное ребро.
Saved Query (Сохраненный запрос / Коллекция): Запрос к графу, результаты которого предварительно вычислены и сохранены для быстрого доступа (например, коллекция "Живые Президенты США").
State (Состояние): Статус ограничения для конкретного узла: TRUE (удовлетворено), FALSE (не удовлетворено) или UNKNOWN (требует дальнейшего вычисления/обхода графа).
Target Constraint (Целевое ограничение): Ограничение в сохраненном запросе, которое потенциально затронуто обновлением графа, так как оно включает измененное ребро.
Temporary Lookup Results (Временные результаты поиска): Кэш, в котором хранятся результаты недавних обходов графа для повторного использования при оценке других ограничений.
Triple (Триплет): Базовая единица данных в графе: Субъект (Source Node), Предикат (Edge), Объект (Target Node).

Ключевые утверждения (Анализ Claims)

Патент описывает внутренние процессы Google без прямых рекомендаций для SEO. Он дает понимание инфраструктуры обновления Графа Знаний.

Claim 1 (Независимый пункт): Описывает основной процесс обновления сохраненных результатов в ответ на обновление графа.

Система получает обновление графа (Source Node, Update Edge, Target Node).
Идентифицируется Target Constraint, который принадлежит сохраненному запросу и чей путь включает Update Edge.
Система оценивает Target Constraint для Member Node, определяя его State путем обхода графа по указанному пути.
Система определяет, указывает ли Collapsed Definition запроса (основанный на этом State) на то, что Member Node является или не является ответом на запрос.
Система обновляет Saved Query Result в соответствии с Collapsed Definition, если статус ответа изменился.

Claim 3 (Зависимый от 1): Вводит ключевую оптимизацию, основанную на длине пути.

Идентифицируется второе целевое ограничение (Second Target Constraint) в том же запросе.
Это второе ограничение имеет большую длину пути (Path Length), чем первое.
Система устанавливает состояние второго (более длинного) ограничения в UNRESOLVED (соответствует UNKNOWN в описании).

Система откладывает вычисление более дорогих (длинных) обходов графа, приоритизируя более дешевые (короткие).

Claim 4 (Зависимый от 3): Описывает итеративный процесс разрешения запроса.

Система определяет, что Collapsed Definition, основанный на состоянии первого (короткого) ограничения, не позволяет определить статус ответа (запрос все еще не разрешен).
Только в этом случае система оценивает второе (более длинное) ограничение, выполняя обход графа.
Система повторно определяет Collapsed Definition на основе состояний обоих ограничений и обновляет результат.

Вычисление длинного пути выполняется только тогда, когда это абсолютно необходимо для разрешения запроса.

Claim 5 (Зависимый от 1): Вводит механизм кэширования и повторного использования работы.

Система сохраняет результат обхода графа для первого ограничения.
Идентифицируется второе ограничение, путь которого включает путь первого ограничения.
Система использует сохраненный результат обхода при оценке второго ограничения.

Это позволяет избежать дублирования работы при обходе графа для разных ограничений, имеющих общие сегменты пути.

Где и как применяется

Изобретение является частью инфраструктуры управления графовыми базами данных (Knowledge Graph).

INDEXING – Индексирование и извлечение признаков
Основное применение патента. Система отвечает за поддержание целостности и актуальности Графа Данных и связанных с ним Saved Query Results. Когда Graph Engine обрабатывает новую информацию и обновляет Graph-Based Data Store (вносит изменения в узлы и ребра), активируется Saved Query Engine для обновления сохраненных результатов в реальном времени.

Система взаимодействует с:

Graph-Based Data Store: Для выполнения обходов графа (traversals) с целью проверки ограничений.
Query Edge Index: Для быстрого поиска затронутых ограничений.
Saved Queries/Saved Query Results: Для чтения определений запросов и обновления списков участников.
Temporary Lookup Results: Для кэширования и повторного использования результатов обхода графа.

Входные данные:

Обновление графа в виде триплета (Source Node, Edge, Target Node) и типа операции (добавление/удаление).
Определения Saved Queries.
Query Edge Index.

Выходные данные:

Обновленные списки участников (Membership) в Saved Query Results (добавление или удаление Member Nodes).

На что влияет

Патент носит общий инфраструктурный характер и не содержит информации о влиянии на конкретные типы контента, запросы, форматы, ниши или географические/языковые ограничения.

Влияние: Система влияет исключительно на данные, хранящиеся в графовой базе данных (Knowledge Graph). Она обеспечивает точность и свежесть коллекций сущностей.

Когда применяется

Триггеры активации: Алгоритм активируется немедленно (в реальном времени) в ответ на любую операцию обновления данных в графе (добавление или удаление ребра/связи).
Временные рамки: Патент упоминает возможность группировки обновлений, происходящих в течение короткого периода (например, менее 5 минут), по исходному узлу (Source Node) для повышения эффективности и повторного использования кэша (Temporary Lookup Results).

Пошаговый алгоритм

Процесс обновления сохраненных запросов в реальном времени.

Получение обновления графа: Система получает информацию об изменении в графе (добавление или удаление триплета: Исходный узел, Ребро, Целевой узел). Обновления могут группироваться по исходному узлу.
Идентификация целевых ограничений: Система использует Query Edge Index для поиска всех Target Constraints во всех Saved Queries, которые используют измененное ребро.
Интеллектуальная оценка ограничений: Для каждого Target Constraint система определяет его State (TRUE, FALSE, UNKNOWN). Процесс оптимизирован:
- Приоритет отдается ограничениям с короткими путями (например, длина 1 или 2).
- Проверяется наличие кэшированных результатов обхода графа (Temporary Lookup Results). Если есть, они используются.
- Если кэша нет, выполняется обход графа для коротких путей, и результаты кэшируются.
- Ограничения с длинными путями изначально помечаются как UNKNOWN.
Свертывание определения запроса (Collapsing): Система выбирает запрос, содержащий оцененные ограничения, и подставляет их State в Constraint Expression.
Проверка разрешения: Система оценивает свернутое выражение с помощью булевой логики.
- Если разрешено (TRUE или FALSE): Переход к шагу 7.
- Если не разрешено (содержит UNKNOWN): Переход к шагу 6.
Итеративное разрешение (при необходимости): Система выбирает одно или несколько ограничений с состоянием UNKNOWN (начиная с самых коротких) в текущем запросе, выполняет необходимые обходы графа для определения их состояния и возвращается к шагу 4.
Обновление членства (Membership Update): Система обновляет Saved Query Results для разрешенного запроса. Например, если ребро было добавлено и запрос разрешился в TRUE, соответствующий Member Node добавляется в результаты. Если ребро было удалено и запрос разрешился в FALSE, узел удаляется из результатов.
Завершение: Процесс повторяется для всех затронутых запросов. Кэш (Temporary Lookup Results) может быть очищен при переходе к обработке обновлений для другого исходного узла.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на структурных данных графа и инфраструктуре его обновления. Он не упоминает использование контентных, технических, ссылочных, поведенческих, временных, мультимедийных, географических или пользовательских факторов.

Структурные факторы (Граф): Узлы (Nodes/Entities), Ребра (Edges/Relationships) и Триплеты (Triples). Это единственные данные, которые используются для оценки ограничений.
Системные данные: Определения Saved Queries (Constraint Expressions), Query Edge Index, Кэш обходов графа (Temporary Lookup Results).

Какие метрики используются и как они считаются

Система не вычисляет метрики ранжирования, а разрешает булевы состояния.

State (Состояние): Вычисляется для каждого ограничения путем обхода графа. Результат: TRUE, FALSE или UNKNOWN.
Path Length (Длина пути): Длина пути, указанного в ограничении (количество ребер). Используется как метрика стоимости вычисления для приоритизации оценки ограничений (короткие пути обрабатываются первыми).
Наличие кэша: Проверка наличия сохраненных результатов обхода в Temporary Lookup Results для оптимизации.

Патент описывает внутренние процессы Google без прямых рекомендаций для SEO. Он дает понимание инфраструктуры и приоритетов Google в отношении Графа Знаний.

Приоритет свежести данных в графе: Google придает большое значение поддержанию актуальности Графа Знаний в реальном времени и инвестирует в сложную инфраструктуру для этого.
Эффективность превыше всего: Основная цель патента — оптимизация вычислительных ресурсов. Система спроектирована так, чтобы выполнять минимально необходимый объем работы для обновления результатов.
Механизмы оптимизации: Ключевыми методами оптимизации являются: (1) Приоритизация коротких путей (дешевых вычислений) и откладывание длинных путей (дорогих вычислений). (2) Кэширование и повторное использование результатов обхода графа. (3) Группировка обновлений по исходному узлу.
Подтверждение структуры данных: Патент подтверждает, что Google оперирует данными в формате графа (узлы, ребра, триплеты) и активно использует предварительно рассчитанные коллекции (Saved Queries) для быстрого доступа к данным.
Отсутствие SEO-сигналов: Патент не содержит информации о том, как данные попадают в граф, как разрешаются конфликты или как оценивается качество источников. Он описывает только процесс поддержания графа после того, как данные уже были приняты в него.

Best practices (это мы делаем)

Поскольку патент является инфраструктурным и описывает внутреннюю оптимизацию баз данных Google, прямых практических выводов для SEO немного. Однако он подчеркивает важность структурированных данных.

Фокус на Сущностях и Связях: Продолжать работу по определению ключевых сущностей сайта (организация, авторы, продукты) и их связей. Хотя патент не говорит о том, как попасть в Граф Знаний, он показывает, как эффективно Google обрабатывает эти данные, когда они туда попадают.
Обеспечение консистентности данных (Consistency): Убедитесь, что информация о ваших сущностях (например, NAP, ключевые факты, связи между сущностями) согласована на всех платформах (сайт, соцсети, каталоги). Это облегчает Google формирование точных триплетов, которые затем будут обрабатываться механизмом, описанным в патенте.
Использование микроразметки Schema.org: Внедрение точной и полной микроразметки помогает Google распознавать сущности и связи, формируя триплеты для Графа Знаний. Чем четче определены связи (например, founder, alumniOf, worksFor), тем точнее они будут отражены в графе и его коллекциях.

Worst practices (это делать не надо)

Предоставление противоречивой информации: Публикация противоречивых фактов о сущности (например, разные даты основания компании в разных источниках). Хотя этот патент не занимается разрешением конфликтов, он показывает, что каждое изменение факта вызывает каскад обновлений в реальном времени. Противоречивые данные могут вести к нестабильности представления сущности в Графе Знаний.
Игнорирование управления репутацией сущности (Entity Reputation Management): Нельзя фокусироваться только на ключевых словах, игнорируя то, как ваша организация или бренд представлены в качестве сущности в Графе Знаний.

Стратегическое значение

Патент подтверждает стратегическую приверженность Google к моделированию мира на основе сущностей и связей (Entity-First Indexing). Он демонстрирует, что Граф Знаний — это не статичный набор данных, а динамичная система, обновляемая в реальном времени. Для SEO это означает, что долгосрочная стратегия должна быть направлена на построение и управление представлением бренда как сущности, обеспечивая точность и актуальность фактов, связанных с ней.

Практические примеры

Сценарий: Обновление информации о руководстве компании

Описание: Компания (Сущность А) нанимает нового Генерального директора (Сущность Б).

Действия SEO/PR: Обновляется страница "О нас" на сайте, выпускается пресс-релиз, обновляется профиль LinkedIn Сущности Б, обновляется статья в Википедии (если применимо). Микроразметка Person на сайте для Сущности Б обновлена с указанием worksFor и jobTitle.
Обработка Google: Google сканирует источники, извлекает факты и обновляет Граф Знаний. Добавляется новый триплет: <Сущность Б, CEO_of, Сущность А>.
Активация механизма патента:
- Система идентифицирует, что ребро CEO_of было изменено.
- Через Query Edge Index определяются затронутые Saved Queries. Например: Q1: "Руководители Компании А", Q2: "CEO технологических компаний".
- Система эффективно пересчитывает членство. Сущность Б добавляется в результаты Q1 и Q2. Предыдущий CEO удаляется из Q1.
Ожидаемый результат: Благодаря описанному механизму, информация в Knowledge Panel для Компании А и Сущности Б обновляется в короткие сроки (в реальном времени), отражая актуальные факты благодаря эффективной инфраструктуре обновления графа.

Влияет ли этот патент на ранжирование сайтов в органическом поиске?

Нет, напрямую не влияет. Патент описывает исключительно инфраструктуру для эффективного обновления графовой базы данных (Knowledge Graph) в реальном времени. Он не затрагивает алгоритмы ранжирования, оценку качества контента или поведенческие факторы.

Что такое "Saved Query" или Коллекция в контексте этого патента?

Это предварительно рассчитанный и сохраненный набор сущностей, отвечающих определенным критериям. Например, коллекция "Выпускники Гарварда" или "Компании, основанные после 2010 года". Google хранит эти списки, чтобы не вычислять их заново при каждом запросе пользователя.

Насколько быстро происходят обновления согласно патенту?

Патент нацелен на обновления в реальном времени (real-time). Это означает, что процесс обновления запускается сразу после изменения данных в графе. Упоминается возможность группировки обновлений, произошедших в течение нескольких минут (например, до 5 минут), для повышения эффективности.

Поможет ли этот патент понять, как попасть в Граф Знаний (Knowledge Graph)?

Нет. Патент не описывает процессы сбора информации, оценки достоверности источников или критерии включения сущностей в граф. Он описывает только то, как система управляет данными, которые уже находятся внутри Графа Знаний.

Что означает "Свертывание определения запроса" (Collapsing the query definition)?

Это применение булевой логики для разрешения запроса с минимальным количеством вычислений. Например, если запрос состоит из (Условие А OR Условие Б), и система быстро определила, что Условие А истинно (TRUE), то весь запрос истинен, и вычислять Условие Б уже не нужно. Это экономит ресурсы.

В чем заключается основная оптимизация, описанная в патенте?

Оптимизация достигается двумя основными способами. Первый — приоритизация вычислений: сначала обрабатываются ограничения с короткими путями (дешевые), а длинные пути (дорогие) откладываются. Второй — кэширование результатов обхода графа и их повторное использование для оценки других ограничений.

Что такое "Query Edge Index" и зачем он нужен?

Это индекс, который связывает каждое ребро (отношение, например, 'occupation') со всеми сохраненными запросами, которые используют это ребро. Когда факт обновляется (меняется ребро), этот индекс позволяет мгновенно найти все запросы, которые нужно проверить, вместо сканирования всех существующих запросов.

Как система решает, какие ограничения вычислять первыми?

Система использует длину пути (Path Length) как меру стоимости вычисления. Ограничения с наименьшей длиной пути в определении запроса оцениваются в первую очередь. Также приоритет отдается ограничениям, для которых результаты обхода уже есть в кэше.

Что происходит, когда система помечает ограничение как UNKNOWN?

Это означает, что вычисление этого ограничения было временно отложено, обычно потому, что оно требует дорогостоящего обхода длинного пути в графе. Система попытается разрешить запрос без него. Если это не удастся, она вернется и вычислит это ограничение позже.

Каков главный вывод для SEO-специалиста из этого патента?

Главный вывод в том, что Google обладает высокоэффективной инфраструктурой для поддержания актуальности Графа Знаний в реальном времени. Это подчеркивает важность работы с сущностями и необходимость предоставления Google четкой, согласованной и актуальной информации о вашем бренде и связанных с ним сущностях.

Как Google автоматически классифицирует сущности в Knowledge Graph с помощью "Коллекций"

Google использует систему для автоматического создания и категоризации групп сущностей ("Коллекций") в Knowledge Graph на основе общих признаков. Патент описывает язык правил для определения принадлежности к коллекции и высокоэффективный механизм, который проверяет сущность на соответствие всем коллекциям за один проход, обеспечивая масштабируемость и актуальность данных.

US20150100605A1
2015-04-09

Knowledge Graph
Индексация
Семантика и интент

Как Google динамически выбирает и ранжирует факты об объектах в зависимости от запроса пользователя (Основы Knowledge Graph)

Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а динамически выбирает и ранжирует наиболее релевантные факты для каждого объекта, основываясь на конкретном запросе пользователя, а также метриках достоверности и важности.

US7774328B2
2010-08-10

Knowledge Graph
Семантика и интент
SERP

Как Google использует Knowledge Graph для выбора формата отображения и ранжирования ответов на запросы с модификаторами (например, «лучший», «самый высокий»)

Google использует этот механизм для ответов на запросы, содержащие сущности и модификаторы (например, «самые высокие здания» или «лучшие фильмы»). Система анализирует запрос, извлекает данные из Knowledge Graph и автоматически определяет, как ранжировать результаты (например, по высоте или рейтингу) и в каком формате их представить (например, в виде списка, карты, временной шкалы или диаграммы) на основе свойств сущностей.

US9390174B2
2016-07-12

Knowledge Graph
Семантика и интент
SERP

Как Google использует двухмерный индекс и пре-компьютерные пути для ультрабыстрого поиска в Knowledge Graph

Google использует специализированную архитектуру индекса для Knowledge Graph, отличную от веб-индекса. Патент описывает двумерную структуру индекса, которая позволяет обрабатывать сложные запросы к графу (связи сущностей, диапазоны, геолокация) с очень низкой задержкой. Система интегрирует текстовый поиск с графом, предварительно вычисляет сложные пути и использует специальные структуры для оптимизации локального и диапазонного поиска.

US9576007B1
2017-02-21

Knowledge Graph
Индексация
Local SEO

Как Google оптимизирует получение свежих данных от партнеров (например, отелей или авиакомпаний) в условиях ограниченной пропускной способности API

Патент описывает инфраструктурный механизм Google для планирования запросов к партнерским системам (например, сайтам бронирования). Система рассчитывает «Ценность» (Utility Value) для каждого запроса на основе его популярности у пользователей и частоты обновления данных. Это позволяет Google запрашивать самые важные данные, не перегружая каналы партнеров.

US10410270B2
2019-09-10

Свежесть контента

Как Google объединяет разные стратегии и поведенческие данные для генерации и выбора лучших альтернативных запросов

Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей (например, длительности кликов) и критериях разнообразия. Лучшие альтернативы предлагаются пользователю, часто с превью результатов, чтобы помочь уточнить поиск.

US7565345B2
2009-07-21

Поведенческие сигналы
SERP

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов

Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.

US7617205B2
2009-11-10

Поведенческие сигналы
Семантика и интент
SERP

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования

Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.

US8832083B1
2014-09-09

Поведенческие сигналы
SERP

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов

Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.

US7664734B2
2010-02-16

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя

Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.

US8645390B1
2014-02-04

Персонализация
Поведенческие сигналы
SERP

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных

Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.

US8577897B2
2013-11-05

SERP
Семантика и интент
EEAT и качество

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи

Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.

US9092529B1
2015-07-28

Поведенческие сигналы
Персонализация
EEAT и качество

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)

Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.

US8510285B1
2013-08-13

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией

Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.

US9223897B1
2015-12-29

Поведенческие сигналы
Индексация
Техническое SEO

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче

Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.

US9002832B1
2015-04-07

Ссылки
Антиспам
SERP