
Google использует инфраструктурное решение для мгновенного расчета сложных метрик схожести (например, Personalized PageRank) в огромных графах связей (например, Документы и Запросы). Система заранее разбивает граф на тематические категории и создает компактные подграфы (Reduction). Это позволяет в реальном времени оценивать тематическую близость контента или интересов пользователей (Aggregation), минуя обработку всего массива данных.
Патент решает проблему высокой вычислительной сложности при расчете ранжирования по схожести (Similarity Ranking) в массивных и часто несбалансированных (lopsided) двудольных графах в реальном времени. Двудольные графы моделируют отношения между двумя типами сущностей (например, миллионы Документов и миллиарды Запросов). Задача — мгновенно определить схожесть между узлами, особенно в контексте конкретной категории (Targeted Similarity), что ресурсоемко на полном графе.
Запатентована система для эффективного вычисления схожести в двудольных графах, основанная на двухэтапном подходе: офлайн-операции Редукции (Reduction Operation) и онлайн-операции Агрегации (Aggregation Operation). Система заранее разбивает большой граф на непересекающиеся категории и создает компактные взвешенные подграфы (Weighted Category Subgraphs) для каждой из них. Это позволяет обрабатывать запросы на схожесть в реальном времени путем быстрой агрегации этих предварительно рассчитанных данных.
Система работает следующим образом:
Disjoint Categories) (например, Темы запросов).common neighbor) в этой категории. Вес ребра определяется метрикой схожести (например, Jaccard, Personalized PageRank).Высокая. Анализ графов и вычисление схожести между сущностями, документами, пользователями и запросами являются фундаментальными задачами в современных поисковых и рекомендательных системах (Information Retrieval). Эффективность этих вычислений критична для работы в реальном времени. Этот патент описывает базовую инфраструктуру для масштабирования такого анализа.
Патент имеет значительное инфраструктурное влияние на SEO (7.5 из 10). Он не описывает факторы ранжирования, но раскрывает механизмы, позволяющие Google мгновенно оценивать схожесть между сущностями в рамках конкретных тем. Эта инфраструктура лежит в основе систем, которые определяют тематический авторитет (Topical Authority), кластеризуют контент и анализируют связи (включая эффективный расчет PPR). Понимание этого механизма критично для построения эффективных контент-стратегий.
Weighted Category Subgraphs. Выполняет основную часть вычислений заранее.Neighbor Intersection, Jaccard coefficient, Adamic-Adar, Katz и Personalized PageRank (PPR).Патент фокусируется на инфраструктуре и оптимизации вычислений, защищая метод предварительной обработки и агрегации графов.
Claim 1 (Независимый пункт): Описывает основную систему и офлайн-процесс (Редукция).
partition) каждый узел B на одну из непересекающихся категорий.common neighbor node) в наборе B, который принадлежит этой категории.Ядром изобретения является метод предварительной обработки графа путем его разделения по категориям и создания компактных подграфов, которые фиксируют связи внутри этих категорий, устраняя необходимость обрабатывать узлы B во время запроса.
Claim 10 (Независимый пункт): Описывает метод выполнения Операции Редукции.
similarity metric).Это детализирует процесс создания Weighted Category Subgraphs.
Claim 15 (Независимый пункт): Описывает полный цикл обработки (Редукция + Агрегация).
prior to receiving a query) система генерирует подграфы.aggregating) два или более подграфов для определения других узлов A с наивысшим сходством (highest similarity rankings).Этот пункт защищает применение предварительно вычисленных данных для быстрого ответа в реальном времени.
Изобретение является инфраструктурным и затрагивает этапы индексирования (для подготовки данных) и ранжирования (для использования данных).
INDEXING – Индексирование и извлечение признаков (Офлайн-процессы)
На этом этапе происходит Reduction Operation. Система анализирует исходный двудольный граф (построенный, например, на основе логов запросов, кликов или данных краулинга). Происходит категоризация узлов B и выполняются ресурсоемкие вычисления (патент упоминает возможность использования MapReduce) для генерации Weighted Category Subgraphs. Эти подграфы сохраняются как предварительно рассчитанные признаки.
QUNDERSTANDING – Понимание Запросов
Механизм может использоваться для быстрого определения схожести между запросами (если граф построен как Пользователи <-> Запросы) или связанными сущностями для уточнения интента в рамках конкретной тематики.
RANKING / RERANKING – Ранжирование и Переранжирование
На этих этапах происходит Aggregation Operation. Система может использовать механизм для получения оценок схожести в реальном времени. Например, для оценки схожести документа с авторитетными документами в заданной категории (расчет PPR), для персонализации выдачи или для работы рекомендательных систем (Google Discover).
Входные данные (Офлайн): Двудольный граф; Категоризация узлов B; Метрика схожести.
Выходные данные (Офлайн): Набор взвешенных категориальных подграфов.
Входные данные (Онлайн): Запрос (Узел A, Набор категорий); Соответствующие подграфы.
Выходные данные (Онлайн): Ранжированный список узлов A, схожих с заданным узлом.
Targeted Similarity).Процесс А: Офлайн Редукция (Предварительный расчет)
PPR, Jaccard).Weighted Category Subgraphs сохраняются для быстрого доступа.Процесс Б: Онлайн Агрегация (Ответ на запрос)
iterative aggregation-disaggregation algorithm).Патент фокусируется исключительно на использовании структуры графа.
weighted bipartite graph). Веса ребер (например, частота кликов, сила связи) учитываются при расчете метрик, особенно PPR.Патент детально описывает адаптацию операций редукции и агрегации для пяти метрик схожести. Веса в подграфах (W) рассчитываются так, чтобы итоговая агрегация давала тот же результат (или его аппроксимацию), что и расчет на полном графе.
1. Neighbor Intersection (Пересечение соседей)
PPR) в реальном времени на огромных наборах данных. Это позволяет системе мгновенно понимать связи между сущностями.Reduction Operation). Система заранее рассчитывает и сохраняет "полуфабрикаты" данных о сходстве в виде категориальных подграфов.Jaccard до сложного PPR), что позволяет Google использовать наиболее подходящую метрику для конкретной задачи (ранжирование, рекомендации, кластеризация).Хотя патент является инфраструктурным, он подтверждает важность стратегий, направленных на построение четких семантических и структурных связей.
Disjoint Categories.PPR или Adamic-Adar) будут это отражать, так как у вас будут общие соседи.Патент подчеркивает стратегический переход Google к анализу связей и структур в графах. Он демонстрирует инвестиции в инфраструктуру, позволяющую проводить сложный анализ сходства в реальном времени. Для SEO это означает, что построение сильного, тематически связного (cohesive) сайта, который четко ассоциируется с определенными сущностями и кластерами запросов, является фундаментальным. Способность Google эффективно вычислять метрики типа Personalized PageRank означает, что "расстояние" до авторитетных источников в тематическом графе является критически важным фактором.
Сценарий: Оценка Тематического Авторитета в нише
Представим, что Google анализирует граф "Сайты (A) <-> Запросы (B)". Запросы разделены на категории, например, "Горные велосипеды" и "Шоссейные велосипеды".
PPR, отражая авторитетность в этой теме.PPR в этом подграфе, получит преимущество (сигнал Topical Authority) перед сайтом B, который имеет высокий глобальный авторитет, но слабо представлен в этом конкретном тематическом подграфе.Что такое двудольный граф (Bipartite Graph) в контексте SEO?
Это способ моделирования отношений между двумя разными типами объектов. Самые важные для SEO примеры: Граф "Документы <-> Запросы" (показывает, какие документы релевантны каким запросам) и Граф "Сайты <-> Темы/Сущности" (показывает, какие темы покрывает сайт). Анализ этих графов позволяет Google понять структуру контента и тематические связи.
Описывает ли этот патент конкретный фактор ранжирования?
Нет, это инфраструктурный патент. Он не вводит новый фактор ранжирования, но описывает механизм, который позволяет Google эффективно и быстро вычислять сложные метрики схожести (например, Personalized PageRank, Adamic-Adar) на огромных графах. Эти метрики затем могут использоваться как сигналы в основных алгоритмах ранжирования или рекомендательных системах.
Что такое Targeted Similarity и как "категоризация" влияет на расчет схожести?
Targeted Similarity — это расчет схожести в конкретном контексте. Категоризация (например, разделение запросов по темам) позволяет Google это реализовать. Два сайта могут быть очень похожи в категории "Рецепты выпечки", но совершенно не похожи в категории "Ремонт автомобилей". Патент описывает, как Google может мгновенно "сфокусироваться" на нужной категории при расчете.
Что такое Personalized PageRank (PPR) и почему он важен в этом патенте?
PPR измеряет тематическую или контекстуальную авторитетность узла относительно заданного контекста. Это очень ресурсоемкая метрика для расчета. Этот патент критически важен, потому что он описывает инфраструктуру, которая позволяет Google вычислять сложные метрики, такие как PPR, мгновенно, что необходимо для использования их в реальном времени.
Как этот патент связан с Topical Authority?
Он предоставляет техническую базу для ее измерения. Если Google строит граф "Сайты и Темы", этот механизм позволяет быстро определить, какие сайты похожи друг на друга на основе тем, которые они покрывают (в рамках конкретной категории). Если ваш сайт имеет высокое сходство с уже известными авторитетами в нише, это может служить сильным сигналом вашей тематической авторитетности.
В чем разница между операциями Редукции (Reduction) и Агрегации (Aggregation)?
Операция Редукции выполняется заранее (офлайн). Это трудоемкий процесс анализа всего графа и создания упрощенных, компактных подграфов по категориям. Операция Агрегации выполняется в реальном времени в ответ на запрос. Она использует эти предварительно созданные подграфы для мгновенного расчета итогового сходства.
Что на практике означает "общий сосед" (common neighbor) для двух документов?
Если мы рассматриваем граф "Документы <-> Запросы", то "общий сосед" для двух документов – это запрос, по которому оба документа признаны релевантными. Если мы рассматриваем граф "Документы <-> Сущности", то это сущность, которая присутствует в обоих документах. Чем больше общих соседей, тем выше структурное сходство.
Как SEO-специалист может использовать эти знания на практике?
Необходимо сосредоточиться на создании плотных тематических кластеров контента. Убедитесь, что страницы внутри кластера связаны общими интентами, сущностями и ключевыми словами. Это увеличит количество общих связей в соответствующем тематическом подграфе Google, что приведет к более высокой оценке схожести и авторитетности в данной теме.
Что такое Adamic-Adar и как она применяется?
Adamic-Adar — это метрика сходства, которая придает больший вес общим связям, которые являются редкими или уникальными. Если два сайта связаны через очень популярную тему (например, "Новости"), это дает малый вклад в сходство. Но если они оба связаны через узкоспециализированную тему, это значительно увеличивает их сходство по Adamic-Adar. Это подчеркивает ценность нишевой экспертизы.
Влияет ли этот патент на работу Google Discover или систем рекомендаций?
Да, с высокой вероятностью. Системы рекомендаций напрямую зависят от возможности быстро находить похожий контент или пользователей со схожими интересами (например, в графе Пользователи <-> Интересы). Описанный в патенте механизм идеально подходит для решения таких задач в масштабах Google в реальном времени.

Knowledge Graph
Индексация
Local SEO

Семантика и интент
Ссылки
SERP

Семантика и интент
Индексация
Техническое SEO

SERP

SERP
Поведенческие сигналы
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

SERP
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Мультимедиа
Семантика и интент

Поведенческие сигналы
Ссылки
SERP

SERP
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Мультимедиа
Семантика и интент

Индексация
Техническое SEO
Структура сайта

SERP
Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
SERP
Семантика и интент
