Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)

PRODUCING A RANKING FOR PAGES USING DISTANCES IN A WEB-LINK GRAPH (Создание рейтинга страниц с использованием расстояний в графе веб-ссылок)

US9165040B1
Google LLC
2006-10-12
2015-10-20

Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.

Какую проблему решает

Патент решает проблему уязвимости стандартного алгоритма PageRank перед манипуляциями, такими как создание ссылочных ферм (link farms) или искусственное зацикливание ссылок (loops), которые приводят к завышению рейтинга спам-страниц. Альтернативный подход, основанный на расчете PageRank от набора доверенных страниц (Seed Pages, концепция, схожая с TrustRank), сталкивается с проблемой вычислительной сложности: расчет необходимо проводить отдельно для каждого источника, что ограничивает количество используемых Seed Pages. Изобретение предлагает эффективный метод расчета рейтинга авторитетности, который устойчив к спаму и позволяет использовать большое количество разнообразных Seed Pages без критического увеличения сложности вычислений.

Что запатентовано

Запатентована система ранжирования страниц в гиперссылочной структуре, которая определяет рейтинг страницы на основе её близости к набору предопределенных доверенных страниц (Seed Pages). Система трансформирует задачу итеративного вычисления весов (как в PageRank) в задачу нахождения кратчайшего пути в ссылочном графе. Ссылкам присваивается «длина» (Length) на основе их свойств и свойств ссылающейся страницы (в частности, её исходящей степени Out-degree). Итоговый рейтинг определяется кратчайшим расстоянием от Seed Pages до целевой страницы.

Как это работает

Система функционирует следующим образом:

Выбор источников (Seed Pages): Определяется набор высококачественных, доверенных страниц.
Определение длины ссылок: Каждой ссылке в графе присваивается «длина». Эта длина увеличивается, если страница-источник имеет много исходящих ссылок. Например, используется функция, включающая логарифм исходящей степени источника ( $log(|q|_{out})$ ).
Расчет кратчайших расстояний: Вычисляются кратчайшие пути (Shortest Distances) от набора Seed Pages до всех остальных страниц путем суммирования длин ссылок вдоль пути.
Определение рейтинга: Ranking Score страницы определяется на основе этих расстояний. Чем короче расстояние, тем выше рейтинг. Для надежности используется расстояние до k-го ближайшего источника (k-th shortest distance).

Актуальность для SEO

Высокая. Принципы, заложенные в этом патенте, тесно связаны с концепциями TrustRank и оценки авторитетности на основе близости к доверенным источникам. Борьба со ссылочным спамом и определение надежных источников (как часть E-E-A-T) остаются ключевыми задачами поиска. Описанный механизм предоставляет математическую основу для эффективного расчета метрик доверия в масштабе веба.

Важность для SEO

Патент имеет высокое стратегическое значение для SEO (8/10), особенно в области построения ссылочного профиля. Он математически обосновывает, почему качество ссылочного окружения и близость к авторитетным ресурсам критически важны. Механизм объясняет, почему ссылки с заспамленных страниц или страниц с огромным количеством исходящих ссылок имеют низкую ценность (большую «длину»), и подчеркивает важность получения ссылок из надежных источников, которые сами находятся близко к Seed Sites.

Термины и определения

Seed Pages (Исходные страницы, сайты-источники): Набор предварительно отобранных, высококачественных и доверенных страниц, которые служат эталоном для оценки качества других страниц. Они являются отправными точками для расчета расстояний.
Link-graph (Ссылочный граф): Структура данных, представляющая веб-страницы как узлы и гиперссылки между ними как направленные ребра.
Length (L(q→p)) (Длина ссылки): Метрика, присваиваемая ссылке от q к p. Представляет собой «стоимость» перехода по ссылке. Длина ссылки обычно увеличивается с ростом количества исходящих ссылок со страницы-источника q.
Out-degree (|q|_out) (Исходящая степень): Количество исходящих ссылок со страницы q.
Shortest Distance (Кратчайшее расстояние): Минимальная суммарная длина ссылок вдоль пути от Seed Page до целевой страницы.
k-th shortest distance (k-е кратчайшее расстояние): Метод определения итогового расстояния до страницы. Вместо использования расстояния от самого ближайшего источника (k=1), система может использовать расстояние от k-го по близости источника. Это повышает устойчивость к манипуляциям.
Damping factor (d) (Коэффициент затухания): Коэффициент, используемый в расчетах PageRank. В данном патенте он используется для определения базовой длины ссылки через параметр $α = -log(d)$ .
Reduced link-graph (Редуцированный ссылочный граф): Подграф исходного графа, состоящий только из тех ссылок, которые участвуют в формировании k кратчайших путей от Seed Pages до всех остальных страниц.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод ранжирования.

Система получает набор взаимосвязанных страниц и набор Seed Pages.
Система присваивает значения длины (lengths) ссылкам на основе свойств ссылок и страниц, которые они соединяют.
Вычисляются кратчайшие расстояния (shortest distances) от набора Seed Pages до каждой страницы на основе длин ссылок.
Определяется Ranking Score для каждой страницы на основе вычисленных кратчайших расстояний.
Создается ранжирование страниц на основе Ranking Scores.

Claim 2 и 3 (Зависимые): Уточняют механизм определения длины ссылки.

Длина ссылки определяется как функция от количества исходящих ссылок (Out-degree) со страницы-источника. Эта функция является монотонно невозрастающей, то есть длина ссылки увеличивается (или остается прежней) при увеличении количества исходящих ссылок.

Claim 5 (Зависимый): Детализирует формулу длины ссылки.

Длина ссылки q→p включает член $(\alpha+log(|q|_{out}))$ , где α — неотрицательное значение. Это подтверждает, что ценность ссылки логарифмически уменьшается с ростом исходящей степени источника.

Claim 6 (Зависимый от 5): Уточняет значение α.

α определяется как $-log(d)$ , где d — коэффициент затухания (damping factor). Это устанавливает прямую математическую связь между моделью PageRank и моделью кратчайших расстояний.

Claim 9, 10 и 11 (Зависимые): Определяют метод расчета итогового рейтинга.

Ranking Score определяется с использованием k кратчайших расстояний от k ближайших Seed Pages. В частности, он базируется именно на k-м кратчайшем расстоянии (D(p)). Рейтинг может быть пропорционален $e^{-D(p)}$ .

Где и как применяется

Изобретение описывает метод вычисления глобальной метрики качества или авторитетности страниц, аналогичной PageRank, но с акцентом на доверие, исходящее от Seed Pages.

CRAWLING – Сканирование и Сбор данных
Метрики, рассчитанные этим методом, могут использоваться для приоритизации сканирования (Crawl Scheduling). Страницы с более коротким расстоянием до Seed Pages (более высоким рейтингом) могут сканироваться чаще.

INDEXING – Индексирование и извлечение признаков
Основное применение патента. На этом этапе происходит анализ ссылочного графа:

Определение длин ссылок: Для каждой ссылки вычисляется её длина на основе исходящей степени источника.
Расчет расстояний: Используя алгоритмы поиска кратчайшего пути (например, Dijkstra), система вычисляет расстояния от Seed Pages до всех достижимых страниц.
Вычисление Ranking Score: Рассчитывается итоговый скор на основе k-го кратчайшего расстояния.
Сохранение: Полученная метрика сохраняется в индексе как статический сигнал качества/авторитетности страницы.

RANKING – Ранжирование
На этапах L2 и L3 ранжирования вычисленный Ranking Score используется как один из сигналов для определения итоговой позиции документа в выдаче по конкретному запросу.

Входные данные:

Полный или частичный граф веб-ссылок.
Набор предопределенных Seed Pages (и их опциональные веса).
Данные об исходящей степени (Out-degree) для каждой страницы.

Выходные данные:

Ranking Score для каждой достижимой страницы, основанный на кратчайшем расстоянии до Seed Pages.
Reduced link-graph, показывающий пути распространения авторитета.

На что влияет

Все типы контента и ниши: Алгоритм является универсальным и применяется ко всему ссылочному графу для определения общей авторитетности страниц.
Борьба со спамом: Особенно сильно влияет на оценку сайтов, пытающихся манипулировать стандартным PageRank. Ссылочные фермы и сети сателлитов оказываются «далеко» от доверенных источников, так как связи внутри них часто имеют большую длину (высокий Out-degree) и не имеют коротких путей к Seed Pages.

Когда применяется

Условия применения: Алгоритм применяется глобально ко всему индексу.
Частота применения: Расчет происходит периодически во время обновления основного индекса и пересчета глобальных ссылочных факторов (аналогично пересчету PageRank). Это офлайн-процесс, а не расчет в реальном времени.

Пошаговый алгоритм

Процесс расчета рейтинга авторитетности на основе расстояний:

Инициализация:
1. Определяется набор Seed Pages (S).
2. Каждой Seed Page s_i присваивается начальное расстояние d_i⁰. Если используются веса w_i, то $d_i^0 = -log(w_i)$ . По умолчанию d_i⁰ = 0.
Расчет длин ссылок: Для каждой ссылки q→p в графе вычисляется её длина L(q→p). Используется формула (Equation 10): $L(q→p)=-log(d)+log(\frac{|q|_{out}}{w(q→p)})$ .
Вычисление кратчайших путей: Система одновременно вычисляет кратчайшие расстояния от всех Seed Pages до всех остальных страниц. Для каждой страницы p и каждого источника s_i вычисляется D_i(p) как $min_{q→p}(D_i(q) + L(q→p))$ .
Агрегация расстояний: Для каждой страницы p определяется итоговое расстояние D(p). Оно выбирается как k-е наименьшее значение из набора всех расстояний {D_i(p)}.
Финальный расчет рейтинга: Ranking Score R(p) вычисляется на основе итогового расстояния. Например, $R(p) = e^{-D(p)}$ .

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на использовании структуры ссылочного графа и предварительно отобранных эталонных страницах.

Ссылочные факторы: Критически важные данные. Система использует информацию о входящих и исходящих ссылках для построения графа. Ключевым параметром является исходящая степень (Out-degree) каждой страницы, которая напрямую используется для расчета длины ссылки. Также могут учитываться веса ссылок (w(q→p)), основанные на их свойствах (например, позиция, шрифт), если они используются.
Системные данные: Набор Seed Pages. Эти страницы должны быть предварительно идентифицированы как высококачественные и доверенные.

Другие типы факторов (контентные, технические, поведенческие и т.д.) в этом конкретном алгоритме расчета авторитетности не используются.

Какие метрики используются и как они считаются

Link Length (L(q→p)): Длина ссылки. Рассчитывается для трансформации мультипликативной модели PageRank в аддитивную модель расстояний. Основная формула (Equation 10): $L(q→p)=-log(d)+log(\frac{|q|_{out}}{w(q→p)})$ .
Shortest Distance (D(p)): Итоговое расстояние до страницы p. Определяется как k-е наименьшее расстояние от набора Seed Pages.
Ranking Score (R(p)): Итоговый рейтинг авторитетности. Вычисляется как $e^{-D(p)}$ .

Математическое обоснование TrustRank: Патент предоставляет конкретный и вычислительно эффективный механизм для реализации концепций, подобных TrustRank. Авторитетность определяется не общим количеством ссылок, а краткостью пути от доверенных источников (Seed Pages).
Логарифмическое пенальти за исходящие ссылки: Ценность ссылки (её «длина») напрямую зависит от количества других исходящих ссылок на странице-доноре (Out-degree). Зависимость логарифмическая. Это снижает эффективность ссылок с каталогов, форумов и заспамленных ресурсов.
Трансформация PageRank в расстояние: Ключевая идея патента — преобразование итеративного расчета PageRank в задачу поиска кратчайшего пути. Это позволяет эффективно использовать тысячи Seed Pages одновременно.
Важность множественных путей (параметр k): Использование k-го кратчайшего расстояния означает, что для получения высокого рейтинга желательно иметь короткие пути не к одному, а к нескольким (k) различным доверенным источникам. Это защищает систему от манипуляций через один скомпрометированный источник или случайную сильную связь.
Качество важнее количества: Алгоритм явно предпочитает качество связей. Короткий путь, состоящий из высококачественных ссылок (с малым Out-degree доноров), даст лучший результат, чем множество длинных путей через ссылочные хабы низкого качества.

Best practices (это мы делаем)

Фокус на качестве доноров и их близости к авторитетам: Приоритет отдается получению ссылок с ресурсов, которые сами имеют сильный и чистый ссылочный профиль. Необходимо стремиться сокращать «расстояние» до авторитетных сайтов в своей нише (идеально — до самих Seed Sites, таких как крупные СМИ, правительственные ресурсы, ведущие университеты).
Анализ исходящих ссылок донора (Out-degree): Необходимо оценивать количество исходящих ссылок на странице-доноре. Ссылки со страниц с низким Out-degree являются более ценными (имеют меньшую «длину»), согласно патенту.
Диверсификация путей авторитетности: Стройте ссылочный профиль так, чтобы к вашему сайту вели короткие пути от разных авторитетных кластеров. Использование параметра 'k' в алгоритме подчеркивает важность подтверждения авторитетности из нескольких источников.
Оптимизация внутренней перелинковки: Учитывайте собственный Out-degree. Размещение большого количества исходящих ссылок на ключевых страницах увеличивает «длину» этих ссылок и уменьшает авторитет, передаваемый целевым страницам (как внутренним, так и внешним).

Worst practices (это делать не надо)

Массовая закупка ссылок с бирж и агрегаторов: Ссылки с ресурсов с очень высоким Out-degree (каталоги, футеры, заспамленные блоги) имеют большую «длину» и практически не сокращают расстояние до Seed Sites.
Построение PBN и ссылочных ферм без внешней подпитки: Закрытые сети сайтов, не имеющие коротких путей к доверенным источникам, будут классифицированы как неавторитетные, даже если внутри сети высокий PageRank.
Игнорирование структуры сайта и страницы донора: Оценка потенциальной ссылки только по авторитетности домена без учета количества других исходящих ссылок на конкретной странице является ошибкой.

Стратегическое значение

Патент подтверждает стратегическую важность построения репутации и получения качественных редакционных ссылок. Он предоставляет модель для понимания того, как Google может измерять «Доверие» (Trust). Стратегия линкбилдинга должна смещаться от накопления ссылочной массы к построению кратчайших и наиболее качественных путей от эталонных авторитетных ресурсов к продвигаемому сайту. Это требует глубокого понимания ссылочного графа в своей нише и идентификации ключевых авторитетов.

Практические примеры

Сценарий: Оценка ценности двух разных ссылок

Мы хотим получить ссылку для сайта (Сайт P). Есть два варианта:

Вариант А: Ссылка со страницы новостей крупного СМИ (Сайт Q1). На этой странице 30 исходящих ссылок.
Вариант Б: Ссылка из каталога компаний (Сайт Q2). На этой странице 500 исходящих ссылок.

Применение механизма патента (расчет длины ссылок):

Используем упрощенную формулу длины $L = \alpha + log(Out-degree)$ . (Предположим α=0.1 и используем натуральный логарифм).

Длина ссылки А: L(A) = 0.1 + ln(30) ≈ 0.1 + 3.40 = 3.50
Длина ссылки Б: L(B) = 0.1 + ln(500) ≈ 0.1 + 6.21 = 6.31

Результат:

Ссылка А значительно «короче» ссылки Б. Если предположить, что оба сайта Q1 и Q2 находятся на одинаковом расстоянии от Seed Sites, то получение ссылки А даст Сайту P более высокий Ranking Score (меньшее итоговое расстояние), чем получение ссылки Б.

Что такое «Seed Pages» (Страницы-источники) и как их определить для своей ниши?

Seed Pages — это набор высококачественных, доверенных сайтов, используемых как эталон для оценки авторитетности других ресурсов. В патенте предполагается, что они отбираются и обладают высокой надежностью, разнообразием и хорошей связностью. Для своей ниши это могут быть ведущие отраслевые СМИ, правительственные сайты, сайты университетов, энциклопедии (например, Wikipedia) и крупнейшие авторитетные бренды.

Как патент предлагает рассчитывать «длину» ссылки?

Длина ссылки (Link Length) — это мера её ценности. Чем длина больше, тем ценность ниже. Патент предлагает рассчитывать её как функцию от количества исходящих ссылок (Out-degree) страницы-донора. Ключевая формула включает $log(|q|_{out})$ . Это означает, что ссылка со страницы, где всего 5 ссылок, будет значительно «короче» (ценнее), чем ссылка со страницы, где их 500.

Что означает использование «k-го кратчайшего расстояния» (k-th shortest distance)?

Это механизм защиты от спама и повышения надежности оценки. Вместо того чтобы присваивать рейтинг на основе самого короткого пути от одного Seed Site (k=1), система может требовать наличия коротких путей от нескольких (k) разных источников. Если k=5, то ваш сайт должен быть близок как минимум к пяти Seed Sites, чтобы получить максимальный рейтинг. Это усложняет манипуляции через одну сильную ссылку.

Как этот патент связан с PageRank?

Этот метод является аппроксимацией (приближением) расчета PageRank, сфокусированного на доверенных источниках (Seed-based PageRank или TrustRank). Патент описывает математическую трансформацию (используя логарифмы), которая позволяет заменить сложный итеративный процесс расчета PageRank на более эффективный алгоритм поиска кратчайших путей в графе.

Означает ли это, что ссылки с Википедии или крупных СМИ всегда очень ценны?

Не всегда. Хотя Википедия и СМИ часто являются Seed Sites или находятся очень близко к ним, ценность конкретной ссылки зависит от её «длины». Если на странице СМИ очень много исходящих ссылок (высокий Out-degree), длина этой ссылки увеличится. Однако, близость к источнику обычно перевешивает фактор Out-degree, делая такие ссылки в большинстве случаев очень ценными.

Как использовать этот патент при построении PBN (Private Blog Network)?

Патент показывает уязвимость PBN, изолированных от внешнего мира. Чтобы PBN была эффективной, она должна получать «короткие» ссылки от сайтов, которые сами близки к Seed Sites. Изолированная сеть, даже с высокой внутренней перелинковкой, будет иметь большое расстояние до доверенных источников и, следовательно, низкий рейтинг авторитетности по этому алгоритму.

Влияет ли Nofollow на расчет этих расстояний?

Патент не упоминает атрибут Nofollow. Однако, исходя из того, что модель основана на аппроксимации PageRank и направлена на измерение передачи авторитета, логично предположить, что ссылки Nofollow (или Sponsored/UGC) исключаются из этого графа и не участвуют в построении кратчайших путей для передачи рейтинга.

Почему используется логарифмическая зависимость длины от количества исходящих ссылок?

Логарифмическая зависимость используется для сглаживания влияния Out-degree и соответствует математической трансформации из модели PageRank. Она сильно штрафует переход от малого количества ссылок к среднему (например, от 10 к 100), но слабо реагирует на изменения при очень больших значениях (например, от 10000 к 10100).

Можно ли как-то измерить «расстояние» своего сайта до Seed Sites?

Точно измерить это невозможно, так как мы не знаем полный список Seed Sites Google и точные формулы расчета длин ссылок. Однако можно использовать сторонние метрики (например, Trust Flow или аналогичные показатели авторитетности в SEO-инструментах), которые часто базируются на схожих принципах расчета близости к доверенным источникам.

Влияют ли свойства самой ссылки (например, анкор, позиция на странице) на её длину?

Да, патент упоминает возможность использования веса ссылки w(q→p), основанного на её свойствах (например, позиция, шрифт), при расчете длины (Equation 10). Это подразумевает, что система может уменьшать длину (повышать ценность) для ссылок с определенными характеристиками (например, редакционные ссылки в основном контенте) и увеличивать длину для других (например, ссылки в футере).

Как Google рассчитывает авторитетность и ранжирует сайты, вычисляя кратчайшие пути до доверенных источников (Seeds) в Веб-графе

Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния используются для расчета метрик авторитетности и ранжирования сайтов: чем ближе сайт к доверенным источникам, тем выше его предполагаемое качество.

US8631094B1
2014-01-14

EEAT и качество
Ссылки

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)

Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.

US8825646B1
2014-09-02

Ссылки

Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента

Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.

US7603350B1
2009-10-13

EEAT и качество
Knowledge Graph
SERP

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)

Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.

US9558233B1
2017-01-31

Ссылки
Поведенческие сигналы
Антиспам

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок

Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.

US7509344B1
2009-03-24

Антиспам
Ссылки
Техническое SEO

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей

Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.

US9552430B1
2017-01-24

Local SEO
Поведенческие сигналы

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей

Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.

US9116957B1
2015-08-25

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний

Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.

US8656266B2
2014-02-18

Ссылки
EEAT и качество
Свежесть контента

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок

Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.

US12353458B2
2025-07-08

Ссылки
Семантика и интент
SERP

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи

Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.

US9940367B1
2018-04-10

SERP
Семантика и интент
EEAT и качество

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность

Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.

US7870147B2
2011-01-11

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента

Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.

US9098511B1
2015-08-04

Поведенческие сигналы
Мультимедиа
SERP

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные

Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.

US20150242512A1
2015-08-27

Персонализация
Поведенческие сигналы
SERP

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR

Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.

US10922326B2
2021-02-16

Knowledge Graph
SERP
Семантика и интент

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи

Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.

US8538970B1
2013-09-17

Персонализация
Поведенческие сигналы
SERP