Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания

PERSONALIZED TERM IMPORTANCE EVALUATION IN QUERIES (Персонализированная оценка важности терминов в запросах)

US8326861B1
Google LLC
2010-06-23
2012-12-04

Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.

Какую проблему решает

Патент решает проблему обработки запросов, особенно на естественном языке (natural language queries), которые часто содержат многословные формулировки, шум или неоднозначные термины. Стандартные методы оценки важности терминов (например, основанные на частоте в корпусе документов) могут неверно интерпретировать намерение конкретного пользователя. Изобретение направлено на то, чтобы идентифицировать, какие термины в запросе действительно важны для пользователя, основываясь на его персональной истории взаимодействия с поиском.

Что запатентовано

Запатентована система персонализированной оценки важности терминов (Personalized Term Importance Evaluation). Система использует иерархическую структуру данных — Personalized Profile Tree (Персональное дерево профиля), которая строится на основе истории поиска пользователя. Важность термина в запросе определяется путем сопоставления его с узлами в этом дереве, учитывая специфичность (глубину узла) и широту (количество дочерних узлов) интереса пользователя к данной теме.

Как это работает

Система работает следующим образом:

Построение профиля: На основе истории поиска и кликов пользователя строится Personalized Profile Tree, где узлы представляют категории интересов.
Анализ запроса: При получении нового запроса система сопоставляет его термины и фразы с узлами в дереве.
Расчет важности: Для каждого термина рассчитывается Importance Score. Оценка повышается, если термин соответствует более глубокому (специфичному) узлу (Depth), и понижается, если узел имеет много дочерних элементов (Child Count) (широкая категория).
Генерация альтернативного запроса: Термины с низкими оценками важности могут быть отброшены. Система генерирует Alternative Query, состоящий только из важных терминов, который затем используется для поиска.
Условное применение: В одном из вариантов система сначала выполняет поиск по исходному запросу. Если качество результатов низкое, активируется механизм генерации и поиска по альтернативному запросу.

Актуальность для SEO

Высокая. Персонализация и понимание намерений пользователя на основе его истории являются фундаментальными аспектами современного поиска. Хотя конкретная реализация в виде Profile Tree могла эволюционировать в более сложные модели (например, векторные представления интересов), базовый принцип использования истории для взвешивания терминов в запросе остается крайне актуальным для обработки неоднозначных и разговорных запросов.

Важность для SEO

Влияние на SEO значительно (7/10). Патент описывает механизм, который подчеркивает, что релевантность не абсолютна, а персонализирована. Для разных пользователей одни и те же слова в запросе имеют разный вес. Это влияет на обработку длинных запросов и подчеркивает стратегическую важность построения долгосрочных отношений с аудиторией, чтобы сайт и его тематика стали устойчивым интересом в профиле пользователя.

Термины и определения

Alternative Query (Альтернативный запрос): Новый запрос, сгенерированный системой путем отбора подмножества терминов из исходного запроса, которые имеют Importance Score выше определенного порога.
Child Count (Количество дочерних узлов): Метрика узла в Profile Tree, указывающая на количество прямых или косвенных потомков. Отражает широту или общность категории. Высокий Child Count снижает важность термина.
Importance Score (Оценка важности): Числовая оценка, присваиваемая термину или фразе в запросе. Рассчитывается на основе Level и Child Count соответствующих узлов в персональном дереве профиля.
Level / Depth (Уровень / Глубина): Положение узла в иерархии Profile Tree. Отражает специфичность интереса. Большая глубина увеличивает важность термина.
Personalized Profile Tree (Персональное дерево профиля): Иерархическая структура данных, связанная с User Identifier. Состоит из узлов, представляющих категории информации (топики), которыми пользователь ранее интересовался (на основе истории поиска, кликов, браузинга).
PTIE Engine (Personalized Term Importance Evaluation Engine): Компонент поисковой системы, отвечающий за расчет персонализированных оценок важности терминов.
User Identifier (Идентификатор пользователя): Уникальный идентификатор (логин, IP, device ID), используемый для связи запроса с персональным профилем.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод персонализированной оценки важности терминов и генерации альтернативного запроса.

Система получает запрос и User Identifier.
Система обращается к Profile Tree, связанному с этим идентификатором. Дерево иерархично, и каждый узел представляет тему, основанную на истории поиска.
Для каждого термина в запросе:
- Идентифицируются соответствующие узлы в дереве.
- Определяется Level (глубина) этих узлов.
- Определяется Child Count (количество потомков, прямых и косвенных) этих узлов.
- Рассчитывается Importance Score на основе этих двух метрик.
Критически важная деталь расчета: Importance Score прямо пропорциональна глубине (Depth) узлов и обратно пропорциональна количеству их потомков (Child Count).
Идентифицируются термины, чьи Importance Score превышают заданный порог.
Генерируется Alternative Query, состоящий только из этих высоко оцененных терминов.

Цель — определить важность термина на основе специфичности интереса пользователя. Чем глубже узел (специфичнее интерес) и чем меньше у него потомков (уже фокус), тем важнее термин.

Claim 7 (Зависимый от 1): Уточняет, что метод применяется не только к отдельным терминам, но и к фразам (n-граммам).

Из запроса генерируются поисковые фразы (два или более последовательных термина).
Для каждой фразы выполняется тот же процесс: поиск соответствующих узлов, определение Level и Child Count, расчет Importance Score.
Alternative Query генерируется из высоко оцененных терминов И высоко оцененных фраз.

Claim 8 (Зависимый от 1): Описывает условный сценарий применения механизма.

До генерации альтернативного запроса система выполняет первый поиск по исходному запросу.
Оценивается качество полученных результатов.
Если качество удовлетворяет критерию (quality criterion), эти результаты предоставляются пользователю.
Если качество НЕ удовлетворяет критерию, только тогда система запускает процесс генерации Alternative Query.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, в основном фокусируясь на понимании запроса и его переписывании.

INDEXING / Data Processing (Оффлайн-процессы)
Система требует предварительной обработки данных. История поиска, клики и, возможно, история просмотров пользователя анализируются для построения и обновления Personalized Profile Tree. Эти данные хранятся в базе данных персональных профилей.

QUNDERSTANDING – Понимание Запросов
Основной этап применения патента. PTIE Engine анализирует входящий запрос в контексте профиля пользователя.

Получение профиля: По User Identifier извлекается соответствующий Profile Tree.
Оценка важности: Рассчитываются Importance Scores для терминов и фраз.
Переписывание запроса (Query Rewriting): Генерируется Alternative Query путем фильтрации шума.

RANKING – Ранжирование
Система влияет на этот этап косвенно. Основной механизм ранжирования использует Alternative Query (более чистый и сфокусированный на интересах пользователя) для поиска и сортировки документов. В альтернативных реализациях, упомянутых в описании, Importance Scores могут использоваться как весовые коэффициенты для терминов в исходном запросе.

RERANKING – Переранжирование (Условное применение)
В сценарии, описанном в Claim 8, система функционирует как механизм "подстраховки". Если стандартный процесс RANKING выдает низкокачественные результаты, активируется процесс из патента для генерации альтернативного набора результатов.

Входные данные:

Исходный поисковый запрос.
User Identifier.
Personalized Profile Tree пользователя.

Выходные данные:

Alternative Query (очищенный запрос).
ИЛИ Importance Scores для терминов исходного запроса.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на длинные запросы на естественном языке (разговорные), где много шума, а также на неоднозначные запросы, где история пользователя помогает выбрать правильную интерпретацию.
Типы контента и ниши: Применимо ко всем типам контента и нишам. Особенно актуально в тематиках, где термины могут иметь разные значения в зависимости от контекста пользователя.

Когда применяется

Условия работы: Алгоритм применяется, когда пользователь идентифицирован и для него существует достаточно данных для построения Personalized Profile Tree (пользователь должен разрешить сбор истории).
Триггеры активации:
- Вариант 1: Применяется ко всем запросам идентифицированного пользователя для генерации Alternative Query или взвешивания терминов.
- Вариант 2 (Условный, Claim 8): Активируется только тогда, когда качество результатов поиска по исходному запросу не удовлетворяет заданному критерию (quality criterion).

Пошаговый алгоритм

Процесс А: Построение Personalized Profile Tree (Оффлайн)

Сбор данных: Накопление истории поиска (запросы и клики) и, опционально, истории браузинга, связанной с User Identifier.
Извлечение терминов и фраз: Извлечение ключевых понятий из запросов и контента просмотренных документов.
Категоризация и Построение иерархии: Формирование дерева, где более общие категории находятся ближе к корню, а более специфичные — глубже. Обновление дерева по мере накопления новых данных.

Процесс Б: Обработка запроса в реальном времени

Получение запроса и идентификатора.
Условная проверка (Опционально, по Claim 8):
- Выполнить первый поиск по исходному запросу.
- Оценить качество результатов.
- Если качество высокое: вернуть результаты и завершить процесс.
- Если качество низкое: продолжить выполнение шага 3.
Предварительная обработка: Удаление стоп-слов (опционально). Идентификация терминов и фраз (n-грамм).
Доступ к профилю: Извлечение Personalized Profile Tree пользователя.
Сопоставление (для каждого термина/фразы): Поиск соответствующих узлов в дереве.
Извлечение метрик (для каждого найденного узла):
- Определение Level (глубины).
- Определение Child Count (количества потомков).
Расчет Importance Score (для каждого термина/фразы): Применение функции, где Оценка $\propto$ Глубина и Оценка $\propto$ 1 / Количество потомков.
Фильтрация: Идентификация терминов/фраз, чьи Importance Score превышают порог.
Генерация альтернативного запроса: Формирование Alternative Query из отобранных терминов/фраз.
Выполнение поиска: Использование Alternative Query для поиска (или второго поиска) и ранжирования результатов.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на использовании поведенческих и пользовательских данных для интерпретации запроса.

Поведенческие факторы: Являются основой изобретения. Используются для построения Personalized Profile Tree. Включают:
- История поисковых запросов (search history data).
- История выбора результатов поиска (клики на документы).
- (Упоминается в описании) История навигации (navigational history), закладки, подписки на фиды.
Пользовательские факторы: User Identifier используется для привязки истории к конкретному пользователю и извлечения нужного профиля.

Какие метрики используются и как они считаются

Система вычисляет следующие метрики на основе структуры Personalized Profile Tree:

Level (Depth): Глубина узла в дереве. Рассчитывается как количество предков от корня до узла.
Child Count: Количество потомков узла. Рассчитывается как общее количество всех потомков (прямых и косвенных).
Importance Score: Основная вычисляемая метрика для терминов запроса. Рассчитывается как функция от Level и Child Count соответствующих узлов. Патент явно указывает (Claim 1):
- Прямая пропорциональность глубине: $Score \propto Depth$
- Обратная пропорциональность количеству потомков: $Score \propto 1/ChildCount$
Порог важности (Threshold): Пороговое значение для Importance Score, используемое для отбора терминов в Alternative Query.
Quality Criterion (Критерий качества): (Опционально) Порог для оценки качества результатов первичного поиска, используемый как триггер для активации механизма.

Персонализация на уровне интерпретации запроса: Патент демонстрирует, что персонализация используется не только для переранжирования результатов, но и на более раннем этапе — для понимания и переписывания самого запроса. История пользователя напрямую определяет веса терминов.
Специфичность интереса как мера важности: Система отдает приоритет терминам, которые соответствуют узким и специфичным интересам пользователя. В терминах патента это узлы с большой глубиной (Depth) и малым количеством потомков (Child Count). Общие интересы получают меньший вес.
Фильтрация шума в разговорных запросах: Основная цель механизма — обработка natural language queries путем удаления несущественных слов и фокусировки на терминах, отражающих реальные интересы пользователя, что приводит к созданию более точного Alternative Query.
Важность фраз (N-грамм): Система анализирует не только отдельные слова, но и устойчивые словосочетания (фразы), оценивая их важность аналогичным образом, что повышает точность интерпретации.
Механизм подстраховки качества: В одном из вариантов реализации система активируется только тогда, когда стандартный поиск не дает удовлетворительных результатов. Это указывает на то, что персонализированное переписывание запроса может использоваться как инструмент для повышения качества SERP в сложных случаях.

Best practices (это мы делаем)

Фокус на долгосрочное вовлечение пользователя: Стратегия должна быть направлена на то, чтобы тематика сайта стала устойчивым интересом пользователя. Необходимо стимулировать повторные визиты и глубокое взаимодействие с контентом. Чем чаще пользователь ищет информацию по вашей тематике, тем более прочное место эта тема займет в его Profile Tree.
Развитие узкой специализации (Niche focus) и Topical Authority: Создавайте глубоко проработанный контент в узкой нише. Это повышает вероятность того, что интерес пользователя к этой теме будет классифицирован как специфичный (глубокий узел с малым Child Count). Термины, связанные с такой нишей, будут получать высокий Importance Score в будущих запросах пользователя.
Оптимизация под разговорные запросы с учетом ядра интента: При создании контента под длинные (natural language) запросы фокусируйтесь на ядре интента. Понимайте, что Google может отфильтровать общие слова, если они не подтверждены историей пользователя, и сгенерировать Alternative Query из ключевых терминов.
Использование четких и устойчивых фраз: Поскольку система оценивает важность фраз (Claim 7), использование точных, общепринятых в нише словосочетаний помогает системе корректно идентифицировать и высоко оценить эти фразы в запросах пользователей, интересующихся темой.

Worst practices (это делать не надо)

Ориентация на одноразовый трафик без построения бренда: Стратегии, направленные исключительно на сбор холодного трафика без попыток удержать пользователя и сформировать у него интерес к тематике сайта, снижают эффективность в контексте этого патента.
Создание поверхностного контента по слишком широким темам: Если сайт пытается охватить слишком много тем поверхностно, он будет соответствовать только верхним уровням Profile Tree (малая глубина, большой Child Count). Термины, связанные с такими широкими темами, могут получать низкий Importance Score и отбрасываться.
Игнорирование контекста пользователя: Нельзя предполагать, что запрос интерпретируется одинаково для всех пользователей. Оптимизация только под текст запроса без учета возможного контекста и истории пользователя менее эффективна.

Стратегическое значение

Патент подтверждает стратегическую важность перехода от ориентации на сессии к ориентации на пользователя и его жизненный цикл (User Journey). Для Google важна не только релевантность документа запросу в моменте, но и соответствие ответа долгосрочным интересам пользователя. Это подчеркивает важность построения бренда и комьюнити как способа закрепиться в "профиле интересов" целевой аудитории. SEO-стратегия должна учитывать, как формируется история взаимодействия пользователя с тематикой и сайтом.

Практические примеры

Сценарий 1: Разрешение неоднозначности запроса на основе истории

Пользователь А (Программист): Имеет обширную историю поиска по темам "Programming", "Databases". В его Profile Tree это глубокие узлы.
Пользователь Б (Бариста): Имеет историю поиска по темам "Coffee", "Roasting".
Запрос: Оба пользователя вводят неоднозначный запрос "Java implementation".
Обработка для Пользователя А: Система сопоставляет "Java" с глубоким узлом в ветке "Programming". Importance Score высок. Выдача будет о языке программирования Java.
Обработка для Пользователя Б: Система сопоставляет "Java" с глубоким узлом в ветке "Coffee" (остров Ява). Importance Score высок в этом контексте. Выдача будет о кофе с острова Ява.

Сценарий 2: Фильтрация шума в длинном запросе

Пользователь: Регулярно ищет информацию о винтажных автомобилях BMW. Имеет глубокий узел "Vintage BMW" в Profile Tree.
Запрос: "where can I find the best mechanic for my vintage BMW in London".
Обработка:
- Слова "where", "can", "I", "find" и т.д. получают низкие Importance Score.
- Фраза "vintage BMW" соответствует глубокому узлу и получает очень высокий Importance Score.
- Слова "mechanic" и "London" получают средние или высокие оценки.
Alternative Query: "mechanic vintage BMW London".
Результат: Сфокусированная выдача по запросу, очищенному от шума и ориентированному на ключевой интерес пользователя.

Что такое Personalized Profile Tree и как он строится?

Это иерархическая структура данных, отражающая интересы конкретного пользователя. Она строится офлайн на основе его поведенческих данных: истории поисковых запросов (search history data), кликов по результатам выдачи и, возможно, истории посещенных страниц. Узлы дерева представляют тематические категории, причем более глубокие узлы соответствуют более специфичным интересам.

Как рассчитывается Importance Score термина согласно патенту?

Importance Score рассчитывается путем сопоставления термина с узлами в Profile Tree пользователя. Оценка прямо пропорциональна глубине (Depth) соответствующего узла и обратно пропорциональна количеству его дочерних элементов (Child Count). Это означает, что термины, соответствующие узким, специфичным интересам, получают более высокий балл.

В чем разница между Depth и Child Count в дереве профиля?

Depth (Глубина) указывает на специфичность интереса. Например, узел "Спорт" находится на меньшей глубине, чем узел "Бейсбол". Child Count (Количество потомков) указывает на широту категории. Узел "Спорт" имеет много потомков (виды спорта), тогда как узел "Бейсбол" имеет меньше. Специфичный интерес = Большая глубина + Малое количество потомков.

Что такое Alternative Query и зачем он нужен?

Alternative Query — это переписанная версия исходного запроса, из которой удалены термины с низким Importance Score (шум). Он используется для повышения точности поиска, особенно при обработке длинных разговорных запросов, фокусируя систему только на тех словах, которые отражают реальные интересы пользователя.

Применяется ли этот механизм ко всем запросам?

Патент описывает два варианта. В основном варианте он может применяться ко всем запросам идентифицированных пользователей с достаточной историей. Однако в Claim 8 описан условный вариант: механизм активируется, только если результаты поиска по исходному запросу имеют низкое качество. Это позволяет экономить ресурсы и вмешиваться только при необходимости.

Как этот патент влияет на SEO-стратегию по работе с ключевыми словами?

Он снижает эффективность ориентации только на текст запроса и повышает важность понимания контекста аудитории. Необходимо фокусироваться на терминах и фразах, которые соответствуют устоявшимся, специфичным интересам целевой аудитории. Важно не просто привлечь пользователя по ключу, а вовлечь его в тематику, чтобы этот ключ стал частью его профиля интересов.

Как можно повлиять на Personalized Profile Tree пользователя?

Напрямую повлиять нельзя, но можно косвенно. Необходимо стимулировать долгосрочное взаимодействие пользователя с контентом сайта и тематикой в целом. Повторные визиты, изучение различных аспектов узкой темы, использование бренда в запросах — все это способствует формированию глубоких узлов в профиле пользователя, связанных с вашим доменом или тематикой.

Влияет ли этот патент на обработку фраз или только отдельных слов?

Он явно влияет на обработку фраз (Claim 7). Система генерирует фразы (n-граммы) из запроса и оценивает их важность точно так же, как и отдельные термины, используя Depth и Child Count. Это подчеркивает важность использования в контенте четких и релевантных словосочетаний.

Что делать, если мой сайт посвящен очень широкой тематике (например, новости)?

Для сайтов с широкой тематикой важно иметь четкую структуру и глубоко проработанные разделы. Хотя общая тема широка (высокий Child Count), пользователь может иметь специфический интерес к конкретному разделу (например, "Экология" на новостном сайте). Необходимо развивать глубину внутри разделов, чтобы соответствовать специфичным интересам пользователей.

Требует ли этот механизм, чтобы пользователь был залогинен в аккаунте Google?

Не обязательно, но пользователь должен быть идентифицирован, и система должна иметь доступ к его истории. Хотя вход в аккаунт обеспечивает наиболее точную идентификацию, патент упоминает, что User Identifier может быть любым идентификатором, позволяющим связать историю с пользователем или устройством. Для работы механизма пользователь должен разрешить сбор истории поиска.

Как Google использует иерархию истории поиска (Profile Tree) для персонализации поисковых подсказок

Google создает иерархическое дерево интересов (Profile Tree) для пользователя на основе его истории поиска, кликов и просмотров. При вводе запроса система переранжирует стандартные подсказки. Подсказки, соответствующие более глубоким и специфичным (нишевым) интересам пользователя, получают повышение, вытесняя общие популярные варианты.

US8316019B1
2012-11-20

Персонализация
Поведенческие сигналы

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи

Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).

US9298777B2
2016-03-29

Персонализация
Поведенческие сигналы
SERP

Как Google персонализирует сниппеты в выдаче, используя профиль интересов пользователя

Google использует механизм для генерации сниппетов в поисковой выдаче, основанный не только на терминах запроса, но и на профиле интересов пользователя. Система анализирует документ, находит термины, соответствующие интересам пользователя, и выделяет их в сниппете. Это призвано повысить релевантность сниппета для конкретного пользователя и лучше отразить содержание документа в контексте его интересов.

US8631006B1
2014-01-14

Персонализация
SERP
Семантика и интент

Как Google использует данные социальных сетей, интересы и членство в сообществах для персонализации и расширения поисковых запросов

Google использует информацию из социальных сетей для персонализации поиска. Система анализирует профиль пользователя, его членство в сообществах (группах по интересам) и даже профили связанных с ним людей. На основе этих данных система может расширять исходный запрос пользователя дополнительными терминами или фокусировать поиск на предпочтительных сайтах, чтобы предоставить результаты, соответствующие контексту и интересам пользователя.

US8832132B1
2014-09-09

Персонализация
Поведенческие сигналы
SERP

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска

Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.

US7580929B2
2009-08-25

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы

Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.

US9129029B1
2015-09-08

Local SEO
Поведенческие сигналы
Свежесть контента

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей

Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.

US9213748B1
2015-12-15

SERP
Семантика и интент
Поведенческие сигналы

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя

Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.

US20060224583A1
2006-10-05

Персонализация
Поведенческие сигналы

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных

Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.

US8577897B2
2013-11-05

SERP
Семантика и интент
EEAT и качество

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента

Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.

US8892549B1
2014-11-18

EEAT и качество
Семантика и интент

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования

Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.

US7783644B1
2010-08-24

Поведенческие сигналы
Индексация
Семантика и интент

Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph

Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).

US9208229B2
2015-12-08

Knowledge Graph
Ссылки
EEAT и качество

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика

Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.

US9031929B1
2015-05-12

Поведенческие сигналы
EEAT и качество

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске

Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.

US8965875B1
2015-02-24

Поведенческие сигналы
Семантика и интент
EEAT и качество

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы

Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.

US20120278171A1
2012-11-01

Local SEO
Семантика и интент
Поведенческие сигналы