SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google объединяет поисковый запрос и профиль пользователя для персонализации выдачи с помощью векторных эмбеддингов (LCR)

LATENT COLLABORATIVE RETRIEVAL (Латентный коллаборативный поиск)
  • US20130325846A1
  • Google LLC
  • 2012-06-01
  • 2013-12-05
  • Персонализация
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует метод Latent Collaborative Retrieval (LCR) для персонализации поиска. Система создает векторные представления (эмбеддинги) для текущего запроса пользователя и его долгосрочного профиля (история, предпочтения). Эти векторы приводятся к единой размерности в общем латентном пространстве, что позволяет напрямую сравнивать и комбинировать релевантность запросу и соответствие профилю пользователя для формирования финальной выдачи.

Описание

Какую проблему решает

Патент решает проблему интеграции традиционного информационного поиска (Information Retrieval) и систем рекомендаций (Collaborative Filtering). Традиционный поиск часто фокусируется исключительно на релевантности контента текущему запросу, игнорируя долгосрочные предпочтения и контекст пользователя. Изобретение предлагает механизм (Collaborative Retrieval) для одновременного учета обоих факторов. Ключевая техническая проблема — это сравнение разнородных данных (запрос, профиль пользователя, документы), которые изначально имеют разные форматы и размерности.

Что запатентовано

Запатентована система латентного коллаборативного поиска (Latent Collaborative Retrieval, LCR). Суть изобретения заключается в методе трансформации разнородных математических представлений (векторов) запроса, профиля пользователя и элементов (документов, товаров) в единое латентное пространство с uniform length (единой размерностью). Это позволяет напрямую вычислять и комбинировать схожесть между всеми компонентами для генерации персонализированной поисковой выдачи.

Как это работает

Система LCR работает следующим образом:

  • Векторизация: Создаются исходные математические представления (векторы) для текущего запроса и профиля пользователя (история, предпочтения).
  • Трансформация (Embedding): Исходные векторы запроса, профиля и всех элементов (документов) трансформируются в векторы единой, обычно меньшей, размерности (embedding vectors). Это достигается с помощью матриц трансформации (transformation matrix operation).
  • Вычисление схожести: В новом пространстве вычисляются две независимые метрики: схожесть «Запрос — Элемент» и схожесть «Профиль — Элемент».
  • Комбинирование: Эти две метрики схожести объединяются (например, суммируются) для получения итоговой оценки (overall similarity measurement), которая используется для ранжирования результатов.

Актуальность для SEO

Критически высокая. Патент описывает фундаментальные концепции современного поиска: использование векторных эмбеддингов, трансформацию данных в латентное пространство и мультимодальное сравнение. Эти методы лежат в основе современных ML-моделей (таких как BERT, MUM) и систем персонализации, используемых Google для понимания контента, запросов и пользователей.

Важность для SEO

Патент имеет высокое значение для понимания SEO-стратегии (8/10). Он описывает технические основы глубокой персонализации поиска. Для Senior SEO-специалистов это демонстрирует, что релевантность определяется не только соответствием контента тексту запроса, но и соответствием контента профилю интересов пользователя. Это смещает фокус с оптимизации под изолированные ключи на понимание долгосрочных интересов целевой аудитории и построение Topical Authority для удовлетворения этих интересов.

Детальный разбор

Термины и определения

LCR (Latent Collaborative Retrieval)
Латентный коллаборативный поиск. Метод, объединяющий информационный поиск (retrieval) и коллаборативную фильтрацию (рекомендации) путем проецирования запросов, профилей и элементов в общее латентное пространство.
Mathematical Representation (Математическое представление)
Числовое представление данных (запроса, профиля пользователя или элемента). В контексте патента это, как правило, вектор признаков (Feature Vector).
Feature Vector (Вектор признаков)
Вектор, содержащий числовые признаки, описывающие объект. Например, представление "bag-of-words" для запроса или список взаимодействий для профиля.
Uniform Length (Единая длина)
Фиксированная размерность векторов после трансформации. Ключевое свойство, позволяющее сравнивать разнородные данные (например, короткий запрос и длинную историю пользователя) в общем векторном пространстве.
Embedding Vector (Вектор встраивания, Эмбеддинг)
Вектор фиксированной (часто низкой) размерности, полученный после трансформации исходного Feature Vector. Представляет семантику объекта в латентном пространстве.
Transformation Matrix Operation (Операция с матрицей трансформации)
Математический метод, использующий обученные матрицы для преобразования исходных векторов признаков разной длины в Embedding Vectors единой длины.
Similarity Measurement (Измерение схожести)
Метрика для оценки близости между двумя векторами в пространстве эмбеддингов. Примеры: скалярное произведение (dot product) или подсчет общих элементов.
User Profile (Профиль пользователя)
Набор данных о пользователе, включающий историю запросов (query history), историю покупок (purchase history), явно указанные предпочтения (user preferences) и демографические характеристики.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод латентного коллаборативного поиска.

  1. Генерация первого математического представления (для Запроса) и второго математического представления (для Профиля пользователя).
  2. Доступ к множеству математических представлений для Элементов (документов/товаров).
  3. Трансформация всех трех типов представлений (Запрос, Профиль, Элементы) для приведения их к uniform length (единой длине).
  4. Генерация первого подмножества результатов (Subset 1) на основе измерения схожести между представлением Запроса и представлениями Элементов.
  5. Генерация второго подмножества результатов (Subset 2) на основе измерения схожести между представлением Профиля и представлениями Элементов.
  6. Генерация итогового набора результатов на основе Subset 1 и Subset 2.

Ядром изобретения является интеграция двух различных источников релевантности (запроса и профиля) путем приведения их к общему математическому знаменателю (латентному пространству), где они могут быть напрямую сопоставлены с контентом.

Claim 2 (Зависимый): Уточняет, что математические представления являются векторными (vector-based representations).

Claim 3 (Зависимый): Определяет состав User Profile. Он может включать историю запросов, элементы, связанные с пользователем (например, покупки), указанные пользователем предпочтения и характеристики пользователя.

Claim 7 (Зависимый): Детализирует механизм трансформации. Указывается, что для приведения векторов к единой длине используется transformation matrix operation. Это техническое описание процесса создания эмбеддингов с помощью машинного обучения.

Где и как применяется

Изобретение применяется на этапах понимания запроса и ранжирования для обеспечения глубокой персонализации выдачи.

INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются признаки элементов (документов, товаров) и генерируются их исходные математические представления (plurality of mathematical representations). Они сохраняются в индексе.

QUNDERSTANDING – Понимание Запросов
Входящий запрос обрабатывается и векторизуется (first mathematical representation). Параллельно система получает доступ к User Profile и генерирует его представление (second mathematical representation).

RANKING – Ранжирование / RERANKING – Переранжирование
Основное место применения алгоритма LCR.

  1. Трансформация: Векторы запроса, профиля и отобранных кандидатов трансформируются в общее пространство эмбеддингов (uniform length) с использованием предварительно обученных матриц.
  2. Вычисление схожести: Рассчитываются две независимые оценки: схожесть Запрос-Элемент и схожесть Профиль-Элемент.
  3. Комбинирование и Ранжирование: Оценки комбинируются (например, суммируются) для определения финального ранга элемента в персонализированной выдаче (result set). Это может происходить на этапах L2/L3 ранжирования или как финальное переранжирование.

Входные данные:

  • Запрос пользователя.
  • Профиль пользователя (история поиска, покупки, предпочтения).
  • Математические представления элементов-кандидатов.
  • Обученные матрицы трансформации.

Выходные данные:

  • Персонализированный ранжированный список элементов (result set).

На что влияет

  • Конкретные типы контента: Наибольшее влияние на системы рекомендаций: музыка (явно упоминается в патенте), видео, товары (E-commerce), книги, локальные заведения. Также применимо к веб-поиску в сценариях, где персонализация играет важную роль.
  • Специфические запросы: Влияет на неоднозначные или широкие запросы, где история пользователя помогает уточнить интент (например, запрос [Java] для программиста и любителя кофе). Также влияет на коммерческие запросы, где прошлые взаимодействия определяют предпочтения брендов или ценовой сегмент.
  • Конкретные ниши или тематики: E-commerce, медиа и развлечения, путешествия, локальный поиск, хобби.

Когда применяется

  • При каких условиях работает алгоритм: Алгоритм активируется, когда система может идентифицировать пользователя (логин, cookies, сессия) и имеет достаточный объем данных для построения значимого User Profile.
  • Триггеры активации: Степень влияния зависит от уверенности системы в данных профиля и от степени неоднозначности запроса. Если запрос очень специфичен, доминировать будет компонент запроса (Similarity 1). Если запрос общий, а профиль пользователя богат данными, доминировать может компонент профиля (Similarity 2).

Пошаговый алгоритм

Процесс обработки запроса с использованием LCR:

  1. Получение данных: Система получает Запрос от пользователя и извлекает его User Profile.
  2. Векторизация (Генерация исходных представлений):
    • Запрос преобразуется в First mathematical representation (например, вектор "bag-of-words").
    • Профиль преобразуется в Second mathematical representation (например, вектор взаимодействий с элементами).
  3. Доступ к элементам: Система получает доступ к plurality of mathematical representations для элементов-кандидатов.
  4. Трансформация (Создание Эмбеддингов): Система применяет обученные Transformation Matrices ко всем трем типам векторов (Запрос, Профиль, Элементы), чтобы привести их к uniform length. В результате создаются Эмбеддинг Запроса, Эмбеддинг Профиля и Эмбеддинги Элементов в общем латентном пространстве.
  5. Вычисление Схожести 1 (Релевантность Запросу): Рассчитывается first similarity measurement между Эмбеддингом Запроса и Эмбеддингами Элементов (например, с помощью dot product). Генерируется first result subset.
  6. Вычисление Схожести 2 (Релевантность Профилю): Рассчитывается second similarity measurement между Эмбеддингом Профиля и Эмбеддингами Элементов. Генерируется second result subset.
  7. Комбинирование и Ранжирование: Результаты из двух подмножеств объединяются. Итоговая оценка (overall similarity measurement) может быть рассчитана как сумма Схожести 1 и Схожести 2. Элементы ранжируются по итоговой оценке.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Содержимое элементов (текст веб-страниц, метаданные товаров или треков) используется для создания их векторов (plurality of mathematical representations). Текст входящего запроса используется для создания first mathematical representation.
  • Поведенческие факторы: Критически важные данные для User Profile. Используются история покупок (purchase history), предыдущие запросы (previous queries), просмотренные элементы, клики.
  • Пользовательские факторы: Используются для User Profile. Включают явно указанные предпочтения (user preferences, лайки/дизлайки) и характеристики пользователя (возраст, пол, местоположение).

Какие метрики используются и как они считаются

  • Методы векторизации: Патент упоминает использование методов типа "bag-of-words" для запросов или бинарных векторов для профилей (где 1 означает наличие взаимодействия/покупки, 0 — отсутствие).
  • Трансформация (Эмбеддинги): Ключевой механизм. Используются Transformation Matrices для преобразования исходных векторов (часто разреженных и высокоразмерных) в плотные векторы низкой размерности (uniform length). В патенте указано, что эти матрицы строятся с использованием машинного обучения (machine learning).
  • Similarity Measurement: Метрика для оценки схожести в пространстве эмбеддингов. Патент явно упоминает dot product operation (скалярное произведение) и подсчет общих элементов как методы определения уровня схожести.
  • Агрегация данных: Итоговая оценка релевантности (overall similarity measurement) рассчитывается путем комбинирования двух отдельных оценок схожести. Патент предлагает суммирование (summing) как способ расчета итоговой метрики.

Выводы

  1. Персонализация через общее векторное пространство: Патент описывает фундаментальный механизм персонализации. Он показывает, как Google проецирует разнородные данные — текст запроса, историю поведения пользователя и контент документов — в общее латентное пространство (latent space) с помощью эмбеддингов.
  2. Двойная оценка релевантности: Система явно разделяет, а затем объединяет два вида релевантности: релевантность сиюминутному запросу (Query Relevance) и релевантность долгосрочному профилю пользователя (Profile Relevance). Профиль пользователя фактически действует как второй, неявный запрос.
  3. Критичность поведенческих данных: Работа алгоритма LCR напрямую зависит от качества и объема накопленных данных о пользователе (User Profile). История поиска, клики и взаимодействия являются топливом для этой системы персонализации.
  4. Эмбеддинги как основа сравнения: Использование Transformation Matrix Operations для создания эмбеддингов единой длины (uniform length) является техническим решением, которое позволяет сравнивать "яблоки с апельсинами" — например, короткий текстовый запрос и обширную историю покупок.
  5. Снижение объективности SERP: Механизм LCR ведет к тому, что выдача становится субъективной. Результаты, высокорелевантные профилю пользователя, могут ранжироваться выше результатов, более релевантных самому тексту запроса.

Практика

Best practices (это мы делаем)

  • Глубокое понимание Customer Journey Map (CJM) и интересов аудитории: Необходимо анализировать не только прямые запросы, но и смежные интересы, предыдущие и последующие шаги целевой аудитории. Google учитывает эту историю (User Profile) при ранжировании. SEO-стратегия должна охватывать весь путь и интересы пользователя.
  • Построение Topical Authority: Создавайте контент-хабы, которые широко покрывают область интересов вашей аудитории. Это увеличивает вероятность того, что вектор вашего контента (Item Representation) будет семантически близок к вектору профиля интересов пользователя (Profile Representation) в латентном пространстве.
  • Стимулирование лояльности и вовлеченности (User Engagement): Работайте над удержанием аудитории. Пользователи, которые регулярно взаимодействуют с вашим сайтом, помогают Google сформировать четкий профиль интересов, связанный с вашим брендом. Это повышает шансы ранжирования вашего контента для этих пользователей по релевантным запросам.
  • Анализ данных по сегментам: Анализируйте трафик и конверсии не в целом, а по сегментам аудитории (новые vs вернувшиеся, разные интересы), чтобы лучше понять, как персонализация влияет на вашу видимость.

Worst practices (это делать не надо)

  • Фокус на изолированных ключевых словах: Стратегии, основанные исключительно на текстовой оптимизации отдельных страниц под конкретные запросы без учета общего контекста и профиля интересов аудитории, будут терять эффективность из-за работы механизмов персонализации типа LCR.
  • Привлечение нерелевантного трафика и кликбейт: Попытки привлечь пользователей, чьи долгосрочные интересы не соответствуют тематике сайта, контрпродуктивны. Это может "размыть" понимание Google о том, кому следует рекомендовать ваш контент, и ухудшить поведенческие сигналы.
  • Игнорирование связанных сущностей и тем: Создание контента, который не покрывает смежные темы и интересы аудитории, уменьшает вероятность его показа пользователям, интересующимся данной областью в целом.

Стратегическое значение

Патент подтверждает стратегический взгляд Google на поиск как на непрерывный процесс взаимодействия с пользователем, а не как на серию не связанных между собой запросов. Персонализация, основанная на векторных представлениях, является ключевым компонентом ранжирования. Для долгосрочного SEO критически важно создавать ресурсы, которые интегрируются в долгосрочные интересы пользователей. Это также означает, что традиционный мониторинг позиций теряет актуальность, уступая место анализу поведения аудитории.

Практические примеры

Сценарий: Персонализация выдачи в E-commerce (спортивный магазин)

  1. Профиль пользователя (User Profile): Пользователь регулярно ищет информацию о беге на длинные дистанции, просматривал кроссовки для марафона и покупал энергетические гели. Эти данные формируют Second mathematical representation (Эмбеддинг Профиля), который семантически близок к теме "марафонский бег".
  2. Текущий запрос (Query): Пользователь вводит общий запрос "лучшие кроссовки" (First mathematical representation / Эмбеддинг Запроса).
  3. Обработка LCR: Система анализирует выдачу.
  4. Расчет схожести:
    • Similarity 1 (Запрос): Высокая схожесть с общими обзорами кроссовок (для ходьбы, баскетбола, бега).
    • Similarity 2 (Профиль): Высокая схожесть с контентом о марафонском беге и соответствующей экипировкой.
  5. Результат: Система комбинирует оценки. Страницы с обзорами кроссовок для марафона и соответствующие товарные карточки получат значительное повышение в выдаче, так как они имеют высокие показатели как по Similarity 1 (релевантны запросу), так и по Similarity 2 (релевантны профилю). Обзоры баскетбольных кроссовок будут ранжироваться ниже для этого конкретного пользователя.

Вопросы и ответы

Что такое "латентное пространство" (latent space) или пространство эмбеддингов в контексте этого патента?

Это общее векторное пространство фиксированной, обычно низкой размерности (uniform length), в которое система проецирует разнородные данные (запросы, профили пользователей, документы). В этом пространстве семантически близкие объекты располагаются рядом друг с другом, что позволяет сравнивать их напрямую, даже если их исходные форматы сильно отличались.

Как именно происходит трансформация векторов разной длины в единую размерность?

Патент указывает на использование transformation matrix operation. Система использует предварительно обученные (с помощью machine learning) матрицы трансформации. Умножение исходного вектора признаков на эту матрицу приводит к созданию нового вектора (эмбеддинга) фиксированной длины. Для каждого типа данных (запросы, профили, документы) используется своя матрица.

Какие данные Google использует для формирования "Профиля пользователя" (User Profile)?

Согласно патенту, User Profile может включать историю запросов пользователя (query history), элементы, связанные с пользователем (например, история покупок purchase history или прослушиваний), явно указанные пользователем предпочтения (user-specified preferences), а также характеристики пользователя (например, демографические данные, локация).

Означает ли этот патент, что текстовая релевантность запросу теряет значение?

Нет, не означает. Система LCR вычисляет две оценки: релевантность запросу (first similarity measurement) и релевантность профилю (second similarity measurement). Итоговый результат является комбинацией обеих. Если контент совершенно не релевантен запросу, он вряд ли попадет в топ, но при прочих равных предпочтение будет отдано контенту, соответствующему профилю пользователя.

Как SEO-специалист может повлиять на вектор профиля своей целевой аудитории?

Напрямую повлиять на профиль конкретного пользователя сложно. Однако можно влиять на то, как ваш сайт ассоциируется с определенными интересами. Для этого нужно последовательно публиковать высококачественный контент по связанным темам (Topical Authority) и работать над удержанием пользователей, стимулируя их возвращаться на сайт и взаимодействовать с контентом по этой тематике.

Применим ли этот патент только к рекомендациям (музыка, товары) или к основному веб-поиску тоже?

Хотя примеры в патенте часто касаются музыки и товаров, описанный механизм является общим для информационного поиска (Information Retrieval). Он применим везде, где доступна персонализация, включая основной веб-поиск, особенно при обработке неоднозначных запросов или запросов, связанных с долгосрочными интересами пользователя.

Как этот патент связан с современными технологиями, такими как BERT или Векторный Поиск?

Этот патент (подан в 2012 году) является одним из ранних описаний применения векторного поиска и эмбеддингов в системах Google. Современные модели, такие как BERT, используют более продвинутые архитектуры (Трансформеры) для создания эмбеддингов, но базовая идея — проецирование данных в латентное пространство для семантического сравнения — остается той же, что и в LCR.

Что произойдет, если у пользователя нет истории поиска или он использует режим Инкогнито?

В этом случае система не сможет сгенерировать надежное представление профиля пользователя (second mathematical representation). Вес этого компонента в ранжировании будет минимальным, и система будет полагаться преимущественно на релевантность непосредственному запросу. Однако может применяться краткосрочная персонализация на основе действий внутри текущей сессии.

Как система балансирует между релевантностью запросу и релевантностью профилю?

Патент предлагает простое суммирование двух оценок схожести. Однако на практике веса этих компонентов могут динамически корректироваться. Если запрос очень специфичен и однозначен, вес запроса будет выше. Если запрос общий или неоднозначный, вес профиля пользователя может быть увеличен для уточнения интента.

Означает ли это, что два разных пользователя увидят совершенно разную выдачу по одному и тому же запросу?

Да, это вполне возможно, особенно если у пользователей сильно различаются профили интересов. Например, по запросу "лучшие ноутбуки" инженер-программист и геймер могут увидеть разные модели на первых позициях, так как система LCR учтет их предыдущие поисковые запросы и предпочтения, отраженные в User Profile.

Похожие патенты

Как Google использует эмбеддинги и историю взаимодействий для персонализации результатов в вертикальном поиске (Hotels, Flights, Shopping)
Google использует методы коллаборативной фильтрации для персонализации выдачи в вертикальных поисках (Hotels, Flights, Shopping). Система анализирует историю взаимодействий всех пользователей, чтобы создать векторные представления (эмбеддинги) для элементов (отелей, товаров). Затем она сравнивает персональный эмбеддинг пользователя с эмбеддингами элементов для ранжирования результатов, максимально соответствующих его предпочтениям.
  • US20190171689A1
  • 2019-06-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Как Google использует данные о закладках, сообществах и поведении пользователей для персонализации и контекстуализации поиска
Патент описывает раннюю систему персонализации поиска, которая собирает и анализирует закладки (content pointers) пользователей и групп, организованные в иерархические категории. Эта информация используется для создания профилей интересов (content vectors), которые затем применяются для дополнения поисковых запросов (query augmentation) и переранжирования результатов (contextualization) с учетом личного контекста, интересов сообщества и недавней активности пользователя.
  • US7031961B2
  • 2006-04-18
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует сущности, онтологии и векторные представления для кластеризации и организации поисковой выдачи
Google использует этот механизм для структурирования поисковой выдачи по широким запросам. Система группирует результаты в кластеры на основе их связи с сущностями из Базы Знаний. Для объединения кластеров используются онтологические связи (иерархия, синонимы) и векторная близость (embedding similarity). Система параллельно тестирует несколько алгоритмов и выбирает наилучшую структуру SERP на основе метрик качества (покрытие, баланс, пересечение, силуэт).
  • US10496691B1
  • 2019-12-03
  • SERP

  • Семантика и интент

  • Knowledge Graph

Как Google моделирует неопределенность и широту темы, используя вероятностные распределения вместо векторных точек
Google использует метод для улучшения dense retrieval, представляя запросы и документы не как отдельные точки (векторы) в семантическом пространстве, а как многомерные вероятностные распределения (области). Это позволяет системе учитывать неопределенность в понимании контента и широту охвата темы, повышая точность поиска за счет сравнения этих распределений.
  • US20240354557A1
  • 2024-10-24
  • Семантика и интент

Популярные патенты

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.
  • US7657520B2
  • 2010-02-02
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

Как Google находит, фильтрует и подмешивает посты из блогов, релевантные конкретным результатам поиска
Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих ссылок (out-degree), качество входящих ссылок (Link-based score), возраст поста, его длину и расположение ссылок, чтобы гарантировать качество подмешиваемого контента.
  • US8117195B1
  • 2012-02-14
  • EEAT и качество

  • Антиспам

  • Ссылки

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)
Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.
  • US8417697B2
  • 2013-04-09
  • Персонализация

  • Поведенческие сигналы

  • Антиспам

Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика
Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.
  • US7716225B1
  • 2010-05-11
  • Ссылки

  • Поведенческие сигналы

  • SERP

seohardcore