SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует анализ "Свежести Ранжирования" (Rank Freshness) и человеческую оценку для борьбы с манипуляциями в поиске и спамом

CONTENT ENTITY MANAGEMENT (Управление сущностями контента)
  • US8176055B1
  • Google LLC
  • 2007-03-27
  • 2012-05-08
  • Свежесть контента
  • Антиспам
  • SERP
  • Ссылки
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google описывает гибридную систему для выявления и разрыва нежелательных ассоциаций контента (например, манипулятивных результатов поиска или спам-комментариев). Система алгоритмически выявляет подозрительные связи, используя сигналы, такие как "Свежесть Ранжирования" (внезапный рост позиций), и отправляет их на проверку оценщикам (Арбитрам). Если консенсус подтверждает нарушение, ассоциация разрывается.

Описание

Какую проблему решает

Патент решает проблему наличия нерелевантных, неуместных или манипулятивных ассоциаций между различными единицами контента. Он направлен на две ключевые области:

  • Манипуляции поисковой выдачей: Противодействие тактикам искусственного завышения ранга веб-страниц, например, путем создания множества ссылок с одинаковым анкорным текстом (Google Bombing).
  • Спам в Пользовательском Контенте (UGC): Очистка комментариев, отзывов или тегов от спам-ссылок, ненормативной лексики или нерелевантного контента.

Что запатентовано

Запатентована система управления контентом, использующая гибридный подход: комбинацию автоматизированной оценки и человеческого анализа для валидации ассоциаций. Система выявляет подозрительные связи на основе алгоритмических сигналов (Association Score) и представляет их группе «арбитров» (Arbiters). Если достигается консенсус о некорректности связи, система выполняет её разрыв (Disassociation).

Как это работает

Ключевой механизм включает несколько этапов:

  1. Идентификация и Оценка: Система анализирует связи между контентом и вычисляет Association Score на основе «феноменов» (Phenomena) — индикаторов спама или манипуляции. Ключевым индикатором является Rank Freshness (Свежесть Ранжирования) — внезапное изменение позиции в поиске.
  2. Отбор Кандидатов: Подозрительные ассоциации (с низкой оценкой или высокой Rank Freshness) выбираются для проверки.
  3. Арбитраж: Ассоциации представляются нескольким арбитрам (людям или программным агентам), часто в «слепом контексте».
  4. Принятие Решения: Система агрегирует решения арбитров. Если количество голосов за разрыв связи превышает порог (Count Threshold), принимается решение о диссоциации.
  5. Исполнение и Поощрение: Связь разрывается (например, результат пессимизируется), а арбитры могут получать поощрения (Credits).

Актуальность для SEO

Высокая. Принципы, заложенные в патенте, — сочетание машинных сигналов и человеческой оценки (работа асессоров/Quality Raters) для борьбы со спамом и манипуляциями — остаются фундаментальными для Google. Концепция выявления аномалий в скорости ранжирования (Rank Freshness) как индикатора манипуляций крайне актуальна, хотя конкретные алгоритмы обнаружения аномалий, вероятно, эволюционировали.

Важность для SEO

Патент имеет значительное влияние на SEO (7.5/10). Он прямо указывает на то, что Google отслеживает не только статичные факторы, но и динамику изменения ранжирования. Rank Freshness является конкретным механизмом для обнаружения искусственных манипуляций. Агрессивные SEO-техники, приводящие к внезапному и неестественному росту позиций, могут активировать этот механизм, приводя к проверке и последующей пессимизации результата.

Детальный разбор

Термины и определения

Arbiters / Reviewers (Арбитры / Рецензенты)
Сущности (люди или программные агенты Software Agents), которые оценивают ассоциацию между первой и второй сущностями и принимают решение о ее валидности.
Association Score (Оценка Ассоциации)
Автоматически рассчитываемая метрика качества связи. Обычно рассчитывается в обратной пропорции к количеству обнаруженных негативных Phenomena.
Blind Context (Слепой контекст)
Режим работы арбитров, при котором они принимают решения независимо, не зная решений других арбитров.
Count Threshold (Порог Количества)
Минимальное количество голосов арбитров, необходимое для принятия решения о разрыве связи. Может быть динамическим.
Disassociation (Диссоциация / Разрыв связи)
Действие по удалению связи между сущностями. Например, удаление спам-комментария или пессимизация результата поиска по запросу.
First Content Entity (Первая сущность контента)
Основной объект. Примеры: поисковый запрос, видео, веб-страница.
Phenomena (Феномены / Явления)
Индикаторы или паттерны, которые предполагают нерелевантность, спам или манипуляцию. Примеры: ненормативная лексика, спам-URL, текстовые шаблоны, высокая Rank Freshness.
Rank Freshness (Свежесть Ранжирования)
Параметр, указывающий на то, что ранг (rank) сущности (например, результата поиска) недавно изменился. Высокий ранг в сочетании с высокой Rank Freshness может указывать на искусственную манипуляцию.
Second Content Entity (Вторая сущность контента)
Контент, ассоциированный с первой сущностью. Примеры: результаты поиска, комментарии, теги.

Ключевые утверждения (Анализ Claims)

Анализ Формулы изобретения (Claims) показывает, что ядром изобретения является специфическая комбинация автоматизированного обнаружения аномалий ранжирования и краудсорсинговой проверки.

Claim 1 (Независимый пункт): Описывает основной защищаемый метод.

  1. Отбор контента по Свежести Ранжирования: Система отбирает Second Content Entities на основе их Association Score. При этом оценка должна быть основана (хотя бы частично) на том, что Rank Freshness (показатель недавнего изменения ранга в поиске) превышает пороговое значение.
  2. Выбор арбитров по локации: Система выбирает множество арбитров, основываясь (хотя бы частично) на их географическом местоположении.
  3. Получение решений: Система предоставляет контент арбитрам и получает их решения.
  4. Принятие решения о разрыве связи: Система определяет, что связь должна быть разорвана, если количество решений о разрыве превышает пороговое значение (Count Threshold).
  5. Исполнение и Вознаграждение: Система разрывает связь и начисляет поощрения (Credits) на счета арбитров, которые приняли решение о разрыве.

Защищенное изобретение (Claim 1) сфокусировано на сценарии обнаружения поисковых манипуляций: использование Rank Freshness как триггера для проверки географически релевантными и мотивированными рецензентами для подтверждения и удаления манипулятивного результата.

Claim 2 (Зависимый): Уточняет, что Association Score также основан на количестве других Phenomena в контенте, таких как текстовый паттерн, ненормативное слово/фраза или URL.

Claim 4 (Зависимый): Описывает стратегию выборки: выбираются сущности, чьи оценки выше первого порога ИЛИ ниже второго порога. Это позволяет показывать арбитрам как подозрительный контент, так и заведомо качественный для контекста и калибровки.

Где и как применяется

Изобретение функционирует как система контроля качества, использующая данные, сгенерированные на разных этапах поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна рассчитывать и отслеживать метрики. Это включает анализ контента на наличие Phenomena (спам, стоп-слова). Эти данные сохраняются для расчета Association Score.

RANKING – Ранжирование
Система должна отслеживать историю ранжирования, чтобы сравнивать текущий ранг с предыдущими и вычислять Rank Freshness. Если Rank Freshness высока (резкий скачок позиций), это может использоваться для снижения Association Score и активации проверки.

RERANKING – Переранжирование (Пост-обработка)
Основное применение патента.

  1. Триггер: Система идентифицирует сущности с низкой Association Score (например, из-за высокой Rank Freshness).
  2. Арбитраж: Запускается процесс проверки с привлечением Arbiters.
  3. Корректировка: Если арбитры подтверждают невалидность ассоциации, сущность диссоциируется. В контексте поиска это означает удаление результата из выдачи по данному запросу или его значительную пессимизацию на этапе RERANKING.

Входные данные:

  • Первая и вторые сущности контента.
  • Исторические данные о ранжировании (для Rank Freshness).
  • Association Scores.
  • Профили арбитров (география, опыт).

Выходные данные:

  • Решение о диссоциации (Да/Нет).
  • Обновленный набор ассоциаций (очищенная выдача).

На что влияет

  • Специфические запросы и результаты поиска: Наибольшее влияние на результаты, демонстрирующие аномальное поведение ранжирования (высокая Rank Freshness), что часто является признаком манипуляций (например, агрессивного линкбилдинга).
  • Пользовательский контент (UGC): Влияет на качество комментариев, отзывов, тегов на платформах (например, YouTube, Google Maps).
  • Конкретные ниши: Конкурентные коммерческие ниши, подверженные агрессивному SEO и спаму.

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда у Second Content Entity обнаруживаются подозрительные Phenomena. Согласно Claim 1, ключевым триггером является превышение порога Rank Freshness. Также триггером может быть слишком низкий Association Score (явный спам).
  • Временные рамки: Процесс оценки может быть синхронным (в реальном времени с таймером) или асинхронным (решения накапливаются в буфере).

Пошаговый алгоритм

Этап 1: Автоматическая оценка и выбор кандидатов

  1. Мониторинг Ранжирования и Расчет Rank Freshness: Система отслеживает изменения позиций сущностей в поиске и вычисляет метрику Rank Freshness.
  2. Сбор данных о Феноменах: Поиск во вторых сущностях индикаторов спама (текстовые шаблоны, URL).
  3. Расчет Association Score: Вычисление оценки для каждой второй сущности. Оценка обратно пропорциональна количеству обнаруженных феноменов и уровню Rank Freshness.
  4. Выбор кандидатов для проверки: Идентификация сущностей, удовлетворяющих критериям активации (например, Rank Freshness выше порога).

Этап 2: Арбитраж и Принятие Решений

  1. Выбор Арбитров: Выбор группы рецензентов. Критерии могут включать геолокацию (как в Claims), опыт или точность.
  2. Презентация Задачи: Отправка первой и выбранных вторых сущностей арбитрам в Blind Context. Может быть установлено ограничение по времени.
  3. Сбор Решений: Получение от арбитров определений о необходимости диссоциации.
  4. Агрегация и Принятие Решения: Определение, достигнут ли Count Threshold (необходимое количество голосов для разрыва связи). Порог может зависеть от Association Score.
  5. Исполнение: Диссоциация невалидных вторых сущностей (пессимизация или удаление).
  6. Поощрение: Начисление Credits арбитрам, которые приняли верное решение.

Какие данные и как использует

Данные на входе

  • Контентные и Структурные факторы: Текст вторых сущностей. Система ищет конкретные текстовые паттерны (textual patterns), ненормативную лексику и URL.
  • Временные факторы / Данные Ранжирования: История изменения позиций (ранга) второй сущности. Критически важны для расчета Rank Freshness.
  • Пользовательские и Географические факторы: Данные об арбитрах. Учитываются уровень опыта, точность предыдущих оценок и географическое положение (arbiter location).

Какие метрики используются и как они считаются

  • Rank Freshness (Свежесть Ранжирования): Метрика, измеряющая, насколько недавно и значительно изменился ранг контента. Высокое значение является триггером для проверки.
  • Association Score (Оценка Ассоциации): Агрегированная метрика качества связи. Рассчитывается в обратной пропорции (substantially inverse proportion) к идентификации Phenomena (включая Rank Freshness).
  • Count Threshold (Порог Количества): Определяет необходимый уровень консенсуса среди арбитров. Патент предлагает динамическую систему (см. Таблицу 1 в описании), где требуемый процент голосов зависит от Association Score. Пример:
    • Если Score низкий (высокое подозрение), требуется меньше голосов (например, >50%).
    • Если Score высокий (низкое подозрение), может требоваться единогласие (100%).

Выводы

  1. Rank Freshness как индикатор манипуляций: Патент явно определяет скорость изменения ранжирования (Rank Freshness) как ключевой сигнал для выявления потенциальных манипуляций в поиске. Резкий взлет позиций является триггером для проверки.
  2. Гибридный подход к качеству (Машина + Человек): Система использует автоматические алгоритмы (Association Score) для выявления подозрительного контента, но полагается на человеческую оценку (Arbiters) для финальной валидации и принятия мер.
  3. Гибкость в принятии решений: Уровень уверенности автоматической системы влияет на вес человеческих решений. Чем ниже Association Score, тем меньше голосов арбитров может потребоваться для пессимизации контента.
  4. Борьба с UGC-спамом и манипуляциями в поиске: Описан универсальный механизм, применимый как для очистки комментариев/отзывов, так и для контроля качества поисковой выдачи (включая борьбу с тактиками типа Google Bombing).
  5. Важность контекста и характеристик ревьюеров: Система учитывает характеристики арбитров (например, локацию, опыт) и может предоставлять им контекст (показывая как плохой, так и хороший контент) для повышения качества валидации.

Практика

Best practices (это мы делаем)

  • Фокус на устойчивом и естественном росте: Стратегии должны быть направлены на постепенное улучшение позиций. Естественный рост снижает риск достижения критического порога Rank Freshness и активации проверки на манипуляции.
  • Мониторинг скорости роста (Velocity): SEO-специалистам следует отслеживать скорость изменения позиций. Если сайт резко взлетает в ТОП, это может привлечь внимание систем качества Google.
  • Жесткая модерация UGC: Необходимо активно модерировать пользовательский контент (комментарии, отзывы). Наличие спама или нерелевантного контента (Phenomena) может негативно влиять на общее качество ресурса.
  • Естественный анкор-лист: Патент упоминает манипуляцию через общий анкорный текст как проблему. Это подтверждает необходимость поддержания разнообразного и естественного профиля обратных ссылок.

Worst practices (это делать не надо)

  • Агрессивные тактики для быстрого роста (Высокая Link Velocity): Использование PBN, массовая закупка ссылок или другие тактики, направленные на резкий рост позиций в короткие сроки. Это напрямую увеличивает Rank Freshness и является триггером для проверки и последующей пессимизации.
  • Манипуляции с анкорным текстом (Google Bombing): Создание большого количества ссылок с идентичным коммерческим анкором является тактикой, против которой направлены подобные системы контроля качества.
  • Игнорирование качества UGC: Разрешение публикации немодерируемого пользовательского контента, который может содержать спам (Phenomena).

Стратегическое значение

Этот патент подтверждает, что Google анализирует не только текущее состояние факторов ранжирования, но и скорость их изменения. Динамика ранжирования является важным элементом систем обнаружения аномалий. Стратегическое SEO должно избегать создания паттернов, которые выглядят неестественно или манипулятивно с точки зрения скорости изменений. Патент также демонстрирует инфраструктуру Google для интеграции человеческого интеллекта в процесс контроля качества поиска.

Практические примеры

Сценарий: Выявление и нейтрализация манипуляции результатами поиска

  1. Ситуация: Сайт использует агрессивную тактику (например, мощную PBN) для продвижения по запросу «быстрый займ онлайн» и за неделю перемещается с 30-й позиции на 2-ю.
  2. Реакция системы (Идентификация): Алгоритмы Google фиксируют аномально высокий показатель Rank Freshness для этой ассоциации (запрос-документ). Association Score снижается.
  3. Активация проверки: Ассоциация помечается как подозрительная и отправляется на проверку арбитрам (асессорам).
  4. Проверка Арбитрами: Арбитры оценивают качество сайта и его релевантность запросу. Если они находят сайт менее качественным или манипулятивным, они голосуют за разрыв ассоциации.
  5. Результат: Если достигнут Count Threshold (например, большинство голосов), система выполняет диссоциацию, что приводит к резкому понижению сайта в выдаче по этому запросу.

Вопросы и ответы

Что такое "Свежесть Ранжирования" (Rank Freshness) и почему это важно для SEO?

Rank Freshness — это метрика, которая показывает, насколько недавно и значительно изменилась позиция документа в поисковой выдаче. Согласно патенту, сочетание высокого ранга и высокой Rank Freshness (т.е. внезапный скачок в ТОП) рассматривается как сильный сигнал потенциальной искусственной манипуляции. Для SEO это означает, что агрессивные тактики, вызывающие слишком быстрый рост позиций, несут повышенные риски активации систем контроля качества и последующей пессимизации.

Кто такие "Арбитры" (Arbiters) в этом патенте? Это Quality Raters?

Arbiters — это субъекты, оценивающие качество ассоциаций. Патент указывает, что это могут быть как люди, так и автоматизированные программные агенты (Software Agents). Функционал арбитров очень похож на работу асессоров Google (Quality Raters) — они предоставляют структурированную человеческую оценку для валидации результатов поиска и обучения алгоритмов.

Как система определяет, что ассоциация подозрительна?

Система вычисляет Association Score. Эта оценка обратно пропорциональна наличию "феноменов" (Phenomena) — индикаторов низкого качества. Феномены включают в себя Rank Freshness, а также наличие спам-паттернов, ненормативной лексики или подозрительных URL. Низкая Association Score является триггером для проверки арбитрами.

Как взаимодействуют автоматическая оценка (Association Score) и решения людей (Arbiters)?

Патент предлагает гибкую систему. Если автоматическая система высоко уверена в низком качестве (очень низкая Association Score), может потребоваться меньше голосов от арбитров для диссоциации (например, 50%). Если же автоматическая оценка не так критична, может потребоваться более высокий консенсус или даже единогласное решение (100%).

Патент фокусируется только на поисковом спаме или также на UGC?

Описание патента охватывает оба аспекта. Rank Freshness применяется в контексте поисковых манипуляций. Выявление Phenomena, таких как спам-ссылки или неуместный текст, применяется для модерации пользовательского контента (UGC), такого как комментарии к видео или отзывы о товарах. Система универсальна.

Как этот патент влияет на стратегии линкбилдинга?

Он напрямую влияет на них через концепцию Rank Freshness. Агрессивный линкбилдинг (высокая Link Velocity), приводящий к неестественно быстрому росту позиций, увеличивает риски проверки. Кроме того, патент упоминает искусственное завышение веса через общий анкорный текст как проблему, подчеркивая риски использования монотонных анкоров и неестественных ссылочных профилей.

В Claim 1 упоминается выбор арбитров по географическому местоположению. Почему это важно?

Выбор арбитров по локации критически важен для проверки локализованных результатов поиска или контента, требующего культурного или языкового контекста. Это гарантирует, что ревьюеры лучше понимают специфику региона, для которого предназначен контент, и могут точнее оценить его релевантность.

Что такое "слепой контекст" (Blind Context) при проверке?

Blind Context означает, что арбитры работают независимо друг от друга. Они не знают, кто еще проверяет этот контент и какие решения принимают другие. Это обеспечивает объективность и предотвращает влияние мнения большинства на индивидуальное решение, повышая надежность итогового консенсуса.

Может ли мой сайт быть понижен, если он растет слишком быстро, но естественно?

Теоретически, резкий рост (даже естественный) может превысить порог Rank Freshness и инициировать проверку. Однако, если сайт является качественным и релевантным, арбитры должны подтвердить корректность ассоциации, и сайт не будет понижен. Система ищет манипуляции, а не наказывает за естественный успех, но быстрый рост всегда привлекает дополнительное внимание систем качества.

Насколько актуальна концепция Rank Freshness сегодня?

Концепция мониторинга аномалий в ранжировании остается крайне актуальной. Хотя термин Rank Freshness может не использоваться публично, лежащий в его основе принцип — обнаружение неестественно быстрых изменений как признака манипуляции — является стандартной практикой в системах обнаружения аномалий и борьбы со спамом. Современные ML-модели, вероятно, используют более сложные методы для этого анализа.

Похожие патенты

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент
Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.
  • US8874558B1
  • 2014-10-28
  • EEAT и качество

  • Свежесть контента

  • Индексация

Как Google визуально выделяет популярные профили в поиске и использует частоту запросов для борьбы с фейковыми аккаунтами
Google использует данные о популярности (количество связей) и качестве (вовлеченность) профилей пользователей, чтобы визуально выделить наиболее авторитетные результаты при поиске людей или брендов. Если один профиль значительно популярнее других, он отображается крупнее. Система также динамически регулирует порог качества в зависимости от частоты запроса: чем популярнее имя, тем выше требования к профилю для его отображения, что помогает бороться со спамом.
  • US8935245B1
  • 2015-01-13
  • SERP

  • Антиспам

  • EEAT и качество

Как Google определяет оригинальность контента для расчета Авторского Ранга (Author Rank) и влияния на ранжирование
Google использует систему для идентификации оригинального контента и повышения авторитета его создателей. Система разбивает документы на фрагменты (content pieces) и отслеживает их первое появление. Авторы (включая домены) ранжируются на основе количества созданного ими оригинального контента и частоты его копирования другими. Ранг автора затем используется для повышения в выдаче документов этого автора, особенно свежих публикаций.
  • US8983970B1
  • 2015-03-17
  • EEAT и качество

  • Свежесть контента

  • SERP

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Популярные патенты

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google использует историю чтения новостных сайтов для определения географических интересов пользователя и персонализации выдачи
Google может определять географические интересы пользователя, анализируя местоположение издателей новостных сайтов, которые он посещал. Эта информация (Geo Signal) используется для корректировки ранжирования будущих поисковых запросов, повышая результаты, релевантные этим интересам, даже если пользователь физически находится в другом месте.
  • US20130246381A1
  • 2013-09-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google использует генеративный ИИ для создания динамических и гиперперсонализированных бизнес-профилей
Google разрабатывает систему, которая заменяет статические бизнес-профили динамическими «курируемыми профилями», генерируемыми ИИ (например, LLM). Эти профили адаптируются в реальном времени под конкретного пользователя, учитывая его запрос, предпочтения, историю поиска и демографию, чтобы показать наиболее релевантный контент, продукты и описания бренда.
  • US20250054045A1
  • 2025-02-13
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

seohardcore