SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)

PERMITTING USERS TO REMOVE DOCUMENTS (Предоставление пользователям возможности удалять документы)
  • US8417697B2
  • Google LLC
  • 2005-08-22
  • 2013-04-09
  • Персонализация
  • Поведенческие сигналы
  • Антиспам
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.

Описание

Какую проблему решает

Патент решает проблему наличия в поисковой выдаче нежелательных для пользователя результатов (спам, нерелевантный или оскорбительный контент). Изобретение преследует две цели: (1) Персонализация — предоставить пользователю контроль над своей выдачей, позволяя фильтровать нежелательный контент. (2) Улучшение качества поиска — использовать агрегированную обратную связь пользователей для выявления и понижения низкокачественных или спамных ресурсов в глобальном масштабе.

Что запатентовано

Запатентована система, предоставляющая пользователю интерфейс (Remove Feature) для удаления документов или сайтов из результатов поиска. Система предлагает гранулярный контроль над областью действия (документ, сайт, связанные документы) и продолжительностью (текущий поиск, сессия или навсегда). Ключевым элементом является агрегация этих персональных списков удаления (Remove Lists) для вычисления глобальной оценки Remove List Score, которая используется как сигнал ранжирования.

Как это работает

Система работает в двух режимах:

  • Персонализация: Пользователю предоставляется опция для блокировки результата. Этот выбор сохраняется в персональном Remove List. При последующих поисках система фильтрует выдачу, удаляя заблокированный контент и заменяя его другими результатами.
  • Глобальное ранжирование: Система собирает данные из Remove Lists множества пользователей. Эти данные агрегируются, при этом для защиты от манипуляций может применяться фильтрация, учитывающая только «легитимных пользователей» (legitimate users). На основе этих данных вычисляется Remove List Score. Эта оценка используется как фактор ранжирования наряду с IR Score (релевантность) и Link-Based Score (ссылочные факторы).

Актуальность для SEO

Высокая. Хотя конкретный интерфейс блокировки сайтов в Google менялся (был явно доступен около 2011-2012 гг.), базовая концепция использования агрегированной негативной обратной связи (явной или неявной) для оценки качества и борьбы со спамом остается фундаментальной для Google. Присутствие Мэтта Каттса среди изобретателей подчеркивает антиспамную направленность механизма.

Важность для SEO

Патент имеет высокое значение для SEO (85/100). Он описывает конкретный механизм, с помощью которого массовое недовольство пользователей сайтом может быть преобразовано в глобальный сигнал ранжирования (Remove List Score). Это подчеркивает, что удовлетворенность пользователя (User Satisfaction) и качество UX являются критически важными факторами для долгосрочного успеха в SEO, способными нивелировать другие положительные сигналы.

Детальный разбор

Термины и определения

Document Score (Итоговая оценка документа)
Финальная оценка, используемая для ранжирования. Является функцией от IR Score, Link-based Score и Remove List Score.
IR Score (Information Retrieval Score)
Оценка релевантности документа запросу, основанная на анализе контента.
Legitimate users (Легитимные пользователи)
Пользователи, идентифицированные системой как настоящие (в отличие от спамеров или ботов). Их обратная связь используется для расчета Remove List Score, чтобы предотвратить манипуляции.
Link-based Score (Оценка на основе ссылок)
Оценка авторитетности документа, основанная на анализе ссылок (например, PageRank).
Remove feature (Функция удаления)
Элемент пользовательского интерфейса (кнопка, ссылка, меню), позволяющий пользователю инициировать удаление результата.
Remove List (Список удаления)
Персональный список, хранящий идентификаторы заблокированных пользователем документов/сайтов. Может иметь уровни: для текущего поиска, сессии или постоянный.
Remove List Score (Оценка на основе списка удаления)
Глобальная метрика ранжирования, рассчитываемая на основе агрегированных данных о том, как часто пользователи блокируют данный документ/сайт.
Session (Сессия)
Последовательность запросов или взаимодействий пользователя в течение определенного периода активности.

Ключевые утверждения (Анализ Claims)

Патент содержит две основные концепции. Claims (Формула изобретения) фокусируются на механизме персонализации и UI, тогда как Description (Описание изобретения, особенно FIG. 18-19) детализирует механизм глобального ранжирования.

Claims 1, 3, 17 (Независимые пункты): Описывают процесс персонализированного удаления с гранулярностью по времени.

  1. Система предоставляет список результатов поиска.
  2. Вместе с конкретным результатом визуально представляются три опции удаления:
    • Опция 1: Удалить только для этого поиска.
    • Опция 2: Удалить только для этой сессии.
    • Опция 3: Удалить для всех поисков и сессий.
  3. Система получает выбор пользователя.
  4. В зависимости от выбора, результат удаляется немедленно (Опция 1) или информация сохраняется в соответствующем Remove List (Опции 2 и 3).
  5. Критический элемент: Система создает модифицированный список результатов, в котором удаленный результат заменяется другим результатом.
  6. Модифицированный список представляется пользователю.

Анализ механизма ранжирования (на основе Description):

  1. Система собирает информацию из Remove Lists группы пользователей.
  2. Эта информация агрегируется. При агрегации может применяться фильтрация для учета только legitimate users с целью защиты от спам-атак.
  3. На основе агрегированных данных вычисляется Remove List Score для документов.
  4. Итоговая оценка документа (Document Score) рассчитывается путем комбинации IR Score, Link-Based Score и Remove List Score.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя как офлайн-вычисления, так и обработку в реальном времени.

INDEXING – Индексирование и извлечение признаков (Offline/Batch)
На этом этапе происходит агрегация данных. Система собирает информацию о блокировках, фильтрует её для выявления legitimate users и вычисляет Remove List Score. Эта оценка сохраняется в индексе.

RANKING – Ранжирование
Во время ранжирования система использует предварительно вычисленный Remove List Score как один из сигналов. Он комбинируется с другими оценками для определения итогового Document Score.

RERANKING – Переранжирование (Real-time/Personalization)
После основного ранжирования система применяет персональные фильтры. Результаты сравниваются с персональным Remove List пользователя, и заблокированные документы удаляются из финальной выдачи.

Входные данные:

  • Действия пользователей по блокировке.
  • Идентификаторы пользователей и данные для оценки их легитимности.
  • Идентификаторы документов/сайтов (URL).
  • Исходный список результатов поиска.

Выходные данные:

  • Персонализированная (отфильтрованная) SERP для пользователя.
  • Агрегированный Remove List Score для использования в глобальном ранжировании.

На что влияет

  • Конкретные типы контента и ниши: Наибольшее влияние оказывается на контент, который пользователи считают нежелательным: спам, низкокачественные ресурсы, сайты с агрессивной рекламой (MFA), вводящий в заблуждение или оскорбительный контент.
  • Борьба со спамом: Это прямой механизм обратной связи для выявления спама на основе коллективного мнения пользователей.

Когда применяется

  • Персонализация: Применяется в реальном времени при каждом поиске, если у пользователя есть активный Remove List.
  • Глобальное ранжирование: Расчет Remove List Score происходит периодически в фоновом режиме. Влияние на ранжирование постоянно после расчета.
  • Исключения (Quality Override): Патент упоминает, что если документ определен как высококачественный (на основе его оценки, свежести, количества обратных ссылок и т.д.), он может быть показан пользователю, даже если находится в его Remove List. В этом случае он будет визуально выделен (например, серым цветом или в отдельном блоке).

Пошаговый алгоритм

Процесс А: Персонализированная фильтрация (Real-time)

  1. Получение результатов: Система генерирует стандартный список результатов поиска.
  2. Проверка Remove List: Система сравнивает результаты с персональным Remove List пользователя.
  3. Модификация выдачи: Если есть совпадения, эти результаты удаляются и заменяются следующими по рангу документами.
  4. Представление выдачи: Пользователю показывается модифицированный список с уведомлением об удаленных результатах и опцией отмены (Undo).

Процесс Б: Добавление в Remove List (Real-time)

  1. Получение индикации удаления: Пользователь активирует Remove Feature для результата.
  2. Выбор параметров: Пользователь выбирает область действия (Документ/Сайт) и продолжительность (Поиск/Сессия/Навсегда).
  3. Обновление Remove List: Идентификатор ресурса добавляется в соответствующий список.
  4. Обновление выдачи: Текущая выдача немедленно модифицируется (см. Процесс А).

Процесс В: Корректировка глобального ранжирования (Offline/Batch)

  1. Сбор данных: Система собирает информацию о блокировках от группы пользователей.
  2. Валидация пользователей: Система фильтрует данные, чтобы учитывать только legitimate users и отсеивать манипуляции.
  3. Агрегация данных: Подсчитывается частота блокировок для документов/сайтов.
  4. Расчет Remove List Score: На основе агрегированных данных вычисляется Remove List Score.
  5. Интеграция в ранжирование: Remove List Score комбинируется с IR Score и Link-based Score для расчета итогового Document Score.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Явные действия пользователя по удалению (блокировке) результата (explicit negative feedback).
  • Пользовательские факторы: Данные для оценки легитимности пользователя: история взаимодействий с поиском, репутация, наличие логина, наличие платных отношений с поисковой системой.
  • Контентные и Ссылочные факторы: Используются для расчета базовых IR Score и Link-based Score.

Какие метрики используются и как они считаются

  • Remove List Score: Метрика, основанная на агрегированных данных о блокировках. Может учитывать количество разных пользователей, заблокировавших документ. Рассчитывается только на основе данных от legitimate users.
  • Document Score: Итоговая оценка ранжирования. Рассчитывается как комбинация трех компонентов: IR Score, Link-based Score и Remove List Score.
  • Оценка легитимности пользователя (Legitimacy Score - подразумевается): Метрика для фильтрации спама при расчете Remove List Score.

Выводы

  1. Явная негативная обратная связь как сигнал ранжирования: Патент подтверждает, что Google разработал инфраструктуру для использования явных действий пользователей (блокировок) в качестве глобального сигнала ранжирования (Remove List Score).
  2. Коллективная оценка качества: Массовая блокировка сайта легитимными пользователями сигнализирует о его низком качестве или нежелательности, что приводит к его понижению в выдаче для всех пользователей.
  3. Защита от манипуляций (Anti-Spam): Система включает критически важный компонент фильтрации обратной связи, учитывая только legitimate users. Это предотвращает возможность конкурентам искусственно «заблокировать» сайт.
  4. Интеграция с основными сигналами: Remove List Score является одним из трех основных компонентов итоговой оценки, наряду с релевантностью и авторитетностью.
  5. Приоритет качества над персонализацией (Quality Override): Система может игнорировать персональную блокировку, если считает документ высококачественным по другим метрикам, но уведомит об этом пользователя.

Практика

Best practices (это мы делаем)

  • Максимизация удовлетворенности пользователя (User Satisfaction): Это ключевая стратегия. Необходимо предоставлять качественный контент и отличный UX, чтобы минимизировать вероятность того, что пользователь захочет заблокировать ваш сайт.
  • Соответствие интенту и ожиданиям: Убедитесь, что контент точно соответствует тому, что обещано в сниппете. Несоответствие ведет к разочарованию и потенциальным блокировкам.
  • Мониторинг репутации и UX: Отслеживайте обратную связь и поведенческие метрики. Агрессивная реклама, всплывающие окна и плохая навигация — основные причины, по которым пользователи могут блокировать сайт.
  • Создание авторитетного бренда (E-E-A-T): Работайте над повышением доверия к сайту. Пользователи реже блокируют сайты, которым они доверяют.

Worst practices (это делать не надо)

  • Использование кликбейта и обманных техник: Привлечение трафика с помощью вводящих в заблуждение заголовков или дорвеев резко повышает риск массовых блокировок и ухудшения Remove List Score.
  • Агрессивная монетизация и MFA-сайты: Сайты с низкокачественным контентом и плохим UX, созданные для показа рекламы, являются основными кандидатами на пессимизацию через этот механизм.
  • Попытки манипуляции системой: Организация массовых блокировок сайтов конкурентов неэффективна из-за механизмов фильтрации по legitimate users.
  • Игнорирование негативной обратной связи: Игнорирование жалоб пользователей и плохих поведенческих факторов опасно, так как это коррелирует с сигналами, которые Google использует для оценки качества.

Стратегическое значение

Патент подтверждает стратегию Google по интеграции поведенческих данных и обратной связи в ядро алгоритмов ранжирования. Он демонстрирует, как негативный пользовательский опыт преобразуется в измеримый сигнал ранжирования. Для SEO это означает, что долгосрочная стратегия должна быть направлена на реальную удовлетворенность конечного пользователя, чтобы избежать накопления негативных сигналов, таких как Remove List Score.

Практические примеры

Сценарий: Глобальное понижение сайта из-за плохого UX

  1. Ситуация: Информационный сайт внедряет агрессивные полноэкранные рекламные баннеры (interstitial ads), которые мешают доступу к контенту.
  2. Реакция пользователей: Значительное количество пользователей, приходящих из поиска, испытывают фрустрацию и используют функцию «Удалить» для блокировки этого сайта навсегда.
  3. Обработка Google: Система агрегирует эти данные. Убедившись, что блокировки исходят от legitimate users, система пересчитывает Remove List Score для домена.
  4. Расчет оценки: Remove List Score ухудшается, что снижает общий Document Score, даже если IR Score и Link-based Score остаются высокими.
  5. Результат: Сайт теряет позиции в глобальной выдаче по релевантным запросам, уступая место ресурсам с лучшим UX.

Вопросы и ответы

Что такое Remove List Score и как он влияет на ранжирование?

Remove List Score — это глобальный сигнал ранжирования, рассчитываемый на основе агрегированных данных о том, как часто пользователи блокируют определенный документ или сайт. Согласно патенту, эта оценка является одним из трех компонентов итогового рейтинга документа, наряду с релевантностью (IR Score) и ссылочной оценкой (Link-Based Score). Если сайт часто блокируется, это негативно влияет на его позиции в глобальной выдаче.

Могут ли конкуренты использовать эту функцию для атаки на мой сайт?

Патент предусматривает защиту от таких манипуляций. При расчете Remove List Score система фильтрует обратную связь и учитывает только «легитимных пользователей» (legitimate users). Легитимность определяется на основе истории активности, репутации пользователя или статуса аккаунта. Скоординированные атаки ботов или нелегитимных аккаунтов, скорее всего, будут проигнорированы.

Как SEO-специалисту понять, что сайт часто блокируют пользователи?

Прямых данных о блокировках Google не предоставляет. Необходимо ориентироваться на косвенные метрики неудовлетворенности пользователей: плохие поведенческие факторы (высокий Bounce Rate, низкое время на сайте), негативные отзывы на сторонних ресурсах и жалобы. Необходимо фокусироваться на улучшении UX и качества контента для предотвращения блокировок.

Где хранится «Remove List» — в браузере пользователя или на серверах Google?

Патент описывает оба варианта. Remove List может храниться локально на клиенте (например, если функция реализована через плагин браузера) или на сервере поисковой системы. Хранение на сервере требует идентификации пользователя (например, через логин) и необходимо для сбора данных для глобального ранжирования.

Если пользователь заблокировал мой сайт, он никогда его больше не увидит?

Не обязательно. Во-первых, пользователь может выбрать временную блокировку (поиск или сессия). Во-вторых, патент описывает механизм «Quality Override»: если система признает документ высококачественным по другим метрикам, она может показать его пользователю в особом виде (например, серым цветом) с опцией восстановления, игнорируя блокировку.

Чем отличаются опции удаления «для этого поиска», «для этой сессии» и «для всех поисков»?

«Для этого поиска» удаляет результат только из текущей страницы выдачи. «Для этой сессии» блокирует результат на время текущей активности пользователя. «Для всех поисков» — это постоянная блокировка. Предположительно, постоянные блокировки имеют больший вес при расчете глобального Remove List Score.

Влияет ли блокировка одного документа на ранжирование всего сайта?

Да, может влиять. Пользователь может выбрать опцию блокировки всего сайта. Кроме того, при агрегации данных система может обобщать информацию о блокировках отдельных страниц для оценки качества сайта в целом, что повлияет на Remove List Score всего домена.

Актуален ли этот патент, если сейчас в Google нет явной кнопки «Заблокировать сайт»?

Хотя интерфейс мог измениться, базовые принципы актуальны. Патент описывает инфраструктуру для обработки негативной обратной связи. Даже если эта функция сейчас отсутствует или заменена имплицитными сигналами (например, pogo-sticking), механизм агрегации пользовательского недовольства и его использования в ранжировании остается важной концепцией.

Что происходит с выдачей, когда пользователь блокирует результат?

Выдача немедленно модифицируется. Заблокированный результат удаляется, а на его место подтягивается следующий по релевантности документ, который ранее не попадал на эту страницу выдачи. Система также показывает пользователю уведомление о том, что контент был скрыт, и предлагает опцию отмены действия («Undo»).

Какова роль Мэтта Каттса (Matt Cutts) в этом патенте?

Мэтт Каттс возглавлял команду Google по борьбе с веб-спамом. Его присутствие среди изобретателей подчеркивает, что механизм блокировки рассматривался не только как функция персонализации, но и как важный инструмент для сбора данных о спаме и низкокачественном контенте от пользователей для улучшения общих алгоритмов ранжирования.

Похожие патенты

Как Google использует специфические сигналы (частоту постинга, рекламу и популярность) для оценки качества блогов и борьбы с автоматизированным контентом
Google разработал систему для ранжирования блогов, которая вычисляет независимую от запроса Оценку Качества (Quality Score). Эта оценка учитывает сигналы популярности (подписки, CTR), авторитетности (Pagerank, ссылки), а также выявляет спам-паттерны: автоматизированную частоту и размер постов, расположение рекламы и ссылочные схемы. Финальный рейтинг определяется комбинацией этой оценки качества и стандартной релевантности.
  • US8244720B2
  • 2012-08-14
  • EEAT и качество

  • Антиспам

  • Индексация

Как Google использует персональные оценки пользователей для экстраполяции предпочтений и персонализации поисковой выдачи
Google использует механизм для агрегации оценок (явных или неявных), которые пользователь дает отдельным веб-страницам. Система формирует персональный «рейтинг сайта» или раздела сайта на основе этих данных. Затем этот агрегированный рейтинг используется для повышения или понижения позиций других страниц этого сайта в будущих поисковых результатах конкретного пользователя, даже если эти страницы он ранее не оценивал.
  • US8589391B1
  • 2013-11-19
  • Персонализация

  • SERP

  • Поведенческие сигналы

Как Google персонализирует выдачу, понижая результаты, которые пользователь исторически игнорирует или быстро покидает
Google использует историю поиска пользователя для выявления результатов, которые пользователь систематически пропускает или считает нерелевантными (например, быстро возвращается на выдачу). Такие результаты идентифицируются как «нежелательные» (User-Disfavored) и активно понижаются в персональной выдаче для этого пользователя, даже если их общий рейтинг высок.
  • US7827170B1
  • 2010-11-02
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
  • US9152652B2
  • 2015-10-06
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

seohardcore