SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя

SYSTEMS AND METHODS FOR ANALYZING A USER'S WEB HISTORY (Системы и методы анализа веб-истории пользователя)
  • US20060224583A1
  • Google LLC
  • 2005-03-31
  • 2006-10-05
  • Персонализация
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.

Описание

Какую проблему решает

Патент решает задачу повышения релевантности поиска путем интеграции исторических данных о поведении пользователя. Стандартная выдача не учитывает индивидуальные предпочтения и контекст. Цель изобретения — использовать историю поиска и браузинга (prior activities) для персонализации результатов, автоматического выявления важного контента и предоставления пользователю инструментов для анализа его прошлой активности.

Что запатентовано

Запатентована система сбора, анализа и применения истории веб-активности пользователя. Система отслеживает запросы, клики по результатам и рекламе, а также общую браузинговую активность. Ключевыми элементами являются методы организации этой истории в Query Sessions (связанные действия в рамках одного сеанса) и Session Groups (связанные действия, распределенные во времени), а также использование этих данных для модификации результатов поиска и идентификации Preferred Locations (предпочитаемых локаций).

Как это работает

Система работает в нескольких направлениях:

  • Сбор данных: Активность пользователя мониторится (например, через Client Assistant или серверные логи) и сохраняется в User Information Database.
  • Структурирование истории: Система анализирует активность, группируя связанные действия в Query Sessions. Затем она связывает похожие сессии из разных периодов времени, формируя Session Groups для понимания долгосрочных интересов.
  • Определение предпочтений: На основе частоты визитов и времени пребывания (stay-time) система вычисляет Preferred Locations (неявные закладки).
  • Персонализация выдачи: При новом поиске система корректирует ранжирование, повышая позиции ранее посещенных или предпочитаемых ресурсов, или визуально выделяет знакомые ссылки.

Актуальность для SEO

Высокая. Патент описывает фундаментальные принципы персонализации поиска. Хотя конкретные алгоритмы с 2005 года значительно эволюционировали в сторону сложных ML-моделей, базовые концепции (использование истории кликов, анализ сессий, учет времени пребывания для изменения SERP) остаются критически важными для современных поисковых систем.

Важность для SEO

Патент имеет высокое стратегическое значение (8/10). Он напрямую подтверждает, что Google использует историю поведения конкретного пользователя для изменения его персональной выдачи. Это означает, что успешное прошлое взаимодействие с сайтом (высокий CTR, длительный stay-time, повторные визиты) может привести к его значительному повышению в ранжировании для этого пользователя в будущем. Это критически важно для стратегий удержания аудитории (retention) и построения бренда.

Детальный разбор

Термины и определения

Client Assistant (Клиентский помощник)
Локальная программа или плагин на устройстве пользователя (например, тулбар), предназначенный для мониторинга действий пользователя (включая браузинг) и передачи их на сервер.
Derived Data (Производные данные)
Информация, вычисленная на основе анализа сырых данных о событиях (Event-Based Data). Примеры: профиль интересов пользователя, список Preferred Locations, агрегированные оценки.
Event-Based Data (Данные, основанные на событиях)
Сырые записи о действиях пользователя. Включают типы: Query Event (запрос), Result Click Event (клик по результату), Ad Click Event (клик по рекламе), Browsing Event (посещение страницы).
History Score (Оценка истории)
Ранговое значение, присваиваемое событию в истории. Может зависеть от времени (например, уменьшаться по мере устаревания) и использоваться для корректировки результатов поиска.
Preferred Locations (Предпочитаемые локации)
Набор сайтов или страниц, автоматически идентифицированных как важные для пользователя на основе его истории (implicit favorites). Ранжирование основано на частоте, давности визитов и Stay-time.
Query Session (Сессия запросов)
Группа связанных запросов и ассоциированных с ними действий, выполненных в течение одного ограниченного периода активности (Browsing Session).
Session Group (Группа сессий)
Объединение тематически связанных Query Sessions из разных периодов времени (разных Browsing Sessions). Отражает долгосрочный интерес пользователя к теме.
Stay-time (Время пребывания)
Оценка времени, которое пользователь провел на странице. Используется как показатель интереса (прокси важности) при расчете Preferred Locations.
User Information Database (База данных информации о пользователе)
Хранилище, содержащее Event-Based Data и Derived Data для конкретного пользователя.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод анализа исторической активности пользователя путем структурирования истории во времени и по темам.

  1. Система идентифицирует часть исторической активности пользователя.
  2. Из этой активности выделяются как минимум две отдельные сессии (first session и second session).
  3. Внутри каждой сессии идентифицируются одна или несколько группировок (groupings) связанных действий.
  4. Система ассоциирует (связывает) идентифицированную группировку из первой сессии с группировкой из второй сессии.

Ядром изобретения является метод организации истории, который активно ищет и связывает тематически схожие действия (группировки), произошедшие в разные периоды времени (сессии). Это позволяет системе строить продольное представление активности пользователя по конкретным темам (формируя Session Groups).

Claim 4 (Зависимый от 1): Описывает применение этого анализа в поиске.

  1. Получение поискового запроса и стандартных результатов поиска.
  2. Идентификация ассоциированной группировки (из Claim 1), релевантной запросу.
  3. Одновременное отображение этой ассоциированной группировки и стандартных результатов поиска.

Система может дополнять стандартную выдачу историческим контекстом, показывая прошлую связанную активность пользователя.

Claim 7 (Зависимый от 1): Уточняет механизм связывания группировок.

Ассоциация происходит, когда оценка схожести (similarity score) между группировками из разных сессий превышает определенный порог.

Где и как применяется

Изобретение затрагивает сбор данных о пользователе, их анализ и использование для персонализации на финальных этапах ранжирования.

INDEXING – Индексирование (Пользовательских данных)
Система собирает Event-Based Data (запросы, клики, браузинг) и индексирует их в User Information Database. На этом этапе (офлайн или в режиме, близком к реальному времени) вычисляются Derived Data: профили интересов, Query Sessions, Session Groups и Preferred Locations.

QUNDERSTANDING – Понимание Запросов
Система выполняет глубокий анализ истории пользователя для выявления долгосрочных интересов (Session Groups). Эта информация может использоваться для лучшего понимания контекста текущего запроса.

RANKING – Ранжирование
Генерируется стандартный (неперсонализированный) набор результатов поиска.

RERANKING / METASEARCH – Переранжирование и Смешивание
Основной этап применения патента. Система использует данные из User Information Database для корректировки стандартных результатов:

  1. Корректировка оценок (Reranking): Оценки ранжирования результатов модифицируются. Результаты, которые пользователь ранее посещал или которые являются Preferred Locations, могут быть повышены (boosted). Результаты, которые ранее показывались, но не были выбраны, могут быть понижены (demoted).
  2. Смешивание и Отображение (Blending/Presentation): Релевантные результаты из истории могут отображаться в отдельном блоке (My Search History results) или использоваться для визуальной индикации (например, дата последнего визита) на SERP.

Входные данные:

  • Текущий поисковый запрос и стандартные результаты поиска.
  • Данные из User Information Database (История событий, Session Groups, Preferred Locations).
  • Идентификатор пользователя (User ID) или клиента (Client ID/Cookie).

Выходные данные:

  • Персонализированный набор результатов поиска (с измененным порядком, аннотациями и/или добавленными блоками).

На что влияет

  • Персональная выдача: Влияет исключительно на выдачу конкретного пользователя, для которого собрана история. Не влияет на глобальное ранжирование напрямую.
  • Типы запросов: Наибольшее влияние на повторяющиеся запросы, исследовательские задачи (где формируются Session Groups) и навигационные запросы.

Когда применяется

  • Условия работы: Алгоритм применяется, когда пользователь идентифицирован и у него активна запись истории.
  • Триггеры активации: Наличие в стандартной выдаче результатов, с которыми пользователь ранее взаимодействовал, или наличие в истории релевантных Session Groups/Preferred Locations.
  • Исключения: Пользователь может управлять подпиской (subscription information) на запись разных типов данных или активировать режим "snooze" (временная остановка записи активности).

Пошаговый алгоритм

Процесс А: Сбор и обработка истории (Фоновый/Офлайн процесс)

  1. Мониторинг и передача: Отслеживание активности пользователя и отправка данных на сервер.
  2. Идентификация и проверка подписки: Определение пользователя и проверка разрешений на запись данных (учет snooze).
  3. Сохранение: Запись Event-Based Data в User Information Database.
  4. Пересчет производных данных: Обновление Derived Data (например, Preferred Locations, History Score).
  5. Анализ сессий:
    • Идентификация Browsing Sessions (периоды активности).
    • Идентификация Query Sessions (кластеризация связанных запросов внутри сессии).
    • Идентификация Session Groups (связывание схожих Query Sessions из разных периодов на основе similarity score).

Процесс Б: Персонализация поисковой выдачи (В реальном времени)

  1. Получение запроса и стандартных результатов: Система выполняет стандартный поиск.
  2. Анализ истории: Поиск в User Information Database релевантных данных (предыдущие визиты, Preferred Locations, Session Groups).
  3. Корректировка результатов:
    • Вычисление и применение оценок истории.
    • Переранжирование результатов (повышение/понижение).
  4. Аннотирование и дополнение: Добавление визуальных индикаторов посещений и/или формирование отдельного блока с результатами из истории.
  5. Предоставление ответа: Отправка персонализированной выдачи пользователю.

Какие данные и как использует

Данные на входе

Система полагается преимущественно на поведенческие данные пользователя.

  • Поведенческие факторы (Ключевые данные):
    • Queries: Тексты прошлых запросов.
    • Result Clicks: Клики по стандартным результатам поиска.
    • Ad Clicks: Клики по рекламным объявлениям.
    • Browsing Events: Посещение страниц (URL) вне контекста поиска.
    • Stay-time: Оценка длительности пребывания пользователя на странице.
    • Impressions без клика: Факт показа результата без последующего клика (используется как возможный негативный сигнал для понижения).
  • Временные факторы: Timestamp для каждого события. Используется для определения сессий, частоты (Frequency), давности (Recency) и расчета метрик, зависящих от времени (time-decay).
  • Пользовательские факторы: User Identifier, Client Identifier (Cookie), настройки приватности (подписки, snooze). Пользовательские аннотации и метки к контенту.

Какие метрики используются и как они считаются

  • History Score: Метрика для оценки важности события. Может уменьшаться (затухать) с течением времени.
  • Similarity Score (Оценка схожести): Метрика для определения связи между Query Sessions. Если превышает порог, сессии объединяются в Session Group. Рассчитывается на основе схожести запросов и/или контента.
  • Score (Оценка для ContentID/Preferred Locations): Производная оценка важности контента для пользователя. Факторы расчета включают:
    • Частоту посещений.
    • Stay-time (время пребывания).
    • Давность последнего визита.
    • Негативные сигналы (пропуск клика при показе).
  • Visit Score (Оценка посещения): В одном из вариантов реализации — сумма оценок отдельных визитов (instance visit scores), где оценка каждого визита уменьшается со временем.

Выводы

  1. Персонализация как прямой фактор ранжирования: Патент детально описывает инфраструктуру для глубокой персонализации. История взаимодействий пользователя используется для переранжирования его индивидуальной выдачи, включая повышение (boosting) и понижение (demoting) результатов.
  2. История как долгосрочный контекст (Session Groups): Система анализирует не просто отдельные события, а выстраивает контекст, объединяя связанные действия в Query Sessions и связывая их во времени (Session Groups). Это позволяет понимать долгосрочные задачи и интересы пользователя.
  3. Неявные индикаторы интереса (Stay-time и Frequency): Время пребывания на странице (stay-time) и частота визитов рассматриваются как ключевые показатели интереса пользователя.
  4. Автоматическое определение важных ресурсов (Preferred Locations): Система автоматически формирует список предпочитаемых ресурсов (неявные закладки) на основе метрик вовлеченности. Эти сайты получают преимущество в ранжировании для данного пользователя.
  5. Агрегация данных с разных устройств: Предусмотрен механизм связывания нескольких идентификаторов клиента (устройств/браузеров) с одним аккаунтом пользователя для создания полной истории активности.
  6. Влияние рекламы на историю: Клики по рекламе (Ad Clicks) записываются и анализируются наравне с органическими кликами, влияя на профиль пользователя и определение Preferred Locations.

Практика

Best practices (это мы делаем)

  • Фокус на удержании пользователя (Retention) и построении бренда: Ключевая стратегия. Повторные визиты, частота и длительность взаимодействия (stay-time) увеличивают вероятность попадания сайта в Preferred Locations и обеспечивают буст в персональной выдаче пользователя. Работа над лояльностью аудитории критически важна.
  • Оптимизация вовлеченности и Stay-time: Создавайте контент и UX, которые максимально удерживают пользователя на сайте. Уменьшение показателя отказов и предотвращение pogo-sticking положительно влияют на восприятие сайта как предпочтительного.
  • Оптимизация сниппетов для высокого CTR: Критически важно мотивировать пользователя совершить первый клик. Если пользователь видит сайт в выдаче, но игнорирует его, патент предлагает использовать это как негативный сигнал для будущей персонализации (понижение).
  • Создание тематических хабов для поддержки сессий: Механизмы Query Sessions и Session Groups группируют связанные активности. Создание обширного контента, поддерживающего пользователя на всех этапах решения задачи, помогает сайту стать релевантным для всей Session Group.

Worst practices (это делать не надо)

  • Кликбейт и обман ожиданий: Привлечение трафика с помощью вводящих в заблуждение сниппетов приведет к коротким визитам (низкий stay-time). Это ухудшит позиции сайта в персональной выдаче этих пользователей.
  • Ориентация на одноразовые визиты: Стратегии, направленные только на привлечение трафика без работы над удержанием, теряют эффективность в контексте персонализации, основанной на истории.
  • Игнорирование UX и скорости загрузки: Технические проблемы или плохой UX, вынуждающие пользователя быстро покинуть ресурс, снижают stay-time и уменьшают вероятность того, что сайт станет Preferred Location.

Стратегическое значение

Патент подтверждает фундаментальный сдвиг к персонализированному поиску. Для Senior SEO-специалистов это означает, что метрики, основанные на "чистых" позициях в ТОПе, могут быть обманчивы. Стратегически более важно фокусироваться на общем качестве трафика, вовлеченности (engagement) и удержании (retention). Долгосрочная стратегия должна быть направлена на превращение сайта в Preferred Location для целевой аудитории путем построения сильного бренда и обеспечения превосходного пользовательского опыта.

Практические примеры

Сценарий: Персонализированное повышение авторитетного источника

  1. Контекст: Пользователь регулярно читает новости на сайте NewsPortalA.com, проводя там значительное время. Система классифицирует NewsPortalA.com как Preferred Location для этого пользователя.
  2. Новый запрос: Пользователь вводит общий запрос о текущем событии, например, "выборы в Германии".
  3. Стандартное ранжирование: В нейтральной выдаче NewsPortalA.com находится на 5 позиции.
  4. Применение механизма: Система распознает, что NewsPortalA.com является Preferred Location для пользователя и релевантен запросу.
  5. Результат: Система модифицирует выдачу для этого пользователя, повышая NewsPortalA.com на 1 или 2 позицию и/или добавляя аннотацию о частоте посещений ("Вы часто посещаете этот сайт").

Вопросы и ответы

Насколько сильно история пользователя влияет на ранжирование согласно патенту?

Влияние может быть значительным для конкретного пользователя. Патент описывает механизмы для повышения (boosting) результатов, с которыми пользователь успешно взаимодействовал, и понижения (demoting) тех, которые он игнорировал. Если сайт признан Preferred Location, он может получать существенное преимущество в персональной выдаче.

Что такое Session Group и почему это важно для SEO?

Session Group — это объединение связанных поисковых сессий, которые произошли в разное время (например, в разные дни). Это показывает, что Google анализирует поведение в контексте долгосрочных задач. Для SEO это означает, что удовлетворение интента сегодня может повлиять на ранжирование завтра, если пользователь продолжит исследование этой же темы, подчеркивая важность построения тематических кластеров контента.

Как Google определяет Preferred Locations (Предпочитаемые локации)?

Система определяет их автоматически на основе анализа истории. Ключевые факторы включают частоту посещений сайта, давность последнего визита и stay-time (время пребывания). Чем чаще пользователь посещает сайт и чем больше времени там проводит, тем выше его оценка предпочтения.

Учитывает ли система время пребывания на сайте (Stay-time/Dwell Time)?

Да, патент явно упоминает stay-time как один из факторов для определения и ранжирования Preferred Locations. Время пребывания используется как показатель (proxy) важности локации для пользователя. Это подтверждает необходимость оптимизации контента и UX для удержания внимания.

Может ли низкий CTR негативно повлиять на ранжирование?

Да, в контексте персонализации. Патент описывает возможность понижения результата в выдаче, если он был ранее показан пользователю, но тот его не выбрал (пропустил клик). Это означает, что низкий CTR для конкретного пользователя может привести к ухудшению позиций сайта в его будущих поисках.

Влияет ли этот патент на ранжирование в режиме Инкогнито?

Нет. Механизмы основаны на сборе и анализе истории пользователя, привязанной к его идентификатору (логин или cookie). В режиме Инкогнито или при отключенной истории поиска эта информация недоступна, и система будет использовать стандартное, неперсонализированное ранжирование.

Учитывается ли история браузинга, не связанная с поиском Google (например, прямые заходы)?

Да. Патент описывает сбор Browsing Events, которые могут происходить вне контекста поискового запроса и отслеживаться через клиентские приложения (Client Assistant, например, браузер с синхронизацией). Эта активность также используется для определения предпочтений пользователя и персонализации.

Влияет ли история кликов по рекламе на органический поиск?

Да, согласно патенту. Клики по рекламе (Ad Click Events) записываются и анализируются. Если пользователь часто переходит на сайт через рекламу и положительно с ним взаимодействует, этот сайт может стать Preferred Location, что даст ему преимущество в органической выдаче для этого пользователя.

Учитывает ли система историю с разных устройств?

Да, патент предусматривает механизм ассоциации нескольких идентификаторов клиента (Client ID – устройства или браузеры) с одним идентификатором пользователя (User ID – аккаунт). Это позволяет агрегировать историю активности пользователя с разных устройств в единый профиль.

Актуальны ли эти механизмы в 2025 году, учитывая возраст патента?

Концепции, заложенные в патенте, абсолютно актуальны и являются основой персонализации поиска. Хотя конкретные алгоритмы значительно эволюционировали (с большим использованием машинного обучения и нейросетей), базовый принцип — использование истории пользователя для корректировки ранжирования — остается неизменным.

Похожие патенты

Как Google использует историю поиска и браузинга для персонализации выдачи и создания неявного "Избранного"
Google записывает историю поиска и просмотров пользователя для персонализации результатов. Система определяет "предпочтительные сайты" на основе частоты посещений, кликов и времени на сайте, повышая их в выдаче для этого пользователя. Патент также описывает объединение предпочтений пользователя с предпочтениями других людей для формирования комбинированного рейтинга.
  • US20060224608A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google отслеживает, анализирует и использует историю поведения пользователя для персонализации поиска и визуализации активности
Патент Google описывает инфраструктуру для сбора и анализа истории действий пользователя (запросы, клики по органике и рекламе, просмотры страниц). Система использует эти данные, включая метрики вовлеченности вроде «stay-time», для определения «предпочитаемых местоположений» и персонализации выдачи. Также описан метод графической визуализации объема этой активности.
  • US7694212B2
  • 2010-04-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
  • US20150261858A1
  • 2015-09-17
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
  • US8195654B1
  • 2012-06-05
  • Поведенческие сигналы

  • SERP

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
  • US8732187B1
  • 2014-05-20
  • Ссылки

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google использует клики пользователей для определения составных фраз (N-грамм) в запросах
Google анализирует, какие результаты поиска выбирают пользователи, чтобы понять, являются ли последовательные слова в запросе единой фразой (например, "Нью Йорк") или отдельными терминами. Если пользователи преимущественно кликают на результаты, содержащие эту последовательность как неразрывную фразу, система определяет ее как составную (Compound) и использует это знание для улучшения ранжирования и понимания запроса.
  • US8086599B1
  • 2011-12-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google извлекает сущности из активности пользователя для запуска проактивных (имплицитных) поисковых запросов
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного запуска фоновых поисковых запросов (имплицитных запросов), релевантных текущему контексту пользователя, часто с использованием персонализированных данных.
  • US9009153B2
  • 2015-04-14
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

seohardcore