SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выборочно индексирует действия пользователя на локальном устройстве, основываясь на поведении и частоте событий

SYSTEMS AND METHODS FOR SELECTIVELY STORING EVENT DATA (Системы и методы для выборочного хранения данных о событиях)
  • US8346777B1
  • Google LLC
  • 2004-03-31
  • 2013-01-01
  • Индексация
  • Local SEO
  • Поведенческие сигналы
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Анализ патента Google, описывающего инфраструктуру для клиентского поиска (например, Google Desktop). Система фиксирует действия пользователя (события) с контентом (статьями) и решает, индексировать ли их, используя критерии, основанные на частоте событий, доступных ресурсах и предполагаемых интересах пользователя (имплицитно выведенных из его поведения).

Описание

Какую проблему решает

Патент решает проблемы производительности и эффективности традиционных систем клиентского (локального) поиска. Он устраняет необходимость в ресурсоемком пакетном индексировании всего контента, заменяя его системой, которая захватывает взаимодействия пользователя (events) с контентом (articles) в реальном времени и выборочно (selectively) решает, какие события индексировать. Это предотвращает перегрузку индекса неважными или слишком частыми событиями (например, автосохранениями) и позволяет системе адаптироваться к поведению пользователя и доступным ресурсам.

Что запатентовано

Запатентована система и метод для выборочного хранения и индексирования данных о событиях на клиентском устройстве. Суть изобретения заключается в механизме оценки каждого захваченного события на соответствие определенным критериям (criterion). Только если событие удовлетворяет критерию, оно индексируется. Критерии могут быть явными (заданными пользователем) или неявными (выведенными системой на основе поведения пользователя, частоты событий или доступности ресурсов).

Как это работает

Система работает на клиентском устройстве:

  • Захват событий: Специальный компонент (Capture Processor) отслеживает взаимодействие пользователя с приложениями и контентом (просмотр веб-страниц, редактирование документов, получение email).
  • Оценка и Фильтрация: Индексатор (Indexer) получает событие и оценивает его на соответствие критериям. Критерии могут включать: тип контента, частоту подобных событий, время/место захвата или неявные предпочтения пользователя.
  • Выборочное Индексирование: Если событие не удовлетворяет критерию или является дубликатом, оно не индексируется.
  • Структурирование: Индексированные события связываются с Related Event Object (например, все просмотры одного URL группируются вместе) для эффективного хранения и поиска.

Актуальность для SEO

Низкая. Патент описывает инфраструктуру, тесно связанную с продуктом Google Desktop Search, поддержка которого прекращена. Хотя базовые концепции захвата пользовательских данных и выборочного индексирования остаются актуальными для операционных систем и браузеров (Chrome, Android), конкретная реализация, описанная в патенте, устарела.

Важность для SEO

Влияние на современные SEO-стратегии минимальное (3/10). Патент описывает внутренние процессы Google для клиентского (локального) поиска и не имеет прямого отношения к алгоритмам ранжирования веб-сайтов в основном поиске Google. Однако он представляет ценность как детальный пример того, как Google способен захватывать, анализировать и интерпретировать гранулярные данные о поведении пользователей на контролируемых платформах.

Детальный разбор

Термины и определения

Article (Статья)
Любой элемент контента, с которым взаимодействует пользователь: веб-страница (HTML, PDF), email, документ Word, сообщение IM, медиафайл и т.д.
Capture Processor (Процессор захвата)
Компонент системы, отвечающий за мониторинг активности на клиентском устройстве и захват событий и связанных с ними данных.
Criterion (Критерий)
Условие, используемое для оценки события. Если событие удовлетворяет критерию, оно индексируется; если нет — игнорируется.
Event (Событие)
Любое действие или происшествие, связанное со статьей, приложением или устройством. Примеры: просмотр веб-страницы, сохранение файла, получение email, движение мыши, ввод текста.
Event Capture Criterion (Критерий захвата события)
Критерий, основанный на контексте захвата события (когда, где, как): например, время суток, местоположение устройства, активный профиль пользователя.
Historical Events (Исторические события)
События, произошедшие до установки системы или когда она была неактивна (например, существующие файлы на диске).
Indexable/Non-indexable Events (Индексируемые/Неиндексируемые события)
Классификация событий по важности. Индексируемые события (просмотр, сохранение) сохраняются в индексе. Неиндексируемые (движение мыши) могут использоваться для обновления текущего состояния пользователя, но не сохраняются.
Real-time Events (События реального времени)
События, происходящие в настоящий момент.
Related Event Object (Объект связанных событий)
Структура данных, которая группирует связанные события. Например, все события просмотра одного и того же URL или все события редактирования одного документа.

Ключевые утверждения (Анализ Claims)

Патент описывает инфраструктурные процессы для клиентского поиска без прямых рекомендаций для SEO.

Claim 1 (Независимый пункт): Описывает базовый метод выборочного хранения данных.

  1. Система захватывает событие (event), связанное со статьей (article).
  2. Система оценивает событие на соответствие критерию (criterion).
  3. Если событие соответствует критерию, оно индексируется.
  4. Создается объект связанных событий (related event object), объединяющий набор связанных событий, включая текущее.
  5. Объект связанных событий сохраняется в первом расположении хранилища данных.
  6. По крайней мере часть индексированного события сохраняется во втором расположении.
  7. Создается указатель (pointer) между объектом связанных событий и сохраненной частью индексированного события.

Ядро изобретения — это комбинация выборочного индексирования на основе критериев (шаги 2-3) и структурированного хранения с использованием объектов связанных событий (шаги 4-7).

Claim 3 (Зависимый от 1): Уточняет процесс фильтрации.

Система сначала определяет, является ли событие индексируемым или неиндексируемым. Индексирование происходит только если событие определено как индексируемое И удовлетворяет критерию.

Claim 6 (Зависимый от 1): Описывает автоматическое создание правил.

Критерий генерируется неявно (implicitly generating the criterion), то есть без прямого указания пользователя, вероятно, на основе анализа его поведения.

Claim 15 (Зависимый от 1): Описывает адаптацию к ресурсам и частоте.

Система корректирует критерий на основе одного или нескольких факторов: общего объема сохраненных данных о событиях, частоты захвата событий (event capture frequency) или оставшейся емкости хранилища данных.

Claim 18 и 25 (Зависимые от 1): Определяют типы критериев.

Критерий может быть основан на контексте захвата события (event capture criterion — Claim 18) или на характеристиках самой статьи (article criterion — Claim 25).

Где и как применяется

Важно понимать, что патент описывает архитектуру клиентского поиска (например, Google Desktop), а не основного веб-поиска Google. Он применяется на локальном устройстве пользователя.

CRAWLING – Сканирование и Сбор данных (Локальный контекст)
Capture Processor выступает в роли локального краулера. Он постоянно отслеживает активность пользователя в реальном времени (Real-time Events) и периодически сканирует файловую систему или кэши приложений для обнаружения Historical Events.

INDEXING – Индексирование и извлечение признаков (Локальный контекст)
Это основной этап применения патента. Indexer получает события и выполняет ключевые функции:

  1. Нормализация: Преобразование данных события в индексируемый текст.
  2. Фильтрация (Selective Storing): Применение критериев (Criterion) для решения, индексировать ли событие. Это включает проверку типа события (индексируемое/неиндексируемое) и соответствие правилам (явным или неявным).
  3. Дедупликация: Использование контрольных сумм для предотвращения повторного индексирования идентичных событий.
  4. Структурирование: Связывание события с Related Event Object.

Входные данные:

  • События (Events) и связанный с ними контент (Articles).
  • Данные о производительности системы.
  • Поведенческие данные пользователя (используются для генерации неявных критериев).

Выходные данные:

  • Структурированные данные в локальном хранилище (Index, Database, Repository).
  • Обновленные Related Event Objects.

На что влияет

В контексте локального поиска:

  • Типы контента: Влияет на все типы локального контента (документы, email, история браузера, IM). Система может применять разные критерии к разным типам контента (например, индексировать все документы Word, но только некоторые логи .log).
  • Частота обновления: Система активно подавляет индексирование слишком частых событий, таких как многократные автосохранения одного и того же документа.

Когда применяется

Алгоритм применяется постоянно, при захвате каждого нового события на клиентском устройстве.

  • Триггеры активации фильтрации:
    • Превышение порога частоты событий (event capture frequency) для определенного типа или конкретной статьи.
    • Низкий объем доступного места в хранилище.
    • Неявные сигналы о незаинтересованности пользователя в определенном типе контента (например, пользователь никогда не ищет и не кликает на результаты из IM).
    • Явные инструкции пользователя на исключение (например, не индексировать определенные папки или сайты).

Пошаговый алгоритм

Процесс выборочного хранения и индексирования события:

  1. Получение события: Индексатор извлекает следующее событие из очереди.
  2. Нормализация контента: Данные статьи, связанные с событием, конвертируются в канонический индексируемый текст (THIS_INDEX_TEXT). Для этого используются специализированные обработчики (handlers) для разных форматов (HTML, PDF и т.д.).
  3. Генерация контрольной суммы: Вычисляется контрольная сумма (C_TEXT, fingerprint, например, MD5 или SHA1) для индексируемого текста.
  4. Проверка критериев (Фильтрация): Система оценивает, удовлетворяет ли событие критерию.
    • Проверяется тип события (индексируемое/неиндексируемое).
    • Проверяется соответствие явным правилам (включения/исключения).
    • Проверяется соответствие неявным критериям (частота, ресурсы, поведение пользователя).
    • Если НЕТ: Событие не индексируется. Процесс завершен.
  5. Проверка на дубликаты: Система проверяет, существует ли уже индексированное событие с такой же контрольной суммой C_TEXT.
    • Если ДА: Событие не индексируется. Могут быть обновлены статистики доступа. Процесс завершен.
  6. Присвоение ID события: Новому уникальному событию присваивается Event ID.
  7. Обработка объекта связанных событий: Система определяет, существует ли Related Event Object для данного события (например, по URI файла или URL).
    • Если ДА: Загружается существующий объект.
    • Если НЕТ: Создается новый объект и ему присваивается Related Event ID.
  8. Сохранение данных:
    • Оригинальный и/или индексируемый текст сохраняются в Репозитории.
    • Событие и объект связанных событий обновляются и сохраняются в Базе Данных (создаются указатели между ними).
  9. Обновление индекса: Индексируемый текст добавляется в Полнотекстовый Индекс.

Какие данные и как использует

Данные на входе

Система использует данные, захваченные на локальном устройстве.

  • Контентные факторы: Содержимое статей (текст, изображения), метаданные (заголовки, отправители/получатели email, формат файла).
  • Технические факторы: URL веб-страниц, пути к локальным файлам.
  • Временные факторы: Время события (используется для определения частоты).
  • Пользовательские факторы (Контекст захвата): Активный профиль пользователя, используемое приложение, местоположение устройства (если доступно), сетевое подключение.
  • Поведенческие факторы (Для генерации критериев): История прошлых поисков пользователя, клики на результаты (clickthroughs), частота доступа к определенным статьям или типам статей. Эти данные используются для неявного вывода о важности контента для пользователя.
  • Системные факторы: Доступная емкость хранилища, загрузка процессора (может влиять на скорость и объем индексирования).

Какие метрики используются и как они считаются

  • Capture Score (Оценка важности события): Упоминается как возможный механизм для определения, является ли событие indexable или non-indexable.
  • Event Capture Frequency (Частота захвата событий): Метрика, отслеживающая, как часто происходят однотипные события (например, сохранение конкретного файла). Используется для подавления индексирования слишком частых событий.
  • Frequency Threshold (Порог частоты): Пороговое значение для Event Capture Frequency. Если частота превышает порог, индексирование может быть пропущено (например, индексировать не чаще, чем раз в 30 минут).
  • Fingerprint / Checksum: Криптографический хэш (MD5, SHA1) от индексируемого текста. Используется для дедупликации событий.

Выводы

Патент описывает инфраструктурные процессы Google для клиентского поиска и не содержит прямых рекомендаций для SEO. Основные выводы для понимания технологий Google:

  1. Гранулярный захват поведения пользователей: Патент демонстрирует техническую способность Google (уже в 2004 году) детально фиксировать взаимодействие пользователя с контентом на уровне отдельных событий (просмотры, редактирования, время взаимодействия).
  2. Приоритет эффективности и релевантности (Selective Indexing): Ключевая идея — индексировать не всё подряд, а только то, что полезно и эффективно. Система активно фильтрует шум (дубликаты, слишком частые события).
  3. Неявные критерии на основе поведения: Система автоматически адаптирует правила индексирования (Criterion), основываясь на поведении пользователя. Если пользователь не интересуется определенным типом контента, система может перестать его индексировать.
  4. Адаптация к частоте (Frequency-based Criteria): Внедрен механизм для борьбы с переиндексацией часто изменяющегося контента, что схоже с концепцией управления краулинговым бюджетом в веб-поиске.
  5. Структурирование через связанные события: Использование Related Event Objects для группировки всех взаимодействий с одной единицей контента (например, URL) позволяет эффективно агрегировать сигналы и статистику (например, общее время взаимодействия).

Практика

Best practices (это мы делаем)

Поскольку патент описывает систему локального поиска, прямых SEO-рекомендаций нет. Однако, исходя из продемонстрированных возможностей Google по анализу поведения пользователей, можно подтвердить важность следующих общих стратегий:

  • Фокус на User Experience (UX) и Вовлеченности: Патент подтверждает, что Google обладает технологиями для детального измерения взаимодействия пользователя с контентом (частота доступа, время просмотра). Если подобные технологии используются в Chrome/Android и влияют на ранжирование, то создание контента, который пользователи часто посещают и с которым долго взаимодействуют, является критически важным.
  • Создание запоминающегося и полезного контента: В патенте система учится на поведении пользователя и может перестать индексировать контент, который пользователь игнорирует. Это подчеркивает необходимость создания контента, который стимулирует повторные визиты и взаимодействие.

Worst practices (это делать не надо)

Патент не описывает механизмы борьбы с SEO-манипуляциями в веб-поиске.

Стратегическое значение

Стратегическое значение патента для SEO заключается в понимании глубины аналитических возможностей Google. Он детально описывает фреймворк для захвата и интерпретации гранулярных поведенческих данных на контролируемых платформах. Это служит сильным напоминанием для Senior SEO-специалистов, что поведенческие факторы (даже если они собираются не этим конкретным методом) являются важной частью экосистемы Google, и долгосрочная стратегия должна быть сосредоточена на реальном вовлечении пользователей.

Практические примеры

Практических примеров применения данного патента в работе по SEO продвижению сайтов нет, так как он описывает систему локального (клиентского) поиска.

Вопросы и ответы

Описывает ли этот патент, как Google ранжирует сайты в интернете?

Нет. Патент строго сфокусирован на системе клиентского (локального) поиска, такой как Google Desktop. Он описывает, как Google индексирует файлы и активность пользователя на его собственном компьютере. Механизмы, описанные здесь, не применяются напрямую к сканированию интернета Googlebot или ранжированию в основном веб-поиске.

Использует ли Google данные из этой системы (Google Desktop) для ранжирования в веб-поиске?

В патенте нет информации об использовании этих локально собранных данных для влияния на глобальный индекс или ранжирование в веб-поиске. Патент описывает только процесс создания и поддержания локального индекса (local index) для нужд пользователя этого устройства.

Что такое "Related Event Object" и как это связано с SEO?

Related Event Object — это способ группировки всех локальных событий, связанных с одним элементом контента. Например, все просмотры пользователем страницы CNN.com группируются вместе. В SEO это концептуально похоже на то, как Google агрегирует сигналы вокруг канонического URL, но технически это разные системы.

Патент упоминает захват поведения пользователя. Подтверждает ли это использование поведенческих факторов в SEO?

Патент подтверждает техническую возможность Google детально отслеживать и анализировать поведение пользователя (частоту доступа, клики, время просмотра) на локальном уровне. Он также показывает, как Google использует это поведение для принятия решений (в данном случае, о том, что индексировать локально). Хотя это не доказывает использование ПФ в веб-ранжировании, это демонстрирует глубокий интерес и технологические возможности Google в этой области.

Что означают "неявные критерии" (implicit criteria)?

Неявные критерии — это правила, которые система выводит автоматически, не спрашивая пользователя. В патенте описано, как система может заметить, что пользователь никогда не ищет сообщения из мессенджеров, и на основании этого неявно создать критерий, предписывающий прекратить их индексацию для экономии ресурсов.

Зачем система фильтрует события по частоте (Frequency-based Criteria)?

Это делается для повышения эффективности и предотвращения перегрузки индекса. Например, если пользователь сохраняет документ каждые 30 секунд, нет смысла индексировать каждую версию. Система устанавливает порог (например, раз в 30 минут) и индексирует только события, происходящие реже этого порога, экономя ресурсы.

Актуален ли этот патент, если Google Desktop больше не поддерживается?

Конкретная реализация, связанная с Google Desktop, устарела. Однако базовые принципы — захват событий, выборочное индексирование на основе поведения и частоты — являются фундаментальными и могут применяться в других продуктах Google, таких как Chrome, Android или внутренних системах индексирования.

Что такое "индексируемые" и "неиндексируемые" события?

Система классифицирует события по важности. Индексируемые события (например, сохранение документа или просмотр веб-страницы) считаются достаточно важными для сохранения в индексе. Неиндексируемые события (например, движение мыши или выделение текста) считаются менее важными и не индексируются, хотя могут использоваться для других целей.

Как система определяет дубликаты событий?

Перед индексированием система преобразует контент события в текст и вычисляет его контрольную сумму (хэш или fingerprint). Если в индексе уже есть событие с такой же контрольной суммой, новое событие считается дубликатом и не индексируется повторно.

Какова основная ценность этого патента для SEO-специалиста?

Основная ценность заключается в понимании технологической философии Google. Патент демонстрирует, что Google придает большое значение эффективности индексирования и стремится использовать поведение пользователя для определения важности контента. Это косвенно подчеркивает важность UX и вовлеченности в общей SEO-стратегии.

Похожие патенты

Как Google автоматически категоризирует локальный контент и историю пользователя для контекстного поиска по неявным запросам
Патент Google, описывающий технологию для локального (Desktop) или персонализированного поиска. Система отслеживает взаимодействие пользователя с контентом (события) и использует «схемы событий» для автоматической категоризации файлов, электронных писем и истории просмотров. Эти категории затем используются для предоставления релевантных результатов в ответ на неявные запросы, генерируемые системой на основе текущего контекста пользователя.
  • US7788274B1
  • 2010-08-31
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google индексирует действия пользователя на локальном устройстве для контекстного поиска (Архитектура Google Desktop)
Патент описывает архитектуру клиентского поискового движка (например, Google Desktop), который в реальном времени фиксирует взаимодействия пользователя с контентом (веб-страницы, документы, email). Система индексирует этот контент локально и может генерировать автоматические (имплицитные) запросы на основе текущего контекста пользователя, объединяя локальные и веб-результаты.
  • US7725508B2
  • 2010-05-25
  • Индексация

  • Local SEO

  • Поведенческие сигналы

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google персонализирует рекомендации популярных запросов на основе истории поиска и браузинга пользователя
Google анализирует глобальные тренды поисковых запросов и сопоставляет их с индивидуальной историей пользователя (посещенные сайты, прошлые запросы, категории интересов). Если популярный запрос соответствует выявленным интересам пользователя, он будет рекомендован. Система также применяет фильтры, исключающие запросы, которые пользователь вводил недавно.
  • US9443022B2
  • 2016-09-13
  • Персонализация

  • Поведенческие сигналы

  • Свежесть контента

Как Google индексирует, ранжирует и структурирует события по времени и местоположению, обеспечивая темпоральное разнообразие
Патент Google, описывающий систему поиска событий, которая фильтрует результаты по времени и месту. Система разделяет запрошенный временной интервал (например, неделю) на сегменты (например, дни) и ранжирует лучшие события отдельно для каждого сегмента. Это предотвращает доминирование популярных событий одного дня и гарантирует видимость релевантных результатов на протяжении всего интервала.
  • US7647353B2
  • 2010-01-12
  • Индексация

  • Краулинг

  • Local SEO

Популярные патенты

Как Google идентифицирует, оценивает и ранжирует «Глубокие статьи» (In-Depth Articles) и «Вечнозеленый контент»
Google использует систему для идентификации и ранжирования высококачественного лонгрид-контента (In-Depth Articles). Система определяет авторитетные сайты на основе внешних наград и ссылочных паттернов. Контент оценивается по критериям «вечнозелености» (Evergreen Score), структуры (Article Score), отсутствия коммерческого интента и авторитетности автора (Author Score). Ранжирование основано на комбинации качества (IDA Score) и релевантности запросу (Topicality Score).
  • US9996624B2
  • 2018-06-12
  • EEAT и качество

  • Индексация

  • Семантика и интент

Как Google рассчитывает авторитетность и ранжирует сайты, вычисляя кратчайшие пути до доверенных источников (Seeds) в Веб-графе
Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния используются для расчета метрик авторитетности и ранжирования сайтов: чем ближе сайт к доверенным источникам, тем выше его предполагаемое качество.
  • US8631094B1
  • 2014-01-14
  • EEAT и качество

  • Ссылки

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах
Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.
  • US20180113919A1
  • 2018-04-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках
Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.
  • US8417692B2
  • 2013-04-09
  • Семантика и интент

  • Поведенческие сигналы

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц
Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.
  • US7308643B1
  • 2007-12-11
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
  • US20150261858A1
  • 2015-09-17
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

seohardcore