SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует префиксный индекс для формирования подсказок URL и запросов в Autocomplete

INTERACTIVELY SUGGESTING NETWORK LOCATION (Интерактивное предложение сетевого расположения)
  • US10592573B1
  • Google LLC
  • 2017-08-21
  • 2020-03-17
  • Индексация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему интерактивных подсказок (Autocomplete), которая предлагает как завершение запроса, так и прямые URL-адреса по мере ввода пользователем префикса. Система заранее создает индекс, анализируя популярные сайты и связывая префиксы с наиболее релевантными URL на основе анкорных текстов, заголовков, доменных имен и поисковых запросов пользователей.

Описание

Какую проблему решает

Патент решает задачу ускорения навигации пользователя к искомому контенту. Он сокращает время поиска, предлагая релевантные сетевые расположения (URL) и варианты завершения запроса (character-combinations) интерактивно, по мере ввода пользователем первых символов (query prefix). Это позволяет пользователю быстро перейти на нужный сайт, не завершая ввод запроса и не переходя на страницу результатов поиска (SERP).

Что запатентовано

Запатентована система и метод для генерации интерактивных подсказок. Суть изобретения заключается в создании и использовании специализированного репозитория (Prefix & Network Location Index). Этот индекс хранит заранее рассчитанные связи между различными комбинациями символов (префиксами) и списком URL, которые признаны наиболее релевантными для данного префикса.

Как это работает

Система работает в двух режимах:

  • Офлайн-обработка (Индексирование): Система идентифицирует популярные сайты (network locations). Затем извлекается репрезентативный контент (Items of content), такой как анкорные тексты, заголовки, доменные имена и поисковые запросы, ведущие на сайт. Этот контент разбивается на все возможные префиксы (например, "fish" -> "f", "fi", "fis", "fish"). Рассчитывается оценка релевантности между каждым префиксом и URL. Пары (префикс -> список топовых URL) сохраняются в индексе.
  • Онлайн-обработка (Время запроса): Когда пользователь вводит символы, система мгновенно сопоставляет их с индексом. Извлекается список наиболее релевантных URL и вариантов завершения запроса, которые отображаются в качестве подсказок.

Актуальность для SEO

Высокая. Автозаполнение (Autocomplete) является фундаментальной функцией современных поисковых систем и браузеров. Описанные методы — использование префиксной индексации и предварительный расчет релевантности на основе различных сигналов — являются стандартной практикой для обеспечения высокой скорости и эффективности систем подсказок.

Важность для SEO

Патент имеет среднее стратегическое значение для SEO (6.5/10). Он не описывает алгоритмы ранжирования в основной выдаче, но критически важен для понимания того, как формируется навигационный трафик через Autocomplete. Попадание сайта в качестве предложенного URL может значительно увеличить прямой трафик, минуя SERP. Патент раскрывает источники данных для этой системы, подчеркивая важность брендинга, анкорного профиля и поведения пользователей.

Детальный разбор

Термины и определения

Character-combination (Комбинация символов)
Последовательность из одного или более символов. Является подмножеством Item of content (префиксом). Используется как ключ в индексе подсказок и как вариант завершения запроса.
Enumeration Module (Модуль перечисления)
Компонент системы, отвечающий за разделение Item of content на последовательность префиксов. Например, слово "fish" делится на "f", "fi", "fis", "fish".
Item of content (Элемент контента)
Текст, репрезентативный для сетевого расположения. Источниками могут быть анкорные тексты ссылок, заголовок страницы, URL, доменное имя или поисковые запросы, по которым сайт находится в выдаче.
Network Location (Сетевое расположение)
Ресурс в сети, например, веб-страница или веб-сайт.
Prefix & Network Location Index (Индекс префиксов и сетевых расположений)
Репозиторий (база данных), хранящий пары: Префикс и список URL, наиболее релевантных этому префиксу.
Query Prefix (Префикс запроса)
Символы, введенные пользователем в реальном времени.
Relevance Determination Module (Модуль определения релевантности)
Компонент, вычисляющий оценку (score), представляющую уровень релевантности (level of relevance) между префиксом и сетевым расположением.
Selection Module (Модуль выбора)
Компонент, который выбирает набор популярных сетевых расположений для включения в систему подсказок. Выбор основан на таких факторах, как ранг (например, PageRank, упомянутый в описании), количество ссылок, частота доступа.
Suggestion Module (Модуль предложений)
Компонент, который сравнивает введенный Query Prefix с индексом и извлекает подсказки.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный цикл работы системы, включающий создание репозитория и его использование для генерации подсказок.

Часть А: Создание репозитория (Офлайн)

  1. Идентификация множества сетевых расположений (сайтов).
  2. Идентификация элементов контента (items of content), связанных с каждым сайтом.
  3. Разделение контента на комбинации символов (префиксы).
  4. Определение оценки (score) релевантности каждого префикса для связанного с ним сайта.
  5. Определение наиболее релевантных сайтов для каждого префикса на основе оценок.
  6. Сохранение пар: (Префикс + Список релевантных URL).

Часть Б: Использование репозитория (Онлайн)

  1. Получение префикса запроса (query prefix) на входе.
  2. Идентификация в репозитории комбинаций символов, совпадающих с префиксом.
  3. Идентификация в репозитории URL, символы которых совпадают с префиксом.
  4. Предложение (suggesting) идентифицированных комбинаций символов И идентифицированных URL.

Ядро изобретения — это предварительное вычисление и хранение связей между префиксами и релевантными URL для обеспечения быстрых интерактивных подсказок. Система предлагает как завершение текста запроса, так и прямые ссылки, используя единый индекс.

Claim 4 (Зависимый от 1): Уточняет, что именно может быть "элементом контента" (items of content). Это критически важный пункт для SEO.

Идентификация элементов контента включает идентификацию как минимум одного из:

  • (i) Анкорный текст (anchor text), связанный со ссылками, указывающими на сетевое расположение.
  • (ii) Доменное имя (domain name).
  • (iii) Поисковый запрос (search query), в ответ на который поисковая система предоставила этот ресурс.
  • (iv) Текст URL (text of a uniform resource locator).

Этот пункт прямо указывает, что внешние сигналы (анкоры) и поведение пользователей (поисковые запросы, ведущие на сайт) используются для определения того, с какими префиксами должен ассоциироваться сайт в системе подсказок.

Где и как применяется

Изобретение затрагивает этапы индексирования для подготовки данных и этап понимания запросов для генерации подсказок в реальном времени.

INDEXING – Индексирование и извлечение признаков (Офлайн-обработка)
На этом этапе происходят процессы подготовки данных для системы подсказок:

  • Selection Module использует данные о популярности сайтов (ранг, ссылки, трафик), собранные из основного индекса, для выбора кандидатов.
  • Система собирает и анализирует Items of content (анкоры из ссылочного графа, заголовки и URL из индекса, данные из логов запросов).
  • Enumeration Module генерирует префиксы.
  • Relevance Determination Module рассчитывает оценки.
  • Результатом является создание Prefix & Network Location Index.

QUNDERSTANDING – Понимание Запросов (Онлайн / Время запроса)
Это основной этап применения патента в реальном времени (компонент Autocomplete).

  • Система фиксирует ввод пользователя (Query Prefix).
  • Suggestion Module выполняет быстрый поиск в Prefix & Network Location Index.
  • Система мгновенно возвращает подсказки (URL и завершения запросов) в пользовательский интерфейс до начала основного процесса ранжирования.

Входные данные:

  • Метрики популярности (ранг, ссылки, частота доступа).
  • Anchor texts (Анкорные тексты).
  • Network location titles (Заголовки страниц).
  • Доменные имена и URL.
  • Логи поисковых запросов.

Выходные данные:

  • Список предложенных URL и character-combinations, релевантных введенному префиксу.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на навигационные и брендовые запросы, где намерение пользователя состоит в поиске конкретного, известного сайта.
  • Типы контента: Влияет на сайты, которые могут быть идентифицированы как популярные и имеют сильные ассоциации с определенными терминами.
  • Поведение пользователей: Может направлять трафик прямо на URL, позволяя пользователю миновать SERP.

Когда применяется

  • Триггеры активации: Активируется мгновенно, как только пользователь вводит первый символ в строку поиска или адресную строку браузера.
  • Условия работы: Работает интерактивно (interactively), обновляя предложения при каждом изменении ввода, при условии, что ввод соответствует префиксу в индексе. Обнаружение ввода не требует его отправки (например, нажатия Enter).
  • Исключения: В описании упоминается, что если скорость ввода слишком высока, система может приостановить выдачу подсказок до паузы.

Пошаговый алгоритм

Процесс А: Офлайн-создание Индекса Подсказок (Repository Creation)

  1. Выбор сайтов (Selection): Идентификация множества сетевых расположений для включения в систему. Используются критерии популярности (ранг, ссылки, частота доступа, выбор пользователем).
  2. Сбор контента (Extraction): Для каждого выбранного сайта идентификация репрезентативных элементов контента (Items of content). Источники: анкорные тексты, доменное имя, URL, заголовки страниц, поисковые запросы, ведущие на сайт.
  3. Генерация префиксов (Enumeration): Разделение каждого элемента контента на последовательность всех возможных префиксов (character-combinations).
  4. Оценка релевантности (Relevance Scoring): Определение оценки (score), представляющей уровень релевантности каждого префикса для соответствующего сетевого расположения. Учитывается частота, уникальность, позиция (например, префикс в доменном имени имеет больший вес).
  5. Фильтрация и Индексация: Для каждого префикса определение списка наиболее релевантных сетевых расположений на основе оценок. Сохранение пар (Префикс -> Список релевантных URL) в Prefix & Network Location Index.

Процесс Б: Онлайн-генерация подсказок (Interactive Suggestion)

  1. Обнаружение ввода: Детектирование ввода пользователем префикса запроса (Query Prefix) в реальном времени.
  2. Сравнение с Индексом: Сравнение ввода с комбинациями символов, хранящимися в индексе.
  3. Поиск совпадений: Определение, совпадает ли ввод с одним или несколькими сохраненными префиксами.
  4. Извлечение данных: Если совпадение найдено, извлечение соответствующих сохраненных URL и других подходящих комбинаций символов (завершений запроса) из индекса.
  5. Предоставление подсказок: Отображение извлеченных данных пользователю в интерфейсе.
  6. Обновление: При обнаружении дополнительного ввода процесс повторяется с шага 1.

Какие данные и как использует

Данные на входе

Патент явно разделяет данные, используемые для выбора сайтов для индексации, и данные, используемые для ассоциации этих сайтов с префиксами.

Факторы для выбора сайтов (Selection Module):

  • Ссылочные факторы: Ранг сетевого расположения (rank of a network location, например, PageRank), количество ссылок (number of links).
  • Поведенческие факторы: Частота доступа к расположению (number of times the network location is accessed), выбор расположения пользователем (selection of the network location by a user).
  • Технические факторы: Длина URL (length of an identifier).

Факторы для ассоциации с префиксами (Items of Content):

  • Ссылочные факторы: Анкорные тексты входящих ссылок (anchor texts residing at identifiers pointing to the network location). (Claim 4).
  • Контентные факторы: Заголовок сетевого расположения (network location title).
  • Технические факторы: Доменное имя (domain name) (Claim 4), текст URL (text of a uniform resource locator) (Claim 4).
  • Поведенческие/Логи запросов: Поисковые запросы, которые приводят к показу сетевого расположения в результатах поиска (search query) (Claim 4).

Какие метрики используются и как они считаются

  • Score representing a level of relevance (Оценка уровня релевантности): Метрика, определяющая силу связи между префиксом и сайтом. Патент не приводит формулу, но указывает факторы, влияющие на расчет:
    • Частота появления слова на сайте.
    • Количество других слов с тем же префиксом.
    • Уникальность слова для данного сайта.
    • Местоположение слова (например, префикс в доменном имени считается более релевантным).
  • Весовые коэффициенты: Система может применять веса к оценкам релевантности. Например, в зависимости от длины префикса (более короткие могут получать меньший вес) или если префикс полностью совпадает со словом.

Выводы

  1. Autocomplete как источник прямого трафика: Патент описывает механизм, позволяющий Google предлагать прямые URL в подсказках, минуя SERP. Это подтверждает важность оптимизации под Autocomplete для получения навигационного трафика.
  2. Популярность и Авторитетность как критерий включения: Чтобы сайт попал в индекс подсказок, он должен быть предварительно отобран Selection Module. Отбор основан на сигналах популярности и авторитетности (PageRank, ссылки, частота доступа пользователей).
  3. Ключевые источники данных для ассоциаций: Критически важный вывод для SEO — это источники данных (Items of content), используемые для связи сайта с префиксами. Это не только контент сайта (Title, URL, домен), но и внешние сигналы:
    • Анкорные тексты входящих ссылок.
    • Реальные поисковые запросы пользователей, по которым сайт появляется в выдаче.
  4. Важность брендинга и SERM: Сильная и позитивная ассоциация бренда с определенными терминами в анкорах и запросах пользователей напрямую влияет на то, как он будет представлен в подсказках.
  5. Префиксная индексация: Система заранее анализирует все возможные префиксы ассоциированных терминов, что обеспечивает скорость работы. Релевантность рассчитывается для каждого префикса отдельно.

Практика

Best practices (это мы делаем)

  • Укрепление ассоциации Бренд/Запрос: Необходимо добиваться сильной ассоциации между названием бренда и ключевыми запросами в поведении пользователей. Если пользователи часто ищут "[Бренд] + [Услуга]", эта фраза станет Item of content (источник: search query), что приведет к показу вашего URL в подсказках при вводе префиксов этой фразы.
  • Оптимизация анкорного профиля: Поскольку Anchor texts являются прямым источником данных, критически важно иметь чистый, релевантный и брендированный анкорный профиль. Ссылки с анкорами, соответствующими названию сайта или его ключевым услугам, напрямую помогают системе связать эти префиксы с вашим URL.
  • Оптимизация Заголовков (Titles) и URL: Четкие и релевантные заголовки страниц и URL важны, так как они также являются Items of content и влияют на формирование подсказок.
  • Повышение общей популярности и авторитетности сайта: Так как система фокусируется на популярных сайтах (используя ранг, ссылки, трафик), необходимо вести постоянную работу над повышением общего авторитета домена и улучшением поведенческих метрик для включения в индекс подсказок.

Worst practices (это делать не надо)

  • Спам в анкорных текстах: Использование переоптимизированных анкоров для влияния на ассоциации может привести к санкциям со стороны основных алгоритмов ранжирования, что перевесит любую выгоду от подсказок.
  • Манипуляция поисковыми запросами: Попытки искусственно накрутить количество поисковых запросов с упоминанием бренда для влияния на подсказки рискованны и могут быть отфильтрованы.
  • Использование неясных доменных имен: Доменное имя является сильным сигналом (Item of content). Сложные или не отражающие суть бренда домены могут реже появляться в подсказках по брендовым префиксам.

Стратегическое значение

Патент подтверждает стратегическую важность построения бренда и управления репутацией (SERM). Он демонстрирует, как сигналы авторитетности, контентные сигналы и сигналы поведения пользователей агрегируются для работы Autocomplete. Для узнаваемых брендов это ключевой канал навигационного трафика. SEO-стратегия должна включать мониторинг подсказок и активную работу над тем, чтобы URL сайта предлагался как можно раньше, что достигается через комплексное SEO.

Практические примеры

Сценарий: Усиление подсказки для интернет-магазина "ElectroZone"

  1. Задача: Добиться того, чтобы при вводе "Elec" в строке поиска Google предлагал URL electrozone.com.
  2. Действия на основе патента:
    • Популярность: Увеличить общее количество качественных ссылок и упоминаний сайта для повышения его ранга и частоты доступа, чтобы гарантировать включение в индекс (работа Selection Module).
    • Анкоры (Item of content): Провести кампанию по получению естественных ссылок с анкорами "ElectroZone", "Магазин ElectroZone".
    • Заголовки (Item of content): Убедиться, что Title главной страницы начинается с "ElectroZone".
    • Ассоциация с запросами (Item of content): Стимулировать пользователей искать сайт по названию (например, через офлайн-рекламу), увеличивая количество брендовых запросов, ведущих на сайт.
  3. Ожидаемый результат: Система извлекает "ElectroZone" из всех этих источников. Enumeration Module разбивает его на префиксы ("E", "El", "Elec"...). За счет высокой популярности сайта и частого повторения фразы в разных источниках, Relevance Determination Module устанавливает высокую оценку релевантности префикса "Elec" к electrozone.com, и URL попадает в топ подсказок.

Вопросы и ответы

Влияет ли этот патент на ранжирование в основной поисковой выдаче (SERP)?

Нет, напрямую не влияет. Патент описывает механизм работы системы автозаполнения (Autocomplete), которая функционирует до того, как пользователь отправит запрос и увидит SERP. Однако факторы, которые использует эта система (популярность сайта, ранг, анкорные тексты, поведенческие сигналы), тесно коррелируют с факторами, используемыми в основном ранжировании.

Какие основные источники данных использует Google, чтобы связать запрос с моим URL в подсказках?

Патент (Claim 4) явно выделяет четыре ключевых источника (Items of content): анкорные тексты входящих ссылок, доменное имя сайта, текст самого URL и реальные поисковые запросы, по которым пользователи находят ваш сайт. Также используются заголовки страниц (Titles).

Почему мой сайт не появляется в подсказках, даже когда я ввожу его название полностью?

Основная причина, согласно патенту, — недостаточная популярность. Selection Module отбирает сайты для индекса на основе популярности (ранг, ссылки, частота доступа). Если сайт недостаточно популярен по данным Google, он может быть не включен в специализированный индекс подсказок (Prefix & Network Location Index).

Как анкорные тексты влияют на автозаполнение?

Анкорные тексты являются одним из основных источников фраз (Items of content), которые система анализирует. Если на ваш сайт часто ссылаются с анкором "Лучшая пицца в Москве", система разобьет эту фразу на префиксы. При вводе "Лучшая пиц..." ваш URL может быть предложен, если оценка релевантности будет достаточно высокой.

Что такое "префиксная индексация" в контексте этого патента?

Это механизм, при котором все ключевые фразы, связанные с сайтом, заранее разбиваются на все возможные начала (префиксы). Например, для "Amazon" это "A", "Am", "Ama" и так далее. Это позволяет системе мгновенно находить совпадения по мере ввода пользователем символов, обеспечивая скорость работы автозаполнения.

Имеет ли значение, где именно находится ключевая фраза (в Title, анкоре или тексте)?

Да. Патент указывает, что Relevance Determination Module учитывает местоположение фразы. Например, совпадение префикса в доменном имени может получить больший вес (более высокую оценку релевантности), чем совпадение в обычном тексте на странице. Анкоры и заголовки также являются приоритетными источниками.

Как быстро обновляется индекс подсказок?

Патент описывает генерацию индекса (Prefix & Network Location Index) как офлайн-процесс. Это означает, что он обновляется периодически, а не в реальном времени. Изменения в анкорном профиле или популярности сайта отразятся на подсказках только после пересчета этого индекса.

Что важнее для попадания в подсказки: точное совпадение домена или ассоциация с запросами?

Оба важны, так как и домен, и запросы являются Items of content. Однако система разработана так, чтобы предлагать URL, даже если ввод не совпадает с началом доменного имени. Сильная ассоциация с популярными запросами может привести к показу вашего URL, даже если пользователь вводит общую фразу.

Влияет ли внутренняя перелинковка и основной контент страницы на эти подсказки?

Патент фокусируется на заголовках (Title), URL, внешних анкорах и поисковых запросах как на основных источниках Items of content. Хотя основной контент страницы может влиять на общую релевантность, он не выделен как приоритетный источник для этого конкретного механизма генерации префиксов, в отличие от заголовков и внешних сигналов.

Как этот патент связан с SERM (Управление репутацией в поисковых системах)?

Он имеет прямое отношение. Если с брендом ассоциируются негативные запросы (например, "[Бренд] отзывы"), и эти запросы становятся популярными (часто ищутся пользователями), они могут стать Items of content. Это приведет к появлению негативных подсказок при вводе названия бренда. Работа над позитивным ассоциативным рядом критически важна.

Похожие патенты

Как Google использует анализ окончаний запросов (суффиксов) для улучшения работы Автокомплита, игнорируя начало запроса
Google использует механизм для улучшения подсказок Автокомплита (Search Suggest), фокусируясь на окончании (суффиксе) запроса. Если начало запроса редкое или неоднозначное, система ищет популярные прошлые запросы с похожими окончаниями, но разными началами. Это позволяет предлагать релевантные подсказки, основываясь на том, как пользователи обычно заканчивают схожие по структуре запросы.
  • US8417718B1
  • 2013-04-09
Как Google ускоряет автозаполнение (Autocomplete) и какие факторы ранжирования подсказок раскрывает этот механизм кэширования
Google оптимизирует производительность Autocomplete, кэшируя подсказки локально в браузере, чтобы избежать запросов к серверу при каждом вводе символа. Хотя патент фокусируется на скорости, он также подтверждает, что Google ранжирует подсказки на основе популярности запросов (частоты использования) и значимости сущностей (например, численности населения для географических объектов).
  • US20130054632A1
  • 2013-02-28
Как Google формирует персонализированные поисковые подсказки (Autocomplete) на основе контента пользователя (например, в Gmail)
Google использует механизм для улучшения поисковых подсказок (Autocomplete) в таких сервисах, как Gmail. Система анализирует корпус документов пользователя, распознает сущности (например, email-адреса, имена) и предлагает их в качестве подсказок. Это помогает пользователю быстрее находить нужный контент, предлагая контекстуализированные подсказки (например, полный контакт) вместо отдельных слов.
  • US20140201229A1
  • 2014-07-17
  • Персонализация

  • Индексация

  • Семантика и интент

Как Google ускоряет работу поисковых подсказок (Autocomplete) с помощью предиктивного кэширования на устройстве пользователя
Google использует механизм для борьбы с задержками сети при отображении поисковых подсказок (Autocomplete), особенно на мобильных устройствах. Система заранее отправляет наиболее вероятные подсказки на устройство пользователя, где они кэшируются локально. Это позволяет мгновенно отображать подсказки по мере ввода запроса, не дожидаясь ответа сервера.
  • US8560562B2
  • 2013-10-15
Как Google Autocomplete обрабатывает запросы, смешивающие разные языки и форматы ввода (например, иероглифы, пиньинь и английский)
Google использует механизм для генерации поисковых подсказок (Autocomplete), когда пользователь вводит запрос, смешивая разные языки или системы письма. Система создает альтернативные, "неоднозначные" представления ввода, запрашивает подсказки и фильтрует их. Это позволяет корректно интерпретировать сложный ввод (например, сочетание китайских иероглифов, пиньиня и английских слов) и предлагать релевантные варианты.
  • US20120203541A1
  • 2012-08-09
  • Мультиязычность

  • Семантика и интент

Популярные патенты

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
  • US9208233B1
  • 2015-12-08
  • Ссылки

  • Семантика и интент

  • Индексация

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
  • US9268880B2
  • 2016-02-23
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

seohardcore