SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует real-time анализ текста, аудио и изображений для автоматической генерации запросов и проактивного поиска

AUTOMATICALLY PROVIDING CONTENT ASSOCIATED WITH CAPTURED INFORMATION, SUCH AS INFORMATION CAPTURED IN REAL-TIME (Автоматическое предоставление контента, связанного с захваченной информацией, например, информацией, захваченной в реальном времени)
  • US8990235B2
  • Google LLC
  • 2010-03-12
  • 2015-03-24
  • Семантика и интент
  • Персонализация
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Система Google для анализа информации, захваченной из различных источников (вводимый текст, изображения документов, аудиопотоки) в реальном времени. Система автоматически распознает контент, выделяет ключевые фрагменты, формирует поисковые запросы и мгновенно предоставляет пользователю релевантный цифровой контент или связанные действия без явных запросов. Это механизм, лежащий в основе технологий визуального (Lens) и голосового поиска.

Описание

Какую проблему решает

Патент решает задачу устранения разрыва между информацией, которую пользователь потребляет в данный момент (читает, пишет или слышит), и связанным с ней цифровым контентом. Он автоматизирует процесс поиска, устраняя необходимость для пользователя вручную формулировать запросы. Система позволяет устройствам становиться «осведомленными» (aware) об окружающей информации (физической, звуковой, текстовой) и проактивно предоставлять дополнительный контент в реальном времени.

Что запатентовано

Запатентована система и метод для автоматического предоставления контента на основе информации, захваченной в реальном времени. Система способна отслеживать ввод пользователя (набираемый текст) или захватывать информацию из окружающей среды (оптический захват с rendered document, захват audio stream). Суть изобретения заключается в автоматическом анализе этого ввода, формировании запроса (query construction) и поиске соответствующего цифрового контента или действий, которые затем предоставляются пользователю.

Как это работает

Ключевой механизм заключается в непрерывном мониторинге и обработке входящей информации для запуска поиска:

  • Захват (Capture): Устройство захватывает данные (изображение текста, аудиоклип) или отслеживает ввод текста.
  • Распознавание (Recognition): Данные обрабатываются (например, OCR для изображений, Speech-to-text для аудио) для извлечения текста или сигнатур.
  • Построение Запроса (Query Construction): Система автоматически выбирает часть распознанного контента в реальном времени и формирует запрос.
  • Контекстный Поиск (Search & Context Analysis): Запрос отправляется поисковым системам с учетом контекста пользователя и контекста захвата (местоположение, время).
  • Анализ Разметки (Markup Analysis): Система идентифицирует связанную «разметку» (markup) – дополнительные данные или функциональность (например, реклама, действия).
  • Представление (Actions): Релевантная информация и действия автоматически представляются пользователю.

Актуальность для SEO

Критически высокая. Патент описывает основополагающие механизмы для технологий мультимодального поиска, таких как Google Lens (визуальный поиск), и проактивных ассистентов (Google Assistant). Автоматическая генерация запросов на основе визуальной и звуковой информации является стратегическим направлением развития поиска и AI в 2025 году.

Важность для SEO

Патент имеет высокое стратегическое значение для SEO (8.5/10). Он не описывает алгоритмы ранжирования, но определяет, как поиск инициируется вне традиционной поисковой строки. Это фундаментально для понимания визуального и голосового поиска. SEO-специалистам необходимо адаптироваться к тому, что запросы генерируются автоматически из окружающей среды, что требует оптимизации контента для распознавания сущностей и доступности во всех модальностях (текст, аудио, изображение).

Детальный разбор

Термины и определения

Capture Device (Устройство захвата)
Устройство (например, мобильный телефон с камерой и микрофоном), используемое для захвата информации из окружающей среды или ввода пользователя.
Rendered Document (Отображаемый/Визуализированный документ)
Физический объект, предоставляющий информацию, воспринимаемую человеком. Включает печатные документы, билборды, экраны, а также аудио- или видеопотоки.
Text Recognition (Распознавание текста)
Процесс преобразования захваченных данных (изображения или аудио) в текст. Включает OCR и Speech-to-text.
Query Construction (Построение запроса)
Процесс автоматического формирования поискового запроса из распознанной информации.
Search & Context Analysis (Поиск и контекстный анализ)
Компонент системы, который использует запросы для поиска в индексах, учитывая информацию о пользователе (user and account info) и контекст захвата (context engines) для повышения релевантности.
Markup (Разметка)
Дополнительная функциональность или данные, связанные с документом. Рассматривается как оверлей, который может включать рекламу, ссылки или действия (Actions).
Direct Actions (Прямые действия)
Действия, которые система может выполнить немедленно на основе захваченной информации, если намерение пользователя очевидно (например, набор номера), минуя этап поиска.

Ключевые утверждения (Анализ Claims)

Анализ основан на Abstract и Detailed Description патента, которые описывают ключевые процессы изобретения.

Ключевой процесс 1 (Основа для Claims о вводе текста, например, Claim 1): Описывает метод автоматического предоставления информации, релевантной вводимому тексту в приложении.

  1. Получение ввода текста в приложение.
  2. Мониторинг ввода текста по мере его поступления (в реальном времени).
  3. Автоматический выбор части полученного текста (например, сущности, смысловой группы).
  4. Автоматическое формирование запроса на основе выбранной части.
  5. Передача запроса поисковой системе (с возможным выбором индекса).
  6. Получение результатов поиска.
  7. Отображение результата поиска одновременно (concurrently) с полученным вводом текста внутри приложения.

Ядро изобретения здесь — это проактивный поиск в реальном времени, интегрированный в среду потребления/создания контента, работающий без явного запроса пользователя.

Ключевой процесс 2 (Основа для Claims о захвате из документа, например, Claim 8): Описывает метод для захвата информации из отображаемого документа (визуальный поиск).

  1. Захват информации из rendered document с помощью устройства захвата (например, камеры).
  2. Автоматическая идентификация контента, связанного с захваченной информацией (через OCR или распознавание образов).
  3. Отображение идентифицированного контента.

Ключевой процесс 3 (Основа для Claims об аудио, см. FIG. 11, 12): Описывает аналогичный процесс для аудиопотоков.

  1. Прием аудиосигнала.
  2. Конвертация речи в текст (Speech-to-Text).
  3. Идентификация поисковых терминов и выполнение поиска.
  4. Вывод связанной информации на устройство отображения.

Где и как применяется

Изобретение описывает интерфейс и механизмы инициирования поиска, затрагивая преимущественно начальные этапы взаимодействия пользователя с поисковой системой.

CRAWLING & INDEXING
Система полагается на существующие indices & search engines. Контент должен быть проиндексирован, чтобы его можно было найти через этот механизм. Также может индексироваться markup (связанные действия/данные).

QUNDERSTANDING – Понимание Запросов
Ключевая область применения. Система выполняет распознавание (Text Recognition) из мультимодальных источников (изображение, аудио, текст) и автоматически осуществляет Query Construction. Это включает выбор ключевых фрагментов из потока информации. Также применяется Context Analysis, использующий данные о пользователе и контексте захвата для уточнения запроса и выбора подходящего индекса.

RANKING & METASEARCH
Система инициирует поиск (Search) и получает результаты ранжирования. Она также выполняет Markup Analysis для определения дополнительного контента или действий (Actions), которые следует представить пользователю, что является формой смешивания результатов или пост-обработки.

Входные данные:

  • Необработанные данные с устройства захвата (изображения, аудиозаписи, поток вводимого текста).
  • Контекстные данные (геолокация, время, данные сенсоров устройства).
  • Информация о пользователе (user and account info).

Выходные данные:

  • Автоматически сформированные поисковые запросы.
  • Идентифицированный связанный контент или электронные двойники документов.
  • Выполненные действия или меню доступных действий (Actions, Markup).

На что влияет

  • Типы контента и форматы: Влияет на обнаружение всех типов цифрового контента (веб-страницы, изображения, видео, продукты), которые могут быть связаны с текстом, объектами или аудио в реальном мире.
  • Специфические запросы: Вводит новые типы запросов – визуальные и аудиальные, инициированные из окружающей среды или контекста приложения, а не через поисковую строку.
  • Конкретные ниши: Сильное влияние на E-commerce (поиск по фото), образование (дополнение лекций и книг), издательское дело и локальный бизнес (взаимодействие с вывесками, меню).

Когда применяется

  • Условия работы: Алгоритм применяется в реальном времени, когда пользователь взаимодействует с контентом или устройством захвата.
  • Триггеры активации: Активируется автоматически и непрерывно по мере поступления информации (while the text is being captured). Система постоянно анализирует поток и генерирует запросы без явной команды пользователя, как только распознает значимый фрагмент.

Пошаговый алгоритм

Обобщенный алгоритм работы системы (на основе FIG. 1A и описания):

  1. Захват данных (Capture): Получение информации (изображение, аудио, текст) с помощью устройства захвата.
  2. Обработка данных (Data Processing): Предварительная обработка для улучшения качества и идентификации нужной информации.
  3. Распознавание (Text Recognition): Преобразование данных в машиночитаемый формат (например, текст через OCR или Speech-to-Text).
  4. Пост-обработка (Post-processing): Фильтрация распознанных данных.
  5. Проверка на прямые действия (Direct Actions): Определение, возможно ли немедленное выполнение действия (например, звонок по распознанному номеру). Если да, переход к шагу 10.
  6. Построение запроса (Query Construction): Автоматический выбор фрагмента распознанных данных и формирование одного или нескольких поисковых запросов.
  7. Поиск и контекстный анализ (Search & Context Analysis): Передача запросов поисковым системам. Использование контекста (пользователь, местоположение, история) для уточнения запроса и выбора индекса.
  8. Извлечение (Retrieval): Получение идентифицированного контента или документов из источников.
  9. Анализ разметки (Markup Analysis): Идентификация связанной разметки (дополнительной функциональности, данных, рекламы).
  10. Действия (Actions): Отображение результатов пользователю, предложение опций или выполнение задач.

Какие данные и как использует

Данные на входе

Система использует широкий спектр входных данных и контекстуальную информацию:

  • Контентные факторы (Текст): Текст, вводимый пользователем или распознанный из изображений (OCR) или аудио (Speech-to-Text). Анализируются слова, фразы, сущности.
  • Мультимедиа факторы: Сырые изображения, захваченные с rendered documents или объектов. Аудиопотоки (живая речь, записи).
  • Пользовательские факторы: Данные учетной записи (user and account info), история предыдущих захватов и действий. Используются для персонализации и анализа контекста.
  • Географические и Контекстные факторы (Context Engines): Местоположение устройства (GPS), время захвата, данные сенсоров устройства (ориентация, движение).

Какие метрики используются и как они считаются

Патент фокусируется на процессе извлечения информации и инициирования поиска, а не на метриках ранжирования. Конкретные формулы не указаны. Основные механизмы обработки включают:

  • Распознавание (Recognition): Использование OCR и Speech-to-Text. Патент упоминает итеративный процесс распознавания, где информация от кандидатов документов может использоваться для уточнения интерпретации захваченных данных.
  • Выбор фрагмента и Построение запроса: Алгоритмы NLP для автоматического выбора релевантных частей текста (например, выделение сущностей, ключевых фраз, анализ структуры предложения) для формирования запроса. Упоминается учет вероятных ошибок распознавания при построении запроса.
  • Поиск по коротким фразам (Short Phrase Searching): Использование относительных позиций слов для точной идентификации документа и местоположения в нем по короткому фрагменту.
  • Анализ контекста (Context Analysis): Методы для интеграции пользовательских и контекстных данных в процесс поиска и выбора индекса.

Выводы

  1. Мультимодальный ввод как основа поиска: Патент подтверждает стратегию Google по использованию информации из реального мира (визуальной и аудио) в качестве неявных поисковых запросов. Текст, изображение и звук становятся равноправными способами инициирования поиска.
  2. Переход к проактивному поиску (Ambient Search): Описан механизм, позволяющий устройствам проактивно искать информацию на основе того, что видит, слышит или печатает пользователь, в реальном времени и без явных команд.
  3. Автоматическая генерация запросов: Ключевой способностью является автоматическое выделение релевантных фрагментов из потока информации и Query Construction. Это требует глубокого понимания контекста и намерений.
  4. Критичность контекста для интерпретации: Context Analysis, использующий данные пользователя и окружающей среды, является неотъемлемой частью для правильной интерпретации захваченной информации и выбора релевантного индекса.
  5. Интеграция действий и контента (Markup): Цель системы не только найти информацию, но и предложить действия. Механизм Markup позволяет связывать дополнительную функциональность (покупки, бронирования, рекламу) непосредственно с захваченной информацией.

Практика

Best practices (это мы делаем)

  • Оптимизация для мультимодального обнаружения (Visual и Audio SEO): Учитывая, что поиск может быть инициирован через Google Lens или Assistant, необходимо оптимизировать все активы. Для визуального поиска: используйте высококачественные изображения продуктов и объектов, обеспечьте читаемость текста на изображениях (для OCR). Для аудио: предоставляйте точные транскрипты подкастов и видео, чтобы система могла корректно выполнить Speech-to-text и проиндексировать содержание.
  • Усиление связи с сущностями (Entity Optimization): Система автоматически выделяет фрагменты для запросов. Четкое определение сущностей (продуктов, брендов, локаций) в контенте и использование структурированных данных (Schema.org) критически важны. Это помогает системе связать захват в реальном мире с вашей сущностью в Knowledge Graph.
  • Оптимизация локального контекста: Поскольку Context Analysis использует местоположение, поддержание актуальной информации в Google Business Profile критично для локального бизнеса. Это гарантирует, что при визуальном захвате вывески или упоминании бизнеса в разговоре система предоставит корректные данные.
  • Создание контента для быстрых ответов: Система предоставляет информацию параллельно с основной деятельностью пользователя. Структурируйте контент так, чтобы ключевая информация (определения, факты, сводки) была легко извлекаема (оптимизация под Featured Snippets).

Worst practices (это делать не надо)

  • Игнорирование нетекстового поиска: Фокусироваться только на традиционном SEO по ключевым словам. Игнорирование визуального и аудио поиска ограничивает потенциал обнаружения контента в современных интерфейсах.
  • Использование сложных для распознавания форматов: Публикация информации в форматах, затрудняющих распознавание (например, текст в виде низкокачественной графики без текстового эквивалента, аудио с плохим качеством звука).
  • Отсутствие структурированных данных: Неспособность предоставить четкие сигналы о сущностях затрудняет системе идентификацию контента и определение связанных с ним действий (Markup).

Стратегическое значение

Этот патент имеет фундаментальное значение для понимания эволюции поиска от реактивного к проактивному и основанному на окружающей среде (Ambient Search). Он закладывает основу мультимодального поиска. Стратегически, SEO-специалисты должны перейти от оптимизации страниц к оптимизации сущностей и их представлений во всех форматах. Долгосрочная стратегия должна быть направлена на обеспечение максимальной доступности и понятности информации для систем ИИ, которые "смотрят" и "слушают" мир от имени пользователя.

Практические примеры

Сценарий 1: Оптимизация для визуального обнаружения (E-commerce / Google Lens)

  1. Ситуация: Пользователь видит товар в журнале или на полке магазина и использует камеру смартфона для захвата.
  2. Действие SEO-специалиста: Оптимизировать изображения продукта на сайте (высокое качество), использовать разметку Product с GTIN. Убедиться, что текст на упаковке (бренд, модель) соответствует тексту на сайте.
  3. Работа системы: Система выполняет Capture и Text Recognition (OCR текста на упаковке) или распознавание объекта. Формируется запрос (Query Construction). Система идентифицирует продукт в индексе и использует Markup Analysis для предложения действия "Купить" (Action).

Сценарий 2: Оптимизация контента для захвата из аудио (Подкаст/Лекция)

  1. Ситуация: Пользователь слушает лекцию, где упоминается сложный термин. Система анализирует аудиопоток.
  2. Действие SEO-специалиста: Создать авторитетную статью-глоссарий, объясняющую этот термин, с четкой структурой и разметкой DefinedTerm. Предоставить транскрипт лекции.
  3. Работа системы: Система принимает аудио (Capture), применяет Speech-to-text, идентифицирует термин, формирует запрос. Context Analysis помогает понять образовательное намерение.
  4. Результат: Система проактивно предлагает пользователю ссылку на оптимизированную статью-глоссарий для быстрого ознакомления.

Вопросы и ответы

Является ли этот патент описанием Google Lens или Google Assistant?

Патент описывает общую инфраструктуру и методы, которые лежат в основе таких технологий. Он предоставляет фреймворк для захвата визуальной информации (как в Lens) и аудиоинформации (как в Assistant), их преобразования в запросы и проактивного предоставления результатов. Это фундаментальное описание того, как устройство может стать «осведомленным» об окружающей информации.

Влияет ли этот патент напрямую на алгоритмы ранжирования в поиске Google?

Нет, патент не описывает, как ранжируются результаты поиска. Он фокусируется на том, как инициируется поиск из нетрадиционных источников ввода (визуальных, аудио, вводимого текста) в реальном времени. Он полагается на существующие поисковые системы для фактического ранжирования, но определяет новый механизм доступа к ним.

Какое значение имеет концепция "Markup" (Разметка) для SEO?

Markup относится к дополнительным данным или функциональности, связанным с контентом (например, реклама, действия, аннотации). Для SEO это подчеркивает важность структурированных данных (Schema.org) и интеграции с Google Actions. Предоставление четкой разметки позволяет системе не только находить ваш контент, но и предлагать пользователям конкретные действия (купить, забронировать), что критично для конверсии.

Как оптимизировать контент для системы, которая захватывает аудиопотоки?

Ключевым моментом является преобразование речи в текст. Чтобы оптимизировать аудиоконтент (подкасты, видео), необходимо обеспечить высокое качество звука для лучшего распознавания речи и обязательно предоставлять точные транскрипты. Это позволяет системе корректно индексировать содержание аудио и сопоставлять его с захваченными аудиофрагментами.

Что такое "Rendered Document" в понимании этого патента?

Термин используется очень широко. Это не только печатный документ, но и любой физический объект, предоставляющий информацию, воспринимаемую человеком. Сюда входят экраны компьютеров, билборды, знаки, а также аудио- и видеопотоки. Все это рассматривается как потенциальный источник для захвата информации.

Как система обеспечивает релевантность, если запросы генерируются автоматически?

Релевантность обеспечивается за счет комбинации точного распознавания (OCR/Speech-to-Text), глубокого понимания языка для выбора ключевых терминов при Query Construction и использования обширного контекстного анализа (Context Analysis). Контекст помогает сузить область поиска и предоставить наиболее подходящий результат.

Что означает обработка "в реальном времени" в этом патенте?

Это означает, что система не ждет завершения захвата или команды пользователя. Как описано в патенте, система проактивно анализирует входящий поток данных (например, по мере набора текста или поступления аудио) и начинает процесс поиска и предоставления результатов немедленно.

Может ли эта система работать офлайн?

Патент упоминает возможность локального кэширования индекса для повышения производительности или использования в офлайн-режиме. Это предполагает, что часть функциональности, например, доступ к ограниченному индексу (например, для конкретной книги), может быть доступна без подключения к сети.

Как система решает, в каком индексе искать (например, Веб, Новости или Покупки)?

Система выполняет Context Analysis и анализирует природу захваченной информации, чтобы выбрать наиболее подходящий индекс. Если захвачено изображение товара, система может выбрать индекс Google Shopping; если захвачен текст из научной статьи – Google Scholar или общий веб-индекс.

Каков главный вывод для SEO-стратегии из этого патента?

Главный вывод заключается в необходимости перехода к стратегии, ориентированной на мультимодальное обнаружение. SEO больше не ограничивается оптимизацией под клавиатурный ввод. Стратегия должна гарантировать, что сущности и контент бренда четко определены (с помощью структурированных данных) и легко распознаются через визуальные и аудио каналы, чтобы участвовать в проактивном поиске.

Похожие патенты

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google анализирует контент на экране пользователя для генерации и рекомендации контекстных поисковых запросов
Google использует систему для анализа контента, который пользователь просматривает в данный момент (веб-страница, приложение). Система генерирует потенциальные поисковые запросы на основе этого контента, оценивает их качество (популярность, качество результатов, визуальное выделение терминов) и предлагает пользователю лучшие запросы для быстрого контекстного поиска без необходимости вручную вводить текст.
  • US10489459B1
  • 2019-11-26
  • Семантика и интент

Как Google объединяет изображение с камеры и одновременный аудиовход (речь и звуки) для выполнения сложных мультимодальных поисковых запросов
Система мультимодального поиска Google, которая одновременно обрабатывает визуальные данные с камеры и аудиоданные с микрофона. Система извлекает визуальные признаки, транскрибирует речь и анализирует звуковые сигнатуры. Это позволяет пользователям задавать контекстные вопросы об объектах в кадре (например, «[Фото платья] + Найди такое же синее») или диагностировать проблемы по звуку и изображению (например, шум неисправного прибора), получая релевантные результаты из веб-поиска, поиска по картинкам или от генеративных моделей.
  • US12346386B2
  • 2025-07-01
  • Мультимедиа

  • Семантика и интент

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов
Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).
  • US9244977B2
  • 2016-01-26
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google анализирует видимый контент на экране пользователя для предоставления контекстной информации без ввода запроса (Contextual Search)
Google использует механизм для анализа контента, активно отображаемого на экране устройства (веб-страницы, приложения, чаты). По общему триггеру (например, долгое нажатие или жест) система идентифицирует ключевые сущности только в видимой области. Она определяет их важность на основе визуального представления (размер, цвет, позиция) и типа контента, причем логика определения важности адаптируется (например, в чате приоритет у недавних сообщений внизу экрана).
  • US11003667B1
  • 2021-05-11
  • Семантика и интент

  • Knowledge Graph

Популярные патенты

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует внешние данные для оценки репутации сущностей и их взаимной привлекательности в вертикальном поиске
Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления скрытых атрибутов и расчета «Репутационной значимости» каждой сущности. На основе этих данных определяется метрика «Двухстороннего соответствия», которая используется для ранжирования.
  • US10853432B2
  • 2020-12-01
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2015-11-24
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

seohardcore