SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google реализует функцию «Выделить и Искать» с интеллектуальным уточнением запроса на стороне клиента

METHODS AND APPARATUS FOR PROVIDING QUERY PARAMETERS TO A SEARCH ENGINE (Методы и аппаратура для предоставления параметров запроса поисковой системе)
  • US8838562B1
  • Google LLC
  • 2004-10-22
  • 2014-09-16
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google описывает клиентскую технологию, позволяющую пользователю выделить любой элемент на экране (текст или изображение) и мгновенно инициировать поиск. Система автоматически обрабатывает выделенное: применяет OCR к изображениям, дополняет частично выделенные слова и добавляет контекстные слова из окружающего контента для уточнения запроса перед его отправкой в поисковую систему.

Описание

Какую проблему решает

Патент решает проблему неэффективности и сложности ввода поисковых запросов на основе контента, который пользователь просматривает в данный момент. Традиционный метод требует многоэтапной операции копирования и вставки и часто ограничен только выделяемым текстом. Изобретение призвано радикально упростить этот процесс, позволяя инициировать поиск по любым данным, отображаемым в графическом интерфейсе (GUI), включая изображения, минимизируя действия пользователя (например, до одного клика).

Что запатентовано

Запатентован клиентский механизм для быстрого формирования поискового запроса из данных, выделенных в GUI. Система перехватывает выделение (текста или изображения), обрабатывает его, включая оптическое распознавание символов (OCR) для изображений, и автоматически отправляет запрос. Ключевой инновацией является интеллектуальная обработка выделенного фрагмента на стороне клиента: автоматическое дополнение частично выделенных слов и добавление контекстных слов (Context Words) из окружающего контента.

Как это работает

Механизм работает на стороне клиента в несколько этапов:

  • Перехват выделения: Система фиксирует действия пользователя по выделению области в GUI.
  • Извлечение и Определение типа: Определяется, что было выделено — текст или изображение (image data), и данные извлекаются.
  • Конвертация (OCR): Если выделено изображение, применяется OCR для его преобразования в текст.
  • Интеллектуальная обработка текста: Система улучшает текст: дополняет частично выделенные слова, используя соседний невыделенный контент, и добавляет Context Words из окружающего контента для разрешения неоднозначностей.
  • Отправка запроса: Сформированный параметр запроса (Query Parameter) передается поисковой системе (например, путем запуска браузера с соответствующим URL).

Актуальность для SEO

Высокая (с точки зрения UI/UX). Хотя патент подан в 2004 году, описанные концепции лежат в основе стандартных функций современных браузеров и операционных систем («Искать в Google» через контекстное меню). Это также является ранним предшественником более продвинутых технологий, таких как Google Lens и «Circle to Search», которые реализуют контекстный поиск по контенту на экране.

Важность для SEO

Влияние на SEO минимальное (1/10). Патент описывает исключительно клиентскую технологию (User Experience) для формирования и отправки запроса, а не внутренние механизмы поисковой системы (ранжирование, индексирование). Он не дает никаких прямых рекомендаций по оптимизации сайтов для улучшения их позиций. Патент является инфраструктурным и объясняет, как пользователи могут инициировать поиск, а не как Google обрабатывает этот поиск на сервере.

Детальный разбор

Термины и определения

Context Words (Контекстные слова)
Слова, взятые из невыделенной области GUI, окружающей выделенный пользователем фрагмент. Используются для автоматического уточнения и дополнения поискового запроса на стороне клиента.
Conversion Unit (Блок конвертации)
Компонент системы, отвечающий за преобразование выделенных данных (например, изображений) в текст. Использует OCR.
GUI (Graphical User Interface, Графический интерфейс пользователя)
Среда (приложение, ОС, браузер), из которой пользователь выделяет контент для поиска.
OCR (Optical Character Recognition, Оптическое распознавание символов)
Технология для преобразования текста на изображениях в машиночитаемый текст.
Partial Word (Частичное слово)
Слово, которое было выделено пользователем не полностью. Система автоматически пытается его дополнить.
Query Creation Unit (Блок создания запроса)
Компонент, который обрабатывает текст и формирует итоговый поисковый запрос (Query Parameter).
Selection Processing Unit (Блок обработки выделения)
Компонент, отвечающий за перехват действий пользователя по выделению контента в GUI и извлечение соответствующих данных (текста или изображения).
Text Processing Unit (Блок обработки текста)
Компонент, выполняющий интеллектуальную обработку текста: дополнение частичных слов, добавление Context Words, удаление стоп-слов.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на интеллектуальной обработке выделенного контента на стороне клиента для улучшения качества запроса.

Claim 1 (Независимый пункт): Описывает основной метод предоставления параметров запроса.

  1. Система получает выделение, определяющее область в GUI.
  2. Идентифицируются выделенные элементы в этой области и конвертируются в текстовые данные.
  3. Этап Дополнения: Система определяет наличие частичного слова (partial word). Она идентифицирует невыделенные элементы (unselected elements) за пределами выделенной области, которые могут завершить это слово, и добавляет их к выделенным данным.
  4. Этап Контекстуализации: Система определяет контекст на основе невыделенных элементов и генерирует дополнительные термины запроса (query terms) на основе этого контекста. Эти термины отличаются от данных, использованных на этапе Дополнения.
  5. Создается итоговый параметр запроса, включающий дополненный текст и контекстные термины.
  6. Параметр предоставляется поисковой системе.

Ядро изобретения заключается в использовании невыделенного контента для улучшения выделенного контента на стороне клиента.

Claim 3 и 9 (Зависимые): Уточняют, что если выделенные элементы являются изображением или содержат текст в виде изображения, конвертация включает использование OCR для извлечения текста.

Claim 21 (Независимый пункт): Описывает устройство (аппаратуру) для реализации метода.

Устройство включает блок обработки ввода для приема кликов мыши, определяющих область GUI, и блок создания запроса. Блок создания запроса содержит:

  • Conversion Unit для преобразования данных в текст с использованием OCR.
  • Text Processing Unit для выполнения интеллектуальной обработки: определения и дополнения частичных слов, определения контекста, генерации дополнительных терминов и создания финального запроса.

Где и как применяется

Важно понимать, что этот патент не описывает внутренние процессы поисковой системы Google (такие как CRAWLING, INDEXING, RANKING). Он описывает работу клиентского приложения (например, тулбара, расширения браузера или функции операционной системы).

Применение описанных механизмов происходит ДО того, как запрос попадает в стандартную архитектуру поиска Google.

Взаимодействие с компонентами системы:

  • Система взаимодействует с ОС и приложениями на устройстве пользователя для перехвата выделений в GUI и доступа к отображаемому контенту.
  • Она взаимодействует с поисковой системой как внешний клиент, отправляя стандартный сформированный запрос.

Входные данные:

  • Действия пользователя по выделению (координаты мыши, клики).
  • Данные из выделенной области GUI (текст или данные изображения/скриншот).
  • Данные из невыделенной (окружающей) области GUI для контекстного анализа.

Выходные данные:

  • Сформированный текстовый поисковый запрос, отправленный в поисковую систему (часто в виде URL через браузер).

На что влияет

  • Формулировка запроса: Основное влияние патент оказывает на то, как именно формулируется запрос, отправляемый пользователем. Запросы становятся более точными за счет автоматического дополнения и контекстуализации.
  • Типы контента: Позволяет инициировать поиск по любому видимому контенту, включая текст в изображениях (благодаря OCR) и не копируемый текст.

Когда применяется

  • Триггеры активации: Активируется исключительно по действию пользователя — выделение контента и выполнение команды поиска (например, через контекстное меню, специальную кнопку мыши или жест).
  • Условия работы: Наличие графического интерфейса и возможность системы перехватывать данные, отображаемые на экране.

Пошаговый алгоритм

Процесс работы системы на стороне клиента:

  1. Получение выделения: Система получает сигналы от устройства ввода (например, начало и конец нажатия кнопки мыши), определяя координаты выделения в GUI.
  2. Определение типа данных: Система анализирует область выделения, чтобы определить, присутствует ли там выделяемый текст или это изображение.
  3. Извлечение данных:
    • Если текст присутствует: Извлекается выделенный текст.
    • Если текста нет: Извлекаются графические данные (image data) из выделенной области.
  4. Конвертация (при необходимости): Если были извлечены графические данные, применяется OCR для их преобразования в текст.
  5. Интеллектуальная обработка текста: Текст обрабатывается для улучшения качества запроса:
    • Дополнение частичных слов: Если выделение закончилось на середине слова, система ищет невыделенные символы в GUI рядом, чтобы дополнить слово.
    • Удаление слов: Опциональное удаление стоп-слов (упомянуто в описании).
    • Добавление контекста: Анализ невыделенных слов в окружающем GUI для определения контекста. Если выделено неоднозначное слово, система может добавить уточняющее слово, найденное рядом.
  6. Создание запроса: Формирование финального Query Parameter из обработанного и дополненного текста.
  7. Передача запроса: Система создает URL, содержащий Query Parameter, запускает браузер и передает URL поисковой системе.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на данных, отображаемых в графическом интерфейсе пользователя на клиентском устройстве.

  • Контентные факторы: Текст, выделенный пользователем в GUI.
  • Мультимедиа факторы: Изображения (графические данные, image data) из выделенной области GUI.
  • Контекстные данные (GUI): Текст или изображения из невыделенной области GUI, окружающей выделение. Используются как Context Words и для дополнения частичных слов.
  • Пользовательские факторы: Действия пользователя по выделению (координаты, сигналы устройства ввода).

Какие метрики используются и как они считаются

Патент не описывает метрики ранжирования или оценки качества контента. Он описывает методы обработки пользовательского ввода на стороне клиента.

  • Методы анализа изображений: Используется OCR для конвертации изображений в текст.
  • Методы анализа текста (NLP): Применяются эвристические методы для определения границ слов (необходимые для дополнения частично выделенных слов) и для идентификации релевантных Context Words в окружающем тексте. Также упоминается определение языка и удаление стоп-слов.

Выводы

Патент является чисто техническим и описывает инфраструктурные процессы на стороне клиента (UI/UX). Он не дает практических выводов для SEO-специалистов, направленных на улучшение ранжирования сайта.

  1. Клиентская технология, а не алгоритм ранжирования: Все описанные механизмы работают на устройстве пользователя и направлены на формирование более качественного запроса до его отправки в поисковую систему.
  2. Автоматическое улучшение запроса (Query Augmentation): Ключевая инновация патента — это интеллектуальная обработка выделенного фрагмента. Система автоматически дополняет неполные слова и добавляет контекстные термины.
  3. Использование невыделенного контента: Система активно использует контент, который пользователь не выделил, но который находится рядом, для уточнения интента (Claim 1).
  4. Универсальный ввод через OCR: Патент демонстрирует стремление сделать любой видимый контент источником запроса, используя OCR для извлечения текста из изображений.
  5. Предшественник современных технологий: Этот патент можно рассматривать как раннюю реализацию концепций, которые сегодня развиты в таких продуктах, как Google Lens и «Circle to Search».

Практика

Патент скорее инфраструктурный (в части UI/UX) и не дает практических выводов для SEO.

Best practices (это мы делаем)

В патенте нет информации, которая могла бы повлиять на Best Practices в SEO с целью улучшения ранжирования. Патент не касается оптимизации сайтов.

Worst practices (это делать не надо)

В патенте нет информации о худших практиках в SEO или о методах борьбы с манипуляциями.

Стратегическое значение

Стратегическое значение для SEO минимально. Патент подтверждает долгосрочный фокус Google на улучшении пользовательского опыта и стремлении максимально точно понять информационную потребность пользователя в том контексте, в котором она возникает. Это часть глобальной стратегии по упрощению доступа к информации, но она не меняет фундаментальные принципы ранжирования.

Практические примеры

Практических примеров для SEO нет, так как патент описывает функционал пользовательского интерфейса. Ниже приведен пример работы описанного механизма с точки зрения UX.

Сценарий: Уточнение неоднозначного запроса с помощью контекста

  1. Контент на экране: Статья о животных: «Ягуары (Jaguars) — это крупные кошки, обитающие в Америке. Они тесно связаны со львами и тиграми».
  2. Действие пользователя: Пользователь выделяет только слово «Jaguars».
  3. Обработка системой (Client-Side): Клиентский инструмент анализирует окружающий невыделенный текст («крупные кошки», «львами», «тиграми»).
  4. Уточнение запроса: Чтобы исключить результаты об автомобилях, система идентифицирует Context Words (например, «кошки») и добавляет их к запросу.
  5. Результат: В поисковую систему отправляется запрос «Jaguars кошки» вместо просто «Jaguars», что обеспечивает более релевантную выдачу.

Вопросы и ответы

Описывает ли этот патент новый фактор ранжирования?

Нет. Патент полностью сосредоточен на клиентском интерфейсе (UI) и пользовательском опыте (UX). Он описывает, как инструмент (например, расширение браузера или функция ОС) помогает пользователю сформировать и отправить запрос, а не как Google ранжирует результаты поиска на своих серверах.

Что такое "Context Words" и как они влияют на поиск?

Context Words — это слова, которые клиентский инструмент автоматически извлекает из контента, окружающего выделенный пользователем фрагмент. Они добавляются к запросу на стороне клиента для его уточнения и разрешения неоднозначности. Это влияет на формулировку входящего запроса, делая его более точным, но не меняет алгоритмы его обработки поисковой системой.

Как система обрабатывает изображения, согласно патенту?

Если пользователь выделяет область экрана, которая является изображением (включая не копируемый текст), система применяет оптическое распознавание символов (OCR) на стороне клиента. Это позволяет извлечь текст из изображения и использовать его как основу для поискового запроса.

Нужно ли как-то оптимизировать контент под этот механизм автоматического дополнения запросов?

Нет, предпринимать специальных действий для SEO не требуется. Механизм работает на стороне клиента и адаптируется к любому контенту. SEO-специалистам следует продолжать фокусироваться на создании качественного, четко структурированного контента.

Что означает функция "дополнения частичных слов"?

Это функция для улучшения удобства пользователя. Если пользователь неаккуратно выделил текст и захватил только часть слова (например, "темпера" вместо "температура"), система автоматически проанализирует прилегающий невыделенный текст и дополнит слово до полного. В поиск будет отправлено полное слово.

Как этот патент связан с современными функциями, такими как "Circle to Search" или Google Lens?

Этот патент, поданный еще в 2004 году, описывает фундаментальные принципы, которые лежат в основе этих современных функций. К ним относятся: выделение произвольной области на экране, распознавание контента внутри этой области (с помощью OCR) и автоматическое инициирование контекстного поиска на основе выделенных данных.

На каком этапе поиска работает этот механизм?

Он работает до начала стандартного поиска. Это механизм клиентского уровня (UI), который формирует, обрабатывает и уточняет ввод пользователя перед его отправкой в поисковую систему. Его можно рассматривать как инструмент предварительной обработки ввода.

Может ли система удалить слова из выделенного пользователем текста?

Да, в описании патента (FIG. 7) упоминается возможность обработки текста путем удаления стоп-слов (Stop Words) — артиклей, предлогов и других часто встречающихся слов. Это делается для улучшения качества итогового поискового запроса перед его отправкой.

Работает ли этот механизм только в браузере?

Нет. Патент описывает механизм, работающий на уровне графического интерфейса (GUI). Это подразумевает возможность его применения в любых приложениях — текстовых редакторах, PDF-просмотрщиках, браузерах или самой операционной системе.

Какова основная польза от анализа этого патента для SEO-специалиста?

Основная польза минимальна и заключается в понимании того, что не все патенты Google описывают алгоритмы ранжирования. Этот патент полезен для понимания развития пользовательских интерфейсов поиска и того, как могут формироваться запросы пользователей, но он не дает инсайтов для улучшения позиций сайта.

Похожие патенты

Как Google позволяет пользователям уточнять запросы, выбирая термины прямо из сниппетов в выдаче
Патент описывает интерфейсный механизм, позволяющий пользователям быстро уточнять поисковые запросы. Пользователь может выделить термин прямо в сниппете результата поиска и через контекстное меню выбрать действие (например, «обязательно включить», «исключить» или «искать как фразу»). Система автоматически переписывает запрос с использованием соответствующих операторов.
  • US20170220680A1
  • 2017-08-03
  • SERP

  • Семантика и интент

Как Google анализирует видимый контент на экране пользователя для предоставления контекстной информации без ввода запроса (Contextual Search)
Google использует механизм для анализа контента, активно отображаемого на экране устройства (веб-страницы, приложения, чаты). По общему триггеру (например, долгое нажатие или жест) система идентифицирует ключевые сущности только в видимой области. Она определяет их важность на основе визуального представления (размер, цвет, позиция) и типа контента, причем логика определения важности адаптируется (например, в чате приоритет у недавних сообщений внизу экрана).
  • US11003667B1
  • 2021-05-11
  • Семантика и интент

  • Knowledge Graph

Как Google использует выделение деталей на изображении для уточнения визуального поиска и комбинирования результатов
Google использует технологию, позволяющую пользователям уточнять визуальные запросы путем произвольного выделения конкретных деталей на изображении (например, обводя или закрашивая элемент). Система интерпретирует это действие для понимания истинного намерения пользователя. Используя визуальные эмбеддинги, система находит результаты, релевантные как выделенному признаку, так и объекту в целом, и предоставляет комбинированную выдачу, сохраняя контекст исходного запроса.
  • US12072925B2
  • 2024-08-27
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует выделенный на странице контент для параллельного поиска в специализированных базах данных (приложения, расширения, товары)
Google патентует механизм «ассистированного поиска» для специализированных баз данных (например, магазинов приложений или расширений). Пользователь выделяет контент (текст/изображение) на веб-странице, и система использует его как запрос. Специальный конвертер анализирует выделенное, определяет несколько возможных интентов, оптимизирует их под конкретную базу данных и выполняет параллельный поиск, выдавая сгруппированные результаты.
  • US20230214427A1
  • 2023-07-06
  • Семантика и интент

  • SERP

Как Google комбинирует текстовый запрос и изображение-образец для уточнения поиска по картинкам
Google использует механизм для обработки гибридных запросов (текст + изображение). Система находит изображения, которые одновременно релевантны тексту и визуально похожи на образец. Для этого создаются компактные визуальные дескрипторы и используются "визуальные ключи" для быстрого поиска. Финальная выдача ранжируется по степени визуального сходства с образцом.
  • US9043316B1
  • 2015-05-26
  • Мультимедиа

  • Семантика и интент

Популярные патенты

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)
Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.
  • US10146829B2
  • 2018-12-04
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

seohardcore