SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google интерактивно уточняет неоднозначные запросы у пользователя и изучает новую терминологию без переобучения ИИ-моделей

PARSING NATURAL LANGUAGE QUERIES WITHOUT RETRAINING (Парсинг запросов на естественном языке без переобучения)
  • US11301502B1
  • Google LLC
  • 2016-09-14
  • 2022-04-12
  • Семантика и интент
  • Knowledge Graph
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для обработки неоднозначных запросов на естественном языке. Если запрос можно интерпретировать по-разному, система просит пользователя внести ясность (например, добавить скобки или перефразировать). Это помогает Google точно преобразовать запрос в структурированный формат для поиска по Базе Знаний (Knowledge Base), а также позволяет системе изучать отраслевые термины на лету, не требуя медленного переобучения основных ИИ-моделей.

Описание

Какую проблему решает

Патент решает проблему неоднозначности (parsing ambiguity) при интерпретации запросов на естественном языке, особенно когда запросы содержат специализированную или новую терминологию. Традиционный подход к улучшению качества парсинга требует переобучения языковых моделей, что является ресурсоемким и медленным процессом. Изобретение позволяет повысить точность интерпретации запросов и адаптироваться к новым терминам без переобучения основной модели парсера.

Что запатентовано

Запатентована система для интерактивного устранения неоднозначности запросов. Когда система обнаруживает, что запрос на естественном языке может быть интерпретирован несколькими способами, она взаимодействует с пользователем для уточнения намерения. Пользователь вносит изменения в запрос (например, добавляет символы или перефразирует), что позволяет системе выбрать правильную интерпретацию и преобразовать запрос в Structured Operations (например, SQL) для выполнения в Knowledge Base. Система также может изучать новые domain-specific terms в ходе этого взаимодействия.

Как это работает

Механизм активируется при обнаружении parsing ambiguity:

  • Обнаружение неоднозначности: Парсер идентифицирует несколько возможных структурных интерпретаций запроса.
  • Взаимодействие с пользователем: Система уведомляет пользователя о неоднозначности и предлагает способы её устранения.
  • Уточнение запроса: Пользователь модифицирует запрос, добавляя слова, символы (например, скобки или кавычки — Span Constraints), изменяя порядок слов или разбивая запрос на части.
  • Повторный парсинг: Система анализирует модифицированный запрос, устраняя неоднозначность.
  • Обучение (Опционально): Система может идентифицировать новые отраслевые термины на основе действий пользователя и добавить их в Domain-Specific Lexicon для будущего использования без переобучения модели.
  • Выполнение: Уточненный запрос преобразуется в Structured Operations и выполняется.

Актуальность для SEO

Средняя. Способность систем адаптироваться к новой терминологии без полного переобучения остается высокоактуальной задачей в NLP. Однако конкретная реализация UI, описанная в патенте (где система просит пользователя вручную добавить скобки или переставить слова), редко встречается в основном веб-поиске Google. Современные большие языковые модели (LLM) часто решают проблему неоднозначности иначе, хотя идея интерактивного уточнения сохраняет высокую актуальность в диалоговых интерфейсах (например, Google Assistant) и специализированных инструментах поиска.

Важность для SEO

(2/10) Минимальное/Инфраструктура. Патент описывает внутренние процессы Google на этапе Query Understanding и специфический пользовательский интерфейс для разрешения неоднозначностей. Он не содержит информации о сигналах ранжирования или оценке качества контента. Прямых рекомендаций для SEO-специалистов по оптимизации сайтов из этого патента извлечь нельзя.

Детальный разбор

Термины и определения

Domain-Specific Lexicon (Предметно-ориентированный словарь)
Словарь, содержащий термины, фразы и их определения, специфичные для определенной области знаний (например, физики или компьютерных баз данных). Используется парсером для правильной интерпретации специализированных запросов.
Knowledge Base (База знаний)
Структурированное хранилище информации о сущностях (например, Knowledge Graph). Система запрашивает эту базу данных с помощью структурированных API.
Natural Language Query (NL Query)
Запрос, введенный пользователем в свободной форме.
NL Frontend
Интерфейс обработки естественного языка. Включает парсер (Lexer & Parser) и подсистему взаимодействия с пользователем (Conversion and user interaction subsystem).
Parsing Ambiguity (Неоднозначность парсинга)
Ситуация, когда запрос может быть синтаксически или семантически интерпретирован более чем одним способом, и система не может определить предпочтительный вариант без дополнительной информации.
Span Constraints (Ограничения диапазона)
Символы (например, скобки, кавычки), добавляемые пользователем к запросу для явного указания того, как должны группироваться слова или фразы.
Structured Operations (Структурированные операции)
Формализованные команды (например, SQL-запросы), которые система генерирует из запроса на естественном языке для взаимодействия со структурированными API Базы знаний.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод интерактивного устранения неоднозначности запросов.

  1. Система получает запрос на естественном языке (NL).
  2. В процессе парсинга для преобразования NL-запроса в Structured Operations система идентифицирует два или более способа разбора запроса.
  3. Обнаруживается parsing ambiguity, которая не может быть разрешена без дополнительной информации от пользователя (эта информация требует изменения запроса).
  4. Система через интерфейс предоставляет информацию о неоднозначности и запрашивает ввод пользователя для ее разрешения.
  5. В ответ на взаимодействие пользователя, включающее изменение исходного запроса, система модифицирует процесс парсинга.
  6. Structured Operations выполняются в Базе знаний, результаты предоставляются пользователю.
  7. Ключевое уточнение: Изменение запроса включает добавление символов, изменение синтаксиса (перестановку слов) ИЛИ разбиение запроса на подзапросы.

Claim 4 (Зависимый от 1): Описывает механизм обучения.

Взаимодействие с пользователем используется для идентификации domain-specific term. Этот термин сохраняется для использования при парсинге будущих запросов без переобучения парсера.

Claim 5 (Зависимый от 4): Уточняет, как идентифицируется термин.

Domain-specific term идентифицируется на основе вставки символов (например, скобок) вокруг фразы в запросе.

Где и как применяется

Изобретение полностью относится к этапу обработки пользовательского ввода перед тем, как система начнет поиск информации.

QUNDERSTANDING – Понимание Запросов
Это основная область применения патента. Система работает на уровне интерпретации текста запроса в компоненте NL frontend.

  1. Парсинг и Интерпретация: Когда пользователь вводит запрос, система пытается преобразовать его из естественного языка в структурированный формат (Structured Operations), понятный внутренним системам (Knowledge Base APIs).
  2. Разрешение неоднозначности: Если парсер сталкивается с parsing ambiguity, активируется описанный механизм взаимодействия с пользователем.
  3. Обогащение словаря: На этом же этапе происходит обновление Domain-Specific Lexicons на основе полученной обратной связи.

Входные данные:

  • Исходный запрос на естественном языке.
  • Данные от парсера о возможных вариантах интерпретации.
  • Ввод пользователя (модификация запроса).
  • Существующие Domain-Specific Lexicons.

Выходные данные:

  • Сгенерированные Structured Operations (например, SQL).
  • (Опционально) Новые записи в Domain-Specific Lexicon.

На что влияет

  • Специфические запросы: Наибольшее влияние на сложные, многосоставные запросы или запросы, содержащие новую, редкую или многозначную терминологию. Пример из патента: "Where to get bacon and egg sandwich?" (Неясно: "bacon" и "egg sandwich" или "bacon and egg" sandwich).
  • Конкретные ниши или тематики: Влияет на узкоспециализированные домены (наука, технологии), где используется специфический жаргон, который может быть неизвестен общему парсеру.
  • Типы контента: Влияет в первую очередь на результаты, получаемые из структурированных баз данных (Knowledge Base), такие как прямые ответы или данные о сущностях.

Когда применяется

  • Триггер активации: Когда парсер идентифицирует два или более правдоподобных способа интерпретации запроса (parsing ambiguity).
  • Условие срабатывания: Когда система определяет, что для выбора правильной интерпретации требуется дополнительная информация от пользователя. Это может происходить, если оценки уверенности (scores) для нескольких вариантов слишком близки или не превышают определенный порог (threshold value).

Пошаговый алгоритм

Процесс обработки запроса и устранения неоднозначности:

  1. Получение запроса: Система получает запрос на естественном языке от пользователя.
  2. Попытка парсинга и оценка: Система пытается разобрать запрос, используя языковые модели и Domain-Specific Lexicons. Генерируются и оцениваются (scoring) варианты разбора.
  3. Обнаружение неоднозначности: Система определяет, что запрос можно интерпретировать несколькими способами, и автоматический выбор невозможен (например, оценки близки).
  4. Инициация взаимодействия: Система предоставляет пользователю информацию о неоднозначности через интерфейс (например, показывает варианты интерпретации).
  5. Получение уточнения (User Input): Пользователь модифицирует запрос. Это может включать:
    • Добавление символов (Span Constraints), например, скобок: "Where to get [[bacon and egg]] sandwich?".
    • Добавление слов.
    • Изменение синтаксиса или перестановку слов.
    • Разбиение запроса на несколько подзапросов.
  6. Модификация парсинга: Система использует уточненный запрос для повторного анализа, устраняя предыдущую неоднозначность.
  7. (Опционально) Обновление словаря: Если взаимодействие указывает на новый термин (например, пользователь выделил скобками новую фразу), система может добавить его в Domain-Specific Lexicon.
  8. Генерация и выполнение операций: На основе однозначного разбора генерируются Structured Operations, которые выполняются на API Базы знаний.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на процессе интерпретации запроса и взаимодействии с пользователем. Он не упоминает стандартные SEO-факторы (контентные, ссылочные и т.д.).

  • Текст запроса: Исходный текст запроса на естественном языке.
  • Пользовательские факторы (Взаимодействие): Данные о том, как пользователь модифицировал запрос для устранения неоднозначности (добавленные символы, слова, изменения структуры).
  • Системные данные:
    • Domain-Specific Lexicons: Предварительно определенные термины и фразы, специфичные для разных областей.
    • Схемы данных Knowledge Base: Используются для преобразования разобранного запроса в корректные Structured Operations.

Какие метрики используются и как они считаются

Патент не детализирует конкретные формулы, но описывает следующие концепции:

  • Оценка вариантов разбора (Parse Scores): Патент упоминает процесс оценки (scoring) каждого из вариантов разбора, сгенерированных парсером.
  • Пороговое значение (Threshold Value): Упоминается, что Structured Operations генерируются согласно варианту разбора, который удовлетворяет пороговому значению. Parsing ambiguity возникает, когда система не может выбрать один вариант на основе этих оценок и порога.
  • Идентификация Domain-Specific Terms: Механизм для определения того, что модификация, внесенная пользователем (например, добавление скобок вокруг фразы), указывает на новый специализированный термин, который следует сохранить в лексиконе.

Выводы

  1. Приоритет точности понимания запроса: Google готов усложнить пользовательский опыт (запросив уточнение), чтобы гарантировать точную интерпретацию намерения пользователя перед выполнением поиска в Knowledge Base.
  2. Эффективность важнее переобучения: Патент явно противопоставляет интерактивное разрешение неоднозначностей медленному и дорогостоящему процессу переобучения основных моделей парсера.
  3. Быстрая адаптация к новой терминологии: Ключевым элементом является способность системы изучать новые domain-specific terms на лету, основываясь на обратной связи от пользователей. Это позволяет поисковой системе быстро адаптироваться к появлению нового жаргона или терминов в специализированных областях.
  4. Роль Domain-Specific Lexicons: Система полагается на специализированные словари для улучшения качества парсинга в дополнение к общим языковым моделям. Эти словари могут обновляться динамически.
  5. Фокус на структурированных данных: Цель всего процесса — преобразование естественного языка в Structured Operations для запроса к Knowledge Base. Это подчеркивает важность сущностей и структурированных данных в архитектуре поиска.

Практика

Патент носит инфраструктурный характер и описывает внутренние процессы Query Understanding. Прямых рекомендаций для SEO мало.

Best practices (это мы делаем)

  • Использование ясного и недвусмысленного языка: Хотя патент описывает, как Google справляется с неоднозначностью в запросах пользователей, он подчеркивает важность точности интерпретации. Создавайте контент, используя четкие формулировки и однозначно определяя отношения между сущностями, чтобы системам было проще сопоставить ваш контент с точно интерпретированным запросом.
  • Определение специализированных терминов: При работе в узких нишах убедитесь, что вы предоставляете четкие определения и достаточный контекст для специализированных терминов. Это поможет поисковым системам понять значение термина и обеспечить правильное сопоставление с запросами пользователей.
  • Структурирование данных (Schema.org): Поскольку конечной целью патента является запрос к Knowledge Base, последовательное использование микроразметки для определения сущностей помогает Google пополнять свою базу знаний, что увеличивает вероятность использования вашего контента для ответа на структурированные запросы.

Worst practices (это делать не надо)

  • Намеренное использование двусмысленных формулировок: Попытки оптимизировать контент под двусмысленные запросы в надежде охватить несколько интентов могут быть неэффективными. Google стремится сузить и уточнить интент пользователя, прежде чем искать ответ.
  • Использование жаргона без объяснений: Использование узкоспециализированного жаргона без предоставления контекста может привести к тому, что контент будет неправильно интерпретирован, если система еще не знакома с этими терминами (еще не добавила их в Domain-Specific Lexicon).

Стратегическое значение

Патент подтверждает, что Google продолжает инвестировать в глубокое понимание запросов, выходящее за рамки простого сопоставления ключевых слов. Он демонстрирует гибкость системы в адаптации к эволюции языка и специализированных областей без необходимости переобучения массивных моделей. Для SEO-специалистов это сигнал о том, что понимание семантики, интента и контекста в их нише важнее, чем когда-либо.

Практические примеры

Практических примеров применения для SEO нет, так как патент описывает интерфейс взаимодействия Google с пользователем поиска. Ниже приведен пример работы системы, описанной в патенте.

Сценарий: Разрешение неоднозначности в специализированном запросе

  1. Исходный запрос: Пользователь вводит запрос, связанный с компьютерной архитектурой (упомянутой в патенте как пример специализированной области): "how to get ROM and DRAM chips in x86 PC to work?"
  2. Обнаружение неоднозначности: Парсер не уверен, как группировать термины: (1) "ROM" отдельно и "DRAM chips" отдельно, или (2) "ROM and DRAM chips" как единую группу.
  3. Взаимодействие: Система информирует пользователя о проблеме и предлагает варианты уточнения или просит добавить скобки.
  4. Действие пользователя: Пользователь добавляет скобки (span constraints): "how to get [[ROM and DRAM chips]] in x86 PC to work?".
  5. Результат парсинга: Система однозначно интерпретирует "ROM and DRAM chips" как единую группу и генерирует корректные structured operations.
  6. Обучение: Система может добавить "ROM and DRAM chips" в Domain-Specific Lexicon компьютерной архитектуры.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта?

Напрямую нет. Патент не описывает алгоритмы ранжирования или факторы оценки качества контента. Он описывает, как Google обеспечивает точное понимание того, что именно ищет пользователь (Query Understanding), прежде чем начать поиск. Влияние на SEO косвенное и связано исключительно с точностью интерпретации интента.

Что такое Domain-Specific Lexicon и почему это важно?

Это специализированный словарь терминов и фраз, относящихся к конкретной области (например, медицине или SEO). Патент показывает, что Google может пополнять эти словари динамически, на основе взаимодействия с пользователями, не дожидаясь переобучения основных языковых моделей. Это позволяет системе быстро адаптироваться к новому жаргону или терминологии в нише.

Почему Google просто не угадывает интент, зачем спрашивать пользователя?

Патент подчеркивает, что для некоторых приложений (особенно тех, которые запрашивают точные данные из Knowledge Base) точность интерпретации критически важна, а толерантность к ошибкам низка. Вместо того чтобы предоставить потенциально неверный ответ, основанный на догадке, система предпочитает запросить уточнение.

Как система учится новым терминам без переобучения?

Когда пользователь разрешает неоднозначность, например, ставя скобки вокруг определенной фразы (например, [[click spam]]), система может интерпретировать это как указание на новый domain-specific term. Этот термин сохраняется в Domain-Specific Lexicon. При обработке будущих запросов парсер будет использовать этот обновленный словарь для правильной интерпретации термина.

Увижу ли я как пользователь интерфейс для уточнения запроса, описанный в патенте?

В основном веб-поиске это маловероятно. Описанный механизм (например, просьба добавить скобки или переставить слова) скорее применим в диалоговых системах (Google Assistant), интерфейсах поиска по специализированным базам данных или внутренних инструментах, где требуется высокая точность преобразования запроса в структурированную команду.

Как этот патент связан с BERT или MUM?

BERT и MUM — это большие языковые модели, направленные на снижение неоднозначности в запросах. Описанный патент является комплементарным механизмом. Даже с продвинутыми моделями могут возникать ситуации неоднозначности, особенно с новой терминологией. Патент предлагает механизм "страховки" для разрешения таких ситуаций и способ обновления знаний системы (через лексиконы) без переобучения этих больших моделей.

Что такое Structured Operations, упомянутые в патенте?

Это формализованные команды, которые используются для запроса к внутренним базам данных Google (Knowledge Base). Например, запрос на естественном языке преобразуется в структурированную операцию (похожую на SQL или запрос к графу). Патент описывает, как обеспечить точность этого преобразования при наличии неоднозначности.

Должен ли я упрощать язык на своем сайте из-за этого патента?

Не обязательно упрощать, но необходимо стремиться к ясности и однозначности. Если вы используете сложную или специализированную терминологию, убедитесь, что вы предоставляете достаточный контекст и определения. Это поможет системам правильно интерпретировать ваш контент и сопоставлять его с запросами пользователей.

Какое отношение этот патент имеет к Knowledge Graph?

Прямое. В патенте упоминается Knowledge Base, примером которой является Knowledge Graph. Описанный механизм предназначен для генерации точных структурированных запросов к этой базе. Точное понимание запроса пользователя необходимо для извлечения правильных фактов и сущностей из Knowledge Graph.

Могу ли я как SEO-специалист повлиять на Domain-Specific Lexicon?

Напрямую повлиять на этот механизм взаимодействия с пользователем вы не можете. Однако, будучи авторитетным источником в своей нише и последовательно используя и определяя отраслевую терминологию в своем контенте, вы помогаете поисковым системам формировать правильное понимание этой области, что косвенно способствует обогащению их знаний и лексиконов.

Похожие патенты

Как Google позволяет пользователям уточнять запросы, выбирая термины прямо из сниппетов в выдаче
Патент описывает интерфейсный механизм, позволяющий пользователям быстро уточнять поисковые запросы. Пользователь может выделить термин прямо в сниппете результата поиска и через контекстное меню выбрать действие (например, «обязательно включить», «исключить» или «искать как фразу»). Система автоматически переписывает запрос с использованием соответствующих операторов.
  • US20170220680A1
  • 2017-08-03
  • SERP

  • Семантика и интент

Как Google разрешает лингвистическую неоднозначность в сложных запросах, анализируя связи между сущностями в Базе Знаний
Google использует механизм для точной интерпретации запросов на естественном языке при обращении к структурированным данным (например, Графу Знаний). Если слово в запросе неоднозначно, система анализирует возможные связи между сущностями (Пути Соединения) и использует контекст запроса (Подконтексты) для выбора единственно верной интерпретации и генерации точного ответа.
  • US10282444B2
  • 2019-05-07
  • Семантика и интент

  • Knowledge Graph

Как Google исправляет грамматически некорректные запросы пользователей, изучающих язык, предлагая альтернативы
Патент описывает систему, преимущественно для голосовых ассистентов, которая определяет, что пользователь сформулировал запрос грамматически некорректно («плохо сформированная фраза») на неродном для него языке. Вместо выполнения команды система предлагает корректный вариант («хорошо сформированную фразу»), используя для этого предварительно рассчитанные векторные представления (embeddings) и анализ языковой компетентности пользователя.
  • US12019999B2
  • 2024-06-25
  • Семантика и интент

  • Мультиязычность

Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности
Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.
  • US8868591B1
  • 2014-10-21
  • Семантика и интент

Как Google итеративно уточняет и редактирует голосовые запросы пользователя в реальном времени
Google использует систему для обработки сложных или неточных запросов на естественном языке. Система преобразует речь пользователя в структурированный запрос (категории и переменные) и позволяет пользователю итеративно редактировать отдельные элементы этого запроса с помощью последующих голосовых команд, не повторяя весь запрос заново. Это улучшает понимание намерений пользователя в диалоговых интерфейсах.
  • US10318586B1
  • 2019-06-11
  • Семантика и интент

Популярные патенты

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент
Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.
  • US9274683B2
  • 2016-03-01
  • SERP

  • Персонализация

  • Поведенческие сигналы

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов
Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.
  • US7536408B2
  • 2009-05-19
  • Индексация

  • Семантика и интент

  • Ссылки

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

Как Google извлекает сущности из активности пользователя для запуска проактивных (имплицитных) поисковых запросов
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного запуска фоновых поисковых запросов (имплицитных запросов), релевантных текущему контексту пользователя, часто с использованием персонализированных данных.
  • US9009153B2
  • 2015-04-14
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

seohardcore