Google использует многоступенчатую систему для определения, ищет ли пользователь медиа-контент. Система анализирует результаты из товарного индекса, поисковые подсказки (Candidate Queries) и списки ключевых слов. Если эти сигналы указывают на медиа-интент, …
Патенты Google
Разборы патентов поисковой системы Google
Анализ патента Google, описывающего интерфейс (слайдер), позволяющий пользователю динамически регулировать влияние его личных интересов на ранжирование. Система рассчитывает тематические "Boost Values" для сайтов на основе анализа ссылок и отправляет несколько …
Google использует Большие Языковые Модели (LLM) для автоматической генерации синтетических обучающих данных (Задачи, Запросы и Пассажи). Эти данные применяются для обучения универсальных моделей эмбеддингов методом "Instruction Tuning". Это позволяет поисковым …
Google анализирует структуру веб-страницы, включая списки и заголовки, чтобы определить семантическое расстояние между ключевыми словами. Система выявляет семантические блоки, даже если они не размечены явными HTML-тегами, путем анализа повторяющихся паттернов …
Google использует технологию визуального поиска для идентификации текста в изображениях (визуальных запросах). Система оценивает качество распознанного текста (OCR), находит соответствующие строки в своей базе канонических документов (например, веб-страниц или книг) …
Google анализирует списки на веб-страницах (например, списки моделей авто, городов, ингредиентов), чтобы выявить термины, которые часто встречаются вместе, но не являются синонимами (например, «кошка» и «собака», «январь» и «февраль»). Эти …
Google использует автоматизированную систему для поддержания актуальности и полноты Knowledge Graph. Когда система обнаруживает пробел (например, отсутствует свойство у сущности согласно схеме) или устаревшие данные (на основе анализа логов запросов), …
Google использует легковесную модель машинного обучения для мгновенной классификации запросов в реальном времени, когда стандартные методы слишком медленные из-за задержек (latency constraint). Эта модель обучается офлайн и классифицирует новые запросы, …
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те …
Google использует систему для обработки конфликтующих или неполных адресных данных о местах на карте, полученных от разных поставщиков (пользователей, владельцев бизнеса, сервисов). Система стандартизирует форматы, определяет, какие записи относятся к …
Патент Google описывает интерфейс, который позволяет пользователям переключаться между посадочными страницами результатов поиска или рекламных объявлений напрямую, минуя необходимость возвращаться на исходную страницу выдачи. Система предварительно загружает связанные страницы и …
Google анализирует массивы геопривязанных фотографий и их метаданных (включая теги объектов и данные GPS), чтобы идентифицировать конкретные объекты или точки интереса (POIs). Используя кластеризацию данных и пороговые значения от разных …
Google разработал механизм для улучшения точности поиска визуальных концепций. Система анализирует текстовый запрос и определяет слова с «визуальным интентом» (например, описание узора или цвета). Пользователю предлагается заменить эти слова конкретным …
Google разработал систему для улучшения визуального поиска путем стандартизации входных изображений. Анализируя свою базу, Google определяет оптимальный ракурс («канонический вид») для разных объектов. Эти виды предоставляются как шаблоны (наложения) в …
Google анализирует метаданные (GPS, ориентация устройства, данные акселерометра) и визуальные характеристики (края, цвет, текстура) фотографии, сделанной на мобильном устройстве. Эта система позволяет быстро классифицировать, изображено ли на ней "место" (например, …
Google использует метод построения текстовых классификаторов, который учитывает структуру HTML для разделения текста на логические блоки (сегментация). Внутри этих блоков система извлекает n+k-граммы (фразы с пропуском стоп-слов) для лучшего понимания …
Google анализирует текст отзыва, разбивая его на предложения. Каждое предложение оценивается по длине, позиции в тексте и информационной ценности слов (используя IDF). Система выбирает последовательность предложений с наивысшей совокупной оценкой …
Анализ патента, описывающего архитектуру поисковой системы Google, основанную на индексировании фраз, а не отдельных слов. Патент раскрывает, как система извлекает значимые фразы из документов, используя структурные сигналы (заголовки, абзацы, форматирование), …
Google анализирует, как часто и в каких новостных источниках цитируются научные работы. На основе этого рассчитывается «Оценка Популярности» (Popularity Score), учитывающая авторитетность СМИ и Импакт-фактор журнала. Это позволяет высоко ранжировать …
Анализ патента Google, описывающего систему выборочного применения «расширенных функций» (например, больший размер, видео, интерактивность) к рекламным объявлениям. Доступ к лучшим форматам предоставляется на основе оценки (Eligibility Score), учитывающей ставки, эффективность …