Индексация

Патент описывает инфраструктуру (Google Base, предшественник Merchant Center) для приема структурированных данных от поставщиков. Система автоматически определяет популярные пользовательские атрибуты и продвигает их в стандартную схему (Core Attributes). Полнота данных …
Патент Google описывает метод идентификации субстантивных дубликатов (например, товаров, видео или сущностей в разных форматах) исключительно путем сравнения их метаданных. Система нормализует данные, вычисляет взвешенную оценку сходства с учетом важности …
Этот патент описывает архитектуру поисковой системы (на примере 3D-моделей), которая критически важна для понимания современного веб-поиска. Google применяет векторный поиск (ANN) для быстрого отбора кандидатов (L1) и многоэтапное ранжирование (L2/L3), …
Патент Google, описывающий локальную поисковую систему на мобильном устройстве. Система индексирует контент нативных приложений и обширную контекстную информацию о действиях пользователя. Используя векторные представления, она кластеризует активность из разных приложений …
Анализ патента Google, описывающего методы автоматической подсветки поисковых терминов пользователя на веб-странице после клика по результату. Это реализуется либо на стороне клиента через «Помощник браузера» (например, Google Toolbar), который перехватывает …
Google использует систему компьютерного зрения для определения точной геолокации объектов на фото и видео. Сравнивая визуальные признаки (Feature Points) загруженного контента с обширной базой гео-тегов, система идентифицирует местоположение. Для повышения …
Google анализирует исторические данные о поведении пользователей (например, долгие клики) и атрибуты документов, агрегируя их по схожим шаблонам URL. Если страница новая и не имеет собственных данных, система прогнозирует ее …
Патент Google, описывающий пользовательский интерфейс для создания сложных, модифицируемых запросов, называемых "конвейерами". Этот интерфейс позволяет пользователям последовательно фильтровать наборы документов, используя вывод одного запроса как источник для следующего. Технология разработана …
Патент описывает комплексную систему Google для визуального поиска товаров. Система автоматически обрабатывает изображения: отделяет объект от фона (сегментация), выравнивает его, извлекает визуальные признаки (цвет, форма, текстура) и создает цифровые подписи …
Google анализирует личные данные пользователя (история поиска, email, социальная активность) для построения Персонального Графа Знаний. Этот граф структурирует сущности и связи, значимые для пользователя. Сила связей динамически обновляется: усиливается при …
Google использует автоматизированный процесс для категоризации веб-сайтов в иерархическую таксономию. Система анализирует контент для выявления семантических кластеров (групп совместно встречающихся терминов), сопоставляет их с концепциями и определяет наиболее подходящую категорию. …
Google разрабатывает инфраструктуру для индексации данных напрямую из блокчейнов, фокусируясь на NFT. Система извлекает описания, историю транзакций и сами цифровые активы, следуя по ссылкам в блокчейне. Она оценивает качество и …
Google использует модель машинного обучения (например, Support Vector Machine) для анализа изменений между двумя версиями веб-страницы. Система оценивает контентные, структурные (ссылки) и поведенческие (трафик) признаки, чтобы классифицировать обновление как «значимое» …
Анализ патента Google, описывающего систему Dupserver для обнаружения дубликатов контента и редиректов до индексации. Система идентифицирует дубликаты с помощью фингерпринтов и выбирает каноническую версию на основе независимой оценки авторитетности (например, …
Google использует систему геокодирования для интерпретации неструктурированных локальных запросов. Система преобразует запрос в стандартный формат, не зависящий от порядка слов, учитывая синонимы, ошибки и аббревиатуры. Ранжирование результатов зависит от важности …
Google использует этот механизм для понимания контекста местоположения пользователя за пределами сырых координат. Система идентифицирует вложенные "Области Поиска" (магазин, торговый центр, район, город) и выбирает наиболее релевантную. Это позволяет Google …
Google анализирует, как термины из известных эффективных запросов (Seed Queries) расположены в HTML-структуре страницы (например, H1, Title). Если эта структура повторяется на других страницах того же сайта, система создает шаблон …
Google использует систему для выбора наиболее релевантных и визуально качественных фотографий, представляющих туристические места (Destinations) и точки интереса (POIs). Система рассчитывает Relevancy Score, основанный на кликах в поиске по картинкам …
Патент Google описывает инфраструктурную технологию для упрощения разработки приложений, использующих сложные распределенные базы данных. Система (View Gateway) позволяет разработчикам использовать простой язык запросов (например, RVL) и шаблоны, которые автоматически компилируются …
Google использует архитектуру системы рендеринга (WRS) для эффективной пакетной обработки миллиардов страниц. Система применяет «виртуальное время», чтобы избежать таймаутов при загрузке ресурсов, активно блокирует ненужные скрипты (например, аналитику) и использует …