Автор: Виктор Репин

2007 Google Shopping Индексация Мультимедиа Патенты Google

Как Google анализирует изображения продуктов, комбинируя автоматическую сегментацию, извлечение признаков и ручную проверку для визуального поиска

Патент описывает инфраструктуру Google для анализа и индексации изображений, особенно товаров. Система автоматически сегментирует объекты, извлекает визуальные признаки (цвет, форма, текстура) и классифицирует их, используя как изображение, так и метаданные. Критическим элементом является высокопроизводительный интерфейс для ручной проверки (Manual Enrichment), который обеспечивает точность данных. Это основа для систем визуального поиска (Google Lens, Google Shopping), позволяющих искать похожие товары по внешнему виду.

2015 Патенты Google Персонализация Поведенческие сигналы

Как Google использует многоконвейерную архитектуру для генерации блоков рекомендованного контента на сайтах издателей

Google использует систему с несколькими конвейерами (pipelines) для генерации рекомендаций контента (например, «Похожие статьи») в реальном времени. Система обрабатывает данные о посещениях за разные периоды (краткосрочные и долгосрочные) и применяет алгоритмы коллаборативной фильтрации и матричной факторизации для баланса между трендами и персонализацией.

2010 Knowledge Graph Индексация Патенты Google Персонализация

Как Google вычисляет силу социальных связей (Social Affinity) используя публичные данные для ранжирования результатов поиска

Google использует механизм для определения силы социальных связей (Social Affinity) между пользователями на основе публично доступной информации в интернете (например, через XFN или FOAF разметку). Система строит граф связей, различая аккаунты одного человека («Me» связи) и связи между разными людьми («Friend» связи). Анализируя количество и силу всех путей в этом графе, Google вычисляет показатель близости, который может использоваться для ранжирования и персонализации поисковой выдачи.

2012 SERP Индексация Мультимедиа Патенты Google

Как Google комбинирует текст и изображения в поиске и использует «Визуальные ключи» для нахождения похожих картинок

Патент Google, раскрывающий инфраструктуру поиска визуального контента. Он описывает, как обрабатываются гибридные запросы (текст + изображение), генерируются компактные дескрипторы для оценки сходства и используется структура «Spill Tree» для создания «Визуальных ключей». Эти механизмы позволяют мгновенно находить похожие изображения и эффективно обнаруживать дубликаты в выдаче.

2007 Индексация Краулинг Патенты Google

Как Google разделяет оценку релевантности на два этапа (индексирование и ранжирование) и интерпретирует запросы через фразы

Google использует двухэтапную модель оценки релевантности (Bifurcated Scoring) и фразовое индексирование. На этапе индексирования система определяет значимость фраз внутри документа (Phrase Relevance Score). На этапе поиска запрос интерпретируется через наиболее вероятные фразы (Query Phrasification), и предварительные оценки комбинируются для вычисления итогового балла. Это повышает эффективность и точность поиска.

2006 Google Shopping Мультимедиа Патенты Google

Как Google использует категорийно-специфичное распознавание и визуальные сигнатуры для поиска похожих товаров (Visual Search)

Анализ патента (изначально Like.com, приобретен Google), описывающего технологию визуального поиска для E-commerce. Система классифицирует объекты на изображениях (например, обувь, одежда), извлекает специфичные для этой категории визуальные признаки и создает «визуальную сигнатуру» (Signature Value). Это позволяет пользователям находить визуально похожие товары по изображению и получать ссылки на покупку.

2012 Local SEO Патенты Google Персонализация Техническое SEO

Как Google выбирает лучшее местоположение для локального поиска, когда геолокация пользователя неоднозначна (Probabilistic Utility)

Патент Google описывает метод выбора оптимального географического таргетинга, когда точное местоположение пользователя неизвестно. Вместо выбора наиболее вероятного местоположения, система рассчитывает «вероятностную полезность» (Probabilistic Utility). Этот расчет учитывает не только вероятность нахождения пользователя в локации, но и «бремя маршрута» (расстояние, время, стоимость) между всеми возможными локациями, а также контекст запроса, выбирая ту локацию, которая принесет максимальную совокупную пользу.

2006 Мультимедиа Патенты Google Персонализация

Как Google персонализирует смешивание результатов Универсального Поиска на основе истории кликов пользователя

Google отслеживает, на какие типы специализированных результатов (Новости, Картинки, Карты, Видео и т.д.) пользователь нажимал в прошлом. На основе этой истории система строит вероятностную модель, чтобы предсказать, какие типы результатов заинтересуют пользователя в будущем. Эта модель используется для выбора, оценки и ранжирования специализированных блоков при формировании Универсальной выдачи.

2015 SERP Индексация Мультимедиа Патенты Google

Как Google анализирует видео по кадрам, чтобы создавать динамические превью и таймкоды на основе запроса пользователя

Google использует систему для глубокого анализа видеоконтента, сегментируя видео на сцены и идентифицируя семантические концепции в каждом кадре. Это позволяет системе динамически выбирать наиболее релевантные кадры для создания превью (storyboard) или таймкодов в плеере, основываясь на конкретном поисковом запросе пользователя или его интересах, а не использовать статичный эскиз.

2016 Knowledge Graph Патенты Google

Как Google использует онтологии для предложения связанных сущностей в автоподсказках, даже если они не содержат текст запроса

Google использует структурированные онтологии (графы знаний) для улучшения автоподсказок. Система анализирует вводимый пользователем текст, определяет связанную категорию (онтологию) и типы объектов внутри нее. На основе этого предлагаются связанные сущности (термины, изображения), которые расширяют или уточняют запрос, даже если они текстуально не совпадают с введенными символами.

2005 SERP Индексация Мультимедиа Патенты Google

Как Google использует распознавание лиц, одежды и текста внутри изображений для индексации и визуального поиска

Патент описывает комплексную систему для анализа содержимого изображений. Google может распознавать лица, текст на объектах (OCR) и характеристики одежды/аксессуаров. Эта информация индексируется, позволяя пользователям искать изображения не только по тексту, но и используя другое изображение в качестве запроса (визуальный поиск). Система критически важна для понимания контекста изображений и улучшения результатов в Google Images и вертикалях, связанных с продуктами.

2017 Вертикальный поиск Патенты Яндекс Поисковые подсказки Ранжирование

Как Яндекс ранжирует визуальные поисковые подсказки, смешивая популярность и «скрытый интерес»

Яндекс использует метод двойного ранжирования для генерации поисковых подсказок на основе изображений. Система формирует два списка: один оптимизирован по частоте (популярности), а второй — по «скрытому параметру интереса» (высокой релевантности, не зависящей от частоты). Финальный список подсказок создается путем смешивания этих двух списков в динамической пропорции, чтобы предложить пользователю как очевидные, так и неожиданно полезные варианты продолжения поиска.

2011 Local SEO Индексация Мультимедиа Патенты Google

Как Google ранжирует и выбирает фотографии для локальных объектов, анализируя 3D-контекст, качество и популярность

Google использует технологию Structure from Motion (SfM) для создания 3D-моделей местности и точного определения ракурса каждой фотографии. Это позволяет системе ранжировать изображения для точек интереса (POI). При выборе учитывается контекст просмотра карты пользователем (масштаб, направление взгляда), внутреннее качество фото (привлекательность, популярность) и тип фото (снято «из» точки или «в» точке).

2012 Gal Chechik Патенты Google Семантика и интент

Как Google интерпретирует выделенный пользователем текст в поисковые запросы и отдает предпочтение более длинным формулировкам

Google использует механизм для преобразования контента, выделенного пользователем на экране (например, жестом обводки), в оптимизированный поисковый запрос. Система генерирует несколько кандидатов и оценивает их вероятность. Ключевая особенность — нормализация оценок по длине запроса. Это позволяет системе отдавать предпочтение более длинным и точным запросам, а не коротким и частотным, улучшая релевантность выдачи при использовании функций типа «Circle to Search».

2005 SERP Индексация Мультимедиа Патенты Google

Как Google распознает людей, текст и объекты на изображениях для индексации и визуального поиска

Анализ патента, описывающего комплексный подход к пониманию изображений. Система обнаруживает и распознает лица, одежду, текст на объектах (OCR) и другие объекты. Для повышения точности используются комбинации признаков (лицо + одежда) и метаданные (время, местоположение). Распознанная информация индексируется для поиска по тексту или по изображению-примеру.

2017 Knowledge Graph Мультимедиа Патенты Google Персонализация

Как Google анализирует контент на экране (изображения и текст) для понимания и переписывания неоднозначных запросов

Google использует технологию для интерпретации неоднозначных запросов (например, голосовой команды «Что это?»), анализируя текущий контент на экране устройства. Система распознает ключевое изображение (Specific Sub-image) и окружающий его текст (OCR), генерирует метки (Labels) для описания контекста и переписывает исходный запрос в конкретный поисковый запрос (например, «Что такое Эйфелева башня?»).

2003 Local SEO Индексация Патенты Google Персонализация

Как Google группирует локальные результаты поиска вокруг физических адресов и динамически определяет радиус поиска

Google использует систему для организации локальной выдачи, кластеризуя веб-документы вокруг конкретного физического адреса или номера телефона. Система определяет «область интереса», используя динамический радиус поиска, который меняется в зависимости от типа запроса (например, поиск ресторана или автодилера). Результаты ранжируются на основе баланса близости и релевантности.

2015 Google Shopping Краулинг Патенты Google Техническое SEO

Как Google автоматически извлекает структурированные данные (цены, наличие) с меняющихся веб-страниц, используя историю атрибутов

Google использует систему для автоматического извлечения точных атрибутов (например, цен товаров) из веб-страниц, даже если их дизайн меняется. Система находит известные исторические значения на странице, определяет структурные шаблоны («анкоря») вокруг них и статистически проверяет их точность. Это позволяет Google обновлять данные для Google Shopping и Rich Results без зависимости от микроразметки.

2014 Local SEO SERP Патенты Google Персонализация

Как Google определяет местоположение пользователя, используя историю локаций всех его устройств

Google использует историю местоположений всех устройств, привязанных к аккаунту пользователя, чтобы определить его текущее местоположение, когда стандартные методы (GPS, Wi-Fi) недоступны. Система анализирует свежесть данных и то, как часто устройства находятся вместе (Device Co-location Factor), чтобы выбрать наиболее вероятную локацию для предоставления локализованных результатов поиска.

2006 Индексация Краулинг Патенты Google

Как Google комбинирует разные алгоритмы (Shingling и SimHash) для точного определения дубликатов контента

Патент Google описывает методы повышения точности обнаружения почти дубликатов контента. Система может использовать двухэтапный подход, комбинируя алгоритмы: один чувствителен к порядку слов (например, Shingling/Broder), а другой учитывает частоту слов, но игнорирует порядок (например, SimHash/Charikar). Также предлагается применять разные техники для анализа дубликатов внутри одного сайта и между разными сайтами.