Google анализирует неструктурированный текст пользовательских комментариев (UGC) для выявления упоминаний различных продуктов и определения взаимосвязей между ними (альтернативы, дополнения, сравнения). Эти данные используются для кластеризации товаров и, что особенно важно, …
Knowledge Graph
Google использует механизм для разрешения неоднозначности слов и фраз («Элементов знаний»), особенно для целей точного перевода. Система анализирует связанный контекст и применяет вероятностную модель, чтобы определить, какое из возможных значений …
Google анализирует, ищет ли пользователь уникальную сущность, расположенную далеко, или локальный бизнес поблизости. Система сравнивает локальные и глобальные результаты, используя «оценку кластеризации». Если глобальные результаты тесно сгруппированы в отдаленном месте, …
Google анализирует названия Wi-Fi сетей (SSID) и их предполагаемое местоположение, чтобы точно определить, какому бизнесу принадлежит точка доступа. Когда пользователь подключается к этой сети, система получает надежный сигнал о его …
Google может идентифицировать, когда органический результат поиска и рекламное объявление (спонсируемый контент) относятся к одному и тому же бренду или сущности. В этом случае система объединяет элементы из обоих источников …
Google использует механизм неконтролируемого (автоматического) извлечения фактов для пополнения Knowledge Graph. Система находит уже известный факт на странице и анализирует окружающую его HTML-структуру («контекстуальный шаблон»). Затем этот изученный шаблон используется …
Патент описывает механизм интеграции поиска непосредственно в интерфейс Календаря. Пользователь может искать события, места или услуги, не покидая приложение, и создавать новое событие на основе выбранного результата поиска. Система автоматически …
Google может извлекать из веб-страниц специальные аннотации (Structured Data), описывающие интерактивные элементы (User Interface), такие как кнопки «Купить» или поля ввода. Эти элементы встраиваются напрямую в сниппет на странице результатов …
Google использует механизм для определения силы социальных связей (Social Affinity) между пользователями на основе публично доступной информации в интернете (например, через XFN или FOAF разметку). Система строит граф связей, различая …
Google использует структурированные онтологии (графы знаний) для улучшения автоподсказок. Система анализирует вводимый пользователем текст, определяет связанную категорию (онтологию) и типы объектов внутри нее. На основе этого предлагаются связанные сущности (термины, …
Google использует технологию для интерпретации неоднозначных запросов (например, голосовой команды «Что это?»), анализируя текущий контент на экране устройства. Система распознает ключевое изображение (Specific Sub-image) и окружающий его текст (OCR), генерирует …
Патент Google описывает систему выбора контента (например, рекламы), которая интерпретирует запросы и критерии таргетинга как семантические графы сущностей. Вместо ключевых слов система сопоставляет топологию и содержание этих графов. Также описан …
Google использует систему неконтролируемого обучения для автоматического распознавания достопримечательностей (Landmarks). Анализируя текст, визуальное сходство, геоданные и информацию об авторах в больших коллекциях фотографий, система определяет надежные названия объектов (N-граммы). На …
Google использует систему для создания структурированной базы данных цитат. Система извлекает цитаты из веба, идентифицирует автора и сущность, о которой идет речь. Цитаты оцениваются на основе авторитетности источника, релевантности сущности, …
Google использует фреймворк для быстрого создания парсеров, извлекающих точные отношения "Субъект-Предикат-Объект" (S-P-O) из HTML/XML. Ключевым механизмом является определение "области видимости" (Scope) в DOM-дереве, что гарантирует структурную близость и точность связей …
Google использует систему автоматического распознавания лиц для идентификации людей в видео. Система самостоятельно создает базу данных моделей лиц, анализируя изображения и тексты из интернета. Затем она отслеживает лица в видеопотоке, …
Google использует систему для автоматического обнаружения, отслеживания и распознавания лиц в видеоконтенте. Это позволяет индексировать видео не только по метаданным, но и по конкретным людям, присутствующим в кадре. Система может …
Google патентует метод для точной идентификации автора контента до того, как его обнаружит веб-краулер. Система использует уникальные идентификаторы (например, код веб-аналитики) и отслеживает первую активность автора с неопубликованным контентом (например, …
Google использует технологию для анализа видеоконтента, автоматического обнаружения и распознавания лиц. Система создает "закладки" (временные метки), указывающие, когда конкретный человек появляется и исчезает из кадра. Для идентификации используются данные социального …
Google использует двухфазную систему для построения Knowledge Graph. На первом этапе данные из разных источников (например, Wikipedia, базы данных фильмов, музыкальные каталоги) нормализуются, а сущностям присваиваются глобальные идентификаторы. На втором …