Патенты Google

Анализ фундаментального патента Xerox PARC, описывающего методы Information Retrieval. Патент раскрывает, как различные типы данных (текст, изображения, ссылки, поведение пользователей) преобразуются в векторы для мультимодальной кластеризации. Описаны концепции анализа пользователей …
Фундаментальный патент Ларри Пейджа, описывающий алгоритм PageRank. Он определяет, как Google вычисляет важность страницы рекурсивно, на основе важности и количества исходящих ссылок цитирующих ее документов. Патент также защищает использование анкорного …
Google сканирует веб на наличие «Scumware» (вредоносное и нежелательное ПО). Патент описывает, как система различает сайты, которые содержат вредоносный код, и сайты, которые на него ссылаются. Обнаружение угрозы может привести …
Патент Google описывает систему отложенного поиска. Если на запрос пользователя нет ответа, соответствующего критериям качества (например, информация еще не опубликована), система запоминает запрос и начинает мониторинг. Когда высококачественный (авторитетный) ответ …
Google использует механизм для генерации расширенных поисковых подсказок (Expanded Query Suggestions), особенно в географическом поиске. Система идентифицирует сущности, соответствующие введенному префиксу, а затем обходит граф связанных сущностей (Entity Graph), чтобы …
Инфраструктура для взаимодействия с отображаемыми (печатными или экранными) документами. Система использует захват текста (сканирование или голос) для идентификации электронного аналога, позволяя выполнять действия и добавлять аннотации. Патент также детально описывает …
Google использует систему для динамического выбора thumbnail для видео в результатах поиска. Система анализирует запрос пользователя и содержание каждого кадра видео, преобразуя их в числовые векторы в общем семантическом пространстве. …
Google использует иерархическую систему правил для выбора единственной «геолокации запроса» из множества доступных сигналов. Система анализирует физическое местоположение пользователя, локации в тексте запроса, историю поиска и настройки профиля. Затем она …
Google использует систему для извлечения фактов (дат, имен, концепций) и связанных с ними фрагментов предложений из веб-документов. Эти пары индексируются отдельно. В ответ на запрос система находит релевантные факты, ранжирует …
Анализ фундаментального патента (изначально Xerox), описывающего, как системы Information Retrieval преобразуют различные характеристики документов (текст, URL, ссылки, изображения) и поведение пользователей в векторные представления. Это позволяет численно определять сходство, комбинируя …
Google патентует механизм, позволяющий пользователям вручную изменять порядок результатов поиска на странице (например, перетаскиванием). Эти действия интерпретируются как явные сигналы предпочтений (пользователь считает один результат лучше другого). Google агрегирует эти …
Google анализирует визуальную структуру отрендеренной страницы для идентификации основного контента («Колонки интереса»). Система определяет расположение колонок, исключает выбросы (невидимый или удаленный контент) и вычисляет центральную область. Контент, найденный в этой …
Google использует систему для определения точного местоположения изображения путем анализа и сверки трех источников: визуального распознавания объектов (Landmark), текстовых подписей/тегов (Caption) и GPS-данных из файла (Metadata). Система разрешает конфликты, используя …
Патент Google, описывающий метод дедупликации статей на платформах агрегации контента (таких как Google News). Система нормализует заголовки и сравнивает их, используя расстояние Левенштейна. Одновременно сравниваются URL-адреса связанных ресурсов (например, изображений). …
Google определяет, какие бизнесы (POI) показывать на Картах, анализируя реальные изображения местности (например, Street View). Система использует распознавание образов (OCR) для чтения вывесок, подтверждая существование и местоположение бизнеса. Точки интереса …
Патент описывает комплексную систему для визуального поиска. Google может анализировать изображения на удаленных (сторонних) веб-страницах, распознавать объекты (например, одежду на человеке), извлекать их визуальные характеристики (цвет, форму, текстуру) и делать …
Google применяет систему для эффективной дедупликации вакансий из разных источников. Используя алгоритмы MinHash и Jaccard Similarity, система создает цифровые отпечатки объявлений и группирует похожие версии в кластеры. Внутри кластера выбирается …
Google использует систему для определения порядка отображения различных категорий результатов поиска (Веб, Картинки, Локальные и т.д.). Ключевым элементом является расчет «индикатора локальной релевантности» запроса. Если система определяет, что запрос имеет …
Google динамически оптимизирует макет страницы результатов поиска (SERP), агрегируя контент (например, рекламу), релевантный как текущему запросу пользователя, так и его предыдущему запросу. Система оценивает различные шаблоны компоновки и выбирает оптимальный, …
Патент Google описывает систему персонализации подсказок в Autocomplete. Система анализирует социальный граф пользователя и ранжирует поисковые подсказки на основе активности его контактов. Учитывается, как часто контакты искали этот запрос и …