Google использует метод квантования "Shape-Gain" для повышения точности и скорости поиска похожих изображений. Система разделяет векторы признаков на направление (Shape/Форма, определяющее визуальный паттерн) и магнитуду (Gain/Усиление, определяющее интенсивность). Раздельное кодирование …
Индексация
Патент описывает систему Google для автоматического обнаружения сайтов объявлений (например, Craigslist). Система использует эвристики (например, географические названия в URL) и ML-классификаторы для анализа структуры сайта (страницы списков и детальные страницы). …
Google использует специализированную инфраструктуру для индексирования и поиска по большим графам данных, таким как Граф Знаний. Патент описывает двухмерную структуру индекса, механизмы предварительного вычисления сложных путей в графе, а также …
Google использует статистический метод для интерпретации текста без пробелов (например, доменных имен). Система определяет потенциальные языки, разбивает строку на слова для каждого языка, а затем проверяет, какая комбинация слов (включая …
Google использует механизм для оптимизации поиска по картинке. Система заранее определяет, какой визуальный признак (измерение) лучше всего имитирует "идеальное" ранжирование, полученное с помощью дорогостоящей кластеризации. Это позволяет быстро группировать похожие …
Патент Google описывает систему для корпоративного поиска (Enterprise Search). Она извлекает сущности и факты из внутренних документов компании, формируя Корпоративный Граф Знаний. Ключевая особенность — применение прав доступа (ACL) не …
Google использует эффективный метод (O(n)) для группировки структурно похожих документов на веб-сайте. Система определяет страницы, у которых совпадают наиболее весомые термины (Топ-N), используя метрику Modified TF-IDF, смещенную в сторону шаблонного …
Патент описывает интерфейс и методы представления результатов в Google Books. Система организует результаты поиска в соответствии с внутренней структурой книги (главы/разделы) и извлекает ключевые темы (n-gram summary terms). Для определения …
Google использует инфраструктурный метод для высокоскоростного поиска точных совпадений в больших коллекциях документов. Запросы и документы токенизируются, а затем система использует FIFO-буфер (скользящее окно) для последовательного сравнения токенов. Это позволяет …
Патент описывает инфраструктуру, позволяющую пользователям определять собственный корпус контента (загружая данные или указывая конкретные веб-сайты) и создавать для него отдельный поисковый индекс. Система может искать по этим индексам независимо или …
Патент описывает метод повышения эффективности поиска локальных данных (например, контактов) на мобильных устройствах. Система заранее преобразует алфавитно-цифровые данные в числовой индекс, основываясь на раскладке клавиатуры (аналогично T9). Это позволяет устройству …
Этот патент описывает систему для эффективной организации больших объемов входящих сообщений (например, обращений в поддержку или отзывов). Система группирует похожие документы в кластеры и использует статистическую оценку схожести (Similarity Score), …
Google использует этот механизм для оптимизации ресурсов при обработке новых (некэшированных) запросов. Система находит похожий популярный запрос в кэше и анализирует его специфичность, а также является ли новый запрос сущностью …
Патент описывает механизм унифицированного поиска на устройствах, который одновременно запрашивает данные с локального устройства, из магазинов приложений и веб-поиска. Система использует специфический алгоритм смешивания: сначала показывает фиксированное количество лучших результатов …
Патент Google, описывающий внутренний алгоритм систем планирования путешествий (например, Google Flights). Он позволяет эффективно рассчитывать стоимость авиабилетов для разного количества пассажиров в рамках одного поискового запроса, учитывая наличие мест по …
Анализ патента Google, описывающего метод оптимизации базовых математических операций в поиске. Вместо медленных вычислений с большими плотными матрицами Google использует структурированные матрицы на основе произведения Кронекера. Это значительно ускоряет обработку …
Google индексирует не только текст, но и визуальные/аудио характеристики страниц (цвет фона, размер текста, стиль дизайна, музыку, объекты на изображениях). Это позволяет пользователям находить контент по его внешнему виду или …
Google использует систему для эффективного обнаружения контента в облачных сервисах (например, Google Drive, социальные сети), который стал публичным. Вместо ожидания краулера система отслеживает изменения в настройках доступа (ACL). Когда контент …
Патент Google описывает инфраструктуру визуального поиска, использующую два типа индексов. Динамический индекс (быстрый, несжатый) позволяет индексировать и находить новые изображения мгновенно. Статический индекс (большой, сжатый, шардированный) оптимизирован для масштабного поиска. …
Google отслеживает историю изменений данных об авторстве (имя автора, ссылки на профили) на веб-странице. Если авторство меняется слишком часто, система определяет, что это не статья одного автора (например, главная страница …