2009

Google использует технологии кластеризации для идентификации документов, посвященных одной теме или концепции. Комментарии (UGC), оставленные на одном документе, автоматически распространяются на другие документы в том же кластере. Перед показом эти …
Патент описывает систему, работающую на стороне клиента (в браузере), которая анализирует контент текущей веб-страницы. Система идентифицирует ключевые термины ("триггеры запросов"), ранжирует их по значимости (учитывая форматирование, частоту и популярность) и …
Google использует механизм отслеживания кликов по результатам поиска без использования JavaScript или серверов переадресации. Система использует CSS стили (псевдоклассы :active, :hover, :focus) для инициации запроса фонового изображения с сервера отслеживания …
Google обучает отдельные модели машинного обучения для каждого уникального запроса в Поиске по картинкам. Эти модели учатся определять визуальную релевантность, основываясь на признаках (цвет, текстура) изображений, на которые пользователи часто …
Google анализирует текстовые URL-адреса из журналов поиска, чтобы определить наиболее вероятный способ их произношения (например, facebook.com -> «face book dot com»). Этот процесс использует большие языковые модели для сегментации URL. …
Система использует технологию визуального поиска для анализа изображения товара или рекламы («seed content item»), извлекая его визуальные характеристики (цвет, форма, текстура) и генерируя «визуальную подпись» (Signature). Затем выполняется поиск по …
Google улучшает поиск визуального контента (картинки, видео), переводя исходный запрос пользователя на другие языки. Система рассчитывает «Статистику качества результатов» (например, CTR и время взаимодействия) для переведенного запроса. Если качество высокое, …
Патент описывает механизм пользовательского интерфейса (UI) для приложений, работающих со структурированными данными (например, Google Sheets). Система позволяет пользователю кликнуть на ячейку, чтобы открыть скрытый интерфейс, который показывает, откуда были извлечены …
Google использует систему неконтролируемого обучения для автоматического распознавания достопримечательностей (Landmarks). Анализируя текст, визуальное сходство, геоданные и информацию об авторах в больших коллекциях фотографий, система определяет надежные названия объектов (N-граммы). На …
Патент Google описывает систему определения точного местоположения пользователя в трех измерениях, включая конкретный этаж в здании. Система использует данные о высоте (GPS, сенсоры, Wi-Fi) и направлении вертикального движения пользователя. Эти …
Google использует механизм временно-зависимого хеширования для маршрутизации запросов от фронтенд-серверов к бэкенд-серверам. Запрос направляется на один и тот же сервер в течение определенного временного интервала, что позволяет эффективно использовать кэш. …
Google идентифицирует, когда результат поиска является частью дискуссионного треда (форума, блога). Система реконструирует весь тред, находя другие его страницы, даже если они не попали в выдачу. Затем извлекается агрегированная статистика …
Google использует механизм для изменения стандартного ранжирования, чтобы сгруппировать несколько результатов с одного домена вместе (Domain Clustering). Это достигается за счет повышения (promoting) страниц этого домена, которые изначально ранжировались ниже. …
Google стабилизирует обнаружение дубликатов, игнорируя новый или часто меняющийся контент (например, рекламу, комментарии). Система сравнивает текущую версию документа с предыдущей, определяет возраст различных частей и вычисляет контрольную сумму (checksum) только …
Google использует систему предиктивного поиска для повышения скорости и эффективности. Система прогнозирует, какие запросы пользователи введут в будущем, и заранее вычисляет для них результаты поиска, сохраняя их в специальном «предиктивном …
Google использует комбинацию алгоритмов машинного обучения (AdaBoost и Hillclimbing) для точного отделения изображений от текста на сканированных страницах. Система анализирует локальные визуальные признаки (например, SIFT), чтобы классифицировать контент и находить …
Google использует гибридный подход для отображения локальных результатов на картах. Чтобы избежать перегрузки браузера и визуального шума, система разделяет результаты. Лучшие результаты передаются как текст для создания интерактивных иконок. Остальные …
Google улучшает поиск изображений, предлагая переводы исходного запроса на языки, где могут быть лучшие результаты. Система оценивает качество переводов на основе поведения пользователей (CTR, частота использования) и показывает визуальное превью …
Google использует статистические методы и структуру данных «суффиксное дерево» для автоматического создания правил изменения окончаний слов (стемминга и генерации вариантов). Система анализирует наблюдаемые пары слов, обобщает их до правил и …
Патент Google описывает механизм максимизации дохода от рекламы в поиске. Если стандартных платных объявлений (Type-1) недостаточно или они низкого качества, Google заполняет пустые слоты ссылками на релевантные страницы издателей-партнеров (Type-2), …