2006

Google идентифицирует известные сущности (например, знаменитостей) из поисковых логов и веб-документов. Система извлекает изображения, уже связанные с ними (например, через метаданные), и использует распознавание лиц для поиска наиболее репрезентативного лица. …
Патент Google описывает систему создания многоязычной карты синонимов (Synonyms Map), которая учитывает частоту использования вариантов слова (например, с ударениями, лигатурами или транслитерацией) в разных языках. При обработке запроса система определяет …
Google использует механизм для обработки запросов, содержащих акценты, диграфы («ue» вместо «ü») и транслитерацию. Система определяет язык запроса, нормализует термины в упрощенную форму и ищет варианты в предварительно созданной «Карте …
Google предоставляет владельцам сайтов механизм для контроля максимальной частоты запросов краулера (Crawl Rate Limit). Система анализирует статистику сканирования и сравнивает ее с текущим лимитом. Если фактическая частота сканирования не достигает …
Google анализирует, как слова пишутся в разных языках (с акцентами, диграфами или транслитерацией), и создает "карту синонимов". При получении запроса система определяет его вероятный язык и статистически выбирает только те …
Патент Google, описывающий систему автоматического создания рекламных объявлений (креативов и ставок) путем сканирования сайта рекламодателя (например, страниц товаров). Система создает специальный индекс (Page-Ad Index), используя контент страниц как таргетинговые ключевые …
Google использует инфраструктурный механизм для эффективного хранения похожих документов. Система группирует документы (часто с одного хоста, используя реверсированные URL) в кластеры и сжимает их, удаляя повторяющиеся последовательности токенов внутри кластера. …
Google использует механизм, позволяющий вебмастерам указывать формат мобильного контента (например, WML, XHTML, iMode) через Sitemaps. Это позволяет Google выбрать соответствующую «персону» краулера (User-Agent) для доступа к контенту. Это гарантирует корректное …
Патент описывает систему постобработки OCR, которая повышает точность индексации отсканированных документов и изображений. Google группирует похожие по форме символы в кластеры и сравнивает их, чтобы автоматически выявить и исправить ошибки …
Патент описывает инфраструктуру, позволяющую пользователям определять собственный корпус контента (загружая данные или указывая конкретные веб-сайты) и создавать для него отдельный поисковый индекс. Система может искать по этим индексам независимо или …
Google использует частотность текстовых запросов из своих логов для разрешения неоднозначности при вводе текста с цифровой клавиатуры (например, на старых мобильных телефонах). Система определяет наиболее вероятное слово, соответствующее введенной числовой …
Патент описывает инфраструктурное решение Google для поиска ближайших соседей (наиболее похожих объектов) в огромных наборах данных, которые не помещаются на одном сервере. Система использует структуру "Parallel Hybrid Spill Tree" для …
Патент описывает архитектуру, позволяющую пользователям или организациям создавать собственные поисковые индексы (Custom Search Indexes) путем загрузки или указания контента. Система управляет доступом к этим индексам на основе правил, установленных владельцем, …
Патент Google описывает архитектуру для создания и ранжирования пользовательских индексов (Custom Search Index) отдельно от основного веб-поиска. Владельцы контента могут напрямую влиять на ранжирование в своем индексе, используя аннотации (указание …
Патент описывает механизм для рекламных систем (например, Google Ads) по борьбе с дублированием отчетов о конверсиях (Conversion Spam) в моделях с оплатой за действие (CPA). Для каждой конверсии генерируется уникальный …
Патент Google, описывающий механизм персонализации поиска. Документы или сайты, добавленные пользователем в закладки, могут получать повышение в его персональной выдаче. Система позволяет пользователю детально настроить, как именно закладки влияют на …
Google использует инфраструктурный механизм «Эпох» для обновления поискового индекса в реальном времени. Система отслеживает активные поисковые запросы и гарантирует, что устаревшие данные (например, старые версии документов) удаляются только тогда, когда …
Анализ инфраструктурного патента Google, описывающего высокоэффективную систему управления хранилищем данных (Tokenspace Repository). Патент раскрывает механизм "Treadmilling", который позволяет Google постоянно обновлять документы в индексе и эффективно удалять старые версии, восстанавливая …
Анализ патента, описывающего архитектуру платформы JotSpot (позже Google Sites). Система рассматривает все элементы (контент, формы, темы) как редактируемые «объекты страниц». Патент фокусируется на механизме «трансформации» для рендеринга контента и динамической …
Патент Google, описывающий систему для анализа оцифрованных газет и журналов. Система определяет, какие блоки текста на разных страницах принадлежат одной статье. Для этого комбинируются статистический анализ языка (схожесть контента) и …