2008

Google использует механизм для стабилизации индекса при обработке дубликатов в условиях неравномерного сканирования (Crawl Skew). Если страница не была пересканирована, система принудительно связывает ее с предыдущим каноническим URL (Previous Representative). …
Патент Google, описывающий дизайн пользовательского интерфейса для Q&A платформ и форумов. Система позволяет пользователям выполнять поиск (по вебу, картинкам и т.д.) прямо из формы ответа и одним кликом добавлять найденные …
Google использует статистический метод для анализа больших наборов URL и выявления общих префиксов или суффиксов, которые встречаются чаще, чем ожидалось случайно. Это помогает Google понять структуру URL, сгруппировать похожий контент …
Патент описывает метод обеспечения актуальности индекса для контента, у которого нет надежной даты последнего изменения (например, данные в БД). Система отслеживает внутренние номера версий контента. Если версия изменилась с момента …
Google (в частности, YouTube, упомянутый в патенте) использует итеративный процесс для генерации списков связанного контента. Система анализирует метаданные (заголовок, описание, теги) просматриваемого элемента и создает упорядоченный список ключевых слов. Затем …
Google применяет систему для индексации «Глубокого веба» (Deep Web), автоматически определяя, какие ключевые слова вводить в веб-формы. Система использует итеративное зондирование: извлекает начальные слова, отправляет их, анализирует уникальность результатов и …
Google использует итеративный алгоритм сравнения (например, LCS) для анализа изменений между старой и новой версиями веб-страницы. Система не просто определяет добавленный или удаленный контент, но и точно идентифицирует блоки, которые …
Google анализирует поисковые запросы, чтобы определить, спрашивает ли пользователь текущее время. Если такой интент обнаружен, система генерирует специализированный блок ответа (OneBox), показывающий время (используя IP-геолокацию, если местоположение не указано), и …
Патент описывает технологию Google для улучшения релевантности контекстной рекламы. Система сохраняет информацию о предыдущих поисковых запросах пользователя (например, в cookie) и использует ее для выбора рекламы на последующих страницах, которые …
Google использует систему взаимодействия с агентами (Agent Interaction System) для генерации лидов прямо из SERP. Если стандартные результаты не содержат специфической информации (например, цены или наличия), пользователь может отправить запрос …
Google может использовать многоэтапный процесс поиска. Сначала система выполняет поиск по первой части запроса. Затем результаты этого поиска определяют ограниченную область (например, конкретный веб-сайт, домен или связанные страницы) для выполнения …
Google использует эффективный метод (O(n)) для группировки структурно похожих документов на веб-сайте. Система определяет страницы, у которых совпадают наиболее весомые термины (Топ-N), используя метрику Modified TF-IDF, смещенную в сторону шаблонного …
Патент Google описывает механизм работы Автодополнения (Autocomplete/Suggest), который объединяет исторические запросы на разных языках (например, корейском и английском) в единую базу. Система конвертирует запросы в романизированное представление на основе физических …
Google использует этот механизм для помощи пользователям, вводящим фонетический текст (например, Pinyin) в адресную строку браузера. Система преобразует ввод в иероглифы (например, Hanzi) и использует исторические данные из логов запросов …
Патент описывает механизм, позволяющий Google (CSE Provider) генерировать спецификацию для Пользовательской Поисковой Системы (CSE) динамически в момент запроса. Вместо статического хранения настроек, система использует ссылку (URL) на внешний источник (HTML, …
Google использует систему кросс-языкового поиска (CLIR), которая переводит запрос пользователя на целевой язык, выполняет поиск и переводит результаты обратно. Ключевая особенность — интерактивный интерфейс, позволяющий пользователю отредактировать машинный перевод запроса …
Google использует масштабируемую систему для обнаружения полных или частичных совпадений в видео и аудио контенте. Система генерирует компактные цифровые отпечатки (фингерпринты) и применяет трехэтапный процесс: быстрый поиск кандидатов с помощью …
Патент Google, описывающий систему генерации оповещений (Alerts) на основе результатов из пользовательских поисковых систем (Custom Search Engines). Система позволяет пользователям получать уведомления об изменениях в результатах поиска по заданному запросу …
Этот патент описывает инфраструктуру Google для приема оцифрованных книг и журналов. Он определяет «Спецификацию контента» (XML-файл), предоставляемую издателями, которая содержит метаданные, структуру тома и явные инструкции по индексированию (например, гранулярность …
Этот патент описывает UI-механизм для Q&A платформ или форумов. Он позволяет пользователям, отвечающим на вопросы, искать подтверждающую информацию и встраивать в ответ как результат поиска (в виде ссылки), так и …