2005

Google использует систему для извлечения фактов (дат, имен, концепций) и связанных с ними фрагментов предложений из веб-документов. Эти пары индексируются отдельно. В ответ на запрос система находит релевантные факты, ранжирует …
Патент Google описывает систему оценки качества пользовательских отзывов (Quality Score). Система анализирует длину текста, грамматику, ценность используемых слов (используя TF-IDF) и свежесть отзыва. На основе этой оценки выбираются лучшие отзывы …
Патент Google описывает систему глубокого анализа изображений для распознавания лиц, одежды и текста на объектах. Система генерирует уникальные "сигнатуры распознавания" и создает индекс на их основе, что позволяет искать изображения …
Google использует систему контроля качества для Программируемых Поисковых Систем (PSE/CSE), где сторонние провайдеры могут влиять на выдачу через контекстные файлы. Система выявляет спам и предвзятость путем офлайн-анализа аннотаций провайдеров и …
Патент (Yahoo) описывает метод определения связи между разными поисковыми запросами. Если два запроса возвращают схожий набор органических результатов (URL), система считает их семантически связанными. Этот механизм используется для показа релевантной …
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если …
Google анализирует текст отзыва, разбивая его на предложения. Каждое предложение оценивается по длине, позиции в тексте и информационной ценности слов (используя IDF). Система выбирает последовательность предложений с наивысшей совокупной оценкой …
Google может хранить несколько версий (instances) документа в индексе, каждая из которых привязана к определенному диапазону дат (date range). Система использует эту информацию для корректировки ранжирования, рассчитывая взвешенную оценку релевантности …
Google использует репутацию и научный вес членов программных или редакционных комитетов (например, их цитируемость) для оценки качества академического события (конференции, журнала). Эта оценка качества события затем используется для ранжирования документов …
Google анализирует контент страниц, ранжирующихся в топе по исходному запросу, чтобы понять его контекст. На основе этого контекста система находит похожие запросы из своей базы данных. Затем она фильтрует эти …
Google использует механизм для определения самой важной части страницы по запросу пользователя. Система классифицирует слова запроса на «навигационные» (если они есть в Title или URL) и «информационные». При анализе контента …
Google анализирует неявные признаки веб-страницы (структуру, теги, размер, сложность), чтобы определить ее реальный формат и оценить удобство использования (Displayability) на конкретных мобильных устройствах. Это позволяет фильтровать поисковую выдачу, гарантируя пользователю …
Патент Google, описывающий систему персонализации поиска на основе явных оценок пользователей (рейтинги, метки, комментарии). Система использует эти данные для изменения порядка результатов в будущих поисках этого конкретного пользователя. Также описан …
Патент описывает архитектуру Программируемой поисковой системы (Google CSE). Владельцы тематических сайтов могут передавать поисковой системе «контекстные файлы». Эти файлы содержат инструкции по модификации запроса, выбору коллекций документов для поиска, фильтрации …
Google использует механизм для агрегации оценок (явных или неявных), которые пользователь дает отдельным веб-страницам. Система формирует персональный «рейтинг сайта» или раздела сайта на основе этих данных. Затем этот агрегированный рейтинг …
Google использует систему транскодирования для адаптации веб-страниц под мобильные устройства. Система анализирует документ, находит фрагмент, наиболее релевантный исходному поисковому запросу, и форматирует страницу так, чтобы этот фрагмент отображался вверху экрана. …
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется …
Патент Google, лежащий в основе вертикального поиска (например, Google Shopping). Система анализирует структурированные данные (атрибуты товаров, вакансий) и динамически решает, какие фильтры показать пользователю. Выбор основан не только на наличии …
Этот основополагающий патент описывает технологию XML Sitemap. Он определяет, как веб-серверы могут автоматически генерировать списки URL с метаданными (дата изменения, приоритет, частота обновления) путем анализа файловой системы или логов доступа, …
Патент описывает инфраструктуру (Google Base, предшественник Merchant Center) для приема структурированных данных от поставщиков. Система автоматически определяет популярные пользовательские атрибуты и продвигает их в стандартную схему (Core Attributes). Полнота данных …