Google анализирует историю поиска и поведение пользователя (длительность сессий, клики, уточнения запроса), чтобы автоматически выявить неудовлетворенные информационные потребности и долгосрочные интересы. Система периодически перезапускает эти запросы и уведомляет пользователя о …
2005
Google использует систему для поддержания внутренней согласованности своего репозитория фактов (Knowledge Graph). Система выполняет две ключевые задачи: во-первых, она фильтрует и удаляет факты, соответствующие нежелательным критериям, что может привести к …
Google использует фундаментальную архитектуру для персонализации поиска. Система собирает историю действий пользователя (запросы, клики по результатам и рекламе, просмотренные страницы) с разных устройств и браузеров. Эти фрагментированные данные объединяются в …
Google использует систему для автоматического определения, какие URL-параметры влияют на контент страницы (content-relevant), а какие нет (content-irrelevant). URL группируются в кластеры по хосту и пути. Система анализирует статистику прошлых сканирований …
Google анализирует частоту запросов и удовлетворенность пользователей (низкий процент уточнений, долгое время клика), чтобы выявить "Known Highly-Ranked Queries" (KHRQ). Система перенаправляет пользователей с менее успешных или неоднозначных запросов (Nearby Queries) …
Google анализирует исторические данные поиска и действия пользователей (например, клики на построение маршрута), чтобы понять, когда термин в запросе (например, «забегаловка») является синонимом формальной категории бизнеса (например, «ресторан»). Система использует …
Патент Google описывает систему управления сканированием и индексированием в условиях ограниченной емкости индекса. Система приоритизирует URL-адреса на основе их показателя «Важности» (Importance Rank, например, PageRank). Когда индекс заполняется, система сканирует …
Google использует многоэтапную систему для проверки фактов, извлеченных из интернета. Чтобы факт попал в базу знаний, он должен быть подтвержден несколькими независимыми источниками. Система оценивает распространенность атрибута и достоверность значения, …
Патент Google описывает механизм обработки запросов с пропущенными словами (fill-the-blank). Система ищет текстовые совпадения в индексе и извлекает ответы («Filler Text»). Ранжирование ответов основано на трехуровневой оценке: информационная ценность ответа …
Патент Google, описывающий механизм переменной персонализации. Система рассчитывает «значения повышения» (Boost Values) для авторитетных сайтов, анализируя граф сайтов (Site Graph) и распространение авторитета от доверенных источников (Seed Sites). Пользователь может …
Патент описывает систему (Agent Rank), позволяющую Google идентифицировать авторов контента с помощью цифровых подписей. Система рассчитывает репутационный балл для каждого автора на основе качества подписанного им контента и ссылок на …
Google создает "гибридный документ" для индексации блогов, объединяя информацию из разных источников: контент поста, данные из RSS/Atom фида, контекст всего блога (например, блогролл) и внешние связанные страницы (например, профиль автора). …
Google использует метод автоматического обнаружения парафраз (фраз с одинаковым значением) путем анализа индекса, связывающего информационные элементы (даты, имена, концепции) с фрагментами предложений из веба. Если разные фрагменты описывают один и …
Анализ патента (IBM), описывающего механизм устранения неоднозначности сущностей (люди, места, организации). Система использует контекстные описания и метрику «Inverse Network Size» (INS) для оценки уникальности этих описаний в реальном мире, а …
Анализ патента (IBM), описывающего механизм улучшения локального поиска. Система рассчитывает «Оценку Ассоциации» страницы с географическим регионом на основе локальных терминов (адреса, телефоны), близости к другим регионам и входящих ссылок с …
Google использует механизм для обнаружения разных версий одного и того же документа (например, научной статьи в разных репозиториях). Система создает «кандидатные идентификаторы» из метаданных (автор, название, дата), нормализует их и …
Google использует адаптивную систему для генерации сниппетов в результатах поиска. Система анализирует тип запроса (например, поиск по автору или по содержанию) и местоположение ключевых слов в документе. На основе этого …
Google запатентовал систему для анализа неявной обратной связи пользователя на странице результатов поиска. Система отслеживает время и паттерн движения курсора над конкретными результатами (сниппетами), даже если клик не был совершен. …
Google использует систему, позволяющую владельцам тематических (вертикальных) сайтов программно управлять поведением поисковой системы с помощью «Файлов Контекста». Эти файлы содержат инструкции по модификации запроса, выбору коллекций документов для поиска, фильтрации …
Google использует статистическую модель, обученную на поведении пользователей (Session Features) после клика по результату. Анализируя такие сигналы, как время пребывания, последующие клики и запросы, система прогнозирует удовлетворенность пользователя. Хотя патент …