Анализ фундаментального патента Google, описывающего переход от индексации слов к индексации концепций (фраз). Система определяет значимые фразы и их семантические связи через статистику совместной встречаемости (Information Gain). Документы ранжируются на …
Патенты Google
Разборы патентов поисковой системы Google
Google может активировать блоки с ответами (Answer Boxes или Featured Snippets), анализируя не только сам запрос, но и топовые результаты поиска. Если ресурсы в выдаче ассоциированы с определенной темой (Answer …
Google анализирует историю перемещений пользователя (Movement Data), используя GPS, Wi-Fi, IP и данные из Email, чтобы определить его текущее "состояние" (User State). Система строит профиль типичных и атипичных поездок. Эта …
Google использует механизм для индексации общедоступного (generic) контента внутри нативных мобильных приложений, даже если приложение требует обязательного входа в систему (login wall). Система автоматически создает и использует специальные «робот-аккаунты» для …
Google анализирует реальные маршруты пользователей, чтобы понять, как связаны различные физические локации. Система определяет характеристики бизнеса (например, тип ресторана или его качество) на основе того, откуда приезжают посетители, куда они …
Google использует механизм для определения наиболее важных свойств (фактов) о сущности в контексте ее типа. Система анализирует частоту совместного упоминания (co-occurrence) сущности и связанных с ней сущностей в интернете (Related …
Google расширяет поисковые подсказки (Autocomplete) за пределы исторических логов, анализируя метаданные документов, такие как заголовки (Title). Система извлекает фразы, проверяет их грамматическую корректность с помощью NLP (POS-tagging) и добавляет в …
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или ее классе. …
Google использует алгоритм для определения точных границ "семантических мест" (магазинов, ресторанов), анализируя агрегированные данные о перемещениях пользователей. Вместо того чтобы полагаться только на GPS, система кластеризует визиты на основе сигналов …
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает …
Google улучшает межъязыковой поиск (CLIR), рассматривая ссылки между документами на разных языках как «параллельные корпуса». Анализируя анкорный текст и контент связанных страниц, система уточняет смысл многозначных слов и находит точные …
Патент Google описывает систему управления сканированием и индексированием в условиях ограниченной емкости индекса. Система приоритизирует URL-адреса на основе их показателя «Важности» (Importance Rank, например, PageRank). Когда индекс заполняется, система сканирует …
Google использует механизм для корректировки лент контента и результатов поиска. Система определяет долю пользователей с общей характеристикой (например, демография или интересы) в сети. Для пользователей, обладающих этой характеристикой, система гарантирует, …
Google использует данные из социального графа пользователя для обогащения результатов локального поиска. Когда пользователь ищет место (Point of Interest), система проверяет, кто из его контактов посещал это место (сейчас, недавно …
Google использует "восходящий" подход для наполнения лент контента (например, Google Discover). Система заранее генерирует множество запросов по теме и оценивает качество их результатов по метрикам свежести (Velocity), вовлеченности (Feedback), точности …
Патент Google описывает систему персонализации Карт, которая классифицирует пользователей на «туристов» и «местных жителей» на основе их профиля и знакомства с территорией. Система анализирует, с какими категориями объектов (POI) взаимодействуют …
Google использует систему для динамического извлечения фактов из веб-индекса. Когда поступает фактический запрос, система определяет ожидаемый тип ответа (например, дата, число, имя), анализирует топовые результаты поиска и извлекает соответствующие фразы. …
Google использует многоэтапную систему для проверки фактов, извлеченных из интернета. Чтобы факт попал в базу знаний, он должен быть подтвержден несколькими независимыми источниками. Система оценивает распространенность атрибута и достоверность значения, …
Google использует механизм для определения контента, который часто меняется между версиями страницы (транзиентный контент). Сравнивая HTML-структуру и содержимое на всем сайте, система выявляет блоки (Transient Paths), такие как реклама или …
Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, …