2006

Google использует многоэтапный процесс для определения связей между компаниями (сущностями). Система анализирует совместные упоминания (co-occurrence) в новостях и на веб-страницах, оценивая авторитетность источников (включая Pagerank) и контекст. Затем эти связи …
Патент Google, раскрывающий, как система анализирует поведение пользователей (поисковые запросы и последующие клики) для понимания того, как люди интуитивно классифицируют бизнесы. На основе этих данных Google строит динамические иерархические деревья …
Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих …
Патент Google описывает систему ранжирования, учитывающую уровень доверия к сущностям (экспертам, организациям), которые аннотируют или классифицируют контент с помощью «меток» (labels). Система вычисляет «Рейтинг Доверия» (Trust Rank) для этих сущностей …
Google рассчитывает метрику «Webscore» для локальных компаний, основанную на количестве упоминаний их названия в интернете. Эта оценка используется для определения «Популярности» (Prominence) бизнеса и влияет на ранжирование в локальном поиске, …
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. …
Google анализирует, как долго пользователи остаются на странице после клика (Dwell Time). Сравнивая «длинные просмотры» (признак удовлетворенности) с «короткими просмотрами» (признак неудовлетворенности), Google рассчитывает оценку релевантности (LCIC fraction). Эта оценка …
Анализ патента (поданного AT&T), описывающего механизм ранжирования результатов поиска на основе структурного расстояния (глубины клика) между целевой страницей и главной страницей сайта. Поисковые системы могут использовать эту метрику для определения …
Google отслеживает активность пользователя в браузере: посещенные сайты, частоту визитов, время пребывания на сайте и использование закладок. Эти данные используются для формирования персональной статистики и, что критически важно, для корректировки …
Google создает профиль интересов для веб-сайта (Website Profile), анализируя, какие запросы пользователи вводят на этом сайте и на какие результаты они кликают. Этот агрегированный профиль используется для переранжирования будущих результатов …
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту …
Google применяет комплексную систему для чтения текста на изображениях (например, вывесок в Street View). Патент описывает методы улучшения качества размытых изображений путем объединения нескольких кадров (Superresolution), распознавания текста (OCR) и …
Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а …
Этот патент описывает фундаментальную архитектуру мобильного визуального поиска Google (например, Google Lens). Он детализирует, как изображение с телефона анализируется несколькими специализированными движками (объекты, текст, лица). Критически важно, что система использует …
Google использует систему для сбора неструктурированных данных о компаниях (часы работы, парковка, услуги) с веб-сайтов и каталогов. Система извлекает факты, преобразует их в машиночитаемый формат (нормализация), сопоставляет с нужной компанией …
Google анализирует документы (включая книги и веб-страницы), чтобы рассчитать независимую от запроса оценку значимости (Importance Score) для упомянутых сущностей (люди, места, даты). Эта оценка учитывает контекст упоминания, точность, TF-IDF, внешние …
Google использует многоэтапный процесс для разрешения сущностей (Entity Resolution). Система агрессивно нормализует имена сущностей (удаляя стоп-слова, титулы, знаки препинания и сортируя слова по алфавиту), чтобы сгруппировать потенциальные дубликаты. Затем она …
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. …
Патент Google, раскрывающий фундаментальные механизмы геокодирования и извлечения адресов. Система преобразует текстовые описания мест в точные координаты, используя "Массу Локации" (количество адресов в регионе) для оценки значимости. При наличии "Гео-подсказки" …
Патент описывает систему оценки изображений на предмет нежелательного (например, взрослого) контента. Система анализирует не только само изображение и страницу, на которой оно размещено, но и агрегированные статистические данные по другим …