2008

Анализ патента Google, описывающего метод определения характеристик онлайн-сущностей (сайтов, авторов, организаций) путем анализа характеристик связанных с ними сущностей. Система сравнивает профиль связей сущности с эталонными профилями, чтобы вывести недостающую информацию …
Google использует систему для оценки качества и честности пользователей (Raters), оставляющих отзывы. Анализируется, насколько сильно оценки пользователя отличаются от среднего мнения большинства. Если пользователь систематически отклоняется от консенсуса, ему присваивается …
Google использует модель машинного обучения для прогнозирования «Оценки полезности» (Utility Score) документа, основанной на вероятности его показа и клика. Документы ранжируются по этой оценке, и только самые полезные (с учетом …
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает …
Google использует итеративный алгоритм для обеспечения разнообразия в результатах поиска и рекомендациях. Система выбирает первый результат с наивысшей релевантностью, а затем штрафует оставшиеся результаты, если они слишком похожи на уже …
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При …
Google использует систему для автоматического определения синонимов путем анализа корпуса документов. Система учитывает частоту совместной встречаемости слов, их физическую близость в тексте, корреляцию между словами в заголовках/анкорах и теле документа, …
Патент Google, описывающий метод улучшения ранжирования с помощью анализа "социальных сигналов" (Social Reference Data). Система отслеживает, как часто пользователи делятся контентом (через email, соцсети, блоги, закладки) и сколько раз его …
Патент описывает, как Google анализирует пользовательские аннотации и поведение при просмотре (Traffic Traces) для выявления важных сегментов внутри видео. Система автоматически группирует схожие сигналы, определяет границы популярных сегментов (Annotated Clips) …
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) …
Google использует механизм, позволяющий владельцам сайтов влиять на отображение своих страниц в поиске. Система идентифицирует «Объекты отображения результатов поиска» (структурированные данные) и «Шаблоны» (правила форматирования), предоставленные вебмастером или сгенерированные автоматически. …
Анализ патента Google (связанного с Google Knol), который детализирует расчет метрик авторитетности автора: Reputation Score (репутация) и Credibility Factor (достоверность). Патент описывает использование этих метрик для ранжирования и монетизации, а …
Google анализирует, как часто и где текстовые пассажи (например, цитаты или определения) повторяются в корпусе документов. Система рассчитывает оценку значимости пассажа на основе популярности цитирующих авторов, разнообразия источников (diffusion/entropy) и …
Google использует итеративный процесс для борьбы с дубликатами при индексировании. Система кластеризует похожие документы, выбирает лучшего представителя из каждого кластера на основе качества и определяет конечную цель его редиректов. Если …
Google использует NLP и машинное обучение для анализа тональности (sentiment) пользовательских комментариев к медиаконтенту (например, видео на YouTube). Система определяет, считают ли пользователи контент смешным, информативным, спорным и т.д., и …
Google анализирует топовые веб-страницы, ранжирующиеся по запросу, чтобы найти упоминания книг. Система рассчитывает, насколько цитируемые книги релевантны контенту этих страниц (Citation Score) и объединяет это с релевантностью самой страницы запросу …
Google использует метод для идентификации областей сайта, содержащих временный контент (например, рекламу, погоду, динамические виджеты). Система сравнивает разные версии страниц и анализирует, как часто меняется контент в определенных структурных расположениях …
Google анализирует, какие ресурсы пользователи посещают в рамках одной сессии (поисковой или браузерной). Если пользователь посещает известный ресурс по теме А, а затем в той же сессии посещает новый ресурс …
Google анализирует последовательность запросов в вашей текущей поисковой сессии и сравнивает ее с миллионами исторических сессий. Если текущий путь поиска совпадает с прошлыми паттернами, система предлагает наиболее вероятный следующий запрос …
Google использует механизм для определения контента, который часто меняется между версиями страницы (транзиентный контент). Сравнивая HTML-структуру и содержимое на всем сайте, система выявляет блоки (Transient Paths), такие как реклама или …