Патент описывает эффективные алгоритмы (Shingling) для создания цифровых отпечатков веб-страниц. Разбивая контент на перекрывающиеся последовательности (шинглы) и выбирая репрезентативное подмножество, Google может быстро сравнивать миллиарды документов для выявления дубликатов, почти …
2008
Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения …
Google может определять географические интересы пользователя, анализируя местоположение издателей новостных сайтов, которые он посещал. Эта информация (Geo Signal) используется для корректировки ранжирования будущих поисковых запросов, повышая результаты, релевантные этим интересам, …
Google анализирует временные метки (таймкоды) в комментариях к видео для определения популярных сегментов. Система кластеризует близкие метки, ранжирует сегменты по популярности и выполняет их предварительную загрузку (prefetching). Это позволяет пользователям …
Google использует механизм (VisualRank) для улучшения качества поиска по картинкам, анализируя визуальное содержимое изображений. Система не полагается исключительно на окружающий текст. Она сравнивает визуальные характеристики изображения с другими в индексе …
Google использует механизм расчета Универсальной Оценки (MUS Score) для результатов локального поиска. Эта оценка позволяет сравнивать релевантность карт и локальных объектов с результатами из других вертикалей (например, веб-поиска) для формирования …
Google использует механизм для разрешения географической неоднозначности. Если фраза может означать как местоположение, так и нечто иное (например, «Orange»), система анализирует сопутствующие слова в запросе (Location Factor), местоположение пользователя (Origin …
Google анализирует частичные запросы по мере их ввода и определяет местоположение пользователя. Если система прогнозирует, что запрос имеет локальный интент (основываясь на поведении других пользователей), она предиктивно добавляет название локации …
Патент Google, описывающий высокоэффективные алгоритмы для поиска всех пар похожих объектов (All-Pairs Similarity Search) в масштабах веба. Система использует селективное индексирование и математические оценки (границы схожести), чтобы избежать полного перебора …
Google анализирует, как термины взаимодействуют внутри топовых результатов поиска, чтобы построить семантический граф связей. Система обрабатывает документы последовательно, отдавая предпочтение тем, которые вводят более сильные или новые взаимосвязи слов (измеряемые …
Google использует технологию статистического машинного перевода (SMT) для генерации синонимов и перефразирования запросов на одном языке. Система обучается на уникальных наборах данных: парах «Вопрос-Ответ» из FAQ, парах «Запрос-Сниппет» из логов …
Google применяет статистический анализ на основе теории информации для определения, какие параметры URL влияют на уникальность контента. Система вычисляет условную энтропию между значениями параметров и отпечатками контента (fingerprints). Это позволяет …
Google использует контекст пользователя (текущее местоположение по GPS, просматриваемую карту или активное приложение) для выбора специализированной "грамматики" (словаря). Это позволяет системе точнее распознавать названия местных бизнесов и объектов во время …
Google использует механизм для улучшения поисковой выдачи в E-commerce, анализируя распределение цен для различения основных продуктов и их аксессуаров. Если система определяет, что пользователь ищет основной продукт, результаты, классифицированные как …
Google использует механизм для оценки нового контента от авторов без истории рейтинга. Система идентифицирует атрибуты нового автора (например, email-домен, демографию, членство в группах) и рассчитывает начальный рейтинг на основе существующих …
Google анализирует списки на веб-страницах (например, списки моделей авто, городов, ингредиентов), чтобы выявить термины, которые часто встречаются вместе, но не являются синонимами (например, «кошка» и «собака», «январь» и «февраль»). Эти …
Google может улучшать поисковый опыт, встраивая интерактивные предложения запросов прямо в текстовые сниппеты результатов поиска. Система определяет альтернативные запросы (основываясь на анализе поведения пользователей) и связывает их с конкретными словами …
Система для обработки неоднозначных запросов путем идентификации различных значений (концепций) запроса и представления их в виде отдельных вкладок (Tabs). Внутри каждой вкладки похожие результаты группируются в "стеки" (Stacks) для уменьшения …
Google использует механизм для помощи пользователям в уточнении их поискового намерения. Система анализирует текст веб-страниц в результатах поиска и находит фразы, похожие на исходный запрос или характеризующие документ. Эти фразы …
Google использует метод Longest Common Subsequence (LCS) для идентификации лексически близких слов, таких как словоформы, аббревиатуры и составные слова. Система вычисляет самую длинную общую последовательность символов между двумя терминами и …