Индексация

Google использует систему для индексации контента внутри нативных мобильных приложений. Приложение запускается в виртуальной машине, эмулирующей ОС устройства, где экстракторы извлекают текст и заголовки непосредственно из процесса рендеринга. Эта информация …
Этот патент описывает foundational-механизмы Search Generative Experience (SGE). Google генерирует AI-сводки, передавая контент из релевантных результатов поиска в Large Language Model (LLM) — техника, известная как Retrieval-Augmented Generation (RAG). Система …
Google динамически регулирует минимальный порог эффективности (например, CTR или сигналы вовлеченности). Если релевантность результата определена с низкой степенью уверенности (например, через семантическое расширение запроса), ему необходимо показать более высокую эффективность, …
Google использует систему для автоматического определения канонической формы URL. Система активно тестирует различные комбинации параметров в URL, чтобы определить, какие из них влияют на контент, а какие нет (например, tracking-коды …
Google анализирует логи локальных поисковых запросов для обнаружения новых бизнесов. Система отслеживает термины, отсутствующие в текущей базе данных. Если частота использования такого термина в определенном регионе резко возрастает по сравнению …
Google использует этот метод для анализа больших наборов тегов (таких как ключевые слова или сущности) с целью выявления пересекающихся тематических кластеров («сообществ»). Система строит взвешенный граф на основе частоты совместного …
Патент Google, описывающий интерфейс для Карт и локального поиска, который упрощает сбор отзывов о географических объектах (ресторанах, магазинах). Система одновременно показывает список результатов, существующие комментарии и поле для ввода нового …
Google использует механизм для сравнения и совместного ранжирования веб-страниц и нативных мобильных приложений. Поскольку оценки для веба и приложений рассчитываются по разным шкалам, система нормализует оценки приложений, приводя их к …
Google создает "гибридный документ" для индексации блогов, объединяя информацию из разных источников: контент поста, данные из RSS/Atom фида, контекст всего блога (например, блогролл) и внешние связанные страницы (например, профиль автора). …
Google использует систему для ответов на вопросы, заданные на естественном языке. Система извлекает предложения-кандидаты из топовых результатов поиска и ранжирует их на основе трех ключевых метрик: авторитетности источника (Web Ranking …
Патент Google, описывающий систему для выявления «недостаточно обслуживаемых тем» (underserved topics). Google анализирует популярность темы (объем поиска) и сравнивает ее с качеством доступного контента (совокупная релевантность и авторитетность). Если спрос …
Google решает проблему «невидимости» контента внутри приложений для поиска. Система индексирует веб-ресурсы (URL), которые соответствуют контенту в приложении. Если пользователь ищет этот контент, а приложение у него не установлено, Google …
Google анализирует локальные всплески поисковых запросов ("excess queries"), чтобы найти города с похожими интересами, но смещенными во времени. Определяя, какие города лидируют в трендах, а какие следуют за ними, Google …
Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и …
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный …
Патент описывает комплексную систему перехода от индексации слов к индексации фраз. Google определяет статистическую связь между фразами с помощью меры Information Gain. Эти данные используются для автоматической организации поисковой выдачи …
Google использует механизм для эффективного обнаружения дубликатов и почти дубликатов путем генерации цифровых отпечатков (фингерпринтов) и группировки похожих документов в кластеры. При формировании поисковой выдачи система фильтрует результаты из одного …
Google запатентовал систему, которая агрегирует данные о том, какие фрагменты документа пользователи выделяют или копируют. На основе частоты этих действий фрагментам присваиваются весовые значения. Эти данные используются для определения наиболее …
Патент Google описывает систему повышения качества поиска по нетекстовому контенту (изображения, видео). Система агрегирует текстовые метки (Initial Labels) со всех страниц, где размещен контент. Затем эти метки группируются по схожести …
Google использует механизм ранжирования, который динамически снижает влияние прогнозируемых показателей (например, pCTR или оценки качества), если система имеет низкую уверенность в точности этого прогноза. Уверенность рассчитывается статистически на основе объема …