Свежесть контента

Google использует механизм для оптимизации отображения подсказок автозаполнения, получаемых из локального кэша и удаленного сервера. Чтобы избежать мерцания интерфейса из-за сетевых задержек, система намеренно задерживает показ локальных подсказок. Если серверные …
Google анализирует, в каких корпусах (Веб, Картинки, Новости и т.д.) пользователи чаще ищут и кликают результаты по конкретному запросу. Система рассчитывает показатель относительной релевантности между корпусами и использует его для …
Google использует систему, позволяющую «зарегистрированным издателям» предоставлять структурированные данные (например, цены, расписания, статус рейсов) отдельно от основного контента. Эта информация обновляется значительно чаще, чем стандартный веб-индекс, и используется для создания …
Google использует систему для отображения прямых трансляций (Live Events) в результатах поиска. Система предварительно фильтрует трансляции, рассчитывая Quality Score на основе авторитетности организатора (Organizer Score), популярности связанных сущностей (Entity Score) …
Патент Google описывает систему, позволяющую авторам напрямую отправлять контент поисковой системе до или сразу после публикации. Система проверяет новизну контента и может проиндексировать его немедленно, без сканирования URL. Также она …
Google патентует систему, позволяющую местным заведениям (барам, ресторанам) указывать в своих бизнес-профилях, какие именно события (например, спортивные матчи) они будут транслировать. Эта информация индексируется и используется в Поиске и Картах, …
Google патентует систему «Временная карта» (Temporal Map), которая индексирует локальные события (концерты, распродажи, специальные меню) и отображает их на карте в привязке ко времени. Система агрегирует эти данные для вычисления …
Google использует механизм для уточнения временного контекста запроса. Это происходит тремя способами: анализом временных указаний в самом запросе (например, «сезон охоты»), учетом текущего времени и местоположения пользователя (например, поиск «кофейни» …
Google использует инфраструктурный метод обновления инвертированного индекса "на месте" (in-place updates). Система заранее резервирует пустые позиции в отсортированных списках документов (posting lists). Это позволяет почти мгновенно добавлять или удалять документы, …
Google оптимизирует ресурсы сканирования для динамического контента (например, цен товаров). Система использует алгоритм обучения с подкреплением (K-armed adversarial bandits) для адаптивного выбора наилучшей стратегии переобхода. Частота сканирования определяется прогнозируемой вероятностью …
Google использует систему для автоматического понимания структуры сайтов с пользовательским контентом (UGC), таких как форумы. Система разделяет страницы на статичные элементы («boilerplate») и динамический контент («posts»), определяет различные типы постов …
Патент раскрывает инфраструктуру Google для кэширования результатов поиска и сниппетов. Описан механизм, использующий «метки времени» (datestamps) для проверки актуальности кэшированной информации на основе даты последнего индексирования документа. Если кэшированный сниппет …
Google использует модель машинного обучения (например, Support Vector Machine) для анализа изменений между двумя версиями веб-страницы. Система оценивает контентные, структурные (ссылки) и поведенческие (трафик) признаки, чтобы классифицировать обновление как «значимое» …
Google ранжирует локальные результаты (POI) не только по близости, но и по контексту. Система учитывает время суток (часы работы и актуальность категории), свежесть социальных обновлений, уникальность бизнеса в данной местности …
Google использует файлы Sitemap как ключевой источник данных для управления сканированием. Патент описывает, как система обрабатывает метаданные (lastmod, changefreq, priority) и интегрирует их с внутренними сигналами (PageRank) в планировщик краулера. …
Google использует механизм, позволяющий авторизованным владельцам сайтов напрямую отправлять структурированные данные (например, цены, наличие товара) в поисковый индекс. Этот процесс происходит по требованию ("unscheduled update sequence"), значительно быстрее стандартного сканирования, …
Google использует этот механизм для интеграции персонализированного контента (из социальных сетей и подписок пользователя) в общую поисковую выдачу. Система применяет сложное дерево решений, чтобы определить, когда показывать этот контент, основываясь …
Google ранжирует ближайшие точки интереса (POI) не только по расстоянию, но и с учетом контекста. Система анализирует недавние обновления в социальных сетях (особенно от друзей), релевантность категории в текущее время …
Google анализирует всплески поисковых запросов в реальном времени и сопоставляет их с транслируемым медиаконтентом (например, телешоу или спортивными событиями). Сопоставляя термины запроса с метаданными (субтитрами) или анализируя аудио-отпечатки с устройств …
Google использует систему для идентификации событий (спорт, концерты) в запросах и генерации «Интегрированного представления события» (Integrated Event View). Эта система агрегирует фактические данные, результаты веб-поиска и контент из социальных сетей. …