Google использует механизм для динамического обогащения результатов поиска, особенно при навигационных запросах. Система анализирует сущности (продукты, категории) на целевом сайте и сравнивает их с известными интересами пользователя и текущими трендами. …
Ссылки
Google индексирует контент, просмотренный в нативных мобильных приложениях. Система получает от приложения идентификатор контента, его описание и deep link. Это позволяет Google показывать в результатах поиска прямые ссылки на конкретный …
Google использует виртуальные машины для эмуляции мобильных операционных систем. В этой среде запускаются нативные приложения, и система применяет специализированные экстракторы для извлечения контента (текст, изображения, списки) непосредственно перед его рендерингом. …
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, …
Google автоматически создает массивный обучающий набор данных для своих систем семантического анализа (NLP). Система анализирует миллионы веб-страниц, которые ссылаются на авторитетные источники (например, Wikipedia). Анкорный текст этих ссылок рассматривается как …
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон …
Google использует технологию для автоматического извлечения структурированных данных (Заголовков и Элементов) со страниц сайта. Система находит примеры категорий и фильтров (например, "Бренды", "Цвета"), определяет их структурное расположение в коде (Path/XPath), …
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить ее уникальный контекст. Ранжирование улучшается …
Механизм защиты пользователей, который перехватывает запрос на загрузку веб-страницы. Если страница идентифицирована как низкокачественная (паркинг домена, ферма контента или ссылочная ферма), система показывает предупреждение и предлагает перейти на альтернативный релевантный …
Патент Google описывает механизм сопоставления мобильных и десктопных (немобильных) версий документа. Если система устанавливает корреляцию и подтверждает схожесть основного контента, мобильная версия наследует сигналы релевантности (например, обратные ссылки и PageRank) …
Патент Google (с приоритетом от 1999 г.), описывающий методы фильтрации результатов поиска на основе их связанности с заданным контекстом (набором URL или категорий). Документ раскрывает фундаментальные методы определения связанности (Relatedness): …
Google использует систему для выбора одной «основной версии» документа из множества дубликатов. Выбор основан на авторитетности источника, полноте контента и PageRank. Система агрегирует сигналы (например, цитирования и ссылки) всех версий …
Google анализирует, как часто и где текстовые пассажи (например, цитаты или определения) повторяются в корпусе документов. Система рассчитывает оценку значимости пассажа на основе популярности цитирующих авторов, разнообразия источников (diffusion/entropy) и …
Google использует механизм для переноса важной информации между связанными страницами одного сайта. Авторитетность бренда может передаваться с главной страницы на внутренние (Propagation Down), а специфические термины, адреса или категории товаров …
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой …
Google использует систему для индексации контента внутри нативных мобильных приложений (App Indexing). Для этого приложение запускается в виртуальной машине, которая эмулирует операционную систему устройства. Система перехватывает данные, отправляемые в процесс …
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству …
Google использует автоматизированную систему для обнаружения социальных профилей (Facebook, Twitter и т.д.), связанных с бизнес-сущностями. Система сканирует официальные сайты компаний на наличие ссылок, используя списки ключевых слов и форматов URL. …
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система …
Google использует итеративный процесс для борьбы с дубликатами при индексировании. Система кластеризует похожие документы, выбирает лучшего представителя из каждого кластера на основе качества и определяет конечную цель его редиректов. Если …