Ссылки

Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от ее "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, …
Google использует механизм для индексации общедоступного (generic) контента внутри нативных мобильных приложений, даже если приложение требует обязательного входа в систему (login wall). Система автоматически создает и использует специальные «робот-аккаунты» для …
Google улучшает межъязыковой поиск (CLIR), рассматривая ссылки между документами на разных языках как «параллельные корпуса». Анализируя анкорный текст и контент связанных страниц, система уточняет смысл многозначных слов и находит точные …
Патент Google описывает систему управления сканированием и индексированием в условиях ограниченной емкости индекса. Система приоритизирует URL-адреса на основе их показателя «Важности» (Importance Rank, например, PageRank). Когда индекс заполняется, система сканирует …
Google использует механизм для определения контента, который часто меняется между версиями страницы (транзиентный контент). Сравнивая HTML-структуру и содержимое на всем сайте, система выявляет блоки (Transient Paths), такие как реклама или …
Google использует систему для индексации контента внутри нативных мобильных приложений. Приложение запускается в виртуальной машине, эмулирующей ОС устройства, где экстракторы извлекают текст и заголовки непосредственно из процесса рендеринга. Эта информация …
Патент Google, описывающий механизм переменной персонализации. Система рассчитывает «значения повышения» (Boost Values) для авторитетных сайтов, анализируя граф сайтов (Site Graph) и распространение авторитета от доверенных источников (Seed Sites). Пользователь может …
Google использует систему для автоматического определения канонической формы URL. Система активно тестирует различные комбинации параметров в URL, чтобы определить, какие из них влияют на контент, а какие нет (например, tracking-коды …
Google разработал механизм «Snippet Packet», позволяющий пользователям сохранять определенный контент (текст, изображения) с веб-страницы. Пакет включает сам контент, URL и точные данные о местоположении (например, Text Fragments). Система генерирует интерактивные …
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, …
Google решает проблему «невидимости» контента внутри приложений для поиска. Система индексирует веб-ресурсы (URL), которые соответствуют контенту в приложении. Если пользователь ищет этот контент, а приложение у него не установлено, Google …
Google использует систему для идентификации и обработки цитат, приписываемых сущностям. Система применяет разные критерии в зависимости от источника: для общих цитат важна частота упоминаний и консенсус, а для новостных — …
Анализ патента (IBM), описывающего механизм улучшения локального поиска. Система рассчитывает «Оценку Ассоциации» страницы с географическим регионом на основе локальных терминов (адреса, телефоны), близости к другим регионам и входящих ссылок с …
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной …
Google использует механизм для обнаружения разных версий одного и того же документа (например, научной статьи в разных репозиториях). Система создает «кандидатные идентификаторы» из метаданных (автор, название, дата), нормализует их и …
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный …
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу …
Анализ архитектуры индексирования, которая позволяет поисковым системам повышать свежесть выдачи за счет распараллеливания процессов. Вместо ожидания медленного глобального анализа (расчет PageRank, дубликаты), система строит новый индекс, используя результаты предыдущего цикла. …
Анализ патента (IBM), описывающего инфраструктурный механизм для поддержания целостности индекса и графа ссылок. Система использует коды ответа сервера (404 и 301) для хирургического обновления базы данных ссылок и метаданных (включая …
Google использует механизм для изменения порядка результатов поиска на медиа-платформах. Если в выдаче присутствует несколько элементов контента (например, видео) из одного источника («Канала»), система может сгруппировать их в визуальный кластер, …