Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки …
Ссылки
Google использует механизм для анализа HTML и не-HTML документов (PDF, Word и т.д.) с целью автоматического обнаружения упоминаний и цитат (статьи, компании, продукты). Система определяет контекстуально релевантный анкорный текст, ищет …
Google использует специальный метод для генерации сниппетов в расширенных результатах поиска (Sitelinks). Сниппет для главной страницы часто основан на запросе пользователя, но сниппеты для внутренних ссылок (sub-documents) генерируются на основе …
Анализ патента, лежащего в основе программы Google Authorship. Описываются методы верификации авторства путем создания цикла ссылок между статьей и профилем автора (используя атрибуты, такие как rel="author" и rel="contributor-to") или путем …
Google использует систему для поддержания внутренней согласованности своего репозитория фактов (Knowledge Graph). Система выполняет две ключевые задачи: во-первых, она фильтрует и удаляет факты, соответствующие нежелательным критериям, что может привести к …
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в веб-графе (триллионы связей). Система определяет расстояние от миллиардов веб-страниц до заранее выбранного набора авторитетных сайтов ("Seeds"). Эти вычисления обеспечивают масштабируемый …
Google динамически определяет предпочитаемую страну пользователя, используя интерфейс поиска (например, google.de) и IP-адрес. Затем система смещает результаты поиска, повышая оценки (Weighting Factor) или позиции (Shifting Factor) контента, связанного с этой …
Google анализирует топовые веб-страницы, ранжирующиеся по запросу, чтобы найти упоминания книг. Система рассчитывает, насколько цитируемые книги релевантны контенту этих страниц (Citation Score) и объединяет это с релевантностью самой страницы запросу …
Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) …
Анализ патента Google, описывающего фундаментальные механизмы Google Search Console. Патент раскрывает, как Google позволяет верифицированным владельцам сайтов выбирать предпочтительный домен (например, с www или без), консолидируя сигналы ранжирования на канонической …
Google анализирует главные страницы авторитетных новостных сайтов ("Hub Pages"), чтобы определить важность новостных статей. Чем выше и заметнее расположена ссылка на статью (учитывая позицию, размер шрифта, наличие изображений и сниппетов), …
Google оптимизирует ресурсы сканирования, используя метрику Важности Страницы (Page Importance Score, например, PageRank). Высоковажные страницы всегда скачиваются заново для обеспечения свежести. Менее важные и стабильные страницы могут быть «переиспользованы» из …
Google использует механизм автоматического создания вероятностных словарей для перевода между разными языками и наборами символов. Система анализирует «выровненный текст», в первую очередь анкорные тексты ссылок (Parallel Anchor Text), указывающих на …
Google использует систему для автоматического определения, какие URL-параметры влияют на контент страницы (content-relevant), а какие нет (content-irrelevant). URL группируются в кластеры по хосту и пути. Система анализирует статистику прошлых сканирований …
Google использует систему интерактивных подсказок (Autocomplete), которая предлагает как завершение запроса, так и прямые URL-адреса по мере ввода пользователем префикса. Система заранее создает индекс, анализируя популярные сайты и связывая префиксы …
Google использует метод для идентификации областей сайта, содержащих временный контент (например, рекламу, погоду, динамические виджеты). Система сравнивает разные версии страниц и анализирует, как часто меняется контент в определенных структурных расположениях …
Анализ патента IBM (1999 г.), описывающего трехэтапную систему для определения тематически связанных терминов. Система анализирует совместную встречаемость терминов в метаданных гиперссылок (анкорах и окружающем тексте) по всему корпусу документов. Затем …
Google использует механизм для объединения социальных одобрений (например, лайков, шейров, +1) с разных, но связанных страниц в единый счетчик. Это включает агрегацию сигналов со всех канонических версий URL, а также …
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских …
Анализ патента (IBM), описывающего модификации алгоритмов типа PageRank для более точной оценки качества страниц. Система предлагает методы для ранжирования «висячих узлов» (страниц без исходящих ссылок или несканируемых страниц) и механизмы …