SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов

ENHANCING SEARCH RESULTS USING CONCEPTUAL DOCUMENT RELATIONSHIPS (Улучшение результатов поиска с использованием концептуальных связей между документами)
  • US8090736B1
  • Google LLC
  • 2004-12-30
  • 2012-01-03
  • Ссылки
  • SERP
  • Структура сайта
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).

Описание

Какую проблему решает

Патент решает проблему ограниченности традиционных методов поиска информации, которые часто полагаются только на содержание документа (текст) и базовые метаданные (автор, дата создания) или жесткие иерархические структуры каталогов. Это затрудняет поиск релевантной информации, если пользователь не знает точного содержания или расположения документа. Изобретение улучшает качество поиска за счет учета того, как пользователи концептуально организуют информацию.

Что запатентовано

Запатентована система, которая использует определяемые пользователем организационные структуры (user-defined organizational relationships) для расчета независимого от запроса рейтинга документов (Ranking Score). Эти структуры включают логические каталоги, виртуальные структуры (например, ярлыки/метки, как в Gmail) и закладки. Система рассматривает эти организационные связи как 'ссылки' между документами и использует алгоритмы, подобные PageRank, для расчета рейтинга на основе этих концептуальных связей.

Как это работает

Система работает в несколько этапов:

  • Идентификация структур: Система анализирует, как документы организованы — например, какие документы находятся в одной папке, имеют одинаковый ярлык или находятся в одной папке закладок.
  • Определение связей: Эти организационные группировки интерпретируются как связи (ссылки). Определяется степень близости (degree of relatedness): документы в одной папке связаны сильнее, чем документы в соседних (сестринских) папках.
  • Расчет рейтинга: Система рассчитывает Ranking Score для документов на основе этих связей. Учитывается количество связей, их сила и рейтинг связанных документов (используется итеративный алгоритм типа PageRank). Также может учитываться количество разных пользователей, создавших связь.
  • Ранжирование при поиске: При получении запроса система рассчитывает стандартный балл релевантности (IR score) и комбинирует его с предварительно рассчитанным Ranking Score для определения итогового рейтинга в выдаче.

Актуальность для SEO

Средняя. Патент подан в 2004 году и описывает механизмы, которые изначально были актуальны для десктопного, персонализированного или корпоративного поиска (например, Gmail, Google Desktop). Однако базовые принципы использования концептуальных и структурных связей для передачи ранжирующего веса остаются фундаментальными для SEO и архитектуры веб-сайтов, хотя методы их идентификации в современном вебе (например, через нейронные сети и анализ сущностей) ушли далеко вперед.

Важность для SEO

Патент имеет высокое значение (7/10) для понимания принципов информационной архитектуры и внутреннего ссылочного графа сайта. Он формализует идею о том, что структурная и концептуальная организация контента напрямую влияет на ранжирование. Механизм передачи веса между документами, основанный на их структурной близости (общие папки/ярлыки против сестринских папок/ярлыков), дает четкое обоснование для построения сильной архитектуры сайта, оптимизации структуры URL и создания тематических кластеров.

Детальный разбор

Термины и определения

Conceptual Organizational Structures (Концептуальные организационные структуры)
Логические или виртуальные методы группировки документов, определяемые пользователями. Включают ярлыки (labels), под-ярлыки (sub-labels), логические файловые системы (папки/директории) и пользовательские закладки (bookmarks).
Degree of Relatedness (Степень близости/родства)
Метрика, определяющая силу связи между двумя документами на основе их расположения в организационной структуре. Например, документы с общим ярлыком имеют высокую степень близости; документы с сестринскими ярлыками — более низкую.
Document (Документ)
Любой машиночитаемый продукт: текстовый файл, таблица, электронное письмо, изображение, веб-страница, новостной пост, блог и т.д.
First Relationship / First Link (Первая связь / Первая ссылка)
Сильная связь между документами. Определяется как наличие общего иерархического ярлыка, нахождение в одной поддиректории или в одной папке закладок.
IR Score (Information Retrieval Score)
Стандартная оценка релевантности документа запросу, основанная на анализе содержания (частота терминов, их расположение в документе и т.д.).
Link (Ссылка)
В контексте патента — любая связь между документами в коллекции, основанная на организационных структурах. Используется как основа для расчета рейтинга.
Ranking Score / Rank (Рейтинг)
Оценка документа, рассчитанная на основе его концептуальных связей с другими документами, независимо от поискового запроса. Может рассчитываться с использованием итеративных алгоритмов типа PageRank.
Second Relationship / Second Link (Вторая связь / Вторая ссылка)
Более слабая связь между документами. Определяется как наличие сестринских (sibling) ярлыков, нахождение в сестринских поддиректориях или сестринских папках закладок.
Total Score (Итоговая оценка)
Финальная оценка документа, используемая для ранжирования в результатах поиска. Является комбинацией IR Score и Ranking Score.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной механизм дифференцированного учета связей разной силы для ранжирования.

  1. Система выбирает первый документ.
  2. Определяется "Первая связь" (First Relationship) между первым и вторым документом. Эта связь интерпретируется как "Первая ссылка" (First Link). Условия для Первой связи: общий иерархический ярлык, общая поддиректория ИЛИ общая папка закладок. (Это сильная связь).
  3. Определяется "Вторая связь" (Second Relationship) между первым и третьим документом. Эта связь интерпретируется как "Вторая ссылка" (Second Link). Условия для Второй связи: сестринские (sibling) ярлыки, сестринские поддиректории ИЛИ сестринские папки закладок. (Это более слабая связь).
  4. Первому документу присваивается Ranking Score на основе Первой и Второй ссылок.
  5. Ключевое условие: Первая ссылка вносит больший вклад в Ranking Score, чем Вторая ссылка.

Claim 6 (Зависимый от 1): Уточняет механизм расчета рейтинга. Ranking Score первого документа основывается на Ranking Score второго и третьего документов. Это подтверждает использование итеративного алгоритма, подобного PageRank, где связанные документы передают свой вес.

Claim 7 (Зависимый от 1): Уточняет, что Ranking Score также зависит от количества других документов, которые разделяют ту же организационную структуру (ярлык, директорию, закладку) с первым документом.

Claim 9 (Независимый пункт): Описывает механизм с акцентом на ярлыки (Labels) и учет мнения нескольких пользователей.

  1. Система получает ярлыки для первого документа от нескольких разных пользователей.
  2. Обнаруживается Первая ссылка (общий ярлык) и Вторая ссылка (сестринский ярлык).
  3. Присваивается Ranking Score (вклад Первой ссылки больше, чем Второй).
  4. Ключевое условие: Ranking Score дополнительно основывается на количестве разных пользователей, присвоивших ярлыки.
  5. Обнаруживается Третья ссылка (непрямая связь): второй документ связан с четвертым документом через ярлык, которого нет у первого документа.
  6. Ranking Score первого документа модифицируется на основе этой Третьей ссылки.

Где и как применяется

Изобретение применяется на этапах индексирования для расчета структурного рейтинга и на этапе ранжирования для его применения.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная работа по анализу структур и расчету рейтинга.

  1. Сбор данных: Система собирает информацию об организационных структурах (файловая система, ярлыки, закладки).
  2. Анализ связей: Идентифицируются связи (First Relationship, Second Relationship) между документами и определяются степени близости (degree of relatedness).
  3. Расчет рейтинга: Система итеративно рассчитывает независимый от запроса Ranking Score для каждого документа на основе этих связей (например, используя PageRank). Эти оценки сохраняются в индексе.

RANKING – Ранжирование
На этом этапе предварительно рассчитанный рейтинг используется для сортировки результатов.

  1. Отбор кандидатов: Система идентифицирует набор документов, соответствующих запросу.
  2. Расчет IR Score: Для кандидатов рассчитывается оценка релевантности (IR Score).
  3. Расчет Total Score: Система комбинирует IR Score с предварительно рассчитанным Ranking Score (основанным на связях) для получения Total Score.
  4. Сортировка: Документы сортируются на основе Total Score.

Входные данные:

  • Информация о файловой структуре (директории, поддиректории).
  • Данные о ярлыках (Labels) и под-ярлыках, присвоенных документам.
  • Информация о пользовательских закладках (Bookmarks) и их организации.
  • Идентификаторы пользователей, создавших ярлыки или закладки.

Выходные данные:

  • Ranking Score для каждого документа, основанный на концептуальных связях.
  • Итоговый отсортированный список результатов поиска.

На что влияет

Хотя патент в первую очередь описывает системы, где Google имеет прямой доступ к пользовательским организационным структурам (десктопный поиск, Gmail, корпоративный поиск), его принципы применимы к веб-поиску через анализ аналогичных структур на сайтах:

  • Структура URL (Logical Directory Structures): Влияет на документы, организованные в четкую иерархию URL-адресов (подпапки).
  • Внутренняя архитектура сайта (Conceptual Structures/Labels): Влияет на документы, сгруппированные с помощью навигации, хлебных крошек, внутренних ссылок, формирующих тематические кластеры (которые действуют как виртуальные "ярлыки" или "папки").
  • Внешние ссылки (Bookmarks/Multiple Users): Принципы, связанные с закладками и учетом мнения разных пользователей, могут применяться к анализу внешних ссылок и ко-цитирования.

Когда применяется

  • Постоянно (Индексирование): Расчет Ranking Score на основе связей происходит в процессе индексирования и обновляется по мере изменения организационных структур.
  • При каждом запросе (Ранжирование): Рассчитанный Ranking Score используется как фактор ранжирования при обработке поисковых запросов, комбинируясь с IR Score.

Пошаговый алгоритм

Процесс А: Расчет рейтинга на основе связей (Индексирование)

  1. Идентификация документов и структур: Сбор данных о документах и связанных с ними организационных структурах (ярлыки, директории, закладки).
  2. Идентификация связей: Для каждого документа A определяются связанные документы.
  3. Классификация связей: Связи классифицируются по силе (Degree of Relatedness):
    • Сильные (First Relationship): Общий ярлык/папка.
    • Слабые (Second Relationship): Сестринский ярлык/папка.
    • Непрямые: Связь через промежуточные документы.
  4. Итеративный расчет рейтинга: Расчет Ranking Score для документа A. Может использоваться формула, подобная PageRank: r(A)=αN+(1−α)(r(R1)∣R1∣+...+r(Rn)∣Rn∣)r(A) = \frac{\alpha}{N} + (1-\alpha)(\frac{r(R_{1})}{|R_{1}|}+...+\frac{r(R_{n})}{|R_{n}|}) Где R1..Rn – связанные документы. При этом вклад каждого связанного документа (слагаемого в скобках) дополнительно взвешивается в зависимости от силы связи (First Relationship вносит больший вклад, чем Second Relationship).
  5. Учет дополнительных факторов: Модификация рейтинга на основе количества документов в группе и количества уникальных пользователей, создавших связи.
  6. Сохранение рейтинга: Ranking Score сохраняется в индексе.

Процесс Б: Обработка запроса (Ранжирование)

  1. Получение запроса: Пользователь вводит поисковый запрос.
  2. Идентификация совпадений: Поиск документов, соответствующих запросу.
  3. Расчет IR Score: Генерация оценки релевантности контента (IR Score) для каждого документа.
  4. Получение Ranking Score: Извлечение предварительно рассчитанного рейтинга на основе связей (Ranking Score) из индекса.
  5. Расчет Total Score: Генерация итоговой оценки (Total Score) путем комбинации IR Score и Ranking Score.
  6. Сортировка и представление: Сортировка документов по Total Score и отображение результатов пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании структурных данных, созданных пользователями.

  • Технические факторы (Структура хранения): Логическая файловая система, структура директорий и поддиректорий (аналог URL-структуры в вебе).
  • Структурные факторы (Организация): Ярлыки (Labels) и под-ярлыки, присвоенные документам. Иерархия этих ярлыков.
  • Пользовательские факторы (Взаимодействие): Закладки (Bookmarks), организация закладок в папки. Идентификаторы пользователей, присвоивших ярлыки или создавших закладки.

Какие метрики используются и как они считаются

  • Degree of Relatedness (Степень близости): Качественная метрика для взвешивания связей.
    • First Relationship (Высокая): Общая папка/ярлык.
    • Second Relationship (Низкая): Сестринская папка/ярлык.
  • Ranking Score (Рейтинг на основе связей): Рассчитывается итеративно. Основан на количестве связей, их степени близости и рейтинге связанных документов. В патенте приводится формула, аналогичная PageRank (см. Пошаговый алгоритм).
  • Количество пользователей: Количество уникальных пользователей, которые организовали документ определенным образом (например, присвоили ярлык). Большее количество пользователей может повышать рейтинг.
  • IR Score (Оценка релевантности): Стандартная метрика релевантности контента запросу.
  • Total Score (Итоговая оценка): Комбинация Ranking Score и IR Score.

Выводы

  1. Структура как ранжирующий сигнал: Патент четко определяет, что способ организации документов (концептуальные и логические структуры) является самостоятельным сигналом ранжирования, независимым от содержания документа.
  2. Концептуальные связи как ссылки: Организационные группировки (общие папки, ярлыки, закладки) интерпретируются как ссылки (Links) между документами.
  3. Передача веса по структуре (Structural PageRank): Система использует итеративные алгоритмы типа PageRank для расчета рейтинга на основе этих структурных ссылок. Документы передают вес друг другу в зависимости от их собственного рейтинга.
  4. Дифференцированная передача веса: Вводится понятие степени близости (Degree of Relatedness). Более тесные связи (First Relationship, например, в одной папке) передают значительно больше веса, чем более слабые связи (Second Relationship, например, в сестринских папках).
  5. Сигнал "Мудрость толпы": Если несколько разных пользователей независимо друг от друга организуют документ схожим образом (например, добавляют в закладки или присваивают ярлык), это повышает его Ranking Score.
  6. Итоговое ранжирование: Финальный рейтинг документа (Total Score) является комбинацией его релевантности запросу (IR Score) и его структурного рейтинга (Ranking Score).

Практика

Best practices (это мы делаем)

Хотя патент описывает анализ пользовательских структур (папки, ярлыки), его принципы напрямую переносятся на проектирование архитектуры веб-сайтов, поскольку структура сайта является аналогом этих организационных систем.

  • Оптимизация структуры URL (Аналог Logical Directories): Используйте четкую, логичную и иерархическую структуру URL. Документы внутри одной поддиректории (например, /blog/seo/) формируют сильные связи (First Relationship) и активно обмениваются весом.
  • Создание сильных тематических кластеров (Аналог Labels/Folders): Группируйте контент в тесные тематические кластеры. Кластер действует как виртуальная папка или ярлык. Все документы внутри кластера должны быть тесно связаны внутренними ссылками, чтобы максимизировать передачу веса через First Relationship.
  • Оптимизация внутренней перелинковки для усиления связей: Убедитесь, что документы, которые должны быть тесно связаны концептуально, также тесно связаны структурно (через навигацию, хлебные крошки и контекстные ссылки). Это усиливает их Degree of Relatedness.
  • Использование иерархии для управления передачей веса: Понимайте разницу между вертикальными и горизонтальными связями. Связи внутри иерархии (родитель-потомок и документы на одном уровне в одной подпапке) сильнее, чем связи между сестринскими разделами (Second Relationship). Проектируйте архитектуру так, чтобы наиболее важные страницы получали максимальный вес через сильные связи.
  • Стимулирование внешних ссылок и цитирования (Аналог Bookmarks/Multiple Users): Получение внешних ссылок и упоминаний с разных авторитетных сайтов соответствует принципу повышения рейтинга за счет независимых действий разных пользователей (Multiple Users).

Worst practices (это делать не надо)

  • Плоская структура сайта: Размещение всех страниц в корне домена (site.com/page1, site.com/page2) не позволяет системе идентифицировать четкие концептуальные группы и сильные связи (First Relationship), что затрудняет передачу структурного веса.
  • Хаотичная внутренняя перелинковка: Связывание документов без учета их тематической или структурной близости размывает концептуальные связи и приводит к неэффективному распределению веса.
  • Изолированные страницы (Сироты): Страницы, не включенные в общую структуру сайта и не имеющие внутренних ссылок, не участвуют в обмене структурным весом и будут иметь низкий Ranking Score.
  • Слишком глубокая и разветвленная структура: Создание множества мелких разделов с небольшим количеством контента может привести к тому, что большинство связей будут классифицированы как слабые (Second Relationship), что снижает общую эффективность передачи веса.

Стратегическое значение

Патент подтверждает критическую важность информационной архитектуры (IA) для SEO. Он предоставляет математическую модель (PageRank по структуре) и четкие правила (дифференциация сильных и слабых связей) для проектирования сайтов. Стратегически, это означает, что структура сайта — это не просто удобство для пользователя, а мощный инструмент управления распределением ранжирующего веса. Понимание того, как структурная близость влияет на передачу веса, является ключом к созданию эффективной SEO-стратегии на уровне архитектуры.

Практические примеры

Сценарий: Оптимизация архитектуры интернет-магазина

Применение принципов дифференциации связей для распределения веса.

  1. Структура URL: Товары организованы по категориям: /shoes/running/product1.html и /shoes/hiking/product2.html.
  2. Сильные связи (First Relationship): Все товары внутри /shoes/running/ тесно связаны между собой (общая поддиректория). Они активно обмениваются весом друг с другом и со страницей категории /shoes/running/. Это усиливает ранжирование всех страниц в этом кластере по запросам, связанным с беговой обувью.
  3. Слабые связи (Second Relationship): Товары из /shoes/running/ и /shoes/hiking/ связаны слабее, так как это сестринские директории. Они обмениваются весом, но в значительно меньшей степени, чем внутри своих категорий.
  4. Действия SEO-специалиста:
    • Обеспечить максимальную перелинковку внутри категории /shoes/running/ (блоки похожих товаров, навигация по бренду внутри категории).
    • Использовать хлебные крошки для усиления вертикальных связей внутри иерархии.
    • Ограничить прямые ссылки между сестринскими категориями (например, не ссылаться с товара для бега на товар для хайкинга без веской причины), чтобы сохранить вес внутри кластера.
  5. Результат: Четкое распределение структурного веса, усиление тематической авторитетности каждой категории и повышение Ranking Score для страниц внутри кластеров.

Вопросы и ответы

Описывает ли этот патент внутренние ссылки на сайте?

Патент напрямую не описывает внутренние ссылки на веб-сайтах. Он описывает "концептуальные связи", основанные на пользовательских организационных структурах, таких как файловые директории, ярлыки (labels) и закладки. Однако в контексте веб-поиска структура сайта (URL-адреса, навигация, внутренняя перелинковка) является прямым аналогом этих организационных структур. Принципы передачи веса, описанные в патенте, применимы к анализу внутреннего ссылочного графа сайта.

Что такое "First Relationship" и "Second Relationship" и как это использовать в SEO?

First Relationship — это сильная связь между документами в одной группе (общая папка, ярлык). Second Relationship — это более слабая связь между документами в соседних (сестринских) группах. В SEO это означает, что страницы внутри одного тематического кластера или одной поддиректории URL (например, /blog/seo/) имеют сильную связь и активно обмениваются весом. Страницы в соседних разделах (например, /blog/seo/ и /blog/ppc/) имеют слабую связь и обмениваются весом в меньшей степени. Нужно максимизировать перелинковку внутри кластера.

В патенте упоминается PageRank. Значит ли это, что структура сайта формирует отдельный вид PageRank?

Да, именно так. Патент предлагает использовать итеративный алгоритм, аналогичный PageRank (и даже приводит формулу), для расчета рейтинга документа (Ranking Score) исключительно на основе его концептуальных и структурных связей с другими документами. Этот "структурный PageRank" затем комбинируется со стандартной оценкой релевантности (IR Score) для финального ранжирования.

Как влияет на ранжирование количество документов в разделе или кластере?

Согласно патенту (Claim 7), Ranking Score документа зависит от количества других документов, разделяющих ту же организационную структуру. В теории, принадлежность к большой, хорошо организованной группе (кластеру или разделу) может положительно влиять на рейтинг, при условии, что документы в этой группе также имеют хороший рейтинг и тесно связаны между собой.

Что означает учет "разных пользователей" (Multiple Users) в патенте для веб-поиска?

В патенте указано, что если несколько пользователей независимо присваивают ярлык или добавляют документ в закладки, это повышает его рейтинг. В веб-поиске прямым аналогом этого являются внешние ссылки с разных, независимых сайтов или социальные сигналы/упоминания. Это подтверждает важность разнообразия и естественности ссылочного профиля как сигнала доверия.

Стоит ли использовать плоскую структуру URL, чтобы все страницы были максимально связаны?

Исходя из принципов этого патента, плоская структура не оптимальна. Хотя все страницы будут находиться в одной "папке" (корне сайта), отсутствие иерархии не позволяет системе идентифицировать четкие концептуальные группы и управлять распределением веса. Иерархическая структура позволяет создавать сильные тематические кластеры и более эффективно направлять структурный вес на нужные страницы.

Как этот патент соотносится с современными алгоритмами, такими как BERT или MUM?

Этот патент описывает использование структуры, а не содержания. Алгоритмы типа BERT и MUM фокусируются на понимании языка и семантики контента для расчета IR Score. Описанный в патенте механизм расчета Ranking Score на основе структуры дополняет семантический анализ. Оба типа оценок (структурная и семантическая) комбинируются для итогового ранжирования.

Влияют ли непрямые связи на ранжирование?

Да. Патент (Claim 9) описывает учет непрямых связей (Третья ссылка). Например, если ваш документ A связан с документом B (общая метка), а документ B связан с документом C (другая общая метка), то рейтинг документа C может повлиять на рейтинг документа A, хотя и в меньшей степени, чем прямые связи. Это стандартный принцип распространения веса в графовых алгоритмах типа PageRank.

Актуален ли этот патент, учитывая, что он подан в 2004 году?

Хотя патент старый и фокусировался на технологиях того времени (десктопный поиск), описанные в нем фундаментальные принципы — использование структуры для ранжирования, дифференциация силы связей на основе близости и применение PageRank к этим связям — остаются крайне актуальными для понимания основ SEO и информационной архитектуры сегодня.

Как лучше всего комбинировать релевантность контента и структурный рейтинг?

Необходимо обеспечить, чтобы страницы с наиболее релевантным контентом (высокий потенциальный IR Score) также занимали стратегически важные позиции в архитектуре сайта, получая максимальный структурный вес (высокий Ranking Score). Это достигается путем размещения ключевых страниц в центре сильных тематических кластеров и обеспечения мощной внутренней перелинковки на них.

Похожие патенты

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

Как Google использует анализ визуального макета страницы для сегментации контента и понимания его иерархии
Google использует метод анализа визуального макета страницы (Visual Layout), чтобы понять её иерархическую структуру, даже если HTML-код (DOM) не отражает её точно. Система анализирует визуальные разрывы (белое пространство) между блоками контента, чтобы сегментировать страницу и точно связать описательный текст с конкретными объектами, например, отзывы с соответствующими локальными компаниями на странице со списком.
  • US7421651B2
  • 2008-09-02
  • Индексация

  • Local SEO

  • Структура сайта

Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента
Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.
  • US7603350B1
  • 2009-10-13
  • EEAT и качество

  • Knowledge Graph

  • SERP

Как Google использует тематические векторы, косинусное сходство и анализ когезии кластеров для автоматической классификации контента
Патент Google, описывающий технологию автоматической организации документов. Система создает тематическую сигнатуру документа (вектор тем и их весов) и сравнивает её с существующими наборами документов, используя Cosine Similarity. Затем вычисляется Оценка Уверенности на основе среднего сходства и однородности набора. Патент раскрывает фундаментальные механизмы Information Retrieval, которые Google использует для понимания семантики и оценки тематической когезии контента.
  • US8458194B1
  • 2013-06-04
  • Семантика и интент

Как Google ранжирует персональные документы (письма, файлы), используя обобщенные данные о взаимодействии на уровне признаков
Google решает проблему ранжирования личных документов (например, электронных писем), для которых нет истории кликов. Вместо анализа кликов по конкретному документу система анализирует взаимодействие на уровне признаков. Она агрегирует данные о том, как миллионы пользователей взаимодействуют с документами, имеющими схожие признаки (например, структуру темы письма или отправителя), и использует эти данные для ранжирования похожих документов в вашем личном поиске.
  • US10394832B2
  • 2019-08-27
  • Поведенческие сигналы

  • Персонализация

Популярные патенты

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP
Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.
  • US9275421B2
  • 2016-03-01
  • Семантика и интент

  • SERP

  • Ссылки

Как Google использует историю уточнений запросов для выявления и повышения авторитетных сайтов по широким запросам
Google анализирует последовательности запросов пользователей, чтобы понять, как они уточняют свои поисковые намерения. Если пользователи часто переходят от широкого или неточного запроса к более конкретному, который ведет на авторитетный ресурс, Google связывает этот ресурс с исходным широким запросом. Это позволяет показывать авторитетный сайт выше в выдаче, даже если пользователь сформулировал запрос неточно.
  • US8326826B1
  • 2012-12-04
  • Семантика и интент

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом
Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.
  • US7346839B2
  • 2008-03-18
  • Свежесть контента

  • Антиспам

  • Ссылки

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

seohardcore