SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует институциональные подписки для предоставления доступа к закрытым документам в Google Scholar

LIBRARY CITATION INTEGRATION (Интеграция библиотечных цитирований)
  • US7526475B1
  • Google LLC
  • 2006-05-10
  • 2009-04-28
  • Ссылки
  • Персонализация
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google интегрирует данные из библиотек и научных учреждений для улучшения поисковой выдачи (преимущественно в Google Scholar). Система получает от библиотек информацию о доступных документах (holding information) и список авторизованных пользователей (affiliation list). При поиске система идентифицирует пользователя (например, по IP-адресу) и, если он авторизован, добавляет в результаты поиска прямую ссылку для доступа к закрытым материалам через его библиотеку.

Описание

Какую проблему решает

Патент решает проблему доступа к документам с ограниченным доступом (например, научным статьям за пейволлами), которые хранятся в фондах библиотек или институциональных репозиториях. Обычные поисковые системы часто не могут предоставить легальный доступ к таким документам, даже если у пользователя есть на это право через его организацию (например, университет). Изобретение улучшает пользовательский опыт, связывая результаты поиска напрямую с легальными источниками доступа, основанными на институциональной принадлежности пользователя.

Что запатентовано

Запатентована система и метод интеграции библиотечных фондов и прав доступа пользователей в поисковую систему. Библиотеки предоставляют поисковой системе holding information (информацию о фондах – какие документы у них есть) и affiliation list (список аффилированных пользователей – кому разрешен доступ). Поисковая система использует эти данные, чтобы определить, имеет ли конкретный пользователь доступ к конкретному документу через свою библиотеку, и если да, то дополняет результат поиска специальной ссылкой доступа (access link).

Как это работает

Механизм работает следующим образом:

  • Сбор данных: Поисковая система получает от библиотек списки их фондов (holding information) и списки авторизованных идентификаторов (affiliation list, например, диапазоны IP-адресов университета).
  • Индексирование: Создается специальный библиотечный индекс (library index), связывающий документы, библиотеки и права доступа.
  • Обработка запроса: Когда пользователь выполняет поиск, система определяет его идентификатор (user identifier).
  • Проверка аффилиации: Система проверяет, связан ли пользователь с какими-либо библиотеками, сравнивая его идентификатор с affiliation lists.
  • Аугментация результатов: Если найденный документ присутствует в фонде библиотеки, с которой связан пользователь, результат поиска дополняется access link. Эта ссылка часто ведет на link resolver библиотеки, который предоставляет пользователю опции доступа к полному тексту.

Актуальность для SEO

Высокая. Этот патент описывает ключевую инфраструктуру, лежащую в основе интеграции Google Scholar с университетскими и институциональными библиотеками (например, ссылки вида "Find it @ Stanford"). Учитывая, что изобретатели (Verstak и Acharya) являются ключевыми фигурами в разработке Google Scholar, этот механизм активно используется.

Важность для SEO

Влияние на общие стратегии веб-SEO минимальное (1/10). Патент не описывает алгоритмы ранжирования, сигналы качества контента или факторы E-E-A-T для открытого веба. Он фокусируется исключительно на аугментации результатов поиска (преимущественно академических) путем добавления ссылок доступа на основе институциональных привилегий пользователя. Однако для специалистов по академическому SEO (ASEO) и менеджеров институциональных репозиториев этот патент имеет критическое значение, так как описывает механизм взаимодействия их систем с Google Scholar.

Детальный разбор

Термины и определения

Access Link (Ссылка доступа)
Специальная ссылка, добавляемая к результату поиска, которая позволяет пользователю получить доступ к документу через аффилированную библиотеку. Часто указывает на Link Resolver.
Affiliation List / Affiliation Information (Список аффилиации)
Список идентификаторов, предоставляемый библиотекой поисковой системе, определяющий, какие пользователи имеют доступ к ее фондам. Идентификаторы могут включать IP-адреса, диапазоны IP, географическую информацию.
Holding Information (Информация о фондах)
Данные, предоставляемые библиотекой, описывающие документы в ее коллекции (как онлайн, так и офлайн). Включает метаданные (автор, название, журнал, год, ISBN, DOI) и может содержать информацию о Link Resolvers.
Library Index (Библиотечный индекс)
Специализированный индекс, созданный поисковой системой на основе Holding Information и Affiliation Lists. Используется для быстрого сопоставления результатов поиска с доступностью в библиотеках.
Link Resolver (Преобразователь ссылок)
Система на стороне библиотеки, которая принимает стандартизированный запрос от поисковой системы и преобразует его в прямую ссылку на полный текст документа или предоставляет варианты доступа.
Restricted Access Documents (Документы с ограниченным доступом)
Документы, доступ к которым ограничен определенными пользователями (например, студентами, преподавателями) или требует оплаты.
User Identifier (Идентификатор пользователя)
Информация, используемая для идентификации пользователя и определения его аффилиации. Может быть IP-адресом, уникальным ID из cookie или данными учетной записи.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод поиска и предоставления доступа к закрытым библиотечным документам.

  1. Система хранит информацию о множестве библиотек, каждая из которых ограничивает доступ к своим документам только для аффилированных пользователей.
  2. Система получает запрос от пользователя.
  3. Идентифицируется набор релевантных документов (результаты поиска).
  4. Определяется подмножество библиотек, с которыми пользователь аффилирован и к которым ему разрешен доступ.
  5. Из этого подмножества библиотек извлекается holding information (описание доступных документов).
  6. Определяется, какие из результатов поиска доступны пользователю через эти аффилированные библиотеки.
  7. Пользователю предоставляется результат поиска. Для каждого доступного документа предоставляется access link в аффилированную библиотеку, через которую пользователь может получить документ.

Claim 3 (Зависимый от 2): Уточняет визуальное представление ссылок.

Access Links отображаются в разных размерах в зависимости от уровней доступности (levels of accessibility) соответствующих аффилированных библиотек.

Claim 6 (Зависимый от 1): Уточняет механизм доступа.

Каждая из аффилированных библиотек имеет link resolver. Access link, предоставляемая в результатах поиска, ведет на этот link resolver и содержит информацию, идентифицирующую соответствующий документ, хранящийся в библиотеке.

Claim 7 (Зависимый от 1): Детализирует процесс определения аффилиации.

  1. Определяется user identifier пользователя.
  2. Извлекается affiliation information (списки доступа) от библиотек.
  3. Подмножество аффилированных библиотек идентифицируется путем сопоставления user identifier и affiliation information.

Где и как применяется

Изобретение затрагивает этапы индексирования для подготовки данных и этап переранжирования/метапоиска для аугментации результатов в реальном времени.

INDEXING – Индексирование и извлечение признаков
На этом этапе система обрабатывает данные, полученные от библиотек. Это офлайн-процесс, включающий:

  • Получение и обработку Holding Information (каталоги документов).
  • Получение и обработку Affiliation Lists (списки авторизованных идентификаторов).
  • Генерацию Library Index, который связывает документы с библиотеками и условиями доступа.

RANKING – Ранжирование
На этом этапе происходит стандартный поиск по основному индексу для нахождения документов, релевантных запросу. Алгоритмы ранжирования в патенте не описаны.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание (Presentation System)
Это основной этап применения патента, происходящий в реальном времени после получения первичных результатов ранжирования (в патенте упоминается presentation system):

  1. Идентификация пользователя: Система определяет User Identifier (например, IP-адрес).
  2. Определение аффилиации: Система использует User Identifier и данные из Library Index (Affiliation Lists), чтобы определить, с какими библиотеками связан пользователь.
  3. Сопоставление результатов и фондов: Система сравнивает документы из результатов поиска с Holding Information аффилированных библиотек.
  4. Аугментация SERP: Для документов, доступных пользователю, система генерирует и добавляет Access Link, указывающий на Link Resolver соответствующей библиотеки.

Входные данные:

  • Запрос пользователя.
  • User Identifier (IP-адрес, cookie).
  • Первичный набор результатов поиска.
  • Library Index (содержащий Holding Information и Affiliation Lists).

Выходные данные:

  • Аугментированный набор результатов поиска, содержащий стандартные ссылки и персонализированные Access Links к библиотечным ресурсам (например, "Find it @ Stanford").

На что влияет

  • Конкретные типы контента: В первую очередь влияет на научную литературу (scholarly literature): журнальные статьи, материалы конференций, академические работы и их библиографические записи.
  • Специфические запросы: Информационные и исследовательские запросы, связанные с поиском научных публикаций.
  • Конкретные ниши или тематики: Академические, научные и исследовательские ниши (Google Scholar).

Когда применяется

Алгоритм применяется при выполнении следующих условий:

  • Наличие данных: Поисковая система должна иметь предварительно загруженные Holding Information и Affiliation Lists от хотя бы одной библиотеки.
  • Триггеры активации: Механизм добавления конкретной ссылки активируется при одновременном выполнении трех условий:
    1. Документ присутствует в результатах поиска.
    2. Пользователь идентифицирован как аффилированный с библиотекой согласно Affiliation List (например, пользователь заходит из сети университета).
    3. Документ присутствует в Holding Information этой аффилированной библиотеки.

Пошаговый алгоритм

Процесс А: Подготовка данных (Офлайн)

  1. Запрос данных у библиотеки: Поисковая система запрашивает список фондов у библиотеки.
  2. Получение данных: Система получает Holding Information и Affiliation List от библиотеки.
  3. Генерация индекса: Система генерирует или обновляет Library Index, индексируя фонды и связывая их с соответствующими списками аффилиации и информацией о Link Resolvers.

Процесс Б: Обработка запроса (Онлайн)

  1. Получение идентификатора пользователя: Система получает User Identifier (например, из IP-адреса или cookie).
  2. Получение запроса: Система получает поисковый запрос.
  3. Выполнение поиска: Система ищет релевантные документы в основном индексе.
  4. Определение аффилиации: Система использует User Identifier для определения библиотек, с которыми связан пользователь, путем сравнения с Affiliation Lists.
  5. Сопоставление результатов с фондами: Для каждого документа в результатах поиска система проверяет, содержится ли он в Holding Information аффилированных библиотек.
  6. Генерация Access Links (для каждого совпадения):
    • Система определяет, разрешен ли доступ для данного пользователя к данному документу.
    • Если ДА: Генерируется Access Link, указывающий на Link Resolver библиотеки и содержащий идентификатор документа. Ссылка добавляется к результату поиска.
    • Если НЕТ: Результат генерируется без Access Link.
  7. Отображение результатов: Аугментированные результаты поиска с соответствующими ссылками доступа предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о пользователе и данных, предоставленных внешними организациями (библиотеками). Контентные или ссылочные факторы ранжирования не упоминаются.

  • Пользовательские и Технические факторы:
    • User Identifier: Критически важные данные для определения прав доступа. Упоминаются IP-адреса, диапазоны IP, паттерны IP, уникальный ID пользователя, данные из cookie.
  • Географические факторы: Упоминается, что Affiliation List может включать информацию о географическом регионе для определения доступа.
  • Внешние (Институциональные) данные:
    • Affiliation List: Списки авторизованных User Identifiers, предоставленные библиотеками.
    • Holding Information: Метаданные о документах в фондах библиотеки (автор, название, издатель, ISBN, DOI, PubMed Identifier, SICI и т.д.).
    • Информация о Link Resolvers: Адреса (URL) систем библиотеки для доступа к документам.

Какие метрики используются и как они считаются

В патенте не используются сложные метрики ранжирования. Основные операции основаны на булевом сопоставлении:

  • Сопоставление аффилиации: Булева проверка (Да/Нет) совпадения User Identifier с записями в Affiliation List.
  • Сопоставление фондов: Булева проверка (Да/Нет) наличия идентификатора документа в Holding Information конкретной библиотеки.
  • Уровень доступа (Level of Access): Патент (Claim 3) упоминает, что внешний вид Access Link (например, размер шрифта или расположение) может зависеть от уровня доступа, предоставляемого библиотекой. Библиотека, предоставляющая больший доступ, может получить более заметную ссылку.

Выводы

  1. Инфраструктура для специализированного поиска: Патент описывает механизм, который является основой для Google Scholar и его функции интеграции с библиотеками. Он не раскрывает алгоритмов ранжирования для общего веб-поиска.
  2. Персонализация на основе институциональной принадлежности: Система демонстрирует метод глубокой персонализации SERP, основанный не на поведении пользователя, а на его официальной аффилиации с организациями (университетами, исследовательскими центрами) и связанных с этим правах доступа.
  3. Зависимость от внешних данных: Функционирование системы полностью зависит от точности и своевременности данных, предоставляемых библиотеками (Holding Information и Affiliation Lists).
  4. Использование Link Resolvers как ключевого компонента: Ключевым техническим решением является использование Link Resolvers на стороне библиотеки. Google выступает как посредник, направляющий авторизованного пользователя к нужному резолверу, не управляя доступом напрямую.
  5. Работа на уровне представления: Механизм работает на уровне представления (presentation layer), аугментируя уже сформированные результаты поиска персонализированными ссылками, не влияя на базовое ранжирование.

Практика

Практическое применение в SEO

Этот патент имеет минимальное практическое применение для стандартного коммерческого или информационного SEO. Он критически важен для академического SEO (ASEO), библиотек и издателей научной литературы.

Best practices (это мы делаем)

Для институциональных репозиториев и библиотек:

  • Обеспечение точности данных для Google Scholar: Необходимо настроить и поддерживать актуальность Holding Information (списка доступных публикаций) и Affiliation Lists (обычно диапазонов IP-адресов организации), передаваемых в Google Scholar. Это гарантирует, что пользователи увидят Access Links.
  • Настройка Link Resolver: Убедиться, что Link Resolver организации (например, SFX, 360 Link) корректно настроен, доступен и способен обрабатывать запросы, поступающие через Access Links из Google Scholar, для предоставления полного текста.
  • Оптимизация метаданных публикаций: Предоставление полных и точных метаданных (авторы, название, DOI, ISBN) в Holding Information улучшает способность Google сопоставлять публикации в индексе с фондами библиотеки.

Для общих SEO-специалистов:

  • Практических рекомендаций, влияющих на ранжирование в общем поиске, на основе этого патента нет.

Worst practices (это делать не надо)

  • Предоставление неточных метаданных (для издателей): Ошибки в метаданных (например, неверный DOI или ISBN) затруднят сопоставление контента с библиотечными фондами, и пользователи не получат ссылку доступа, даже если библиотека подписана на контент.
  • Использование устаревших списков IP-адресов (для библиотек): Если Affiliation List не обновляется, пользователи в новых сетях организации не получат доступ к функционалу.
  • Игнорирование академического трафика (для релевантных ниш): Если сайт связан с академической сферой, игнорирование оптимизации под Google Scholar и механизмов, описанных в патенте, приведет к потере значительной части целевого трафика.

Стратегическое значение

Патент демонстрирует способность Google создавать специализированные поисковые продукты, интегрируясь с закрытыми базами данных и системами управления доступом. Он подчеркивает стратегию Google по организации не только общедоступной информации, но и контента с ограниченным доступом. Для SEO это пример того, как персонализация и контекст пользователя (в данном случае – институциональная принадлежность) могут радикально изменять вид и функциональность поисковой выдачи в специализированных вертикалях.

Практические примеры

Практических примеров для стандартного SEO нет. Ниже приведен пример применения для библиотеки:

Сценарий: Доступ к научной статье через университетскую подписку

  1. Контекст: Студент находится на территории кампуса и использует сеть университета. Google получает от университета Affiliation List, включающий IP-адрес студента, и Holding Information, включающий подписку на нужный журнал.
  2. Действие пользователя: Студент ищет в Google Scholar статью.
  3. Обработка системой:
    • Система идентифицирует пользователя по IP-адресу и определяет его аффилиацию с университетом.
    • Система находит статью в индексе.
    • Система проверяет Holding Information университета и подтверждает, что статья доступна.
  4. Результат: В выдаче Google Scholar рядом с названием статьи появляется специальная Access Link, например, "Full Text @ MyUni".
  5. Переход: Кликнув по ссылке, студент направляется на Link Resolver университета, который автоматически предоставляет доступ к полному тексту статьи без необходимости дополнительной авторизации или оплаты.

Вопросы и ответы

Влияет ли механизм, описанный в этом патенте, на ранжирование сайтов в основном поиске Google?

Нет, не влияет. Патент описывает исключительно механизм аугментации (дополнения) уже сформированных результатов поиска специальными ссылками доступа (Access Links). Он не касается алгоритмов расчета релевантности, качества контента или авторитетности сайтов в общем веб-поиске.

Где на практике можно увидеть работу этого патента?

Наиболее яркий пример — Google Scholar. Если вы ищете научные статьи, находясь в сети университета или научной организации, вы увидите дополнительные ссылки справа от результатов поиска, например, "Find it @ Stanford" или "Full Text @ Library". Это и есть Access Links, генерируемые описанным механизмом.

Как Google определяет, что я связан с университетом или библиотекой?

В патенте указано, что для этого используется User Identifier. Чаще всего это ваш IP-адрес. Библиотеки предоставляют Google списки (Affiliation Lists) IP-адресов своих организаций. Если ваш IP входит в этот список, система считает вас аффилированным пользователем. Также могут использоваться cookie или данные учетной записи.

Что такое Link Resolver и зачем он нужен?

Link Resolver — это программное обеспечение на стороне библиотеки. Google не хранит полные тексты закрытых статей, а лишь знает, что у библиотеки есть подписка. Access Link направляет пользователя на Link Resolver, передавая ему метаданные статьи. Резолвер затем находит, где физически находится полный текст (например, на сайте издателя), и перенаправляет пользователя туда.

Может ли мой коммерческий сайт использовать этот механизм для повышения видимости?

Нет. Этот механизм предназначен специально для интеграции с библиотеками (Library Citation Integration) и институциональными репозиториями, предоставляющими доступ к документам (часто научным) на основе подписки или членства. Он не применим для стандартных коммерческих или информационных сайтов.

Какая польза от этого патента для SEO-специалиста, работающего с институциональным репозиторием?

Для Academic SEO (ASEO) польза огромна. Патент подчеркивает необходимость предоставления Google Scholar корректной информации о фондах (Holding Information) и списках доступа (Affiliation Lists). Если эти данные неактуальны, пользователи организации не увидят прямых ссылок на полные тексты, что снизит использование репозитория.

Упоминается ли в патенте, как именно должны выглядеть ссылки доступа?

Да, патент (Claim 3) упоминает, что внешний вид ссылок может варьироваться. Например, ссылки могут отображаться разным размером шрифта или в разных местах результата поиска в зависимости от уровня доступа, предоставляемого библиотекой. Библиотека с лучшим доступом может получить более заметную ссылку.

Работает ли этот механизм только для онлайн-документов?

Патент указывает, что Holding Information может включать информацию как об онлайн, так и об офлайн доступности документов (например, физических книг в библиотеке). В таких случаях Link Resolver может направить пользователя к записи в электронном каталоге о наличии печатной копии.

Может ли пользователь быть аффилирован с несколькими библиотеками одновременно?

Да. Патент предусматривает, что если пользователь аффилирован с несколькими библиотеками (например, Стэнфорд и Гарвард, как в примере патента) и документ доступен в обеих, в результатах поиска могут отображаться несколько Access Links, по одному для каждой библиотеки.

Является ли этот механизм формой персонализации выдачи?

Да, это специфическая форма персонализации. Выдача изменяется (дополняется ссылками) на основе контекста пользователя, а именно его институциональной принадлежности и связанных с ней прав доступа к контенту, а не на основе его предыдущих поисков или интересов.

Похожие патенты

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google использует социальные связи и действия пользователей для персонализации и аннотирования поисковой выдачи
Google использует механизм для персонализации поисковой выдачи путем добавления аннотаций к результатам, которые связаны с социальными группами пользователя (друзья, коллеги, жители города). Система определяет, как участники этих групп взаимодействовали с контентом (создали, поделились, одобрили), приоритизирует эти действия и добавляет пояснения к сниппетам. Также описаны механизмы агрегации действий и защиты конфиденциальности при показе аннотаций.
  • US10142441B2
  • 2018-11-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Популярные патенты

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google рассчитывает авторитетность и ранжирует сайты, вычисляя кратчайшие пути до доверенных источников (Seeds) в Веб-графе
Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния используются для расчета метрик авторитетности и ранжирования сайтов: чем ближе сайт к доверенным источникам, тем выше его предполагаемое качество.
  • US8631094B1
  • 2014-01-14
  • EEAT и качество

  • Ссылки

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

seohardcore