SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google оптимизирует сортировку данных в базах данных для поддержки множества языков

MULTI-LANGUAGE SORTING INDEX (Многоязычный индекс сортировки)
  • US8682644B1
  • Google LLC
  • 2011-06-30
  • 2014-03-25
  • Индексация
  • Мультиязычность
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google, описывающий инфраструктурный метод повышения эффективности баз данных при сортировке одного и того же набора данных по правилам разных языков. Система создает вспомогательный индекс сортировки, генерируя ключи сортировки для всех поддерживаемых языков и устраняя дубликаты. Это позволяет ускорить запросы на сортировку (например, алфавитный порядок) в многоязычных приложениях.

Описание

Какую проблему решает

Патент решает проблему неэффективности и избыточного потребления ресурсов при поддержке сортировки данных по правилам разных языков в базах данных. Разные языки имеют разные правила сортировки (например, порядок букв с диакритическими знаками). Традиционный подход требует создания отдельного индекса для каждого поддерживаемого языка, что приводит к значительному увеличению размера базы данных и сложности управления.

Что запатентовано

Запатентован метод создания и использования многоязычного индекса сортировки (multi-language sorting index). Суть изобретения заключается в создании вспомогательной таблицы (auxiliary table), которая хранит ключи сортировки (sort keys) для строк основной таблицы. Для каждой строки генерируются ключи сортировки для всех поддерживаемых языков, но во вспомогательную таблицу записываются только уникальные ключи, что позволяет существенно сократить размер индекса за счет устранения дубликатов, возникающих, когда правила сортировки в разных языках совпадают.

Как это работает

Система работает в двух режимах: индексация и запрос.

  • Индексация: Для каждой строки в основной таблице система вычисляет sort keys для всех необходимых языков. Эти ключи и ссылка на исходную запись сохраняются во auxiliary table. Если ключ сортировки для разных языков одинаков, он сохраняется только один раз.
  • Запрос: Когда поступает запрос на сортировку данных в определенном языке (например, SELECT BETWEEN), система генерирует ключи сортировки для границ диапазона в этом языке. Затем она извлекает все записи из auxiliary table, чьи ключи попадают в этот диапазон. Поскольку этот набор может содержать строки, отсортированные по правилам других языков, система выполняет финальную фильтрацию, удаляя результаты, которые не соответствуют порядку сортировки запрошенного языка, и устраняя дубликаты.

Актуальность для SEO

Средняя. Технология эффективного управления многоязычными данными остается актуальной для баз данных и приложений (например, списков контактов, адресных книг). Однако этот патент описывает инфраструктурное решение для оптимизации баз данных, а не алгоритм ранжирования поиска.

Важность для SEO

Патент имеет минимальное значение (1/10) для SEO-стратегии. Он описывает внутренние процессы оптимизации баз данных, связанные с порядком сортировки (например, алфавитный порядок), а не с релевантностью или качеством контента. Этот механизм не влияет на то, как Google ранжирует веб-страницы в поисковой выдаче. Патент описывает инфраструктуру и не дает прямых рекомендаций для SEO.

Детальный разбор

Термины и определения

Auxiliary Table (Вспомогательная таблица)
Вторая таблица базы данных, используемая для хранения многоязычного индекса сортировки. Содержит Sort Keys и ссылки на записи в основной таблице.
Collation Element (Элемент сопоставления)
Логическое отображение уровней сортировки в последовательность весов (например, первичный, вторичный, третичный вес), как описано в Unicode Collation Algorithm. Используется для генерации Sort Key.
Collation Element Mapping Table (Таблица отображения элементов сопоставления)
Таблица, которая хранит соответствия между последовательностями символов и последовательностями Collation Elements для определенного языка.
Combined Mapping Table (Объединенная таблица отображения)
Таблица, объединяющая Collation Element Mapping Tables для нескольких языков. Используется для параллельной генерации нескольких Sort Keys за один проход.
Degenerate Sort Keys (Вырожденные ключи сортировки)
Ключи сортировки, которые могут быть сгенерированы при использовании Combined Mapping Table, но которые не соответствуют правилам сортировки ни одного из поддерживаемых языков.
Sort Key (Ключ сортировки)
Строка байтов, которая инкапсулирует порядок сортировки для исходной строки текста. Сортировка ключей сортировки обеспечивает правильный порядок сортировки исходных строк.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод использования многоязычного индекса.

  1. Для первой строки в первой таблице (содержащей строки на разных языках):
    • Вычисляется первый Sort Key для строки на первом языке.
    • Вторая таблица (Auxiliary Table) сохраняет первую запись, связывающую первый Sort Key с исходной строкой.
    • Вычисляется второй Sort Key для строки на втором языке.
    • Вторая таблица сохраняет вторую запись, связывающую второй Sort Key с исходной строкой.
  2. Принимается запрос на отсортированный результат элементов из первой таблицы для первого языка.
  3. Генерируется набор результатов, включающий первую запись для первой строки, позиция которой определяется на основе первого Sort Key.
  4. Набор результатов фильтруется для удаления записей для строк на втором языке.
  5. Набор результатов предоставляется пользователю.

Claim 2 (Зависимый от 1): Уточняет процесс индексации.

Система вычисляет Sort Key для строки на каждом из множества языков и сохраняет запись во второй таблице для каждого вычисленного Sort Key, который не является дубликатом ключа, ранее сохраненного в этой таблице. Это ключевой момент оптимизации размера индекса.

Claim 4 (Зависимый от 1): Детализирует обработку диапазонных запросов (типа SELECT BETWEEN).

  1. Запрос указывает начальную и конечную строки.
  2. Генерируются начальный и конечный Sort Keys для этих строк на первом языке.
  3. Идентифицируются Sort Keys во второй таблице, которые находятся между начальным и конечным ключами.
  4. Записи для строк из первой таблицы, связанные с этими идентифицированными ключами, добавляются в набор результатов.

Claim 5 (Зависимый от 1): Уточняет процесс фильтрации для диапазонных запросов.

Фильтрация включает удаление строк из набора результатов, которые не отсортированы между начальной и конечной строками в соответствии с правилами сортировки первого языка. Это необходимо для устранения ложных срабатываний из-за ключей других языков.

Где и как применяется

Изобретение относится к уровню системы управления базами данных (СУБД) и оптимизации выполнения запросов, требующих сортировки (например, ORDER BY, BETWEEN) в многоязычной среде.

Применение в архитектуре поиска Google:

Патент не описывает применение этого механизма в стандартной архитектуре веб-поиска Google (Crawling, Indexing, Ranking и т.д.). Он не влияет на вычисление релевантности, PageRank или сигналов качества. Это инфраструктурная технология, которая может использоваться в любых приложениях Google, где требуется эффективная сортировка пользовательских данных по языковым правилам (например, сортировка контактов в Gmail, сортировка файлов на Google Диске или сортировка данных в отчетах Google Analytics/Search Console).

Входные данные:

  • Строки данных из основной таблицы базы данных.
  • Набор поддерживаемых языков и их правила сортировки (Collation Element Mapping Tables).
  • Запрос пользователя на сортировку (например, SQL-запрос) с указанием языка.

Выходные данные:

  • Отсортированный набор результатов, соответствующий правилам сортировки запрошенного языка.

На что влияет

Патент влияет исключительно на производительность и эффективность хранения данных при выполнении операций сортировки.

  • Типы контента/Запросы/Ниши: Не влияет на ранжирование каких-либо типов контента, запросов или тематик в поиске. Влияет на любые данные, которые могут быть отсортированы (имена, названия, адреса и т.д.) в рамках базы данных, использующей эту технологию.

Когда применяется

  • Триггеры активации: Активируется при получении запроса к базе данных, требующего сортировки результатов в определенном языке (например, запрос с операторами ORDER BY или BETWEEN).
  • Условия работы: Применяется в системах, которые должны поддерживать сортировку одного и того же набора данных по правилам нескольких разных языков.

Пошаговый алгоритм

Процесс А: Создание многоязычного индекса сортировки

  1. Инициализация: Определяется основная таблица данных и набор поддерживаемых языков. Создается пустая вспомогательная таблица (Auxiliary Table).
  2. Генерация ключей сортировки: Для каждой строки в основной таблице вычисляются Sort Keys для всех поддерживаемых языков. Может использоваться техника параллельной генерации (см. Процесс Б).
  3. Сохранение в Auxiliary Table: Для каждого сгенерированного Sort Key система проверяет его наличие во вспомогательной таблице.
    • Если ключ уникален, он сохраняется вместе со ссылкой на исходную запись в основной таблице.
    • Если ключ уже существует (т.е. совпадает с ключом для другого языка или другой строки), дубликат не создается.

Процесс Б: Параллельная генерация ключей сортировки (Использование Combined Mapping Table)

Этот процесс оптимизирует Шаг 2 Процесса А.

  1. Подготовка: Таблицы отображения элементов сопоставления (Collation Element Mapping Tables) для всех языков объединяются в Combined Mapping Table.
  2. Получение строки: Принимается строка, для которой нужно сгенерировать ключи.
  3. Рекурсивный обход: Система рекурсивно обходит строку, начиная с текущего смещения (offset).
  4. Идентификация подстрок: На текущем смещении идентифицируются все возможные подстроки, имеющие запись в Combined Mapping Table.
  5. Добавление элементов сопоставления: Для каждой идентифицированной подстроки соответствующий Collation Element добавляется к текущей последовательности. Процесс ветвится для каждой возможной подстроки.
  6. Завершение последовательностей: Когда достигается конец строки, формируется полный набор возможных последовательностей Collation Elements.
  7. Конвертация в Sort Keys: Каждая последовательность конвертируется в Sort Key путем объединения весов разных уровней (первичный, вторичный и т.д.).
  8. Удаление вырожденных ключей (Опционально): Система может удалить Degenerate Sort Keys, которые не соответствуют ни одному языку, хотя патент отмечает, что их сохранение может быть более эффективным.

Процесс В: Обработка запроса на сортировку (например, SELECT BETWEEN 'Start' AND 'End' на Языке L)

  1. Получение запроса: Система получает запрос и язык сортировки L.
  2. Генерация граничных ключей: Вычисляются Sort Keys для начальной ('Start') и конечной ('End') строк на языке L.
  3. Запрос к Auxiliary Table: Извлекаются все записи из вспомогательной таблицы, чьи Sort Keys находятся между начальным и конечным ключами.
  4. Формирование предварительного набора: Создается предварительный набор результатов на основе ссылок из Auxiliary Table.
  5. Фильтрация результатов: Предварительный набор фильтруется:
    • Удаляются строки, которые фактически не находятся в диапазоне между 'Start' и 'End' согласно правилам сортировки языка L (ложные срабатывания из-за ключей других языков).
    • Удаляются дубликаты строк.
  6. Вывод: Отфильтрованный и отсортированный набор результатов возвращается пользователю.

Какие данные и как использует

Патент является чисто техническим и фокусируется исключительно на механизме сортировки строк текста. Он не использует стандартные SEO-факторы.

Данные на входе

  • Контентные факторы: Используются только сами строки текста, хранящиеся в базе данных, для генерации ключей сортировки.
  • Языковые данные: Критически важными являются правила сортировки для разных языков, представленные в виде Collation Element Mapping Tables или Combined Mapping Table.

Другие факторы (технические, ссылочные, поведенческие, временные и т.д.) в патенте не упоминаются.

Какие метрики используются и как они считаются

В патенте не используются метрики для оценки качества или релевантности. Используются только вычисленные значения для сортировки.

  • Sort Key: Вычисляется на основе Collation Elements (первичные, вторичные, третичные веса) для строки в соответствии с правилами языка.
  • Сравнение ключей: Используется стандартное байтовое сравнение Sort Keys для определения порядка сортировки.

Выводы

  1. Патент инфраструктурный, а не алгоритмический: Основной вывод заключается в том, что этот патент описывает метод оптимизации производительности баз данных и сокращения размера индекса при работе с многоязычными данными. Он не имеет отношения к алгоритмам ранжирования Google.
  2. Разделение сортировки и ранжирования: Патент четко демонстрирует разницу между сортировкой (определение порядка по заданному критерию, например, алфавиту) и ранжированием (определение порядка по релевантности и качеству). SEO-специалисты работают над улучшением ранжирования, а этот патент решает задачи сортировки.
  3. Эффективность за счет устранения дубликатов: Ключевая инновация заключается в признании того, что многие языки имеют одинаковые правила сортировки для многих строк, и в использовании этого факта для создания единого, компактного Auxiliary Table вместо отдельных индексов для каждого языка.
  4. Обработка языковых различий: Система учитывает сложные языковые нюансы (например, "German Phonebook" порядок) и использует Collation Elements для точного определения порядка сортировки.
  5. Отсутствие практической ценности для SEO: Патент не дает никаких инсайтов о том, как улучшить позиции сайта в поисковой выдаче, какие факторы контента или ссылок важны для Google.

Практика

Best practices (это мы делаем)

Патент описывает внутренние процессы Google без прямых рекомендаций для SEO. Практических выводов для SEO-специалистов нет.

Worst practices (это делать не надо)

Патент не описывает SEO-тактики, которые становятся неэффективными или опасными. Практических выводов для SEO-специалистов нет.

Стратегическое значение

Стратегическое значение для SEO отсутствует. Патент имеет значение для разработчиков баз данных и многоязычных приложений, демонстрируя подход Google к эффективной обработке и хранению данных в интернационализированной среде.

Практические примеры

Практических примеров для SEO нет. Пример из области баз данных:

Сценарий: Сортировка списка контактов на разных языках

  1. Задача: Приложение для контактов должно сортировать имя "Töch" по-разному для пользователей из Германии и Швеции.
  2. Индексация: Система генерирует Sort Keys:
    • Немецкий: 4D 43 2B 35...
    • Шведский: 4D 5A A3 06...
    Оба ключа сохраняются в Auxiliary Table.
  3. Запрос (Немецкий пользователь): Пользователь запрашивает список контактов. Система использует немецкие Sort Keys. "Töch" будет отсортирован перед "Z".
  4. Запрос (Шведский пользователь): Пользователь запрашивает тот же список. Система использует шведские Sort Keys. "Töch" будет отсортирован после "Z".
  5. Оптимизация: Для имени "John", которое сортируется одинаково в обоих языках, в Auxiliary Table будет сохранен только один Sort Key, что экономит место по сравнению с созданием двух отдельных индексов.

Вопросы и ответы

Влияет ли этот патент на ранжирование сайтов в поиске Google?

Нет, этот патент не имеет никакого отношения к алгоритмам ранжирования Google. Он описывает метод оптимизации баз данных для эффективной сортировки данных (например, по алфавиту) в соответствии с правилами разных языков. Он не затрагивает вопросы релевантности, качества контента или авторитетности сайтов.

Что такое ключ сортировки (Sort Key) и чем он отличается от ключевого слова в SEO?

Sort Key — это техническое представление строки текста в виде последовательности байтов, используемое для определения порядка сортировки. Ключевое слово в SEO — это термин или фраза, которую пользователи вводят в поисковую систему. Это совершенно разные концепции: Sort Key используется для упорядочивания данных, а ключевое слово — для поиска релевантной информации.

Может ли этот патент помочь в SEO для многоязычных сайтов?

Нет. Этот патент не предлагает никаких стратегий или тактик для улучшения видимости многоязычных сайтов в поиске. Он решает инфраструктурную задачу эффективного хранения и сортировки данных, которая невидима для SEO-специалистов и не влияет на их работу по оптимизации контента или структуры сайта.

Где Google может использовать эту технологию?

Эта технология может использоваться в любых приложениях Google, где требуется сортировка пользовательских данных с учетом языковых правил. Примеры включают сортировку контактов в Gmail, сортировку файлов по имени на Google Диске или упорядочивание данных в отчетах (например, в Search Console). Это повышает удобство использования приложений для пользователей разных стран.

Что такое Auxiliary Table в контексте этого патента?

Это вспомогательная таблица в базе данных, которая служит индексом сортировки. Вместо создания отдельного индекса для каждого языка, Auxiliary Table хранит уникальные Sort Keys для всех поддерживаемых языков и ссылки на исходные данные. Это позволяет значительно сократить размер базы данных.

Зачем нужна фильтрация результатов после использования Auxiliary Table?

Фильтрация необходима, потому что Auxiliary Table содержит ключи для всех языков. При запросе диапазона (например, имена от А до Б) в предварительный набор могут попасть строки, отсортированные по правилам другого языка, которые случайно попадают в этот диапазон байтов. Фильтрация гарантирует, что итоговый результат точно соответствует правилам сортировки запрошенного языка.

Что такое Collation Element?

Это набор весов (первичный, вторичный, третичный), который определяет порядок сортировки символа или группы символов в определенном языке. Например, Collation Element для буквы 'ö' будет разным в немецком и шведском языках, что отражает разницу в правилах их сортировки.

Описывает ли патент, как именно вычисляются веса для сортировки?

Патент не предлагает новый метод вычисления весов, а ссылается на существующие стандарты, такие как Unicode Collation Algorithm и реализации вроде International Components for Unicode (ICU). Патент фокусируется на том, как эффективно хранить и использовать результаты этих вычислений в многоязычной среде.

Что такое Combined Mapping Table и зачем она нужна?

Это оптимизация процесса генерации ключей. Combined Mapping Table объединяет правила сортировки всех языков в одну структуру данных. Это позволяет системе генерировать все возможные Sort Keys для строки за один проход, вместо того чтобы обрабатывать строку отдельно для каждого языка.

Каков основной вывод для Senior SEO-специалиста из этого патента?

Основной вывод заключается в том, что этот патент не должен отвлекать внимание от ключевых задач SEO. Он является напоминанием о том, что значительная часть инженерных усилий Google направлена на инфраструктурные оптимизации, которые, хотя и важны для работы систем, не влияют на стратегию продвижения сайтов. Фокус должен оставаться на E-E-A-T, релевантности и пользовательском опыте.

Похожие патенты

Как Google эффективно сортирует данные на разных языках с помощью единого многоязычного индекса
Патент Google, описывающий инфраструктурный механизм для эффективной сортировки данных (например, контактов или записей в базе данных) с учетом правил разных языков. Система создает единый многоязычный индекс сортировки и использует технику параллельной генерации ключей для его быстрого наполнения. Это позволяет системе быстро предоставлять отсортированные списки на любом поддерживаемом языке без избыточного потребления ресурсов.
  • US9509757B2
  • 2016-11-29
  • Мультиязычность

  • Индексация

Как Google кластеризует документы на разных языках для улучшения поиска и выявления переводов
Google использует метод для объединения документов на разных языках в общие тематические кластеры. Все документы переводятся на единый базовый язык, затем анализируются ключевые слова, и на этой основе формируются кластеры. Это позволяет находить релевантные результаты независимо от языка запроса и определять, являются ли два документа переводом друг друга.
  • US8639698B1
  • 2014-01-28
  • Мультиязычность

  • Индексация

  • Семантика и интент

Как Google оптимизирует инфраструктуру своего индекса для ускорения поиска подстрок и фраз
Этот патент описывает инфраструктурную оптимизацию поискового индекса Google. В нем представлена «гибридная структура данных», которая ускоряет извлечение информации (например, местоположение фраз в документах) путем объединения бинарных деревьев с таблицами поиска и использования высокоэффективных методов сортировки. Это делает поиск быстрее, но не влияет на алгоритмы ранжирования.
  • US8856138B1
  • 2014-10-07
  • Индексация

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google оптимизирует индекс для эффективного поиска по подстрокам и запросам с подстановочными знаками (wildcards)
Google использует специализированную структуру индекса для быстрого поиска по частям слов (подстрокам) и запросам с подстановочными знаками (*, ?). Индекс хранит не только слова, но и их подстроки, связанные с включающими их строками (Inclusive Strings). Это позволяет системе быстро находить все релевантные совпадения без полного сканирования базы данных, оптимизируя вычислительные ресурсы.
  • US8296279B1
  • 2012-10-23
  • Индексация

Популярные патенты

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.
  • US12353458B2
  • 2025-07-08
  • Ссылки

  • Семантика и интент

  • SERP

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google персонализирует Sitelinks и сниппеты, используя интересы пользователя и тренды для прямого перехода на нужные страницы
Google использует механизм для динамического обогащения результатов поиска, особенно при навигационных запросах. Система анализирует сущности (продукты, категории) на целевом сайте и сравнивает их с известными интересами пользователя и текущими трендами. При совпадении Google отображает персонализированные прямые ссылки (например, динамические Sitelinks) на эти конкретные разделы или товары прямо в выдаче.
  • US20140188927A1
  • 2014-07-03
  • Персонализация

  • SERP

  • Ссылки

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

seohardcore