SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует компактные Trie-структуры для локального поиска и автодополнения на мобильных устройствах

SEARCHABLE, MUTABLE DATA STRUCTURE (Поисковая, изменяемая структура данных)
  • US9378304B2
  • Google LLC
  • 2013-08-21
  • 2016-06-28
  • Local SEO
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает специализированную структуру данных (Trie), оптимизированную для эффективного хранения, поиска и обновления ключей (например, слов в электронных письмах) на устройствах с ограниченными ресурсами, таких как смартфоны. Эта структура позволяет быстро выполнять локальный поиск и предлагать варианты автодополнения на основе префиксов.

Описание

Какую проблему решает

Патент решает инженерную задачу эффективного хранения, быстрого поиска и динамического обновления индекса на устройствах с ограниченными вычислительными ресурсами и памятью (resource-constrained computing devices), таких как мобильные телефоны и планшеты. Цель — обеспечить высокую скорость локального поиска (например, по электронной почте на устройстве) и функции автодополнения (Prefix function) при минимальном потреблении памяти и дискового пространства.

Что запатентовано

Запатентована конкретная реализация структуры данных Trie (префиксного дерева), состоящая из трех массивов: Nodes (Узлы), Nexts (Переходы) и Suffixes (Суффиксы). Эта структура оптимизирована для компактности и скорости за счет специфических методов аллокации памяти и использования бинарного поиска. Она является изменяемой (mutable), что позволяет динамически добавлять новые ключи (continuous indexing).

Как это работает

Система использует трехуровневую структуру. Первый массив (Nodes) содержит узлы дерева. Промежуточные узлы указывают на срезы (Slices) во втором массиве (Nexts), где хранятся следующие байты (символы) ключа и указатели обратно на первый массив. Для быстрого поиска внутри срезов используется бинарный поиск. Листовые узлы указывают на третий массив (Suffixes), где хранится оставшаяся часть ключа (суффикс) и связанное с ним значение (Value), например, указатель на список документов, содержащих этот ключ.

Актуальность для SEO

Средняя (для инфраструктуры). Эффективные алгоритмы локального индексирования актуальны для разработки мобильных приложений, где ресурсы ограничены. Однако этот патент описывает решение для локального поиска на клиенте и не отражает архитектуру глобального веб-поиска Google, которая использует значительно более сложные и распределенные системы.

Важность для SEO

Минимальное влияние (1/10). Патент является чисто инфраструктурным и описывает внутренние инженерные решения для хранения данных, оптимизированные для локального поиска на клиенте. Он не описывает алгоритмы ранжирования веб-страниц, сигналы качества, анализ ссылок, E-E-A-T или любые другие факторы, влияющие на SEO в глобальном поиске Google. Практического применения для SEO-специалистов, занимающихся продвижением сайтов, этот патент не имеет.

Детальный разбор

Термины и определения

Trie (Префиксное дерево)
Упорядоченная древовидная структура данных, используемая для хранения динамического набора или ассоциативного массива, где ключами обычно являются строки.
Nodes Array (Первый массив)
Массив, содержащий все узлы дерева: Root Node (корневой), Intermediate Nodes (промежуточные) и Leaf Nodes (листовые).
Nexts Array (Второй массив)
Массив, состоящий из срезов (Slices). Каждый элемент среза хранит следующий байт (символ) ключа и указатель обратно на Nodes Array.
Suffixes Array (Третий массив)
Массив, хранящий оставшиеся части ключей (суффиксы), завершающиеся нулем (null-terminated), и связанные с ними значения (Values).
Slice (Срез)
Непрерывный блок элементов в Nexts Array. Промежуточные узлы указывают на срезы с помощью пары (offset, length). Размеры срезов предпочтительно являются степенью двойки (power of two) для оптимизации памяти.
Value (Значение)
Данные, связанные с полным ключом, хранящиеся в Suffixes Array. Обычно это указатель на секцию файла, содержащую список идентификаторов документов (listing of documents), в которых встречается данный ключ.
Find Function
Функция для поиска заданного ключа в структуре данных Trie.
Insertion Function
Функция для динамического добавления новых ключей в Trie.
Prefix Function
Функция для поиска всех ключей в Trie, которые начинаются с заданного префикса (используется для автодополнения).

Ключевые утверждения (Анализ Claims)

Патент фокусируется на структуре данных и ее применении на вычислительном устройстве (например, смартфоне) для трех основных задач: поиск, автодополнение и обновление.

Claim 1 (Независимый пункт): Описывает вычислительное устройство, использующее данную структуру для поиска.

  1. Устройство хранит поисковую структуру данных, состоящую из трех массивов (Первый, Второй, Третий) с определенными взаимосвязями (Узлы -> Срезы -> Узлы -> Суффиксы).
  2. Элементы Третьего массива хранят подстроку (суффикс) и значение (Value), указывающее на секцию файла.
  3. Устройство ищет совпадение по введенному пользователем ключу.
  4. Если совпадение найдено, возвращается Value, и на дисплее отображается список документов, содержащих ключ (полученный из файла по указателю Value).

Это определение самой структуры и ее применения для локального поиска документов на устройстве.

Claim 8 (Независимый пункт): Описывает использование структуры для функции автодополнения (Suggest).

  1. Устройство ищет возможные совпадения в ответ на ввод пользователем первой части поискового ключа (префикса).
  2. Найденные совпадения отображаются на дисплее как предлагаемые поисковые термины (suggested search terms).

Описывается применение Trie для функции префиксного поиска на устройстве.

Claim 16 (Независимый пункт): Описывает изменяемость (mutability) структуры и процесс обновления индекса.

  1. Устройство обновляет структуру данных, когда ключ из дополнительного документа отражается в файле (индексация нового контента).
  2. Процессор ищет новый ключ. Если ключ уже присутствует в структуре, процессор обновляет соответствующее Value (т.е. обновляет список документов). Если ключ отсутствует, он добавляется в структуру (детализировано в зависимых пунктах 17-20).

Описывается механизм поддержания актуальности локального индекса при появлении новых данных.

Где и как применяется

Патент описывает инфраструктуру хранения данных. Он не вписывается в стандартную архитектуру веб-поиска Google (Crawling, Indexing, Ranking и т.д.), так как предназначен для локального индексирования и поиска на клиентском устройстве (смартфоне, планшете).

Область применения: Локальный поиск в приложениях (например, Gmail, Контакты, Поиск по устройству).

Взаимодействие компонентов (Локальное):

  • Индексирование: Insertion Function используется для построения и динамического обновления локального индекса (Trie Data Structure) при поступлении новых документов (например, писем).
  • Поиск (Retrieval): Find Function используется приложением (Call Interface Program) для быстрого извлечения списка документов из локального файла (File), связанных с введенным ключом.
  • Автодополнение: Prefix Function используется для генерации поисковых подсказок в реальном времени.

Входные данные:

  • Поисковый запрос или префикс, введенный пользователем.
  • Новые ключи (слова) и идентификаторы локальных документов для индексации.

Выходные данные:

  • Указатели на списки локальных документов (Values).
  • Предлагаемые поисковые термины (подсказки).

На что влияет

Изобретение влияет исключительно на производительность и эффективность использования ресурсов при выполнении локальных операций на устройстве:

  • Скорость локального поиска по точным совпадениям.
  • Скорость генерации подсказок (автодополнения).
  • Эффективность использования памяти и дискового пространства для хранения локального индекса.

Патент не влияет на ранжирование веб-сайтов в поиске Google.

Когда применяется

Алгоритмы применяются в следующих сценариях на устройстве:

  • Find function: Когда пользователь вводит полный поисковый запрос в локальном приложении.
  • Prefix function: В реальном времени, когда пользователь вводит символы для получения автодополнения.
  • Insertion function: Когда приложение получает новые данные (например, новые электронные письма), требующие локальной индексации или обновления индекса.

Пошаговый алгоритм

Процесс А: Поиск ключа (Find Function)

  1. Начало поиска: Функция начинает обход Trie с корневого узла (Root Node) в первом массиве (Nodes).
  2. Определение среза: Определяется срез во втором массиве (Nexts), на который указывает текущий узел (используя его offset и length).
  3. Бинарный поиск символа: Выполняется бинарный поиск текущего символа ключа в этом срезе. (Срезы поддерживаются в отсортированном виде).
  4. Обработка результата поиска:
    • Если совпадение не найдено: Поиск прекращается, результат не возвращается.
    • Если совпадение найдено: Система использует указатель, связанный с совпавшим элементом среза, чтобы перейти к следующему узлу в первом массиве.
  5. Итерация или завершение:
    • Если новый узел промежуточный (Intermediate Node): Процесс повторяется с шага 2 для следующего символа ключа.
    • Если новый узел листовой (Leaf Node): Система переходит к третьему массиву (Suffixes).
  6. Сравнение суффикса: Оставшаяся часть ключа сравнивается (Directly Compare) с подстрокой, хранящейся в элементе третьего массива, на который указывает листовой узел.
  7. Финальный результат:
    • Если суффиксы совпадают: Совпадение найдено. Возвращается значение (Value), прикрепленное к суффиксу.
    • Если суффиксы не совпадают: Совпадение не найдено.

Процесс Б: Автодополнение (Prefix Function)

  1. Поиск префикса: Выполняется обход Trie (аналогично Процессу А) для сопоставления введенного префикса.
  2. Достижение узла:
    • Если достигнут листовой узел: Сравнивается подстрока в третьем массиве с оставшимися байтами префикса. Если есть совпадение, которое покрывает длину оставшегося префикса, вернуть только этот ключ как подсказку. Иначе, не возвращать ничего.
    • Если достигнут промежуточный узел (и весь префикс совпал): Перейти к шагу 3.
  3. Обход в глубину (Depth-first Traversal): Выполнить обход в глубину для всех ключей, находящихся под этим промежуточным узлом. Вернуть все найденные ключи как предложенные поисковые термины.

Какие данные и как использует

Данные на входе

Патент сугубо инфраструктурный и не описывает факторы ранжирования веб-поиска (контентные, ссылочные, поведенческие и т.д.). Он оперирует следующими данными:

  • Структурные данные: Сама структура Trie (массивы Nodes, Nexts, Suffixes, узлы, срезы, указатели).
  • Контентные факторы (Локальные): Ключи (слова), извлеченные из локальных документов (например, электронных писем) для построения индекса.
  • Пользовательские факторы: Введенный пользователем поисковый запрос (search key) или префикс.

Какие метрики используются и как они считаются

Метрики ранжирования (Ranking Scores) в патенте не упоминаются. Используются структурные параметры и методы для оптимизации:

  • Offset и Length: Используются для определения точного положения и размера среза (Slice) во втором массиве.
  • Размер среза (Slice Size): Оптимизирован как степень двойки (1, 2, 4, 8...). Это позволяет уменьшить фрагментацию памяти и ускорить аллокацию. В патенте упоминается использование списков свободных пространств (free lists) для управления памятью при перемещении срезов.
  • Методы поиска:
    • Binary Search (Бинарный поиск): Используется для быстрого поиска нужного байта внутри отсортированного среза во втором массиве.
    • Direct Compare (Прямое сравнение): Используется для сравнения суффиксов в третьем массиве.
  • Методы обхода:
    • Depth-first Traversal (Обход в глубину): Используется функцией Prefix для генерации списка подсказок.

Выводы

  1. Фокус на локальной оптимизации: Патент описывает исключительно внутренние инженерные решения Google для оптимизации хранения и поиска данных на клиентских устройствах с ограниченными ресурсами.
  2. Цель — Эффективность и Компактность: Основная цель — обеспечить быстрый поиск (Find), автодополнение (Prefix) и обновление индекса (Insertion) при минимальном потреблении памяти. Это достигается за счет трехуровневой структуры, бинарного поиска и оптимизированной аллокации памяти (степень двойки).
  3. Изменяемость (Mutability): Структура спроектирована так, чтобы поддерживать динамическое добавление новых данных (например, новых писем) без необходимости полной перестройки индекса.
  4. Отсутствие связи с веб-поиском: Патент не содержит абсолютно никакой информации об алгоритмах веб-ранжирования, сигналах качества, E-E-A-T или любых других факторах, влияющих на SEO продвижение сайтов в глобальном поиске Google.
  5. Нет практической ценности для SEO: Практических выводов для SEO-специалистов, занимающихся оптимизацией сайтов, этот патент не несет.

Практика

ВАЖНО: Патент является инфраструктурным, описывает локальное хранение данных и не дает практических выводов для SEO.

Best practices (это мы делаем)

Не применимо к SEO. Рекомендации из этого патента актуальны для разработчиков мобильных приложений, создающих собственные локальные поисковые индексы, но не для SEO-специалистов.

Worst practices (это делать не надо)

Не применимо к SEO.

Стратегическое значение

Стратегическое значение для SEO отсутствует. Патент интересен с точки зрения компьютерных наук и понимания того, как Google решает инженерные задачи локального поиска и индексирования. Он никак не влияет на понимание приоритетов Google в веб-ранжировании и не должен учитываться при разработке SEO-стратегии.

Практические примеры

Практических примеров для SEO нет. Ниже приведен пример, демонстрирующий работу механизма в контексте локального поиска.

Сценарий: Поиск электронного письма на смартфоне

  1. Индексация (Фон): Приложение на телефоне получило новые письма. Функция Insertion обработала их и добавила новые слова (ключи) в локальную структуру Trie.
  2. Ввод пользователя: Пользователь открывает поиск и начинает вводить префикс (например, "goo").
  3. Автодополнение (Prefix Function): Система использует функцию Prefix. Она быстро обходит Trie по пути 'g' -> 'o' -> 'o'. Достигнув соответствующего узла, она выполняет обход в глубину (Depth-first Traversal) и находит все возможные завершения (например, "good" и "goose"). Они отображаются как подсказки.
  4. Выбор пользователя: Пользователь выбирает "good".
  5. Поиск (Find Function): Система использует функцию Find. Она проходит тот же путь в Trie. Достигнув листового узла для "good", она проверяет суффикс.
  6. Результат: Совпадение найдено. Система извлекает Value, связанное с ключом "good". Это Value является указателем на список ID всех писем, содержащих это слово. Письма отображаются пользователю.

Вопросы и ответы

Описывает ли этот патент, как Google индексирует веб-сайты?

Нет. Патент описывает структуру данных (Trie), предназначенную для индексирования локальных данных на устройстве пользователя, например, электронных писем или контактов на смартфоне. Механизмы индексирования глобального веб-поиска Google значительно сложнее, распределены по дата-центрам и отличаются от описанной структуры.

Влияет ли описанная Trie-структура на ранжирование моего сайта в Google Поиске?

Нет, не влияет. Этот патент посвящен эффективности хранения данных и скорости локального поиска на мобильных устройствах. Он не описывает никаких сигналов ранжирования, оценок качества или алгоритмов, которые Google использует для определения позиций веб-сайтов в поисковой выдаче.

Что такое Trie и зачем Google его использует?

Trie (префиксное дерево) — это структура данных для эффективного хранения и поиска строк. Она особенно полезна для задач, где нужно быстро находить слова по их префиксам (автодополнение) или проверять наличие слова в словаре. Google использует эту конкретную реализацию Trie для обеспечения быстрого локального поиска на устройствах с ограниченными ресурсами.

В патенте упоминаются "ключи" (Keys) и "документы" (Documents). Относится ли это к ключевым словам на моем сайте?

Нет. В контексте этого патента "Документы" — это локальные файлы, например, электронные письма на вашем телефоне. "Ключи" — это слова, извлеченные из этих локальных файлов для создания локального индекса. Это не имеет отношения к ключевым словам, используемым для SEO оптимизации веб-страниц.

В чем основная инновация этого патента?

Инновация заключается в специфической реализации Trie с использованием трех массивов (Nodes, Nexts, Suffixes) и оптимизированных методов управления памятью. Использование бинарного поиска внутри срезов (Slices) и аллокация памяти блоками размера степени двойки позволяет добиться высокой компактности и скорости работы на ресурсоограниченных устройствах.

Описывает ли патент, как работает автодополнение (Google Suggest) в основном поиске?

Нет. Патент описывает механизм автодополнения (Prefix function) для локальных данных на основе этой структуры. Система Google Suggest для веб-поиска использует гораздо более сложные механизмы, учитывающие популярность запросов, историю поиска, местоположение и актуальные тренды в глобальном масштабе.

Что означает "изменяемая" (mutable) структура данных в контексте этого патента?

Это означает, что структура данных поддерживает динамическое добавление новых ключей без необходимости полной перестройки всего индекса. Когда на устройство поступают новые данные (например, новое письмо), функция вставки (Insertion function) может эффективно добавить новые слова в существующую структуру Trie.

Зачем нужны три массива вместо одного?

Разделение на Nodes, Nexts и Suffixes позволяет оптимизировать хранение и доступ. Nodes хранят структуру дерева. Nexts оптимизирован для быстрого поиска переходов (используя бинарный поиск в срезах). Suffixes хранит переменной длины оставшиеся части ключей и связанные значения. Это разделение способствует компактности и эффективности управления памятью.

Что такое бинарный поиск в срезах (Slices)?

Когда алгоритм ищет следующий символ ключа, он не перебирает все возможные варианты последовательно. Вместо этого он смотрит на срез (Slice) во втором массиве, связанный с текущим узлом, и использует бинарный поиск для быстрого нахождения нужного символа внутри этого среза, что значительно ускоряет процесс.

Если этот патент не про SEO, зачем его анализировать?

Анализ таких патентов помогает глубже понять инженерные подходы Google к решению конкретных технических задач, таких как оптимизация и эффективность. Хотя этот патент не дает прямых SEO-рекомендаций, для Senior SEO-специалиста важно уметь отличать патенты, влияющие на ранжирование, от инфраструктурных патентов.

Похожие патенты

Как Google оптимизирует инфраструктуру своего индекса для ускорения поиска подстрок и фраз
Этот патент описывает инфраструктурную оптимизацию поискового индекса Google. В нем представлена «гибридная структура данных», которая ускоряет извлечение информации (например, местоположение фраз в документах) путем объединения бинарных деревьев с таблицами поиска и использования высокоэффективных методов сортировки. Это делает поиск быстрее, но не влияет на алгоритмы ранжирования.
  • US8856138B1
  • 2014-10-07
  • Индексация

Как Google организует локальный поиск и индексирование данных приложений на мобильных устройствах
Патент описывает архитектуру локальной службы индексирования и поиска на устройствах (например, смартфонах). Система централизованно собирает данные из различных приложений (почта, контакты, файлы) и создает единый локальный индекс, оптимизированный для устройств с ограниченными ресурсами. Это позволяет выполнять быстрый унифицированный поиск по всему контенту устройства. Патент не связан с веб-поиском Google.
  • US9558248B2
  • 2017-01-31
  • Local SEO

  • Индексация

Как Google использует граф сущностей для генерации расширенных географических подсказок в реальном времени
Google использует механизм для генерации расширенных поисковых подсказок (Expanded Query Suggestions), особенно в географическом поиске. Система идентифицирует сущности, соответствующие введенному префиксу, а затем обходит граф связанных сущностей (Entity Graph), чтобы предложить релевантные подсказки, которые не начинаются с этого префикса. Это позволяет предлагать конкретные места или бизнесы (например, «MoMA New York» на запрос «new y»), основываясь на географических, категорийных и популярных связях между сущностями.
  • US8694512B1
  • 2014-04-08
  • Knowledge Graph

  • Семантика и интент

  • Индексация

Как Google использует префиксный индекс для формирования подсказок URL и запросов в Autocomplete
Google использует систему интерактивных подсказок (Autocomplete), которая предлагает как завершение запроса, так и прямые URL-адреса по мере ввода пользователем префикса. Система заранее создает индекс, анализируя популярные сайты и связывая префиксы с наиболее релевантными URL на основе анкорных текстов, заголовков, доменных имен и поисковых запросов пользователей.
  • US10592573B1
  • 2020-03-17
  • Индексация

  • SERP

Как Google ускоряет автозаполнение (Autocomplete) и какие факторы ранжирования подсказок раскрывает этот механизм кэширования
Google оптимизирует производительность Autocomplete, кэшируя подсказки локально в браузере, чтобы избежать запросов к серверу при каждом вводе символа. Хотя патент фокусируется на скорости, он также подтверждает, что Google ранжирует подсказки на основе популярности запросов (частоты использования) и значимости сущностей (например, численности населения для географических объектов).
  • US20130054632A1
  • 2013-02-28

Популярные патенты

Как Google в Autocomplete динамически выбирает между показом общих категорий и конкретных подсказок в зависимости от «завершенности запроса»
Google анализирует «меру завершенности запроса» (Measure of Query Completeness) по мере ввода текста пользователем. Если намерение неясно и существует много вариантов продолжения (низкая завершенность, высокая энтропия), система предлагает общие категории (например, «Регионы», «Бизнесы»). Если намерение становится ясным (высокая завершенность, низкая энтропия), система переключается на конкретные подсказки или сущности.
  • US9275147B2
  • 2016-03-01
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google идентифицирует экспертов на основе их активности и позволяет фильтровать выдачу по их контенту
Google использует систему для идентификации людей (членов социальной сети), тесно связанных с темой запроса, на основе их активности (посты, взаимодействия, репосты) и квалификации. Система отображает этих людей в специальных блоках (Display Areas) рядом с результатами поиска, позволяя пользователям просматривать их профили или фильтровать выдачу, чтобы увидеть только контент, созданный, одобренный или прокомментированный этими экспертами.
  • US9244985B1
  • 2016-01-26
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

seohardcore