Как Google эффективно извлекает Топ-N результатов с помощью итеративного битового поиска по ранжирующим оценкам

DOCUMENT RETRIEVAL USING MULTIPLE SORT ORDERS (Поиск документов с использованием нескольких порядков сортировки)

US10235432B1
Google LLC
2016-07-07
2019-03-19

Патент Google, описывающий инфраструктурный механизм для повышения эффективности поиска. Система использует итеративный битовый поиск по атрибутам документов (Sort Keys), таким как качество или дата, чтобы быстро найти заданное количество результатов (Топ-N). Это позволяет избежать полного сканирования и сортировки всех релевантных документов, оптимизируя скорость извлечения данных.

Какую проблему решает

Патент решает проблему эффективности и скорости извлечения данных в крупномасштабных поисковых системах. Когда запрос соответствует огромному количеству документов, сортировка всего этого набора для получения Топ-N результатов (например, Топ-10 самых качественных или самых свежих) требует значительных вычислительных ресурсов. Изобретение оптимизирует этот процесс, позволяя быстро изолировать Топ-N результатов без выполнения полной сортировки всего массива данных.

Что запатентовано

Запатентован метод и система для эффективного поиска индексированных ресурсов с использованием Sort Keys (Ключей сортировки) и Restrict Criteria (Критериев ограничения). Система использует итеративный подход, основанный на битовых префиксах оценок. Путем динамической корректировки этих префиксов система быстро находит количество результатов, удовлетворяющее заданному порогу (Predetermined Threshold), оптимизируя скорость извлечения при использовании различных порядков сортировки.

Как это работает

Система работает по принципу итеративного битового поиска:

Индексирование: Атрибуты документов (например, Quality Score, дата) конвертируются в бинарный формат (Sort Key Values).
Инициализация: При получении запроса определяется начальный Restrict Criterion (битовый префикс, например, "111" для поиска наивысших оценок).
Подсчет: Система подсчитывает количество релевантных документов, чьи Sort Key Values начинаются с этого префикса.
Итеративная Корректировка:
- Если результатов слишком много, критерий уточняется (префикс удлиняется, например, до "1111"), чтобы сузить поиск.
- Если результатов слишком мало, они сохраняются, и критерий корректируется (бинарное значение уменьшается, например, до "110"), чтобы проверить следующий диапазон оценок.
Завершение: Процесс повторяется, пока не будет найдено нужное количество результатов (Топ-N).

Актуальность для SEO

Высокая (с точки зрения инфраструктуры). Эффективность извлечения данных (Retrieval) и скорость ответа являются фундаментальными требованиями для современных поисковых систем. Описанные методы оптимизации для работы с большими индексами остаются критически актуальными.

Важность для SEO

Влияние на SEO-стратегии минимальное (1/10. Инфраструктура). Патент не описывает факторы ранжирования или методы расчета оценок (Sort Keys). Он описывает исключительно внутренний механизм эффективного извлечения уже оцененных документов. Для SEO-специалистов он не предоставляет прямых рекомендаций по оптимизации, но дает понимание того, как Google технически реализует быструю сортировку.

Термины и определения

Index Entry (Запись индекса): Структура данных в индексе, соответствующая определенному ресурсу (документу). Содержит Resource ID и связанные Sort Keys.
Order-preserving bijection (Биекция, сохраняющая порядок): Математическая функция для преобразования различных типов данных (строки, числа с плавающей запятой, даты) в унифицированный бинарный формат (например, целое число без знака) таким образом, чтобы сохранялся исходный порядок сортировки. Это позволяет применять битовый поиск ко всем типам данных.
Predetermined Threshold (Предопределенный порог): Целевое количество результатов (Топ-N), которое система стремится найти (например, 10).
Restrict Criterion (Критерий ограничения): Параметр поиска, реализованный как битовый префикс (строка бинарных цифр, например, "110"). Используется для фильтрации Sort Key Values. Система итеративно корректирует этот критерий.
Sort Key (Ключ сортировки): Индексированный атрибут ресурса, по которому производится сортировка. Примеры: оценка качества (Quality Score), дата публикации, размер файла, Ranking Score.
Sort Key Value (Значение ключа сортировки): Конкретное значение Sort Key для данного ресурса, преобразованное в бинарный формат с помощью Order-preserving bijection.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс поиска.

Система хранит индекс, где каждая запись имеет Sort Key и Sort Key Value.
Получается запрос.
Получается первый Restrict Criterion (битовый префикс), используемый как параметр поиска по Sort Key Values.
Определяется первое количество (first count) записей, которые релевантны запросу И чьи Sort Key Values удовлетворяют критерию.
Проверяется, удовлетворяет ли это количество Predetermined Threshold.
Если ДА, набор записей извлекается, генерируются результаты поиска и предоставляются пользователю.

Claim 2 (Зависимый от 1): Описывает логику обработки ситуации "Слишком много результатов" (Refinement).

Если первое количество превышает порог, система модифицирует Restrict Criterion путем увеличения его битовой длины (increasing a bit-length) на один или более битов (например, с "1" на "11").
Определяется обновленное количество результатов.
Если оно все еще превышает порог, процесс итеративно повторяется с дальнейшим увеличением длины префикса для сужения поиска.

Claim 3 (Зависимый от 1): Описывает логику обработки ситуации "Слишком мало результатов" (Relaxation).

Если первое количество меньше порога, система модифицирует Restrict Criterion путем уменьшения на единицу бинарного значения префикса (decrementing by one a bit-level prefix) (например, с "111" на "110").
Определяется обновленное количество результатов в новом диапазоне.
Если общее количество все еще меньше порога, процесс итеративно повторяется с дальнейшим уменьшением значения префикса.

Claim 6 (Зависимый от 1): Описывает использование нескольких порядков сортировки (Multiple Sort Orders / Tie-breaking).

Если количество результатов превышает порог (например, из-за множества документов с одинаковым значением первого Sort Key), система вводит второй Sort Key и второй Restrict Criterion.
Определяется количество результатов, удовлетворяющих обоим критериям.
При необходимости может быть введен третий ключ и критерий.

Где и как применяется

Изобретение является инфраструктурным и затрагивает этапы индексирования и ранжирования (в части извлечения данных).

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит подготовка данных. Система рассчитывает или извлекает атрибуты ресурсов (Sort Keys), такие как оценки качества, даты, размеры. Эти значения преобразуются с помощью Order-preserving bijections в бинарный формат (Sort Key Values) и сохраняются в Index Entries.

RANKING – Ранжирование (Этап Retrieval / Отбор кандидатов L1/L2)
Это основная область применения. Когда система определила широкий набор релевантных документов, ей необходимо эффективно извлечь Топ-N из этого набора, отсортированных по нужному Sort Key (например, по итоговому Ranking Score или дате). Вместо полной сортировки всех кандидатов активируется описанный механизм итеративного битового поиска.

Входные данные:

Запрос пользователя и его признаки (определяющие порядок сортировки).
Начальный набор релевантных Index Entries.
Sort Key Values для этих записей.
Predetermined Threshold (N).

Выходные данные:

Набор из Топ-N Index Entries, отсортированных в соответствии с запрошенным порядком.

На что влияет

Специфические запросы: Наибольшее влияние на эффективность обработки запросов, требующих четкой сортировки. Это включает запросы, чувствительные к свежести (QDF – Query Deserves Freshness), где Sort Key — это дата, или запросы в специализированных вертикалях (например, сортировка товаров по цене).
Эффективность системы: Влияет на скорость ответа поисковой системы и потребление вычислительных ресурсов.

Когда применяется

Условия работы алгоритма: Применяется, когда необходимо извлечь ограниченное количество результатов (Топ-N), отсортированных по определенному Sort Key, из значительно большего набора релевантных документов.
Триггеры активации: Определение системой необходимости сортировки результатов по специфическому атрибуту или использование стандартной сортировки по Ranking Score на этапе отбора кандидатов.

Пошаговый алгоритм

Основной итеративный процесс извлечения Топ-N

Инициализация: Система получает запрос, определяет начальный набор релевантных записей индекса. Определяется требуемый Sort Key (например, Качество) и Predetermined Threshold (N).
Получение критерия ограничения: Выбирается начальный Restrict Criterion (битовый префикс, например, "111" для наивысшего качества).
Подсчет результатов: Система определяет количество записей в начальном наборе, чьи Sort Key Values начинаются с данного префикса.
Проверка порога: Количество сравнивается с порогом N.
Принятие решения и Итерация:
- Результат (Satisfied): Если количество удовлетворяет порогу, процесс завершается (Шаг 6).
- Слишком много (Too Many / Refinement): Если количество > N, система модифицирует Restrict Criterion, увеличивая его битовую длину (например, "111" -> "1111"). Возврат к шагу 3.
- Слишком мало (Too Few / Relaxation): Если количество < N, система сохраняет результаты. Модифицирует Restrict Criterion, уменьшая его битовое значение (например, "111" -> "110"). Возврат к шагу 3.
Завершение и выдача: Система формирует набор результатов поиска.

Оптимизации и особые случаи:

Обработка связей (Ties): Если значения Sort Key первого и N-го результата в текущем наборе "существенно схожи", итерации могут быть прекращены.
Множественные ключи: Если результатов слишком много из-за связей по первому ключу, вводится второй Sort Key и процесс повторяется с учетом обоих критериев.
Исчерпание (Exhaustion): Если найдены все оставшиеся релевантные документы, система выбирает лучший Топ-N из них и прекращает итерации.

Какие данные и как использует

Данные на входе

Патент фокусируется на инфраструктуре и использует предварительно обработанные данные. Он не анализирует сырые SEO-факторы, а оперирует Sort Keys.

Системные данные (Предварительно рассчитанные метрики): Основными данными являются Sort Key Values. Это могут быть любые сортируемые атрибуты, рассчитанные на этапе индексирования. В патенте упоминаются примеры:
- Оценка качества ресурса (quality of the resource).
- Временные факторы (creation time, дата получения).
- Технические факторы (size of a resource).

Какие метрики используются и как они считаются

Преобразование данных: Система использует Order-preserving bijections для конвертации различных типов данных (floating point, double, signed/unsigned integer, character string) в унифицированный бинарный формат.
Restrict Criterion: Битовый префикс, используемый для фильтрации. Модифицируется путем изменения длины или значения.
Predetermined Threshold (N): Пороговое значение для управления итеративным процессом.
Алгоритмы поиска: Упоминается возможность использования алгоритма бинарного поиска (binary search algorithm) для эффективного поиска Sort Key Values на основе Restrict Criterion.

Фокус на эффективности извлечения, а не на ранжировании: Патент описывает инфраструктурный механизм оптимизации производительности (Retrieval). Он не определяет, как рассчитываются факторы ранжирования (Sort Keys), но объясняет, как система быстро находит документы с наивысшими значениями этих факторов.
Итеративный битовый поиск вместо полной сортировки: Ключевая инновация — избегание ресурсоемкой сортировки большого количества кандидатов за счет итеративного уточнения диапазона поиска с помощью битовых префиксов (Restrict Criterion).
Универсальность и гибкость сортировки: Механизм универсален и может применяться к любому атрибуту, конвертированному в Sort Key Value (качество, дата, размер и т.д.), благодаря использованию Order-preserving bijections.
Поддержка сложных сценариев сортировки: Система способна эффективно обрабатывать сортировку по нескольким критериям (Multiple Sort Orders) для разрешения ничьих (tie-breaking) или выполнения сложных запросов.
Зависимость от предварительных вычислений: Эффективность механизма зависит от наличия предварительно рассчитанных и проиндексированных в нужном формате Sort Key Values.

Best practices (это мы делаем)

Патент является инфраструктурным и не дает прямых рекомендаций по SEO-оптимизации контента. Однако он подчеркивает важность точности тех данных, которые могут использоваться как Sort Keys.

Обеспечение точности временных меток: Поскольку дата и время являются ключевыми примерами Sort Keys, этот механизм позволяет Google эффективно сортировать контент по свежести (QDF). Убедитесь, что даты публикации и обновления (в Schema.org, Sitemaps и на странице) точны и доступны для индексации.
Использование четких структурированных данных: Для E-commerce и контентных сайтов важно предоставлять точные данные об атрибутах (цена, рейтинг) через микроразметку. Это гарантирует, что система сможет корректно интерпретировать эти данные как Sort Keys и использовать их при запросах с соответствующей сортировкой.
Фокус на максимизации ранжирующих метрик: Стратегически важно фокусироваться на улучшении факторов, которые формируют основные Sort Keys (релевантность, E-E-A-T, качество). Этот механизм гарантирует, что если ваш сайт имеет наивысшие оценки, он будет эффективно и быстро найден системой.

Worst practices (это делать не надо)

Патент не направлен против конкретных SEO-тактик, но можно сделать косвенный вывод:

Манипуляция временными метками: Искусственное обновление дат без существенного изменения контента. Хотя этот конкретный механизм просто отсортирует контент по предоставленным датам, другие системы Google могут выявить такие манипуляции и понизить общую оценку качества, что приведет к снижению значений основных Sort Keys.

Стратегическое значение

Стратегическое значение патента заключается в понимании инфраструктурных возможностей Google. Он демонстрирует, насколько важна скорость и эффективность на этапе извлечения данных. Это подтверждает, что система технически способна мгновенно применять сортировку по качеству, авторитетности или свежести к любому набору результатов. Для SEO это означает, что техническая чистота и точность метаданных остаются важными для корректной обработки контента.

Практические примеры

Практических примеров применения в SEO-работе нет. Ниже приведен пример того, как система может работать внутри Google.

Сценарий: Эффективное извлечение Топ-10 результатов по Quality Score

Задача: Найти 10 лучших результатов (N=10). Sort Key = Quality Score (представлен 3 битами, от 000 до 111).

Инициализация: Система идентифицирует 100,000 релевантных документов. Начальный Restrict Criterion = "1" (поиск высоких оценок).
Итерация 1: Поиск по префиксу "1". Найдено 50,000 документов. (Слишком много).
Итерация 2 (Refinement): Увеличение длины префикса. Новый критерий = "11". Найдено 25,000 документов. (Слишком много).
Итерация 3 (Refinement): Увеличение длины префикса. Новый критерий = "111". Найдено 3 документа. (Слишком мало).
Итерация 4 (Relaxation): Система сохраняет 3 документа. Осталось найти 7. Уменьшение значения префикса. Новый критерий = "110".
Итерация 5: Поиск по префиксу "110". Найдено 15 документов. (Удовлетворяет порогу).
Результат: Система выбирает Топ-7 из последних 15 и объединяет с первыми 3. Топ-10 сформирован за 5 итераций без полного сканирования 100,000 документов.

Влияет ли этот патент на то, как Google рассчитывает Quality Score или другие факторы ранжирования?

Нет, этот патент не описывает расчет ранжирующих оценок. Он описывает исключительно инфраструктурный механизм для эффективного извлечения (Retrieval) документов, которые уже имеют рассчитанные оценки (Sort Key Values). Патент решает задачу быстрого поиска Топ-N документов с наивысшими оценками.

Что такое Sort Key на практике?

Sort Key — это любой атрибут документа, по которому Google может сортировать результаты. В веб-поиске это может быть итоговая оценка ранжирования (Ranking Score), оценка качества страницы, PageRank, дата публикации (для сортировки по свежести) или цена товара. Для работы механизма эти атрибуты должны быть проиндексированы.

Что такое Restrict Criterion и как он используется?

Restrict Criterion — это битовый префикс. Система преобразует все оценки (Sort Key Values) в бинарный формат. Restrict Criterion используется как фильтр для выбора диапазона значений. Изменяя этот префикс (удлиняя его или меняя значение), система итеративно сужает или расширяет поиск, чтобы быстро найти нужное количество результатов.

Почему Google использует этот итеративный метод вместо полной сортировки?

Ради скорости и эффективности. Запрос может вернуть миллионы релевантных документов. Полная сортировка такого объема данных в реальном времени слишком медленная и ресурсоемкая. Итеративная фильтрация позволяет найти Топ-N результатов значительно быстрее, пропуская нерелевантные диапазоны.

Как система обрабатывает ситуации, когда множество документов имеют одинаковый ранг (ничья)?

Патент предусматривает механизм использования нескольких порядков сортировки (Claim 6). Если по первому критерию (например, качеству) найдено слишком много документов с одинаковой оценкой, система может ввести второй Sort Key (например, дату) для разрешения ничьи и дальнейшей сортировки этой группы.

Могу ли я как SEO-специалист оптимизировать сайт под этот алгоритм?

Оптимизировать под сам алгоритм извлечения данных невозможно. Однако можно гарантировать, что атрибуты вашего сайта, которые могут использоваться как Sort Keys (даты, цены, рейтинги), точны и хорошо структурированы (Schema.org). Это обеспечит корректное позиционирование сайта при активации соответствующих порядков сортировки.

Что такое "Биекция, сохраняющая порядок" (Order-preserving bijection)?

Это способ преобразования различных типов данных (например, текста или дат) в унифицированный битовый формат таким образом, чтобы сохранить их естественный порядок сортировки. Например, более поздняя дата должна иметь большее бинарное значение, чем ранняя. Это необходимо для корректной работы механизма битовых префиксов.

На каком этапе поиска работает этот алгоритм?

Он работает на этапе Ранжирования (RANKING), конкретно во время извлечения кандидатов (Retrieval, L1/L2). Его задача — быстро сократить большой набор потенциально релевантных документов до небольшого Топ-N, отсортированного по заданному критерию.

Что происходит, если система находит "слишком много" результатов на одном из шагов?

Если количество результатов превышает порог, система ужесточает Restrict Criterion. Это достигается путем увеличения длины бинарного префикса (Claim 2). Например, если по критерию "1" найдено слишком много, система попробует "11". Это сужает диапазон поиска.

Что происходит, если система находит "слишком мало" результатов?

Если количество результатов меньше порога, система сохраняет найденные результаты и корректирует Restrict Criterion, чтобы захватить следующий диапазон значений. Это достигается путем уменьшения бинарного значения префикса (Claim 3). Например, если по критерию "111" найдено мало, система попробует "110".

Как Google оптимизирует инфраструктуру своего индекса для ускорения поиска подстрок и фраз

Этот патент описывает инфраструктурную оптимизацию поискового индекса Google. В нем представлена «гибридная структура данных», которая ускоряет извлечение информации (например, местоположение фраз в документах) путем объединения бинарных деревьев с таблицами поиска и использования высокоэффективных методов сортировки. Это делает поиск быстрее, но не влияет на алгоритмы ранжирования.

US8856138B1
2014-10-07

Индексация

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске

Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.

US8965875B1
2015-02-24

Поведенческие сигналы
Семантика и интент
EEAT и качество

Как Google использует многоэтапное ранжирование и автоматическое расширение запросов для повышения релевантности выдачи

Google использует многоэтапную систему ранжирования для эффективной оценки сложных сигналов, таких как близость терминов, атрибуты (заголовки, шрифты) и контекст. Система также автоматически анализирует топовые результаты, чтобы найти дополнительные термины для расширения исходного запроса (Relevance Feedback), улучшая релевантность в последующих итерациях поиска.

US8407239B2
2013-03-26

Семантика и интент

Как Google использует фразовую индексацию и многоуровневую архитектуру (Primary/Secondary Index) для масштабирования поиска и определения тематической релевантности

Google использует архитектуру множественных индексов (Primary и Secondary) для эффективной индексации миллиардов документов на основе фраз. Система определяет связанные фразы с помощью показателя Information Gain и использует эти данные для ранжирования. Primary Index хранит только наиболее релевантные документы в порядке ранжирования, в то время как Secondary Index хранит остальные, оптимизируя хранение и скорость.

US7567959B2
2009-07-28

Индексация
Семантика и интент

Как Google оптимизирует обработку регулярных выражений и дорогих повторяющихся запросов в специализированных системах

Патент описывает инфраструктурные оптимизации для поисковых систем, в частности, для поиска по исходному коду. Он включает два основных механизма: 1) Кэширование результатов для дорогих повторяющихся запросов с обновлением кэша в реальном времени во время индексации. 2) Высокоэффективное префильтрование запросов с регулярными выражениями (regex) с помощью суффиксных массивов и обратного обхода автоматов.

US20150161266A1
2015-06-11

Индексация

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства

Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.

US8868592B1
2014-10-21

Персонализация
Поведенческие сигналы
Local SEO

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска

Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.

US8996514B1
2015-03-31

Техническое SEO
Ссылки

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов

Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.

US9268820B2
2016-02-23

Knowledge Graph
SERP
Семантика и интент

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)

Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.

US9165040B1
2015-10-20

Ссылки
EEAT и качество
Антиспам

Как Google автоматически генерирует блоки "Связанные ссылки" и "Похожие запросы", анализируя контент страницы при загрузке

Патент описывает систему для динамической генерации виджетов связанных ссылок. При загрузке страницы система извлекает текст (заголовок, контент, запрос из реферера), определяет наиболее важные ключевые слова с помощью глобального репозитория (Keyword Repository), выполняет поиск по этим словам (часто в пределах того же домена) и отображает топовые результаты для улучшения навигации.

US9129009B2
2015-09-08

Ссылки
Семантика и интент
Техническое SEO

Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц

Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.

US9081832B2
2015-07-14

Ссылки
SERP
Свежесть контента

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи

Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.

US10579687B2
2020-03-03

SERP
Семантика и интент
Ссылки

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов

Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.

US20190278836A1
2019-09-12

Семантика и интент
Персонализация
EEAT и качество

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов

Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.

US20140372873A1
2014-12-18

Структура сайта
Техническое SEO
Ссылки

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки

Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.

US8442984B1
2013-05-14

SERP
EEAT и качество
Поведенческие сигналы