Как Google строит и динамически обновляет индекс на основе тем и векторных представлений для семантического поиска

SYSTEM AND METHOD FOR INDEXING DOCUMENTS (Система и метод индексирования документов)

US8756236B1
Google LLC
2012-01-31
2014-06-17

Google индексирует документы, присваивая им семантическую "сигнатуру" — вектор, состоящий из абстрактных тем (Topics) и весов (Weights), определяющих их значимость. Патент описывает инфраструктуру для эффективного обновления этого тематического индекса при изменении контента или обновлении моделей NLP Google. Система использует эти векторы для быстрого определения схожести контента через Cosine Similarity.

Какую проблему решает

Патент решает инфраструктурную задачу эффективного построения и динамического обновления поискового индекса, основанного на семантических темах (Topics), а не только на ключевых словах. Цель — обеспечить быструю и точную актуализацию индекса при изменениях в контенте или в алгоритмах его анализа (NLP моделях), что критично для выполнения вычислительно трудоемких операций, таких как определение тематической схожести документов в огромных базах данных.

Что запатентовано

Запатентован метод инкрементального обновления тематического индекса (Topics Index). Система генерирует для документа Document Signature — вектор тем и соответствующих весов. Ключевым элементом является механизм реагирования на Triggering Event (например, изменение контента или обновление моделей NLP): система генерирует новую сигнатуру и эффективно обновляет индекс, основываясь только на разнице (дельте) между старой и новой сигнатурами.

Как это работает

Система функционирует в несколько этапов:

Анализ контента (NLP): Текст документа обрабатывается для определения связанных с ним абстрактных тем (Topics) и весов (Weights), показывающих силу связи. Это формирует Document Signature (вектор).
Индексирование: Создается Topics Index, который связывает каждую тему со списком релевантных документов.
Инкрементальное обновление: При возникновении Triggering Event, сигнатура пересчитывается. Система сравнивает старую и новую сигнатуры и точечно обновляет индекс (добавляет новые связи, удаляет устаревшие).
Применение: Описанная инфраструктура используется для быстрого поиска тематически похожих документов путем расчета Cosine Similarity между их векторными сигнатурами.

Актуальность для SEO

Высокая. Переход к индексированию на основе сущностей, тем и векторов (Entity-First Indexing, Vector Search) является фундаментом современного поиска Google (BERT, MUM). Этот патент описывает базовую инфраструктуру для управления таким семантическим индексом и поддержания его актуальности, что критически важно в 2025 году.

Важность для SEO

Патент имеет высокое стратегическое значение (80/100). Хотя он описывает внутреннюю инфраструктуру, он подтверждает фундаментальный сдвиг в сторону тематического и векторного понимания контента. Он демонстрирует, что Google рассматривает документы как векторы тем и весов. Это подчеркивает критическую важность создания контента с глубоким тематическим фокусом (Topical Authority) и необходимость адаптации к эволюции моделей NLP Google.

Термины и определения

Cosine Similarity (Косинусное сходство): Метрика для определения схожести двух документов. Рассчитывается как нормализованное скалярное произведение (dot product) векторов тематических весов (Document Signatures). Значение (например, от 0 до 1) показывает, насколько похожи тематические профили документов.
Document Signature (Сигнатура документа): Векторное представление документа. Включает список тем (Topics), связанных с документом, и вес (Weight) для каждой темы.
Natural Language Processing (NLP): Технологии обработки естественного языка, используемые для анализа текста и генерации Topics и Weights.
Topics (Темы): Абстрактные идеи или концепции, представляющие содержание документа. Генерируются с помощью NLP. Патент указывает, что тема может не присутствовать в тексте документа дословно (verbatim).
Topics Index (Тематический индекс): Структура данных (например, инвертированный индекс), которая содержит список тем и для каждой темы — ссылки на документы, связанные с ней. Используется для быстрого поиска документов по теме.
Triggering Event (Триггерное событие): Событие, которое инициирует пересчет Document Signature и обновление индекса. Примеры: изменение контента документа, изменение мастер-списка доступных тем (обновление онтологии или моделей NLP), или срабатывание таймера.
Weight (Вес / Topic Weight / Confidence Score): Числовое значение (например, от 0 до 1.0), представляющее, насколько сильно тема связана с документом или уверенность системы в этой связи. Сумма весов всех тем документа может равняться 1.0 (100%).

Ключевые утверждения (Анализ Claims)

Патент защищает механизм эффективного инкрементального обновления тематического индекса.

Claim 1 (Независимый пункт): Описывает метод индексирования с динамическим обновлением.

Система получает первый набор тем и весов для документа (Первая сигнатура).
Генерируется первое обновление индекса: вставляются ссылки на документ для каждой темы из первого набора.
Позже система получает второй набор тем и весов для того же документа (Вторая сигнатура).
Генерируется второе обновление индекса, которое включает:
1. Вставку ссылок на документ для тем, которые есть во втором наборе, но отсутствуют в первом (Новые темы).
2. Удаление ссылок на документ для тем, которые есть в первом наборе, но отсутствуют во втором (Устаревшие темы).
Указано, что второй набор генерируется в ответ на Triggering Event.

Ядром изобретения является обновление индекса на основе дельты (разницы) между сигнатурами, что эффективнее полной переиндексации.

Claims 2, 3, 4 (Зависимые): Детализируют природу Triggering Event.

Claim 2: Изменения, внесенные в документ (обновление контента).
Claim 3: Изменения в списке тем, из которого выбираются темы (обновление онтологии или моделей NLP Google).
Claim 4: Наступление предопределенного времени или интервала (периодическая переоценка).

Эти пункты критически важны, так как показывают, что тематическая оценка документа может измениться даже без изменения контента на сайте, если Google обновит свои алгоритмы понимания языка.

Claim 7 (Зависимый): Утверждает, что тема не обязательно должна присутствовать в тексте документа дословно (verbatim). Это подтверждает использование абстрактного семантического анализа.

Где и как применяется

Изобретение является частью инфраструктуры управления данными и применяется на этапе обработки контента.

CRAWLING – Сканирование и Сбор данных
Система обнаруживает изменения в документе (Triggering Event по Claim 2) или получает команду на пересканирование, что инициирует передачу контента на индексирование.

INDEXING – Индексирование и извлечение признаков
Основной этап применения патента.

Анализ (NLP): Система анализирует текст для генерации Document Signature (тем и весов).
Управление индексом: Система строит и хранит Topics Index.
Обновление: При получении новой сигнатуры (в ответ на любой Triggering Event) система выполняет эффективное инкрементальное обновление индекса (добавление/удаление связей), как описано в Claim 1.

RANKING (L1 - Retrieval) – Ранжирование (Отбор кандидатов)
Созданный Topics Index может использоваться на этапе отбора кандидатов (L1) для быстрого поиска документов, релевантных теме. Также описанный механизм расчета схожести (Cosine Similarity) используется для кластеризации контента, обеспечения разнообразия (Diversity) или как сигнал для определения тематически похожих документов.

Входные данные:

Текст документа.
Существующий Topics Index.
Предыдущая Document Signature (если есть).
Модели NLP / Мастер-список тем (онтология).

Выходные данные:

Новая Document Signature.
Обновленный Topics Index.

На что влияет

Все типы контента: Применимо к любому контенту, который может быть представлен в текстовом виде (веб-страницы, документы, транскрипты видео/аудио).
Скорость и точность обновления индекса: Механизм повышает эффективность отражения изменений контента или изменений в понимании этого контента поисковой системой.
Семантический анализ: Инфраструктура позволяет системе анализировать контент на уровне тем и векторов, что влияет на понимание тематической авторитетности и релевантности.

Когда применяется

Алгоритм применяется в следующих случаях:

Первичное индексирование: Когда документ впервые анализируется.
Повторное индексирование (Triggering Events):
- Когда контент документа изменяется (Claim 2).
- Когда Google обновляет свои модели NLP или онтологию (Claim 3).
- Периодически по расписанию (Claim 4).

Пошаговый алгоритм

Процесс А: Инкрементальное обновление индекса (Основной процесс патента)

Мониторинг: Система отслеживает Triggering Events.
Получение текста: При срабатывании триггера система получает актуальный текст документа.
Генерация новой сигнатуры: Текст обрабатывается NLP для создания нового набора тем и весов (New Signature).
Сравнение сигнатур: Система сравнивает New Signature с предыдущей сигнатурой (Old Signature).
Идентификация дельты:
1. Определяются Добавленные темы (есть в New, нет в Old).
2. Определяются Удаленные темы (есть в Old, нет в New).
Обновление индекса (Topics Index):
1. Для Добавленных тем в индекс вставляется ссылка на документ.
2. Для Удаленных тем из индекса удаляется ссылка на документ.
Хранение: New Signature сохраняется как актуальная сигнатура документа.

Процесс Б: Поиск похожих документов (Use Case, описанный в патенте)

Выбор исходного документа (S): Определяется документ, для которого нужно найти похожие.
Получение сигнатуры: Извлекается Document Signature исходного документа.
Поиск кандидатов (D): Используя Topics Index, система быстро находит все другие документы, которые имеют хотя бы одну общую тему с S. (Это значительно сокращает пространство поиска).
Расчет схожести: Для каждого документа-кандидата (D) рассчитывается Cosine Similarity между его вектором и вектором S.
Фильтрация и ранжирование: Документы сортируются по показателю схожести. Отбираются Топ-N документов или документы, превысившие пороговое значение.

Какие данные и как использует

Данные на входе

Контентные факторы: Весь текст документа является основным входным данными для модуля NLP. Структура, семантика и полнота текста определяют итоговую Document Signature (темы и веса).
Технические факторы: Данные о модификации документа (например, дата изменения или обнаружение изменений при краулинге) используются как Triggering Event.

Какие метрики используются и как они считаются

Weight (Вес темы): Метрика, определяющая силу связи темы с документом. Рассчитывается с помощью NLP. Может представлять собой показатель уверенности (Confidence Score). Патент упоминает, что сумма весов может быть нормализована до 1.0 (100%).
Document Signature (Вектор): Агрегированное представление документа как вектора тем и весов. Например, [Тема А: 0.7, Тема Б: 0.3].
Cosine Similarity (Косинусное сходство): Метрика для сравнения двух документов (S и D) на основе их тематических векторов. Рассчитывается по формуле:

$Sim(S,D) = cosine\theta = \frac{S \cdot D}{||S|| ||D||}$

Подтверждение тематического и векторного индексирования: Патент демонстрирует инфраструктуру, основанную на понимании контента через призму абстрактных тем (Topics). Документы представляются в виде семантических векторов (Document Signatures).
Абстрактность тем (Claim 7): Темы генерируются с помощью NLP и могут не присутствовать в тексте дословно. Это указывает на способность системы понимать смысл, выходящий за рамки буквального совпадения терминов.
Динамическая переоценка контента: Ключевой механизм патента — эффективное инкрементальное обновление индекса. Система спроектирована для постоянной переоценки семантики документа.
Влияние обновлений Google как триггера (Claim 3): Переоценка происходит не только при изменении контента, но и при обновлении собственных алгоритмов Google (моделей NLP или онтологий). Это объясняет, почему ранжирование может меняться во время Core Updates, даже если контент на сайте не менялся.
Схожесть через векторный анализ: Использование Cosine Similarity для определения схожести документов подтверждает применение методов векторного поиска для анализа тематической близости контента.

Best practices (это мы делаем)

Фокус на глубину и четкость темы (Topical Depth): Контент должен быть четко сфокусирован и всесторонне раскрывать тему. Цель — добиться того, чтобы система NLP присвоила целевым темам максимальные веса (Weights) в Document Signature страницы.
Семантическое обогащение контента: Использовать разнообразную лексику, связанные сущности и концепции, чтобы помочь моделям NLP корректно идентифицировать абстрактные Topics. Это увеличивает Confidence Score (вес) нужной темы.
Существенное обновление контента: Изменение контента является явным Triggering Event (Claim 2). Чтобы гарантировать переоценку тематической сигнатуры страницы, обновления должны быть существенными и изменять семантику или глубину раскрытия темы, а не быть косметическими.
Мониторинг изменений в понимании ниши: Так как обновление моделей Google также является триггером (Claim 3), необходимо следить за тем, как Google интерпретирует запросы и кластеризует контент в вашей нише (SERP analysis). Адаптируйте контент под обновленное понимание тематики поисковой системой.
Оптимизация внутренней перелинковки на основе тематической схожести: Используйте принципы Cosine Similarity для построения внутренней перелинковки. Связывайте документы, которые имеют схожие тематические векторы, чтобы усилить тематическую связанность сайта.

Worst practices (это делать не надо)

Поверхностный контент и "размытие" темы: Создание контента, который затрагивает слишком много тем поверхностно, приведет к формированию сигнатуры с низкими весами по многим темам. Это затруднит ранжирование по конкретным тематикам и снизит показатели Cosine Similarity с целевыми тематическими кластерами.
Использование только ключевых слов (Keyword Stuffing): Поскольку темы являются абстрактными (Claim 7), оптимизация под буквальное вхождение ключевых слов неэффективна для влияния на Document Signature. Система оценивает смысл, а не плотность терминов.
"Опубликовал и забыл": Полагаться на то, что однажды созданный контент будет всегда ранжироваться одинаково. Патент явно указывает, что изменения в моделях Google (Claim 3) или периодическая переоценка (Claim 4) могут изменить сигнатуру документа.

Стратегическое значение

Этот патент подтверждает стратегию Google по переходу к семантическому и векторному поиску. Инфраструктура, описанная в патенте, является основой для Entity-First Indexing. Для SEO-специалистов это означает, что долгосрочная стратегия должна фокусироваться на построении тематической авторитетности (Topical Authority) путем создания кластеров контента, которые демонстрируют глубокое понимание тем. Понимание того, что документы представлены как векторы тем, помогает интерпретировать работу современных алгоритмов ранжирования.

Практические примеры

Сценарий 1: Обновление контента для улучшения тематического фокуса (Triggering Event по Claim 2)

Ситуация: Статья "Уход за кактусами" ранжируется низко. Предполагаемая Document Signature: ["Комнатные растения": 0.6, "Садоводство": 0.3, "Декор": 0.1].
Действие: SEO-специалист существенно обновляет статью, добавляя разделы про "Суккуленты", "Адаптацию к засухе", "Виды почв для пустынных растений" и удаляя общие советы по декору.
Результат (по патенту): Обновление контента срабатывает как Triggering Event. Система генерирует новую Document Signature: ["Уход за суккулентами": 0.7, "Ботаника пустынных растений": 0.2, "Комнатные растения": 0.1]. Индекс инкрементально обновляется. Обновленный вектор имеет более высокое Cosine Similarity с целевыми тематическими запросами.

Сценарий 2: Влияние обновления алгоритмов Google (Triggering Event по Claim 3)

Ситуация: Медицинский сайт стабильно ранжируется по запросам о лечении диабета. Контент не меняется.
Событие: Происходит Google Core Update, включающий обновление моделей NLP для лучшего понимания медицинской терминологии и актуальных методов лечения.
Результат (по патенту): Обновление моделей является Triggering Event (Claim 3). Все страницы сайта переоцениваются. Если контент использовал устаревшие методы лечения, его Document Signature изменится. Веса по темам, связанным с актуальной медициной, снизятся. Ссылки на документ удаляются из индекса по ключевым актуальным темам, что приводит к падению трафика, несмотря на отсутствие изменений на сайте.

Чем "Темы" (Topics) в этом патенте отличаются от ключевых слов?

Ключевые слова — это конкретные термины в тексте. Темы (Topics) — это абстрактные концепции, генерируемые с помощью NLP. Патент прямо указывает (Claim 7), что тема может не присутствовать в документе дословно. Например, текст, содержащий слова "автомобиль", "самолет" и "лодка", может быть ассоциирован с темой "Транспортные средства" без упоминания этого термина.

Что такое "Сигнатура документа" (Document Signature) и как она связана с векторным поиском?

Document Signature — это тематический профиль документа: список тем и их весов (например, [Тема А: 70%, Тема Б: 30%]). Это фактически является вектором документа в семантическом пространстве. Патент напрямую связан с векторным поиском, так как описывает использование Cosine Similarity — стандартного метода для определения близости между двумя такими векторами.

Что такое Triggering Event и почему он важен для SEO?

Triggering Event — это событие, которое запускает переоценку документа и обновление его сигнатуры. Это может быть обновление контента (Claim 2), обновление алгоритмов Google (Claim 3) или периодическая проверка (Claim 4). Для SEO это критически важно, так как подчеркивает необходимость актуализации контента и объясняет изменения видимости во время апдейтов Google, даже если сайт не менялся.

Может ли представление моего документа в индексе измениться, если я не менял контент?

Да. Согласно Claim 3, если Google обновляет свои модели NLP или мастер-список тем (онтологию), это является Triggering Event. Ваш контент будет переоценен с использованием новых моделей, что может привести к изменению Document Signature и, как следствие, позиций в выдаче.

Как часто Google пересчитывает тематическую сигнатуру документа?

Патент не указывает точные интервалы, но перечисляет условия для пересчета: при любом изменении контента, при обновлении алгоритмов Google или периодически по расписанию. Система спроектирована для эффективного и постоянного поддержания актуальности индекса.

Что делать, чтобы у моей страницы был высокий вес (Weight) по нужной теме?

Необходимо убедить NLP-модуль Google в том, что ваш контент глубоко раскрывает эту тему. Это достигается за счет использования релевантной терминологии, освещения подтем, использования связанных сущностей и обеспечения четкой структуры контента. Глубина и качество контента (E-E-A-T) играют ключевую роль в формировании высокого веса.

Как использовать знание о Cosine Similarity в SEO?

Понимание Cosine Similarity помогает понять, как Google определяет тематически похожий контент. Чтобы ваш контент считался релевантным запросу или кластеру авторитетных документов, он должен иметь схожий тематический вектор (сигнатуру). Это подчеркивает важность анализа семантики топовых конкурентов и обеспечения покрытия тех же тем с аналогичной или большей глубиной.

Влияет ли этот механизм на скорость попадания обновлений в индекс?

Да, патент направлен на повышение эффективности этого процесса. Благодаря инкрементальному обновлению, система обновляет только те части индекса, которые изменились (дельту между старой и новой сигнатурой), вместо полной переиндексации. Это позволяет быстрее отражать изменения тематики документа в индексе.

Стоит ли часто вносить небольшие изменения в контент, чтобы активировать Triggering Event?

Внесение незначительных изменений (например, исправление опечаток) может вызвать пересканирование, но маловероятно, что это приведет к существенному изменению Document Signature. Для реального влияния на тематическую оценку необходимы существенные обновления, которые меняют глубину или фокус раскрытия темы.

Может ли документ быть связан с несколькими темами одновременно?

Да, Document Signature состоит из набора тем и их весов. Документ может быть на 70% связан с Темой А и на 30% с Темой Б. Это позволяет системе понимать сложные документы, охватывающие несколько областей знаний, и определять основной фокус контента.

Как Google вычисляет семантическую схожесть контента с помощью векторов тем и косинусного сходства

Google использует механизм для эффективного определения семантической схожести документов. Система генерирует «Сигнатуру Документа» — вектор, состоящий из абстрактных тем (Topics) и весов (Weights), показывающих значимость каждой темы. Схожесть вычисляется путем сравнения этих векторов с использованием Косинусного Сходства (Cosine Similarity), что позволяет системе понимать тематические взаимосвязи в масштабе.

US8886648B1
2014-11-11

Семантика и интент
Индексация

Как Google использует тематические векторы, косинусное сходство и анализ когезии кластеров для автоматической классификации контента

Патент Google, описывающий технологию автоматической организации документов. Система создает тематическую сигнатуру документа (вектор тем и их весов) и сравнивает её с существующими наборами документов, используя Cosine Similarity. Затем вычисляется Оценка Уверенности на основе среднего сходства и однородности набора. Патент раскрывает фундаментальные механизмы Information Retrieval, которые Google использует для понимания семантики и оценки тематической когезии контента.

US8458194B1
2013-06-04

Семантика и интент

Как Google использует семантические сигнатуры на основе фраз для выявления и удаления дубликатов контента

Google использует механизм для обнаружения дубликатов и почти дубликатов контента. Система анализирует, какие семантически связанные фразы (related phrases) содержатся в документе. Затем она выбирает несколько ключевых предложений с наибольшей концентрацией этих фраз для создания уникальной сигнатуры документа. Если сигнатуры двух документов совпадают, они считаются дубликатами и удаляются из индекса или поисковой выдачи.

US7711679B2
2010-05-04

Семантика и интент
Индексация
SERP

Как Google определяет тематику и интент запроса, анализируя контент уже ранжирующихся страниц в выдаче

Google использует метод классификации запросов, который анализирует не сам текст запроса, а контент (URL, заголовки, сниппеты) страниц, находящихся в топе выдачи по этому запросу. Сравнивая набор терминов из этих результатов с эталонными профилями разных тематик или типов контента (Новости, Видео, Картинки), система определяет интент пользователя и решает, какие вертикали поиска активировать.

US8756218B1
2014-06-17

Семантика и интент
SERP

Как Google создает семантические векторы (эмбеддинги) для понимания смысла целых документов (Doc2Vec)

Патент описывает нейросетевой метод (известный как Doc2Vec) для преобразования документов любой длины в числовые векторы (эмбеддинги). Эти векторы фиксируют семантику и контекст всего документа, позволяя системе понимать смысл контента, классифицировать его и находить похожие документы, даже если в них используются разные слова.

US20150220833A1
2015-08-06

Семантика и интент

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами

Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.

US8819004B1
2014-08-26

Поведенческие сигналы
Мультимедиа
SERP

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов

Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.

US8762363B1
2014-06-24

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска

Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.

US20150006290A1
2015-01-01

Поведенческие сигналы
Персонализация
Local SEO

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами

Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.

US7783639B1
2010-08-24

Ссылки
Антиспам
EEAT и качество

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи

Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.

US10579687B2
2020-03-03

SERP
Семантика и интент
Ссылки

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя

Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.

US20060224583A1
2006-10-05

Персонализация
Поведенческие сигналы

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)

Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.

US9128993B2
2015-09-08

Ссылки
SERP
Индексация

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)

Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.

US9558233B1
2017-01-31

Ссылки
Поведенческие сигналы
Антиспам

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL

Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.

US20140280133A1
2014-09-18

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи

Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.

US6526440B1
2003-02-25

Ссылки
Антиспам
SERP