Как Google использует анализ сущностей в результатах поиска для подтверждения интента и продвижения авторитетного контента

METHODS, SYSTEMS, AND MEDIA FOR RANKING CONTENT ITEMS USING TOPICS (Методы, системы и медиа для ранжирования элементов контента с использованием тем)

US9213745B1
Google LLC
2013-03-15
2015-12-15

Google анализирует сущности (Topics/Entities) и их типы, общие для топовых результатов поиска, чтобы определить истинный интент запроса. Если интент подтверждается этим тематическим консенсусом выдачи, система продвигает "авторитетные кандидаты" (например, полные фильмы). Если консенсуса нет, продвижение блокируется для предотвращения показа нерелевантных результатов.

Какую проблему решает

Патент решает проблему некорректного продвижения контента на высокие позиции, основанного только на поверхностном совпадении (например, названия с запросом). Он направлен на предотвращение ситуаций, когда нерелевантный, вводящий в заблуждение или поддельный контент (например, имитация фильма или "knockoff") занимает топовые места. Цель — гарантировать, что специфические классы контента (Authoritative Result Candidates) продвигаются только тогда, когда интент пользователя действительно соответствует этому классу.

Что запатентовано

Запатентована система ранжирования, которая использует анализ сущностей (Entities, также называемых Topics) и их типов (Entity Types), связанных со всем набором результатов поиска, для подтверждения интента запроса. Система действует как гейткипер (gatekeeper): она проверяет, соответствует ли общий тематический контекст выдачи определенному классу контента (Content Class), прежде чем разрешить продвижение (promotion) авторитетных результатов этого класса.

Как это работает

Механизм активируется, когда система идентифицирует Authoritative Result Candidate (например, фильм), релевантный запросу.

Идентификация контекста: Определяется Content Class кандидата (например, Фильм) и соответствующие ему Entity Types (например, MOVIE, FILM_DIRECTOR).
Анализ интента: Система анализирует сущности всех топовых результатов поиска (SERP), чтобы понять общий контекст и определить интент запроса.
Проверка критериев: Проверяется выполнение нескольких условий: (A) присутствуют ли целевые Entity Types в других результатах поиска; (B) входят ли целевые Entity Types в число сущностей, общих для всей выдачи (консенсус SERP); (C) связан ли сам кандидат с целевыми Entity Types.
Решение: Если несколько критериев выполнены, интент считается подтвержденным, и кандидат продвигается (promoted). В противном случае продвижение блокируется (inhibited) или кандидат понижается (demoted).

Актуальность для SEO

Высокая. Понимание интента через сущности (Knowledge Graph) и анализ тематического контекста выдачи являются фундаментальными аспектами современного поиска. Этот механизм остается крайне актуальным для управления продвижением специфических форматов контента и борьбы с неоднозначностью запросов, особенно в видео-поиске и универсальном поиске.

Важность для SEO

Высокое (85/100). Патент критически важен для понимания роли сущностей и тематического авторитета. Он демонстрирует конкретный механизм, как Google использует консенсус выдачи (общие сущности топовых результатов) для валидации интента запроса. Это напрямую влияет на стратегии построения тематического авторитета и оптимизации под сущности, показывая, что для ранжирования важен не только контент страницы, но и то, как он вписывается в общий тематический ландшафт SERP.

Термины и определения

Authoritative Result Candidate (Авторитетный кандидат результата): Элемент контента определенного класса, который система потенциально хочет продвинуть на верхние позиции (например, полнометражный фильм, премиум-контент).
Content Class (Класс контента): Категория контента, к которой принадлежит Authoritative Result Candidate (например, Фильм, Телешоу, Лекция, Живое выступление).
Entity (Сущность): Темы (Topics), атрибуты, метаданные, связанные с элементом контента. Примеры включают конкретные объекты (например, фильм "В поисках Немо"), артистов, значимые концепции, Freebase entity. Сущности могут быть назначены автоматически классификатором.
Entity Histogram (Гистограмма сущностей): Распределение частоты встречаемости сущностей или типов сущностей в наборе результатов поиска. Используется для определения того, какие типы сущностей являются общими или популярными для данного запроса.
Entity Type (Тип сущности): Категория, к которой принадлежит сущность (например, MOVIE, FILM_ACTOR, MUSIC_ARTIST, FILM_DIRECTOR). Одна сущность может иметь несколько типов.
Intent Analysis (Анализ интента): Процесс определения того, ищет ли пользователь контент определенного Content Class, основанный на анализе запроса и полученных результатов поиска.
Shared Entities (Общие сущности): Сущности или атрибуты, которые являются общими для нескольких элементов контента в результатах поиска. Анализ Shared Entities помогает определить тематический консенсус выдачи.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования контента с использованием проверки интента.

Система получает запрос и генерирует результаты поиска.
Определяются Entity Types, связанные с определенным Content Class (например, Фильмы). Content Class указывает на тип медиаконтента, а Entity Types указывают на информацию, связанную с этим типом.
Система определяет, является ли запрос запросом на контент этого Content Class, основываясь на множестве критериев (plurality of criteria):
- (i) Определяется, связан ли хотя бы один из результатов поиска с этими Entity Types.
- (ii) Определяется, связаны ли Shared Entities (общие сущности) между результатами поиска с контентом, соответствующим этим Entity Types. Каждая сущность включает метаданные, указывающие как минимум на тему (topic) результата.
- (iii) Определяется, включают ли результаты поиска Authoritative Result Candidates, имеющие сущность с типом, соответствующим этим Entity Types.
В ответ на определение того, что множество критериев выполнено, система продвигает (promoting) как минимум один результат поиска, принадлежащий к этому Content Class.

Claim 5 (Зависимый от 1): Детализирует механизм анализа общих сущностей (критерий ii).

Система сравнивает Entity Types, связанные с сущностями каждого результата поиска, чтобы создать набор общих типов сущностей (set of entity types common). Затем она проверяет, включены ли целевые Entity Types в этот общий набор. Это механизм определения тематического консенсуса SERP.

Claims 7 и 8 (Зависимые от 1): Описывают действия, если критерии НЕ выполнены.

Если множество критериев не выполнено, система выполняет одно или несколько из следующих действий: блокирует включение (inhibiting... from being included) Authoritative Result Candidates или результатов данного класса в список; блокирует их продвижение (inhibiting... from being promoted); или понижает их в ранжировании (demoting). Это подтверждает, что механизм работает как фильтр для продвижения.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, извлеченные на этапе индексирования, для принятия решений о ранжировании на финальных этапах.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна извлечь и связать Entities (Topics) и Entity Types с каждым элементом контента. Упоминается использование автоматических классификаторов и Freebase entities. Эти данные сохраняются для последующего использования.

RANKING – Ранжирование
На этом этапе генерируется первичный набор результатов. Система идентифицирует потенциальные Authoritative Result Candidates в этом наборе.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента. После получения первичных результатов система проводит Intent Analysis, анализируя контекст, сформированный этими результатами (analysis of the query and the obtained search results). На основе этого анализа принимается финальное решение о продвижении, блокировке или понижении кандидатов.

Входные данные:

Поисковый запрос.
Набор результатов поиска.
Данные о сущностях (Entities) и типах сущностей (Entity Types), связанных с каждым результатом.
Определения Content Classes и соответствующих им Entity Types.

Выходные данные:

Обновленный список результатов поиска с измененным ранжированием (продвинутые или пониженные кандидаты).

На что влияет

Специфические запросы: Наибольшее влияние на запросы с неоднозначным интентом, где название может относиться к разным классам контента (например, "Cars" – фильм или автомобили).
Конкретные типы контента: Влияет на контент, который Google может классифицировать как Authoritative Result Candidate. В патенте явно упоминаются видео, фильмы (movie content item), телешоу, каналы, плейлисты, живые выступления (live performance), лекции (class lecture), аудио контент.

Когда применяется

Триггеры активации: Алгоритм активируется, когда в результатах поиска идентифицирован один или несколько Authoritative Result Candidates, принадлежащих к определенному Content Class, которые потенциально могут быть продвинуты.
Условия применения: Применяется для валидации того, действительно ли пользователь ищет этот класс контента, прежде чем применить продвижение.

Пошаговый алгоритм

Процесс обработки запроса и ранжирования контента:

Получение запроса: Система получает поисковый запрос.
Генерация результатов и идентификация кандидатов: Система получает набор результатов поиска. В этом наборе идентифицируются один или несколько Authoritative Result Candidates, принадлежащих к определенному Content Class (например, Фильм).
Определение контекста: Система определяет Entity Types, которые соответствуют этому Content Class (например, MOVIE, FILM_DIRECTOR).
Анализ интента (Intent Analysis): Система анализирует запрос и полученные результаты, чтобы определить, является ли запрос запросом на контент данного Content Class. Это включает проверку нескольких критериев:
- Критерий A (Присутствие в SERP): Определяется, связан ли хотя бы один результат из (по крайней мере части) полученных результатов поиска (например, Топ N) с целевыми Entity Types.
- Критерий B (Консенсус SERP): Определяется, имеют ли сущности, общие для результатов поиска (Shared Entities, например, Топ M общих сущностей), типы, включенные в целевые Entity Types. Может использоваться Entity Histogram.
- Критерий C (Валидация кандидата): Определяется, связан ли каждый Authoritative Result Candidate с сущностью, имеющей тип, соответствующий целевым Entity Types.
Принятие решения: Система проверяет, удовлетворяет ли анализ множеству критериев (multiple criteria) (например, выполнены ли 2 из 3 условий).
Корректировка ранжирования:
- Если ДА: Authoritative Result Candidate продвигается на определенную позицию в списке результатов (например, на самый верх). Если кандидатов несколько, они могут быть ранжированы с использованием Entity Score.
- Если НЕТ: Продвижение и/или показ Authoritative Result Candidate блокируется (inhibit), или он понижается в выдаче (demote).
Презентация: Обновленный список результатов представляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о сущностях для принятия решений о ранжировании.

Структурные факторы (Сущности): Критически важные данные. Используются Entities (Topics) и Entity Types, связанные с каждым элементом контента. Упоминаются Freebase entities, теги, назначенные пользователем (user-assigned tag), и данные, полученные с помощью автоматических классификаторов (automatic classification process).
Системные данные: Набор результатов поиска, полученный от основной поисковой системы.

Какие метрики используются и как они считаются

Система использует пороговые значения и проверки соответствия критериям для принятия решения.

Критерий A (Порог N): Проверка наличия целевых Entity Types в определенном количестве топовых результатов (Топ N).
Критерий B (Порог M): Проверка наличия целевых Entity Types среди определенного количества наиболее общих сущностей (Топ M Shared Entities).
Множественные критерии: Требование выполнения нескольких условий (например, A+B, A+C, B+C или A+B+C) для подтверждения интента.
Entity Score (Оценка сущности): В описании упоминается, что если продвигается несколько кандидатов одновременно, они могут быть ранжированы с использованием Entity Score. Эта оценка может основываться на количестве общих Entity Types или проценте схожести (percentage of similarity) между типами сущностей результата и целевыми типами.

Консенсус SERP определяет интент: Google не полагается только на анализ текста запроса или отдельных страниц для определения интента. Система анализирует Entities и Entity Types, общие для топовых результатов (Shared Entities), чтобы установить тематический консенсус выдачи. Этот консенсус используется для подтверждения или опровержения предполагаемого интента.
Сущности как гейткипер для продвижения: Для продвижения специфических классов контента (Authoritative Result Candidates) недостаточно простого совпадения по ключевым словам. Система требует подтверждения интента через анализ сущностей. Если интент не подтвержден консенсусом SERP, продвижение блокируется (inhibited) или результат понижается (demoted).
Многофакторная проверка валидности контента: Чтобы контент был продвинут, он должен удовлетворять трем условиям: (A) быть релевантным в тематически связанной выдаче, (B) соответствовать общему тематическому фокусу выдачи, и (C) сам быть корректно классифицирован с помощью правильных Entity Types.
Защита от манипуляций и ошибок классификации: Механизм защищает от продвижения подделок (knockoffs) или нерелевантного контента, который случайно совпал с запросом, но не соответствует интенту пользователя или не принадлежит к заявленному классу контента.

Best practices (это мы делаем)

Комплексная оптимизация под сущности (Entity Optimization): Обеспечьте точную и полную связь вашего контента с релевантными сущностями и их типами. Это критично для того, чтобы система могла корректно классифицировать контент (Критерий C). Используйте разметку Schema.org (например, Movie, TVSeries, Course для лекций), чтобы явно указать Content Class и связанные сущности (актеры, режиссеры, темы).
Построение тематического авторитета (Topical Authority): Создавайте контент, который четко соответствует доминирующему интенту и сущностям в вашей нише. Ваш сайт должен вносить вклад в формирование тематического консенсуса SERP (Критерий B). Если вы являетесь авторитетом в теме, ваши сущности с большей вероятностью будут частью Shared Entities.
Анализ доминирующих сущностей в SERP: Изучайте, какие Entity Types доминируют в выдаче по вашим целевым запросам. Если вы пытаетесь ранжировать контент одного класса по запросу, где консенсус выдачи указывает на другой класс (например, Фильм), вы можете столкнуться с трудностями, так как система будет предпочитать Authoritative Result Candidates доминирующего класса.

Worst practices (это делать не надо)

Игнорирование оптимизации под сущности: Полагаться только на совпадение ключевых слов, особенно для неоднозначных запросов, неэффективно. Без четкой связи с сущностями система не сможет подтвердить релевантность вашего контента тематическому консенсусу выдачи.
Манипуляция классом контента (Misrepresentation): Попытки выдать контент за другой класс (например, маркировать короткий клип как полнометражный фильм). Система проверит, действительно ли ваш контент связан с соответствующими Entity Types (Критерий C), и при несоответствии может его понизить (demote).
Создание контента вне тематического контекста: Создание страниц, оптимизированных под запрос, но не соответствующих общим сущностям, которые ожидаются для этого запроса. Такой контент не пройдет проверку консенсуса SERP (Критерий B).

Стратегическое значение

Патент подтверждает стратегическую важность перехода от ключевых слов к сущностям (Entity-First Indexing). Он подчеркивает, что понимание Google контекста основано не только на отдельной странице, но и на анализе всего ландшафта результатов поиска. Для SEO это означает, что стратегически важно позиционировать сайт как авторитетный источник информации о конкретных сущностях и темах (Topics), чтобы соответствовать тематическому консенсусу, который Google использует для валидации интента.

Практические примеры

Сценарий 1: Обработка неоднозначного запроса (Фильм vs Продукт)

Запрос: "Cars".
Кандидат: Система идентифицирует Authoritative Result Candidate – полнометражный фильм "Тачки" (Pixar). Content Class = Movie. Целевые Entity Types = MOVIE, FILM_DIRECTOR.
Анализ SERP (Вариант A - Интент "Автомобили"): Топовые результаты связаны с покупкой машин, обзорами авто. Shared Entities имеют типы AUTOMOBILE, BRAND. Целевые Entity Types отсутствуют.
Результат A: Критерии A и B не выполнены (нет консенсуса по MOVIE). Продвижение фильма "Тачки" блокируется (inhibited).
Анализ SERP (Вариант B - Интент "Фильм"): Топовые результаты связаны с Pixar, трейлерами, актерами озвучки. Shared Entities имеют типы MOVIE, ANIMATION.
Результат B: Критерии A, B и C выполнены. Фильм "Тачки" продвигается (promoted) наверх выдачи.

Сценарий 2: Защита от подделок (Knockoff)

Запрос: "Finding Nemo".
Кандидат: Система идентифицирует низкокачественную имитацию фильма ("knockoff") под названием "Finding Nemo" как потенциальный Authoritative Result Candidate.
Анализ SERP: Выдача четко сфокусирована на оригинальном фильме Pixar (Критерии A и B выполнены).
Валидация кандидата (Критерий C): Система проверяет сущности кандидата. Если он не связан с правильными сущностями (Pixar, Andrew Stanton как FILM_DIRECTOR), он не пройдет валидацию по Критерию C.
Результат: Множество критериев не выполнено (т.к. C не выполнен). Продвижение имитации блокируется, даже если название совпадает и общий интент соответствует фильмам.

Что такое "Authoritative Result Candidate" в контексте этого патента?

Это элемент контента определенного класса, который система считает важным и потенциально хочет продвинуть на самые верхние позиции выдачи. В патенте в качестве примеров приводятся полнометражные фильмы, телешоу, доступные для покупки (премиум-контент), а также лекции или живые выступления. Это не просто релевантный результат, а результат особого формата или значения.

Как система определяет интент запроса согласно патенту?

Система определяет интент не только по самому запросу, но и анализируя полученные результаты поиска. Она изучает сущности (Entities/Topics) и их типы (Entity Types), связанные с топовыми результатами. Ключевым механизмом является анализ "Общих сущностей" (Shared Entities) – тех тем и объектов, которые объединяют большинство результатов. Этот тематический консенсус выдачи и определяет истинный интент запроса.

Что произойдет, если мой контент идеально соответствует запросу по ключевым словам, но не соответствует общему интенту выдачи?

Если ваш контент принадлежит к классу, который система хочет продвигать (Authoritative Result Candidate), но тематический консенсус выдачи не подтверждает этот интент, продвижение вашего контента будет заблокировано (inhibited) или он будет понижен (demoted). Это подчеркивает важность соответствия не только запросу, но и общему тематическому контексту SERP.

Как этот патент связан с Knowledge Graph и E-E-A-T?

Патент напрямую связан с Knowledge Graph, так как он оперирует понятиями Entities и Entity Types (упоминаются Freebase entities). Он описывает, как данные из графа знаний используются для понимания контента и контекста выдачи. Связь с E-E-A-T заключается в том, что построение тематического авторитета (Authority) помогает гарантировать, что ваш контент будет частью тематического консенсуса (Shared Entities), что необходимо для подтверждения интента.

На какие три основных критерия опирается система при принятии решения о продвижении?

Система проверяет: (A) Присутствие в SERP: есть ли другие результаты в топе, связанные с целевыми типами сущностей. (B) Консенсус SERP: входят ли целевые типы сущностей в число общих для всей выдачи (Shared Entities). (C) Валидация кандидата: связан ли сам продвигаемый контент с правильными типами сущностей. Должно быть выполнено множество критериев.

Как SEO-специалист может повлиять на эти механизмы?

Ключевое действие – это максимально точная и полная оптимизация под сущности. Необходимо использовать структурированные данные (Schema.org) для явного указания класса контента и связанных с ним сущностей. Также необходимо развивать тематический авторитет сайта, чтобы он соответствовал и формировал тематический консенсус в своей нише.

Применяется ли этот механизм только к видео и фильмам?

Нет. Хотя в патенте часто используются примеры с фильмами (MOVIE entity type), описанный механизм универсален. Он может применяться к любому классу контента (Content Class), который система хочет выделить, например, к курсам (лекциям), продуктам, музыкальным альбомам или живым выступлениям.

Что такое "Гистограмма сущностей" (Entity Histogram) и как она используется?

Это статистическое распределение, показывающее, как часто различные типы сущностей встречаются в результатах поиска по данному запросу. Система использует её для быстрого определения того, какие Entity Types являются доминирующими или общими для выдачи, что помогает в анализе консенсуса SERP (Критерий B).

Может ли этот механизм понизить мой сайт в выдаче?

Да. В патенте (Claims 7 и 8) явно указано, что если критерии подтверждения интента не выполнены, контент может быть не только лишен продвижения, но и понижен (demoted) в ранжировании. Это может произойти, если система считает, что ваш контент не соответствует истинному интенту запроса, определенному через консенсус SERP.

Что важнее: чтобы моя страница имела правильные сущности или чтобы вся выдача имела правильные сущности?

Важно и то, и другое. Ваша страница должна иметь правильные сущности для валидации (Критерий C). Однако, если вся остальная выдача не подтверждает этот тематический контекст (Критерии A и B), ваш контент может не получить продвижения. Система ищет гармонию между индивидуальным результатом и общим контекстом выдачи.

Как Google анализирует сущности в топе органической выдачи для выбора релевантной рекламы на SERP

Google использует этот механизм для улучшения релевантности рекламы на странице результатов поиска. Система анализирует контент топовых органических результатов, извлекает из них ключевые сущности (концепции, продукты, бренды) и взвешивает их значимость. Затем эти сущности используются для выбора наиболее подходящих рекламных объявлений, позволяя таргетироваться на семантический контекст выдачи, а не только на ключевые слова запроса.

US20150199718A1
2015-07-16

SERP
Семантика и интент

Как Google определяет запросы, требующие ответа списком, и генерирует ранжированные списки сущностей для SERP

Google использует систему для определения, когда пользователь ищет список объектов (сущностей). Система анализирует запрос на наличие индикаторов списка («лучшие», «топ»), определяет категорию (например, «фильмы») и извлекает релевантные сущности из топовых веб-документов. Затем эти сущности ранжируются на основе их значимости в документе и релевантности документа запросу, и представляются в виде отдельного структурированного списка на странице результатов поиска.

US10691702B1
2020-06-23

Семантика и интент
SERP

Как Google определяет и ранжирует наиболее важные факты о сущности на основе совместных упоминаний в интернете

Google использует механизм для определения наиболее важных свойств (фактов) о сущности в контексте ее типа. Система анализирует частоту совместного упоминания (co-occurrence) сущности и связанных с ней сущностей в интернете (Related Entity Score), агрегирует эти данные для каждого свойства (Property Score) и сортирует свойства по важности. Это определяет, какие факты будут показаны первыми в результатах поиска, например, в Панели знаний.

US9256682B1
2016-02-09

Knowledge Graph
Семантика и интент

Как Google связывает запросы с сущностями для формирования выдачи, подсказок и определения доминирующего интента

Google использует систему для определения того, какие сущности (люди, места, объекты) подразумеваются в поисковом запросе. Система анализирует, насколько релевантны топовые документы запросу и насколько центральное место в этих документах занимает конкретная сущность. На основе этого рассчитывается оценка Entity Score, которая определяет ранжирование сущностей для запроса. Этот механизм используется для показа блоков знаний, организации поисковой выдачи и предоставления уточняющих поисковых подсказок.

US20160224621A1
2016-08-04

Семантика и интент
Knowledge Graph
SERP

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала

Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.

US9098551B1
2015-08-04

EEAT и качество
Поведенческие сигналы
SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий

Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.

US11157488B2
2021-10-26

Индексация
Поведенческие сигналы
Семантика и интент

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты

Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.

US20150169576A1
2015-06-18

Поведенческие сигналы
SERP
Семантика и интент

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы

Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.

US9129029B1
2015-09-08

Local SEO
Поведенческие сигналы
Свежесть контента

Как Google находит, фильтрует и подмешивает посты из блогов, релевантные конкретным результатам поиска

Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих ссылок (out-degree), качество входящих ссылок (Link-based score), возраст поста, его длину и расположение ссылок, чтобы гарантировать качество подмешиваемого контента.

US8117195B1
2012-02-14

EEAT и качество
Антиспам
Ссылки

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей

Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.

US20210232659A1
2021-07-29

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования

Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.

US8538989B1
2013-09-17

Семантика и интент
Индексация
Структура сайта

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска

Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.

US8874594B2
2014-10-28

Персонализация
Поведенческие сигналы
Local SEO

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования

Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.

US7933890B2
2011-04-26

Структура сайта
Техническое SEO
Индексация

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами

Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.

US8819004B1
2014-08-26

Поведенческие сигналы
Мультимедиа
SERP

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)

Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.

US20150154610A1
2015-06-04

Local SEO
Антиспам
Поведенческие сигналы