Автор: Виктор Репин

2007 EEAT и качество Hyung-Jin Kim Патенты Google Поведенческие сигналы Техническое SEO

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции

Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.

2013 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей

Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.

Индексация Патенты Google Семантика и интент Ссылки

Как Google определяет связанность документов с помощью контекста, со-цитирования и классификации для фильтрации результатов поиска

Патент Google (с приоритетом от 1999 г.), описывающий методы фильтрации результатов поиска на основе их связанности с заданным контекстом (набором URL или категорий). Документ раскрывает фундаментальные методы определения связанности (Relatedness): анализ ссылок (со-цитирование), текстовое сходство, тематическую классификацию и паттерны поведения пользователей. Эти методы позволяют системе уточнять неоднозначные запросы и ограничивать выдачу релевантным контекстом.

2012 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google идентифицирует, отбирает и диверсифицирует показ экспертов (Authoritative Users) в результатах поиска

Патент описывает механизм интеграции экспертов (Authoritative Users) в поисковую выдачу. Когда запрос совпадает с триггерным запросом, система извлекает пул экспертов и их оценки авторитетности. Этот пул фильтруется с использованием оценок, социальных связей пользователя и элемента случайности. Система специально разработана для диверсификации показа экспертов при повторных идентичных запросах.

2011 Мультимедиа Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует данные о совместном просмотре (Co-Watch) и графовые модели для классификации видеоконтента

Анализ патента Google, описывающего систему классификации видео (например, на YouTube). Для решения проблемы нехватки размеченных данных система анализирует поведение пользователей: какие видео смотрят последовательно (Co-Watch). На основе этих данных строятся графы и кластеры, что позволяет автоматически расширять обучающие выборки и точно классифицировать контент, используя мультимодальные сигналы и учитывая иерархию тем.

2015 EEAT и качество Lev Finkelstein Индексация Патенты Google Семантика и интент

Как Google создает модель «идеального ответа» (Answer Term Vector) для оценки и выбора Featured Snippets

Google анализирует тысячи существующих пар Вопрос-Ответ в интернете, чтобы понять, какие термины чаще всего используются при ответе на конкретный вопрос. На основе этого анализа создается «Вектор Терминов Ответа» (Answer Term Vector) — эталонная модель ожидаемых слов и их важности. Затем кандидаты в Featured Snippet оцениваются по тому, насколько хорошо их текст совпадает с этим вектором.

2013 EEAT и качество Индексация Патенты Google Поведенческие сигналы

Как Google использует данные о том, насколько далеко пользователи готовы ехать до локации, для оценки ее качества и ранжирования в локальном поиске

Google использует данные о перемещениях пользователей для оценки качества физических локаций (например, ресторанов, магазинов). Система сравнивает, как далеко люди фактически едут до конкретного места (Actual Distance Value), с тем, как далеко они обычно едут до подобных мест в этом районе (Anticipated Distance Value). Если пользователи готовы тратить больше времени на дорогу и игнорировать ближайших конкурентов, это сигнализирует о высоком качестве и улучшает ранжирование локации.

2005 Индексация Краулинг Патенты Google Ссылки

Как Google выбирает каноническую (основную) версию документа среди дубликатов и консолидирует сигналы ранжирования

Google использует систему для выбора одной «основной версии» документа из множества дубликатов. Выбор основан на авторитетности источника, полноте контента и PageRank. Система агрегирует сигналы (например, цитирования и ссылки) всех версий и приписывает их основной версии, которая представляется в результатах поиска.

2010 Local SEO Trystan G. Upstill Патенты Google Поведенческие сигналы Семантика и интент

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов

Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.

2007 EEAT и качество Google Shopping Патенты Google Поведенческие сигналы

Как Google использует предиктивные значки (Badges) в SERP для индикации вероятности покупки у продавца

Google использует систему, которая прогнозирует вероятность того, что пользователь совершит покупку у продавца, показанного в результатах поиска (рекламе или органике). На основе этого прогноза система выбирает и отображает визуальный индикатор (значок или «badge»). Для прогнозирования используются данные о коэффициенте конверсии продавца, его репутации (включая возвраты и споры) и истории покупок пользователя.

2010 Индексация Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует связь «Документ-Запрос» и поведение пользователей для генерации блока «Связанные запросы» (Related Searches)

Google генерирует «Связанные запросы» (Related Searches), анализируя, какие еще запросы приводят пользователей к тем же документам, что и исходный запрос. Если Документ X релевантен Запросам A и B, то Запрос B может быть предложен как уточнение для Запроса A. Эта связь усиливается кликами и временем пребывания пользователя на документе.

2013 EEAT и качество Knowledge Graph Патенты Google Семантика и интент

Как Google использует атрибуты сущностей для генерации «Дополненных запросов» и уточнения поиска

Google использует механизм для помощи в исследовании тем, связанных с сущностями (люди, места, продукты). Система распознает сущность в запросе, определяет ее ключевые атрибуты (анализируя результаты поиска или Knowledge Graph) и автоматически генерирует список предлагаемых «дополненных запросов» (Сущность + Атрибут). Это позволяет пользователю одним кликом запустить новый, более сфокусированный поиск по теме.

2013 Gal Chechik Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных

Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.

2006 Hyung-Jin Kim SERP Патенты Google Поведенческие сигналы Семантика и интент

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов

Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.

2005 Индексация Патенты Google Поведенческие сигналы Семантика и интент

Как Google определяет контекстно-зависимую значимость слов и понижает вес или игнорирует неважные термины в запросе

Google использует систему для определения значимости слов в поисковом запросе на основе контекста. Анализируя логи запросов, система выявляет термины, добавление которых статистически не меняет поисковую выдачу. Такие термины считаются малозначимыми в данном контексте. При обработке запроса Google может сделать эти термины необязательными (optional) для поиска и понизить их вес (down-weight) при ранжировании.

2011 Индексация Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует данные о кликах для определения значимости отдельных слов в запросе (Word-Score)

Google рассчитывает метрику «Word-Score» для оценки значимости слова в запросе. Метрика основана на сравнении historical CTR контента, найденного по ключевым словам, включающим это слово (Keep-Count), и CTR контента, найденного по ключевым словам, исключающим его (Drop-Count). Эта оценка используется для фильтрации и выбора наиболее релевантных ключевых слов для поиска контента.

2023 Local SEO Патенты Google Персонализация Поведенческие сигналы

Как Google использует генеративный ИИ для создания динамических и гиперперсонализированных бизнес-профилей

Google разрабатывает систему, которая заменяет статические бизнес-профили динамическими «курируемыми профилями», генерируемыми ИИ (например, LLM). Эти профили адаптируются в реальном времени под конкретного пользователя, учитывая его запрос, предпочтения, историю поиска и демографию, чтобы показать наиболее релевантный контент, продукты и описания бренда.

2021 Антикачество Качество контента Патенты Яндекс Ранжирование Рекомендательные системы Яндекс Дзен

Как Яндекс пессимизирует кликбейт в рекомендательных системах, сравнивая внутреннюю и внешнюю популярность источника

Яндекс патентует механизм борьбы с кликбейтом в рекомендательных системах (например, Дзен). Система сравнивает популярность источника контента внутри платформы с его популярностью в интернете в целом. Если источник аномально популярен внутри системы, но малоизвестен вовне, его контент пессимизируется. Это защищает от контента низкого качества, искусственно завышающего вовлеченность внутри платформы.

2019 Обучение моделей Патенты Яндекс Ранжирование Холодный старт

Как Яндекс конвертирует нечисловые данные (URL, домены, регионы) в ранжирующие сигналы: Ядро алгоритма CatBoost

Патент раскрывает ключевые механизмы библиотеки CatBoost, основного алгоритма ранжирования Яндекса. Он описывает метод преобразования категориальных факторов (например, URL, доменов, текста запроса) в числовые значения для машинного обучения. Для борьбы с переобучением используется техника упорядоченной статистики: значение фактора рассчитывается только на основе исторических данных, предшествующих текущему объекту в специально упорядоченной (часто случайной) выборке.

2010 EEAT и качество Мультимедиа Патенты Google Поведенческие сигналы

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео

Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.