Автор: Виктор Репин

2012 Мультимедиа Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует вероятностное тематическое моделирование для ранжирования видео и медиаконтента

Google использует систему для преодоления ограничений поиска по ключевым словам, особенно для видео, где мало текста. Система определяет вероятность принадлежности запроса к определенной теме (P(T|Q)), а затем находит релевантные результаты для этой темы (P(R|T)). Ранжирование основано на комбинации этих вероятностей, что позволяет находить контент, даже если он не содержит точных ключевых слов из запроса.

2010 Hyung-Jin Kim Индексация Патенты Google Поведенческие сигналы Семантика и интент

Как Google определяет тематику и интент запроса, анализируя клики пользователей и контекст поисковых сессий

Google использует механизм для понимания неоднозначных запросов, анализируя, какие документы пользователи выбирают (клики и время просмотра) и что еще они ищут в рамках одной сессии. Если пользователи часто выбирают документы определенной категории (например, «Товар») по данному запросу, Google присваивает эту категорию самому запросу и распространяет ее на связанные запросы в сессии.

2012 Knowledge Graph Патенты Google Персонализация Поведенческие сигналы

Как Google формирует Панели Знаний (Knowledge Panels), выбирая факты на основе истории запросов пользователей и агрегируя данные из разных источников

Патент Google описывает систему генерации Панелей Знаний (Knowledge Panels). Система идентифицирует сущность в запросе, определяет ее тип и использует соответствующий шаблон. Этот шаблон наполняется контентом, агрегированным из множества разных источников. Ключевой механизм (Claim 1) заключается в выборе конкретных фактов на основе того, как часто пользователи искали эту информацию об этой сущности в прошлом.

2012 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google использует историю поиска, браузера и социальные связи для построения графа интересов и персонализации локальной выдачи

Google патентует систему построения «графа интересов» пользователя на основе его личных данных: истории поиска, посещенных сайтов, email, социальных связей и истории местоположений. Этот граф используется для автоматического предсказания интересов и персонализации предложений локальных событий и мест, когда пользователь находится в новом месте.

2004 EEAT и качество SERP Антиспам Патенты Google

Как Google использует модель «Разумного Серфера» (Reasonable Surfer Model) для определения веса ссылок на основе вероятности клика

Google использует модель машинного обучения для прогнозирования вероятности того, что пользователь перейдет по конкретной ссылке. Эта модель анализирует характеристики ссылки (положение, размер шрифта, анкорный текст) и данные о поведении пользователей. Ссылки с высокой вероятностью клика передают значительно больше ссылочного веса (например, PageRank), чем ссылки, которые пользователи обычно игнорируют.

2004 Paul Haahr Индексация Патенты Google Поведенческие сигналы Семантика и интент

Как Google кластеризует и выбирает связанные запросы (Related Searches) на основе семантической близости результатов поиска

Google анализирует исторические данные о том, как пользователи уточняют свои запросы. Система определяет семантическое значение каждого уточнения, анализируя контент возвращаемых документов. Уточнения с похожими результатами кластеризуются. Затем система выбирает лучший репрезентативный запрос из каждого кластера и ранжирует их, отдавая предпочтение наиболее частым и семантически согласованным группам, чтобы предложить пользователю концептуально различные варианты продолжения поиска.

2012 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google использует явную и неявную обратную связь пользователя для оценки и коррекции качества голосовых ответов

Google использует механизм для обучения диалоговых систем (голосовых ассистентов). Система анализирует последующие реплики и действия пользователя (например, повторение вопроса или уточняющий запрос) как обратную связь на предоставленный ответ. Эта связь используется для корректировки оценок уверенности (Confidence Scores) в парах вопрос-ответ и для немедленного предложения альтернатив при негативной реакции.

2008 EEAT и качество Paul Haahr Индексация Патенты Google Семантика и интент

Как Google использует структурированные данные и шаблоны для создания обогащенных сниппетов (Rich Results)

Google использует механизм, позволяющий владельцам сайтов влиять на отображение своих страниц в поиске. Система идентифицирует «Объекты отображения результатов поиска» (структурированные данные) и «Шаблоны» (правила форматирования), предоставленные вебмастером или сгенерированные автоматически. Это позволяет формировать обогащенные сниппеты с дополнительной информацией (цены, рейтинги, изображения).

2012 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google вычисляет связанность сущностей, используя данные о поведении пользователей при взаимодействии с разными типами контента (видео, веб-страницы)

Google использует систему для определения степени связанности между сущностями путем анализа поведения пользователей (co-interaction data) в разных типах медиа (видео, веб-страницы, покупки). Этот механизм агрегирует поведенческие данные для расчета «оценки связанности» (Relatedness Score), что позволяет генерировать релевантные рекомендации даже для нового контента (решение проблемы «холодного старта»).

2013 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google динамически фильтрует выдачу по сущностям после клика пользователя для уточнения интента

Google использует механизм для разрешения неоднозначности запросов. Если выдача содержит результаты о разных сущностях (например, «Ягуар» как животное и как автомобиль), клик пользователя по одному результату сигнализирует о его интенте. При возврате на SERP система модифицирует выдачу, скрывая или понижая результаты о нерелевантных сущностях, и отображает уведомление о примененном фильтре.

2014 Мультимедиа Патенты Google Поведенческие сигналы Семантика и интент

Как Google измеряет популярность цитат и сущностей в видеоконтенте, используя поисковые запросы и веб-упоминания

Google анализирует объем поисковых запросов, упоминания в социальных сетях и ссылки в онлайн-документах для выявления наиболее популярных цитат и сущностей внутри видеоконтента. Эти данные используются для выделения ключевых моментов и обогащения базы знаний, демонстрируя, как внешние сигналы определяют значимость контента.

2016 E-commerce SEO SERP Патенты Яндекс Структурированные данные

Как Яндекс автоматически извлекает структурированные данные (цены, изображения) из страниц и отображает их прямо в результатах поиска (SERP)

Яндекс использует технологию для анализа страниц в результатах поиска с целью обнаружения повторяющихся шаблонов (например, карточек товаров или объявлений). Система автоматически извлекает уникальные данные (цены, изображения, характеристики) из этих шаблонов и отображает их непосредственно на странице выдачи (SERP), заменяя или дополняя стандартный сниппет. Это позволяет пользователям сравнивать предложения без перехода на сайт.

2017 Google Shopping Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах

Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.

2019 Интент пользователя Патенты Яндекс Поисковые подсказки Свежесть контента

Как Яндекс выявляет трендовые запросы и интегрирует их в поисковые подсказки в реальном времени

Яндекс патентует метод улучшения поисковых подсказок (саджестов) за счет добавления свежих, трендовых запросов. Система анализирует недавнюю поисковую активность и свежие документы из надежных источников. Она рассчитывает частоту новых запросов, оценивает намерение пользователя получить свежий контент и измеряет взаимодействие (CTR). Ключевой механизм – масштабирование краткосрочной частоты свежих запросов для их корректного сравнения с долгосрочными историческими данными, что позволяет актуальным трендам появляться в подсказках.

2019 SERP Патенты Яндекс Поведенческие факторы Ранжирование Холодный старт

Как Яндекс использует рандомизированное переранжирование (Explore/Exploit) для сбора поведенческих данных и обучения алгоритмов

Яндекс патентует механизм активного сбора поведенческих данных для документов с недостаточной статистикой. Система использует вспомогательную модель для прогнозирования качества документа (независимо от кликов). Затем ранг документа случайным образом изменяется (повышается или понижается) в выдаче, чтобы собрать новый фидбэк (Explore). Эти данные используются для переобучения основной формулы ранжирования (Exploit).

2012 EEAT и качество Hyung-Jin Kim Патенты Google Поведенческие сигналы Свежесть контента

Как Google использует метрики «Побед» и «Поражений» (Dwell Time и CTR) для оценки качества сайтов и корректировки ранжирования

Google оценивает качество страниц и доменов, анализируя, как они конкурируют в поисковой выдаче. Система отслеживает «Победы» (Wins) и «Поражения» (Losses) на основе поведения пользователей: сравнивая время пребывания (Dwell Time) при мульти-кликах или анализируя клики относительно показов (CTR) с учетом позиций. На основе этого соотношения рассчитывается корректирующий фактор (Adjustment Factor), который повышает или понижает рейтинг ресурса.

2020 SERP Обучение моделей Патенты Яндекс Холодный старт

Как Яндекс целенаправленно «перемешивает» выдачу (Active Learning) для сбора недостающих поведенческих данных и обучения ранжирования

Яндекс патентует механизм Активного Обучения (Active Learning) для сбора поведенческих данных о документах, по которым мало статистики. Система определяет вероятность принадлежности документа к определенному классу качества (например, «Хороший») и искусственно изменяет его позицию в выдаче (повышает или понижает), чтобы стимулировать взаимодействие пользователя. Собранные данные используются для дообучения основной формулы ранжирования.

2004 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google использует тематическую классификацию и «Boost Vectors» для персонализации и контекстного повышения сайтов в выдаче

Google использует механизм «Boost Vectors» для персонализации поиска. Система классифицирует интересы пользователя или тематику сайта-источника, и на основе этих категорий повышает в выдаче результаты, предварительно ассоциированные с этими темами. Это позволяет адаптировать ранжирование под тематический контекст.

2017 SERP Колдунщики Патенты Яндекс Структурированные данные

Как Яндекс создает интерактивные сниппеты с двусторонней связью (API) для взаимодействия с сайтами прямо на выдаче

Яндекс патентует технологию создания интерактивных сниппетов на странице результатов поиска (SERP). Ключевая особенность — установление двусторонней связи (например, через API) между сниппетом и внешним ресурсом. Это позволяет пользователю взаимодействовать с функционалом сайта (выполнять операции, заказывать, общаться в чате) и получать обновления в реальном времени, не покидая SERP и не переходя на сам сайт.

2007 Ashutosh Garg Kedar Dhamdhere Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google использует историю запросов в текущей сессии для предсказания цели пользователя и корректировки ранжирования

Google анализирует последовательность запросов пользователя в рамках одной поисковой сессии, чтобы определить ее контекст. Сравнивая эту последовательность с историческими паттернами поиска (Query Paths), система выявляет, к какому результату пользователь, вероятно, стремится. Если текущая сессия совпадает с известным паттерном, Google корректирует ранжирование, повышая те результаты, которые статистически часто выбирались в конце аналогичных поисковых сессий.