Автор: Виктор Репин

2007 Патенты Google Поведенческие сигналы Ссылки

Как Google использует пользовательские аннотации и коллекции (Web Notebooks) для определения релевантности контента, даже если ключевые слова отсутствуют на странице

Google может определять релевантность веб-страницы запросу, опираясь на аннотации, заголовки или комментарии, добавленные пользователями в их коллекциях контента («Web Notebooks»). Этот механизм позволяет странице ранжироваться по терминам, которых нет в ее собственном тексте, используя человеческую категоризацию как сигнал релевантности. Также сохраненные фрагменты могут использоваться для генерации сниппетов.

2021 Антиспам Краудсорсинг Патенты Яндекс Яндекс Браузер

Как Яндекс использует историю браузера для выявления и нейтрализации накруток отзывов и рейтингов

Яндекс патентует метод защиты краудсорсинговых данных (отзывов, рейтингов) от внешних манипуляций, таких как «рейды» или накрутки. При обнаружении аномального всплеска оценок система анализирует историю посещений пользователей, оставивших эти оценки. Сравнивая ее с историей обычных пользователей, Яндекс статистически выявляет внешний источник, мобилизовавший трафик (например, пост в блоге или Telegram-канале), и применяет корректирующие меры: удаляет или понижает вес этих аномальных оценок.

2011 EEAT и качество Paul Haahr Антиспам Патенты Google Ссылки

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании

Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм «Доверенных авторитетов», чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.

2016 Индексация Патенты Яндекс Поведенческие факторы Ранжирование

Как Яндекс ранжирует документы без ключевых слов, используя историю поисковых сессий (Annotated Search Index)

Яндекс использует данные о поведении пользователей в исторических поисковых сессиях для выявления релевантных документов, которые не содержат слов из исходного запроса. Если пользователи часто переходят к ресурсу (в пределах 1-3 переходов) и проводят на нем значительное время (более 30 секунд), этот ресурс добавляется в «аннотированный индекс» и может ранжироваться по исходному запросу.

2007 Индексация Патенты Google Семантика и интент Ссылки

Как Google использует архитектуру Universal Search для смешивания вертикальных результатов (например, ТВ-программ) с основным веб-поиском

Патент Google, описывающий фундаментальный механизм Universal Search. Система определяет, когда запрос связан со специализированной вертикалью (например, ТВ-программы), используя систему триггеров (ключевые слова, белые и черные списки). Затем она одновременно запрашивает данные из основного веб-индекса и вертикального индекса. Результаты смешиваются и отображаются в единой выдаче, выделяя вертикальные данные в специальный блок (OneBox).

2003 EEAT и качество Патенты Google Свежесть контента Ссылки

Как Google News кластеризует новости и ранжирует источники, используя свежесть, оригинальность и авторитетность

Анализ патента, лежащего в основе Google News. Google оценивает качество новостных источников по оригинальности и скорости реакции на события. Статьи группируются в кластеры (сюжеты), которые ранжируются по свежести и авторитетности. Внутри сюжета статьи сортируются по «модифицированной свежести», дающей бонус авторитетным источникам (Golden Sources).

2016 Метрики качества поиска Патенты Яндекс Ранжирование Свежесть контента Яндекс Браузер

Как Яндекс рассчитывает Ранг Свежести Просмотра (FBR) на основе истории браузеров и времени создания страниц

Яндекс патентует метод ранжирования, учитывающий свежесть пользовательской активности. Система анализирует агрегированную историю просмотров, присваивая более высокий вес страницам, которые посещались или были созданы недавно. Этот «Ранг Свежести Просмотра» (FBR) рассчитывается итеративно, экспоненциально затухает со временем и распространяется по графу реальных переходов пользователей, а затем комбинируется с показателями релевантности (например, BM25).

2016 Обучение моделей Патенты Яндекс Персонализация Поведенческие факторы

Как Яндекс использует детальное поведение пользователя в браузере для построения персональной модели ранжирования на стороне клиента

Яндекс патентует метод персонализации поиска, при котором анализ поведения пользователя происходит прямо на его устройстве (на стороне клиента), а не на сервере. Система отслеживает микровзаимодействия (движение мыши, скорость скроллинга, копирование текста), чтобы понять предпочтения пользователя. На основе этих данных локально строится персональная модель ранжирования, которая затем используется Яндексом для улучшения выдачи, сохраняя конфиденциальность данных пользователя.

2017 Обучение моделей Патенты Яндекс Поведенческие факторы Ранжирование

Как Яндекс прогнозирует популярность контента (видео, статей), используя данные поиска, браузера и веба

Яндекс прогнозирует популярность контента (например, видео на YouTube), анализируя, как часто его ищут в поиске (Search Logs), посещают через браузер (Browsing Logs, например, Yandex.Browser), и как часто его встраивают (Embeds) или ссылаются на других сайтах (Statistical Web Data). Эта прогнозируемая популярность используется как сильный фактор ранжирования.

2015 EEAT и качество Trystan G. Upstill Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует популярность бренда (навигационные запросы) для переранжирования выдачи по широким категориальным запросам

Google использует механизм для улучшения выдачи по широким (категориальным) запросам. Если система определяет, что пользователь ищет информацию по категории, она продвигает в топ наиболее популярные и авторитетные сайты этой категории. Для этого Google оценивает качество ресурсов на основе их популярности по навигационным (брендовым) запросам, а не только по прямой релевантности исходному широкому запросу.

2013 Knowledge Graph Nitin Gupta Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями

Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.

2024 Индексация Патенты Яндекс Ранжирование Семантический поиск

Как Яндекс в реальном времени оценивает совместное вхождение и близость слов запроса в документе с помощью нейросети

Яндекс патентует метод повышения скорости и качества ранжирования за счет динамического анализа взаимодействия слов запроса. Система в реальном времени извлекает из инвертированного индекса данные о позициях отдельных слов (query-independent data) и на их основе мгновенно вычисляет признаки совместного вхождения и близости (query-dependent features) в Title, URL и тексте. Эти признаки, объединенные с векторными представлениями слов, обрабатываются нейросетью для генерации комплексного фактора ранжирования.

2015 Метрики качества поиска Патенты Яндекс Поведенческие факторы Ранжирование Свежесть контента

Как Яндекс рассчитывает динамический ранг авторитетности (Fresh Browse Rank), учитывая свежесть поведения пользователей и контента

Яндекс патентует метод расчета авторитетности страниц (Fresh Browse Rank — FBR), который является эволюцией BrowseRank (аналог PageRank на основе логов посещений). FBR учитывает время: он повышает ранг страниц, которые были недавно созданы или недавно стали популярными, и понижает те, чей трафик угасает, используя механизм временного затухания (Time Decay). Этот сигнал авторитетности затем комбинируется с факторами релевантности запросу.

2012 Антиспам Патенты Google Ссылки Техническое SEO

Как Google объединяет разные URL в один результат, если они ведут на одну и ту же страницу (например, при мобильных редиректах)

Google использует механизм дедупликации для повышения разнообразия выдачи. Если несколько разных URL в результатах поиска перенаправляют пользователя на одну и ту же целевую страницу (например, из-за редиректа на мобильную версию, страницу входа или главную страницу), Google объединяет эти функциональные дубликаты в один замещающий результат.

2017 SERP Патенты Яндекс Персонализация Поведенческие факторы

Как Яндекс отделяет ранжирование от визуального отображения SERP на основе прогнозируемого поведения и типа устройства

Яндекс патентует механизм динамической конфигурации внешнего вида поисковой выдачи (SERP Layout). Система прогнозирует, как пользователь будет взаимодействовать с результатами, основываясь на исторических данных и типе используемого приложения/устройства. Затем она отправляет инструкции для визуального изменения выдачи (изменение порядка отображения, выделение стилем, нелинейная верстка), чтобы соответствовать этому прогнозу, не меняя базовое ранжирование по релевантности.

2017 Навигационные запросы Патенты Яндекс Ссылки Яндекс Браузер

Как Яндекс использует категоризацию сайтов и поведение пользователей для определения ключевых разделов и улучшения навигации

Яндекс патентует метод улучшения навигации по сайтам. Система автоматически определяет наиболее важные разделы сайта (например, «Корзина», «Личный кабинет») независимо от его владельца. Это определение основано на категории сайта или анализе агрегированных поведенческих данных (популярности страниц). Затем система отображает прямые ссылки на эти разделы в интерфейсе пользователя (например, в браузере), обеспечивая быстрый доступ к ключевым функциям.

2017 Обучение моделей Патенты Яндекс Ранжирование Яндекс Браузер

Как Яндекс прогнозирует будущую популярность контента, используя данные из Поиска, Браузера и Веб-графа (ссылки и встраивания)

Яндекс патентует метод прогнозирования популярности контента (например, видео или статей). Система агрегирует данные из трех источников: поисковые логи (показы и клики в SERP), логи браузера (прямые посещения) и веб-граф (ссылки и встраивания на других сайтах, включая динамику их появления во времени). На основе этих данных модель машинного обучения (GBDT) предсказывает будущую популярность, которая затем используется для ранжирования.

2016 SERP Патенты Google Семантика и интент Ссылки

Как Google использует графовые методы для расширения триггеров SERP-функций и ранжирует источники данных по временным критериям

Патент Google описывает два ключевых механизма. Первый — автоматическое расширение набора запросов (триггеров), активирующих структурированные карточки, с помощью графового анализа и передачи весов между запросами и сущностями. Второй — процесс извлечения данных для заполнения этих карточек, при котором источники ранжируются по критериям свежести (recency) или близости события (temporal criteria), особенно при поиске в персональных данных (например, email).

2013 EEAT и качество Патенты Google Свежесть контента Ссылки

Как Google использует переранжирование (Twiddlers) для обеспечения разнообразия в поисковой выдаче и лентах новостей

Google применяет алгоритмы диверсификации для предотвращения доминирования похожих результатов в выдаче или лентах, отсортированных по времени или местоположению. Система идентифицирует элементы с общими признаками (источник, автор, тип контента) и применяет «фактор понижения» (Demotion Factor), снижая их рейтинг. Это обеспечивает разнообразие контента при сохранении основной логики сортировки.

2003 Антиспам Индексация Патенты Google Ссылки

Как Google использует кластерный анализ и двудольные графы для выявления сетей сайтов и ссылочных схем (спама)

Google выявляет поисковый спам, анализируя группы (кластеры) документов, а не только отдельные страницы. Система ищет подозрительные структуры, такие как сети ссылок (плотные двудольные графы), и агрегирует сигналы манипуляции (скрытый текст, редиректы, неестественный текст) со всех страниц кластера. Это позволяет обнаружить спам, даже если сигналы на отдельных страницах слабые.