Автор: Виктор Репин

2022 Патенты Яндекс Поведенческие факторы Рекомендательные системы Яндекс Дзен

Как Яндекс персонализирует соотношение разных типов контента (видео, статьи, реклама) в рекомендательных лентах (например, Дзен)

Яндекс патентует метод для динамической настройки пропорций различных типов контента (например, видео, статьи, нативный контент) в персонализированных рекомендательных лентах. Система сравнивает, как конкретный пользователь взаимодействует (CTR, время просмотра) с каждым типом контента относительно среднего пользователя. Если пользователь активнее потребляет определенный формат, система увеличивает его долю в ленте в рамках заданных ограничений.

2010 Патенты Google Персонализация Поведенческие сигналы

Как Google фильтрует персонализированные поисковые подсказки на основе контента просматриваемой страницы и глубины навигации

Google использует механизм для уточнения поисковых подсказок после того, как пользователь покинул SERP. Система генерирует персонализированные предложения на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту текущей страницы. Этот механизм также ограничивает показ подсказок, если пользователь слишком глубоко ушел по ссылкам от исходного результата.

2016 SERP Интент пользователя Навигационные запросы Патенты Яндекс

Как Яндекс определяет, когда нужно сразу перенаправить пользователя на сайт, минуя страницу результатов поиска (SERP)

Яндекс патентует механизм автоматического перенаправления пользователя на наиболее релевантный результат, минуя SERP. Система активируется, если топ-1 результат значительно превосходит остальные по релевантности, и если анализ URL, заголовка и исторических кликов подтверждает высокую вероятность того, что этот результат полностью удовлетворит запрос.

2012 Lev Finkelstein Патенты Google Семантика и интент

Как Google генерирует подсказки в Autocomplete, игнорируя прилагательные для расширения охвата

Google использует механизм для улучшения покрытия и качества подсказок в Autocomplete. Система идентифицирует описательные термины (прилагательные, наречия) вводимом пользователем запросе, временно удаляет их для поиска популярных базовых запросов, а затем вставляет описательные термины обратно. Это позволяет предлагать пользователям релевантные длинные подсказки, даже если они никогда ранее не вводились именно в такой формулировке.

2011 EEAT и качество Local SEO Индексация Патенты Google

Как Google определяет архитектуру Устанавливаемых Веб-Приложений (PWA) и управление их доступом в браузере

Анализ патента Google, описывающего базовую архитектуру для работы устанавливаемых веб-приложений (PWA). Патент детализирует, как браузер использует Манифест для упаковки сайта в устанавливаемый объект, управляет локальным хранилищем для офлайн-доступа и строго контролирует разрешения в рамках определенного домена источника (Origin Domain).

2018 SERP Качество контента Метрики качества поиска Патенты Яндекс

Как Яндекс алгоритмически определяет важность предложений для генерации сниппетов и категоризации контента

Яндекс патентует метод оценки важности предложений в тексте для создания резюме (сниппетов) и определения тематики документа без использования внешних словарей. Система разбивает текст на «концептуальные фразы» и оценивает их значимость на основе двух метрик: семантической связи (CIR – насколько фразы пересекаются по словам) и контекстной связи (CDR – как часто фразы встречаются вместе в предложениях). Предложения, содержащие наиболее важные комбинации фраз, используются для генерации сниппета.

2015 Justin Lewis Патенты Google Ссылки

Как Google определяет, какое приложение открыть, если контент доступен в нескольких приложениях на устройстве (Приоритетный диплинкинг)

Патент Google, описывающий механизм ранжирования диплинков для контента, который доступен в нескольких нативных приложениях (например, YouTube и YouTube Kids). Система создает список предпочтений, и при клике на ссылку устройство пользователя автоматически открывает наиболее предпочтительное из установленных приложений, улучшая пользовательский опыт.

2018 Индексация Патенты Google Семантика и интент

Как Google оптимизирует инфраструктуру векторного поиска с помощью мультимасштабного квантования (MSQ)

Патент описывает технику Multiscale Quantization (MSQ), используемую Google для повышения скорости и точности поиска по сходству (векторного поиска). MSQ решает проблему снижения точности стандартных методов сжатия векторов (эмбеддингов), когда векторы имеют разную длину (норму). Разделяя вектор на направление и масштаб, Google может эффективнее хранить и быстрее находить семантически похожий контент в своем индексе.

2023 SERP Интент пользователя Обучение моделей Патенты Яндекс

Как Яндекс генерирует сложные негативные примеры для обучения ранжирующих моделей

Яндекс патентует методы генерации сложных (hard negatives) обучающих примеров для улучшения точности ранжирования. Система использует граф связей между запросами и документами, а также анализ позиций общих документов в выдаче, чтобы найти документы, которые тематически связаны с запросом, но нерелевантны ему. Эти примеры помогают обучить модели (MLA) лучше различать тонкие различия в интенте пользователя.

Патенты Google Персонализация Семантика и интент

Как Google автоматически находит похожие страницы внутри одного сайта, используя текст текущей страницы как запрос (Query by Example)

Анализ патента Google, описывающего технологию автоматического поиска связанного контента внутри одного веб-сайта. Система анализирует текст просматриваемой страницы, извлекает и взвешивает ключевые термины на основе их уникальности, а затем использует их как поисковый запрос (Query by Example) для нахождения тематически похожих документов на том же сайте. Используются классические формулы информационного поиска (TF-IDF/BM25).

2015 SERP Интент пользователя Навигационные запросы Патенты Яндекс

Как Яндекс решает, показать ли SERP или сразу перенаправить пользователя на сайт (Direct Navigation)

Яндекс патентует механизм пропуска стандартной страницы выдачи (SERP) для ускорения поиска. Если система уверена, что Топ-1 документ полностью удовлетворяет запрос, она может сразу перенаправить пользователя на этот сайт. Решение принимается на основе анализа отрыва лидера (Relevancy Differential), а также соответствия Title, URL и исторического CTR (Likelihood Parameter) запросу пользователя.

2018 Патенты Яндекс Поведенческие факторы Ранжирование Рекомендательные системы

Как Яндекс использует поведенческие метрики и теги для ранжирования рекомендаций медиаконтента

Яндекс патентует систему рекомендаций медиаконтента (например, видео), которая определяет схожесть объектов, комбинируя совпадение тегов (тематика, жанр) с поведенческими метриками (время просмотра, CTR). Запатентованная формула использует сумму поведенческих показателей обоих объектов как множитель для количества совпадающих тегов, приоритизируя тематически схожий и высоко вовлекающий контент.

2017 SERP Индексация Патенты Яндекс Структурированные данные

Как Яндекс извлекает структурированные данные (товары, цены, объявления) из HTML-кода и показывает их прямо в выдаче (SERP)

Яндекс патентует метод обогащения поисковой выдачи путем анализа HTML-структуры веб-страниц. Система автоматически обнаруживает повторяющиеся шаблоны кода (например, карточки товаров или объявления) и извлекает из них конкретные данные (цены, изображения, заголовки). Эти данные отображаются прямо на странице результатов поиска, заменяя стандартное описание, и могут использоваться для фильтрации выдачи.

2017 Local SEO SERP Интент пользователя Патенты Яндекс

Как Яндекс использует жизненные Сценарии и Геолокацию для генерации контекстной и приоритизированной локальной выдачи

Яндекс патентует систему генерации контекстно-зависимых результатов поиска, основанную на «Сценариях» (например, командировка, переезд) и местоположении пользователя. Система агрегирует релевантные «Объекты интереса» (POI), группирует их по типам и упорядочивает на основе приоритета (важности) в рамках сценария, а не только расстояния. Цель — формировать структурированную выдачу для решения конкретной жизненной задачи.

2016 E-commerce SEO SERP Патенты Яндекс Структурированные данные

Как Яндекс автоматически извлекает структурированные данные (цены, изображения) из листингов для обогащения сниппетов и фильтрации выдачи

Яндекс патентует метод анализа структуры веб-страниц для выявления «повторяющихся шаблонов» (например, карточек товаров или объявлений). Система автоматически извлекает «неповторяющиеся сегменты данных» (цены, изображения, заголовки) из этих шаблонов и отображает их непосредственно в сниппете, часто заменяя стандартное описание и добавляя интерактивные фильтры на SERP.

2007 Knowledge Graph Патенты Google Семантика и интент

Как Google анализирует топовые органические результаты для извлечения связанных концепций и расширения понимания запроса

Google использует механизм для анализа содержания топовых органических результатов поиска с целью извлечения «коррелирующих сущностей» (часто встречающихся терминов и фраз). Эти сущности позволяют системе расширить понимание контекста исходного запроса. Данные используются в первую очередь для подбора релевантной рекламы, особенно если по исходному запросу объявлений недостаточно.

2007 Индексация Патенты Google Семантика и интент

Как Google оптимизирует свои семантические модели, удаляя редкие и слишком узкие концепции во время обучения

Google использует генеративные модели для понимания семантики текста, группируя связанные слова в «кластеры» (концепции). Этот патент описывает механизм оптимизации этих моделей во время обучения. Система автоматически удаляет кластеры, которые являются слишком маленькими (имеют мало связей) или редко используются. Это позволяет бороться с переобучением (overfitting) и фокусироваться на широких, статистически значимых концепциях.

2018 Антиспам Метрики качества поиска Патенты Яндекс Яндекс Браузер

Как Яндекс выявляет вредоносные сайты, сравнивая подозрительный трафик из браузеров с органической популярностью в поиске

Яндекс патентует метод выявления вредоносных или нежелательных сайтов путем анализа логов браузера и истории поиска. Система отслеживает подозрительные автоматические открытия сайтов (не инициированные пользователем) и сравнивает их частоту с популярностью сайта в органическом поиске. Если сайт часто открывается автоматически, но редко появляется в поиске или имеет низкий органический трафик, он классифицируется как нежелательный и добавляется в черный список.

2014 Патенты Google Семантика и интент

Как Google автоматически запускает нативные приложения в ответ на поисковый запрос, минуя SERP

Google использует механизм для автоматического запуска нативных приложений в ответ на определенные поисковые запросы. Если система определяет, что запрос имеет четкое намерение использовать конкретное приложение («Focus Intent») и это приложение значительно превосходит другие результаты в ранжировании, Google может запустить его напрямую, минуя страницу результатов поиска (SERP). Система также учитывает обратную связь от пользователей, прекращая автозапуск, если пользователи часто сразу закрывают приложение.

2016 Justin Lewis Патенты Google Семантика и интент

Как Google анализирует контент вашего сайта для валидации и приоритизации предлагаемых ключевых слов в своих инструментах

Google использует систему для проверки релевантности предлагаемых ключевых слов (например, в Google Ads), анализируя контент конкретного веб-сайта. Система генерирует семантически связанные термины, но затем проверяет, как часто они фактически встречаются вместе с исходным словом на этом сайте. Это позволяет автоматически отфильтровать нерелевантные предложения и разрешить семантическую неоднозначность, адаптируя подсказки к контексту домена.