Автор: Виктор Репин

2009 Индексация Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует поисковые запросы и клики пользователей для детальной тематической классификации контента

Google использует гибридный подход для классификации контента в детальные иерархические категории. Система анализирует, какие запросы (N-граммы) приводят пользователей к кликам на контент из определенных категорий. Эти запросы становятся «подтверждающими» (Supporters) для категории. При анализе нового текста система сопоставляет его N-граммы с этими Supporters и применяет многоуровневую систему взвешивания (включая TF-IDF и бустинг за глубину иерархии) для точной классификации.

2021 Антиспам Патенты Яндекс Поведенческие факторы Яндекс Маркет

Как Яндекс использует историю браузера и паттерны URL для верификации реальных покупателей и борьбы с накруткой отзывов

Яндекс патентует метод борьбы с фейковыми отзывами путем анализа истории посещений пользователя. Система ищет в истории браузера URL-адреса, соответствующие страницам подтверждения транзакций (например, «Thank you page»). Для этого используются векторные представления (эмбеддинги) и шаблоны URL. Если такой URL найден, пользователь признается реальным покупателем, а его отзыв получает приоритет или пометку «подтвержденный».

2015 Интент пользователя Патенты Яндекс Персонализация Поведенческие факторы

Как Яндекс анализирует и сегментирует историю браузера для определения текущего намерения пользователя и персонализации выдачи

Яндекс патентует метод анализа полной истории посещений пользователя (Browsing Log). Система использует машинное обучение (GBDT) для разделения этой истории на «логические сессии», каждая из которых соответствует конкретной задаче или цели пользователя. Для этого анализируется схожесть URL, текстов страниц и временные интервалы между посещениями. Эта информация о текущем намерении используется для адаптации и персонализации результатов поиска.

2011 Baris Yuksel EEAT и качество Антиспам Патенты Google Поведенческие сигналы

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)

Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.

2016 Патенты Яндекс Поведенческие факторы Рекомендательные системы Холодный старт

Как Яндекс использует данные о поведении пользователей на одних сайтах для персонализации контента на других сайтах (Cross-Site Personalization)

Яндекс патентует механизм кросс-ресурсной персонализации. Система собирает данные о взаимодействиях пользователей с одним ресурсом (например, поисковой системой) и использует эту «контекстную информацию» для ранжирования элементов на совершенно другом ресурсе (например, новостном сайте). Это позволяет персонализировать выдачу даже при первом визите, используя машинное обучение для поиска скрытых корреляций между поведением на разных сайтах.

2020 Патенты Яндекс Поведенческие факторы Ранжирование Рекомендательные системы

Как Яндекс ранжирует рекомендации медиаконтента, умножая тематическую схожесть тегов на показатели вовлеченности

Яндекс патентует метод для систем рекомендаций (например, Видео или Дзен). Система рассчитывает финальный скор схожести (Correspondence Parameter), перемножая количество общих тегов (тематическая близость) на сумму показателей вовлеченности (например, время просмотра) исходного и рекомендуемого объекта. Это усиливает позиции вовлекающего контента в рекомендациях.

2013 Патенты Google Поведенческие сигналы Семантика и интент Ссылки

Как Google создает интерактивное визуальное пространство для исследования связанных поисковых запросов

Google использует механизм для визуального исследования результатов поиска (например, по картинкам). Система определяет запросы, связанные с исходным, и размещает их результаты в виде «панелей» вокруг центрального результата. Пользователь может перемещаться по этому пространству, при этом система динамически генерирует новые связанные запросы на основе видимых панелей, используя аддитивное взвешивание для создания бесконечного интерфейса исследования тем.

2013 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google использует кластеризацию уточнений запросов для создания диалоговых подсказок и управления поисковым путем пользователя

Google анализирует журналы запросов, чтобы определить, как пользователи чаще всего уточняют широкие запросы. Система кластеризирует эти уточнения по темам (например, «кухня», «местоположение»), определяет наиболее разнообразную тему уточнения и предлагает пользователю диалоговую подсказку («Какую кухню вы предпочитаете?»), чтобы быстро сузить результаты поиска в формате диалога.

2007 EEAT и качество Knowledge Graph Патенты Google Ссылки

Как Google использует анкорный текст внешних ссылок для определения синонимов и названий сущностей в Knowledge Graph

Google автоматически изучает альтернативные названия и синонимы для сущностей (например, узнает, что «Big Blue» это IBM), анализируя анкорный текст ссылок, ведущих на авторитетные источники фактов об этой сущности. Система фильтрует и обрабатывает эти тексты, учитывая частоту их использования и качество ссылающихся сайтов (например, PageRank), чтобы обогатить базу знаний (Knowledge Graph) и улучшить понимание запросов.

2006 Антиспам Патенты Google Ссылки

Как Google может рассчитывать авторитетность страниц на основе их кратчайшего расстояния до доверенных «Seed» сайтов

Google патентует метод ранжирования, альтернативный классическому PageRank, который трансформирует расчет авторитетности в задачу поиска кратчайшего пути в веб-графе. Система определяет набор доверенных «Seed» сайтов и измеряет расстояние от них до всех остальных страниц. Чем короче расстояние до нескольких (k) ближайших Seed-сайтов, тем выше ранг страницы. Длина ссылки при этом увеличивается, если у исходной страницы много исходящих ссылок.

2024 Индексация Патенты Яндекс Ранжирование Семантический поиск

Как Яндекс в реальном времени рассчитывает близость и совместное вхождение ключевых слов для ранжирования

Яндекс патентует метод эффективного расчета сложных факторов ранжирования, зависящих от взаимодействия нескольких слов в запросе (например, их близость друг к другу или совместное вхождение в Title/URL). Система использует данные из инвертированного индекса о позициях отдельных слов для динамического вычисления этих факторов на лету. Затем эти данные обрабатываются Нейронной Сетью для генерации комплексного признака ранжирования.

2017 SERP Патенты Яндекс Поведенческие факторы Поисковые подсказки

Как Яндекс генерирует и отображает интерактивные подсказки для уточнения запроса на основе поведения пользователей

Яндекс патентует метод генерации и отображения интерактивных подсказок (уточнений запроса) на странице результатов поиска. Подсказки генерируются путем анализа прошлых успешных запросов, их группировки на основе поведенческой схожести (клики на общие ресурсы) и выбора наиболее популярных и уникальных терминов. Они отображаются как кликабельные объекты (например, кнопки) вне поисковой строки, позволяя пользователю интерактивно сужать область поиска и видеть историю своих уточнений.

2015 Патенты Google Персонализация Поведенческие сигналы Ссылки

Как Google персонализирует мобильную выдачу, повышая в ранжировании приложения, которые пользователь часто использует (Affinity Score)

Google рассчитывает «Affinity Score» для мобильных приложений на основе того, как часто и долго пользователь их использует (относительное вовлечение). При поиске с мобильного устройства система повышает в ранжировании результаты (deep links), ведущие в приложения с высоким Affinity Score, делая выдачу более персонализированной.

2014 Local SEO Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует агрегированные поведенческие данные (поиски, маршруты, GPS) для автоматического создания описаний и характеристик локального бизнеса

Google анализирует агрегированные данные о взаимодействиях пользователей с физическими локациями (поисковые запросы, запросы маршрутов, данные GPS, чекины). Система сравнивает активность в конкретном месте с активностью в аналогичных местах («Peer Groups») или с активностью в разные периоды времени. На основе этого сравнения генерируются текстовые описания («популярно у местных», «в тренде», «быстрый перекус»), которые отображаются в результатах поиска и на картах.

2005 SERP Патенты Google Поведенческие сигналы Ссылки

Как Google автоматически генерирует и отбирает Sitelinks (быстрые ссылки) на основе поведения пользователей и качества страниц

Патент Google, описывающий механизм создания Sitelinks (быстрых ссылок). Система анализирует поведение пользователей (клики, время на странице) и другие сигналы качества (входящие ссылки, вероятность конверсии), чтобы определить наиболее полезные внутренние страницы сайта. Эти страницы затем показываются под основным результатом поиска, ускоряя навигацию пользователя.

2013 Justin Lewis Патенты Google Персонализация Поведенческие сигналы Ссылки

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним

Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.

2013 EEAT и качество Nitin Gupta Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует шаблоны запросов для выявления скрытых вопросов в неоднозначных поисковых запросах

Google определяет, когда неоднозначный запрос (например, «высота Эвереста») на самом деле ищет конкретный ответ. Система сопоставляет запрос с историческими шаблонами поиска (Query Templates). Если этот шаблон связан с явным, валидированным вопросительным шаблоном (например, «какова высота Эвереста?»), Google классифицирует исходный запрос как поиск ответа, что влияет на SERP и показ Featured Snippets.

2004 EEAT и качество Патенты Google Свежесть контента Ссылки

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)

Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.

2012 Патенты Google Поведенческие сигналы Ссылки

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта

Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.

2020 SERP Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс автоматически создает и тестирует относительные (контекстные) факторы ранжирования (Мета-признаки)

Яндекс патентует систему автоматического создания «мета-признаков» для улучшения ранжирования. Мета-признак — это относительный фактор, значение которого зависит не только от самого документа, но и от других документов в выдаче по тому же запросу (например, нормализованный CTR относительно среднего значения по SERP). Система генерирует такие признаки, проверяет их эффективность через A/B тесты и внедряет лучшие в основную формулу ранжирования.