Яндекс патентует метод ранжирования физических локаций (POI) на основе их популярности, измеряемой количеством фотографий объекта в сети. Система использует двухэтапный процесс: сначала идентифицирует фото по метаданным (геотеги, описания), а затем …
Разборы патентов
Google использует технологию для автоматического извлечения структурированных данных (Заголовков и Элементов) со страниц сайта. Система находит примеры категорий и фильтров (например, "Бренды", "Цвета"), определяет их структурное расположение в коде (Path/XPath), …
Патент описывает, как Google анализирует пользовательские аннотации и поведение при просмотре (Traffic Traces) для выявления важных сегментов внутри видео. Система автоматически группирует схожие сигналы, определяет границы популярных сегментов (Annotated Clips) …
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять …
Google использует исторические данные о поведении пользователя для определения его интересов. Когда запрос вызывает Панель знаний для сущности, система переоценивает потенциальные факты и сниппеты для включения в панель. Приоритет отдается …
Google патентует систему для рекомендации целых категорий контента (например, "Рецепты барбекю"), а не только отдельных страниц. Система создает "Эмбеддинги Категорий", агрегируя эмбеддинги топовых результатов поиска по названию этой категории. Затем …
Google использует этот механизм для обогащения поисковой выдачи. Когда система определяет, что запрос направлен на конкретную сущность (например, автора), она анализирует текущую SERP на наличие авторитетных источников и релевантность связанному …
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить ее уникальный контекст. Ранжирование улучшается …
Google использует механизм краудсорсинга для повышения точности данных. Система отслеживает, как пользователи исправляют или подтверждают факты (значения атрибутов сущностей), представленные в поиске. Эти исправления, особенно подтвержденные внешними источниками, используются для …
Яндекс патентует систему расчета «Баллов Доверия» (Trust Score) для веб-ресурсов. Оценка основана на анализе контента, метаданных (WHOIS, возраст, частота обновления), поведенческих факторов (выбор в поиске) и технических аспектов (сертификаты, работоспособность …
Google решает проблему нехватки данных для ранжирования новых или редких пар запрос-документ. Вместо запоминания исторических данных система изучает скрытые признаки (эмбеддинги) отдельно для запросов и документов. Оценка релевантности вычисляется как …
Яндекс патентует метод улучшения качества обучения алгоритмов ранжирования (MLA) путем автоматической генерации «сложных» отрицательных примеров (Hard Negatives). Если пользователь в рамках одной сессии уточняет запрос (с Q1 на Q2), система …
Яндекс патентует метод построения детальных профилей пользователей путем объединения данных из разных источников (например, данные интернет-провайдера и данные Яндекс.Метрики). Система обучает модель на пользователях, о которых известно максимум информации (пересечение …
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) …
Google использует машинное обучение для анализа местоположения, скорости движения и истории пользователя, чтобы предсказать, когда он откроет приложение Карт и что будет искать. Это позволяет системе заранее подготовить релевантные ссылки …
Яндекс патентует механизм поисковых подсказок (Suggest), который предлагает прямые ссылки на сайты еще до завершения ввода запроса. Система анализирует, какие сайты пользователи посещали ранее после ввода похожих запросов (историческое поведение), …
Яндекс автоматически создает тезаурус, анализируя большие объемы текста на основе дистрибутивной семантики. Система изучает контекст (соседние слова), в котором употребляются слова и фразы, и частоту их совместного появления в одном …
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный тематический интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по …
Патент описывает, как Google использует контекст пользователя (местоположение, время, интересы), чтобы предсказать его информационные потребности и предложить «Контекстные кластеры» запросов еще до ввода текста. Система анализирует исторические данные, группирует схожие …
Яндекс использует модель машинного обучения для определения приоритета индексации новых или обновленных страниц. Система оценивает потенциальную «полезность» страницы сразу после сканирования (T1), используя только доступные на этот момент данные. Страницы …

