Google применяет статистический анализ на основе теории информации для определения, какие параметры URL влияют на уникальность контента. Система вычисляет условную энтропию между значениями параметров и отпечатками контента (fingerprints). Это позволяет …
Разборы патентов
Google использует сложный алгоритм для анализа DOM-структуры, чтобы отличить основной контент (статьи, посты) от шаблонных элементов (меню, виджеты). Система генерирует стабильный идентификатор (например, CSS-селектор) для контейнеров основного контента. Это позволяет …
Патент Google, описывающий инфраструктуру управления данными о сущностях (например, компаниях или местах). Вместо использования фиксированных ID, система обрабатывает входящую информацию (правки, отзывы) как неизменяемые «наблюдения». Наблюдения группируются в «кластеры» на …
Яндекс использует машинное обучение для определения оригинального источника (первоисточника) контента, который был многократно перепечатан. Система группирует похожие публикации в тематические кластеры и анализирует исходящие ссылки внутри этого кластера. Учитывая репутацию …
Google использует двухэтапную систему для генерации временных шкал. Сначала система определяет значимые события, анализируя всплеск публикаций от широкой категории источников (например, всех СМИ) в определенные интервалы времени. Затем для этих …
Google анализирует исторические логи поиска, чтобы понять, как пользователи в разных странах и на разных языках структурируют географические запросы. Система генерирует вероятностные Шаблоны Запросов (Query Templates) и рассчитывает вероятность их …
Google разрабатывает систему мультимодального поиска, позволяющую пользователям записывать видео и одновременно задавать вопрос голосом или записывать звук. Система использует продвинутые ML-модели для генерации видео-эмбеддингов, анализа временной информации и аудиосигнатур. Это …
Патент описывает систему оценки изображений на предмет нежелательного (например, взрослого) контента. Система анализирует не только само изображение и страницу, на которой оно размещено, но и агрегированные статистические данные по другим …
Патент Google описывает механизм уточнения результатов поиска прямо на странице выдачи. Пользователь вводит уточняющий запрос, и система динамически фильтрует уже показанные результаты и генерирует новые сниппеты, релевантные уточнению. Все это …
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах …
Google анализирует, как объекты движутся и трансформируются в видео (траектории), чтобы понять, что визуально разные состояния (например, открытый и закрытый глаз) семантически являются одним и тем же объектом. Эта технология …
Google может использовать данные из социальных сетей (member networks) для изменения ранжирования локальных результатов и рекламы. Система учитывает рекомендации (endorsements) от связанных пользователей, корректируя их вес на основе близости социальной …
Google обрабатывает сложные «композиционные запросы», сравнивая атрибуты (местоположение или время) разных типов сущностей в Knowledge Graph. Система находит пары, удовлетворяющие критерию связи (например, расстоянию), и визуализирует результаты на картах или …
Google разработал систему для автоматического анализа неструктурированных документов о занятости (резюме, CV, профили в соцсетях). Система извлекает информацию о должностях, компаниях, образовании и датах работы, структурируя эти данные в виде …
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего …
Google использует социальный граф пользователя для персонализации поиска по картинкам. Система идентифицирует изображения, опубликованные контактами пользователя (друзьями, подписками), и ранжирует их в единой выдаче с общими результатами. Ключевую роль играет …
Патент Google описывает систему семантического парсинга для точной интерпретации запросов. Система определяет интент и извлекает аргументы (сущности), сравнивая запрос с эталонными примерами в векторном пространстве (эмбеддингах). Ключевая особенность — механизм …
Google использует систему для обработки запросов на естественном языке (например, голосовых). Она определяет тематическую область запроса (домен), выбирает наиболее подходящий специализированный поисковый движок или базу данных и переформатирует исходный запрос …
Google использует контекст пользователя (текущее местоположение по GPS, просматриваемую карту или активное приложение) для выбора специализированной "грамматики" (словаря). Это позволяет системе точнее распознавать названия местных бизнесов и объектов во время …
Google анализирует контент (URL, заголовки, сниппеты, метки) топовых результатов поиска для определения доминирующего интента. Система присваивает категории каждому результату и взвешивает их, отдавая значительное предпочтение результатам на более высоких позициях …

