Индексация

Google автоматически разделяет видео, в частности инструкции ("how-to"), на смысловые сегменты. Система использует обязательную комбинацию анализа текстовой транскрипции и технического анализа видеоряда (Motion Flow и Gradient Flow), чтобы определить точные …
Google рассчитывает Mobile-Friendliness Score, рендеря страницы как мобильное устройство и оценивая такие сигналы, как размер кликабельных элементов, читаемость текста, настройки области просмотра (viewport) и скорость загрузки. Эта оценка используется для …
Патент описывает нейросетевой метод (известный как Doc2Vec) для преобразования документов любой длины в числовые векторы (эмбеддинги). Эти векторы фиксируют семантику и контекст всего документа, позволяя системе понимать смысл контента, классифицировать …
Патент Google, описывающий высокоэффективные алгоритмы для поиска всех пар похожих объектов (All-Pairs Similarity Search) в масштабах веба. Система использует селективное индексирование и математические оценки (границы схожести), чтобы избежать полного перебора …
Google разработал систему для эффективного понимания содержания видео. Вместо анализа каждого кадра система выбирает ключевые кадры и использует Vision-Language Model для создания их текстового описания. Когда пользователь задает вопрос о …
Google использует механизм для понимания семантики таблиц в интернете. Система автоматически определяет главную колонку таблицы (Subject Column), содержащую сущности, и классифицирует эти сущности с помощью иерархии знаний (Instance-Class Hierarchy), извлеченной …
Google использует систему контекстной интерпретации текста для идентификации текстовых строк, которые не должны влиять на классификацию документа. Анализируя метаданные (автор, получатель) и контекстные сигналы (приветствия, валюта), система помечает имена, суммы …
Google использует систему для автоматического создания и категоризации групп сущностей ("Коллекций") в Knowledge Graph на основе общих признаков. Патент описывает язык правил для определения принадлежности к коллекции и высокоэффективный механизм, …
Google использует систему для идентификации значимых фраз (концепций) в документах, анализируя структурные и семантические границы текста (предложения, заголовки, HTML-теги). Ключевым механизмом является оценка взаимосвязи между фразами и их подфразами (Devolution). …
Google использует систему для ответов на фактические вопросы путем анализа топовых результатов поиска. Система определяет тип ожидаемого ответа (например, персона, место), извлекает соответствующие сущности из неструктурированного текста этих страниц и …
Google использует автоматизированный метод для расширения своей Географической Информационной Системы (GIS). Система анализирует адреса, которые не удалось распознать из-за неизвестного термина (например, названия района). Удалив этот термин, система определяет координаты …
Google использует статистический анализ (KL-дивергенцию) для определения «согласованности» (coherence) категорий сущностей (например, «Города»). Если сущности внутри категории часто встречаются в одинаковых контекстах запросов, категория считается согласованной. Это позволяет системе обобщать …
Патент Google описывает интерфейс для агрегации контента (например, Google News). Система группирует связанные документы в кластеры и представляет их в виде сворачиваемых блоков. В развернутом виде блок показывает разнообразные типы …
Google анализирует контент интерактивных сессий (например, обучающих видео), чтобы определить, какие инструменты и материалы необходимы для выполнения конкретной задачи. Система классифицирует их как "обязательные" или "опциональные" на основе частоты использования …
Google анализирует контент топовых документов по запросу, использует языковые модели для суммаризации отдельных пассажей и кластеризует эти суммаризации для выявления общих тем. Затем поисковая выдача реорганизуется для представления этих тем, …
Google совершенствует понимание текста за рамками TF-IDF, анализируя, как часто слова встречаются вместе в корпусе документов (Co-occurrence Consistency). Внутри конкретного документа или запроса система запускает алгоритм типа PageRank, где слова …
Патент Google описывает систему динамического определения географической «области релевантности» для локального поиска и рекламы. Система учитывает плотность бизнеса в запрошенной категории для конкретного местоположения: в густонаселенных районах область сужается, а …
Google использует метод "Поиска известного элемента" для надежной идентификации конкретных сущностей (например, научных статей или товаров), даже если исходный запрос содержит ошибки. Система создает несколько запросов с разными комбинациями атрибутов …
Google использует автоматизированную систему (Merchant Trustworthiness Evaluator) для оценки надежности продавцов. Система собирает обещанные сроки доставки в момент заказа (например, через пиксель конверсии) и сверяет их с фактическими данными, полученными …
Патент (Yahoo) описывает метод определения связи между разными поисковыми запросами. Если два запроса возвращают схожий набор органических результатов (URL), система считает их семантически связанными. Этот механизм используется для показа релевантной …