Автор: Виктор Репин

Google использует систему для автоматического извлечения и проверки «Структурных параметров» (бренды, атрибуты, категории, линейки продуктов) из неструктурированного веб-контента и логов запросов. Система валидирует классификацию с помощью анализа контекстуального сходства, целевого краулинга (поиск фраз типа «X является Y») и анализа распределения кликов. Это позволяет стандартизировать данные о товарах от разных продавцов и формировать структурированную E-commerce выдачу.

Google патентует систему, позволяющую местным заведениям (барам, ресторанам) указывать в своих бизнес-профилях, какие именно события (например, спортивные матчи) они будут транслировать. Эта информация индексируется и используется в Поиске и Картах, позволяя пользователям находить заведения по запросам типа «где посмотреть матч [Команда А] сегодня вечером».

Яндекс патентует механизм, который изменяет визуальное расположение результатов поиска в зависимости от устройства или приложения пользователя (например, десктоп или мобильное приложение). Система предсказывает, в каком порядке пользователи будут взаимодействовать с выдачей на данном устройстве, и перестраивает макет SERP для оптимизации UX. При этом фактический ранг релевантности (QSR) сохраняется, а поведенческие сигналы, вызванные изменением интерфейса, не влияют на будущее ранжирование.

Google индексирует веб-контент и проверяет, доступен ли этот же контент («синхронизированный контент») через нативные приложения, установленные на устройстве пользователя. Если приложение установлено и контент синхронизирован, Google формирует специальный результат поиска (Deep Link), который запускает приложение и открывает в нем нужный контент напрямую, минуя веб-браузер.

Патент Google, лежащий в основе вертикального поиска (например, Google Shopping). Система анализирует структурированные данные (атрибуты товаров, вакансий) и динамически решает, какие фильтры показать пользователю. Выбор основан не только на наличии данных, но и на том, какие атрибуты пользователи исторически чаще всего использовали для уточнения аналогичных запросов. Также учитывается полнота данных для ранжирования (Item Rank).

Google патентует систему «Временная карта» (Temporal Map), которая индексирует локальные события (концерты, распродажи, специальные меню) и отображает их на карте в привязке ко времени. Система агрегирует эти данные для вычисления «социальной семантики» или «атмосферы» (Vibe) района в разное время суток, используя эту информацию для персонализации локального поиска и рекомендаций.

Google использует систему «Place Rank» для определения важности и «интересности» геопространственных сущностей (мест, бизнесов). Ранжирование основано на множестве факторов: качестве описания, авторитетности источника, популярности (просмотры, клики), внешних рейтингах, PageRank связанных веб-страниц и персональных предпочтениях пользователя (избранное).

Патент Google, описывающий механизм улучшения пользовательского опыта после клика на результат поиска. Система идентифицирует ключевые фрагменты текста (Resource Search Tidbits) на целевой странице. Когда пользователь переходит на страницу, браузер может автоматически предложить интерфейс для быстрого перехода (прокрутки и подсветки) к этим фрагментам, особенно если они находятся вне зоны видимости.

Патент Google, описывающий инфраструктурные оптимизации для распределенных вычислений (MapReduce), позволяющие анализировать огромные графы (миллиарды узлов) значительно быстрее. Он раскрывает методы повышения эффективности алгоритмов, которые ищут кластеры (связанные компоненты) в графах, сокращая время обработки и сетевой трафик.

Анализ патента Google, лежащего в основе системы «Поиск по картинке» (Search by Image). Описан метод генерации компактных цифровых подписей (хэшей) изображений с помощью вейвлет-преобразований для эффективного поиска почти дубликатов. Также раскрывается архитектура, которая определяет текстовые метки (Labels) для изображения, использует их для поиска и переранжирует веб-страницы, содержащие это изображение, на основе их текстового контекста.

Google использует механизм для определения связанности между локальными бизнесами (POI), выходя за рамки простых категорий. Система анализирует специфические характеристики бизнеса («Known For Terms» или KFT), извлеченные из отзывов, веб-страниц и социального контекста. Схожесть рассчитывается путем сравнения этих характеристик, при этом уникальные общие черты ценятся выше, чем распространенные.

Google обрабатывает голосовые запросы, генерируя несколько текстовых интерпретаций (гипотез). Начальные веса этим гипотезам присваиваются на основе исторических логов запросов. Система выполняет первичный поиск и затем итеративно уточняет веса, основываясь на полученных результатах (например, их количестве). Финальный поиск использует уточненные веса для обеспечения более точной выдачи.

Яндекс использует механизм для идентификации навигационных (брендовых) запросов. Система определяет целевой веб-ресурс и извлекает из базы данных заранее подготовленные «целевые сообщения» (например, рекламные акции, быстрые ссылки или колдунщики), связанные с этим ресурсом. Эти сообщения показываются на приоритетных позициях в SERP, часто вверху выдачи или в формате карусели, а их выбор оптимизируется на основе скорректированного CTR.

Яндекс патентует механизм для интеграции транзакционных функций непосредственно в SERP. Система использует специальный реестр, который связывает веб-ресурсы (например, сайт кинотеатра) с идентификаторами конкретных платформ бронирования. Если результат поиска соответствует записи в реестре, Яндекс генерирует графический компонент (например, кнопку «Купить»), позволяющий пользователю совершить транзакцию напрямую с этой платформой, минуя промежуточные шаги и часто не покидая страницу выдачи.

Google использует механизм для уточнения временного контекста запроса. Это происходит тремя способами: анализом временных указаний в самом запросе (например, «сезон охоты»), учетом текущего времени и местоположения пользователя (например, поиск «кофейни» ночью), или анализом того, какие результаты выбирает пользователь из первоначальной выдачи (например, выбор зимних фотографий). На основе этого уточненного временного контекста выдача перестраивается.

Этот основополагающий патент описывает технологию XML Sitemap. Он определяет, как веб-серверы могут автоматически генерировать списки URL с метаданными (дата изменения, приоритет, частота обновления) путем анализа файловой системы или логов доступа, а затем активно уведомлять поисковые системы о доступности обновлений для повышения эффективности и полноты сканирования.

Google использует инфраструктурный метод обновления инвертированного индекса «на месте» (in-place updates). Система заранее резервирует пустые позиции в отсортированных списках документов (posting lists). Это позволяет почти мгновенно добавлять или удалять документы, сохраняя порядок сортировки, что критично для скорости поиска, но не влияет на SEO-стратегию.

Яндекс патентует гибридный метод точной идентификации объектов на веб-странице (рекламы, логотипов, карт). Система анализирует не только исходный код (теги, скрипты), но и финальные визуальные характеристики объекта после рендеринга (размер, позицию, стиль). Для верификации используются специализированные наборы правил и машинное обучение.

Яндекс патентует метод эффективной обработки синонимов в запросах, избегая «комбинаторного взрыва». Система использует двухэтапный процесс: нормализация (приведение слов к базовой форме/лексеме) и обобщение (замена лексем на самый популярный «основной синоним»). Это позволяет быстро сопоставлять семантически схожие, но текстуально разные фразы, особенно для показа целевого контента.

Яндекс патентует метод исправления опечаток для запросов, которые система видит впервые («холодный старт»). Поскольку истории по новому запросу нет, система находит известный редкий запрос, максимально похожий по написанию, и использует его как прокси («аппроксимированный запрос»). История переходов этого прокси-запроса используется для оценки вероятных исправлений нового запроса.