Автор: Виктор Репин

2011 Патенты Google Семантика и интент

Как Google предлагает несколько вариантов исправления опечаток в запросе и динамически обновляет выдачу без перезагрузки страницы

Google использует механизм для улучшения пользовательского опыта при обработке неоднозначных опечаток. Система предлагает несколько вариантов исправления, включая «агрессивные» (сильно отличающиеся от оригинала). При выборе варианта результаты поиска обновляются динамически, часто без перезагрузки страницы, в том числе в режиме «Живого поиска» (Search as you type).

2008 Индексация Краулинг Патенты Google

Как Google обеспечивает стабильность канонических URL при асинхронном сканировании контента (Crawl Skew)

Google использует механизм для стабилизации индекса при обработке дубликатов в условиях неравномерного сканирования (Crawl Skew). Если страница не была пересканирована, система принудительно связывает ее с предыдущим каноническим URL (Previous Representative). Это обеспечивает стабильность выбора каноникалов и предотвращает индексацию устаревших дубликатов.

2015 Интент пользователя Патенты Яндекс Поведенческие факторы Рекомендательные системы

Как Яндекс использует контекст пользователя (местоположение, сенсоры, историю веб-поиска) для рекомендации мобильных приложений

Яндекс патентует систему для контекстной рекомендации мобильных приложений. Система анализирует глубокий профиль пользователя: историю веб-поиска, геолокацию, данные сенсоров устройства и демографию. Сопоставляя этот контекст с характеристиками приложений (включая анализ отзывов), система определяет, какое приложение (новое или уже установленное) релевантно пользователю в данный момент.

2011 Мультимедиа Патенты Google

Как Google использует совместную встречаемость визуальных элементов для распознавания объектов на изображениях

Google анализирует изображения, разбивая их на визуальные сегменты (области схожего цвета/текстуры). Система изучает, какие сегменты обычно появляются вместе (контекст), и создает базу данных (Codebook). При анализе нового изображения, если его сегменты взаимно «ожидают» увидеть друг друга согласно Codebook, система идентифицирует их как единый объект.

2008 Патенты Google Ссылки

Как Google упрощает добавление ссылок на источники и поисковых запросов в ответы на Q&A платформах и форумах

Патент Google, описывающий дизайн пользовательского интерфейса для Q&A платформ и форумов. Система позволяет пользователям выполнять поиск (по вебу, картинкам и т.д.) прямо из формы ответа и одним кликом добавлять найденные результаты в качестве цитат или сносок. Также может сохраняться исходный поисковый запрос, который использовался для поиска источника.

Краулинг Патенты Google

Как Google адаптивно регулирует скорость сканирования сайтов, чтобы не перегружать серверы (Crawl Budget Management)

Патент Google, описывающий инфраструктуру управления распределенным сканированием. Система группирует URL по хостам и использует механизм «Stall Time» (время простоя), чтобы определить, когда можно снова обратиться к серверу. Это время адаптивно корректируется в зависимости от фактической скорости ответа сервера (Retrieval Time), позволяя Google эффективно управлять Crawl Budget и соблюдать «политику вежливости».

2016 Патенты Google Свежесть контента

Как Google использует всплески поисковых запросов для определения популярных моментов в видеоконтенте и создания интерактивных опросов

Google анализирует аномальные всплески поисковых запросов в реальном времени для автоматического определения «популярных моментов» в транслируемом контенте (ТВ, спорт). Система сопоставляет время и ключевые слова всплеска с метаданными или аудиодорожкой трансляции. На основе этих данных генерируются интерактивные опросы и гиды по лучшим моментам.

2015 Антиспам Безопасный поиск Патенты Google

Как Google использует анализ совместных поисковых сессий для выявления запросов о неприемлемом или запрещенном контенте

Google анализирует поисковые сессии пользователей для обучения классификатора, выявляющего запросы о неприемлемом контенте (например, насилии, CSAM, терроризме). Система отслеживает, какие еще запросы вводил пользователь незадолго до или после ввода уже известного «плохого» запроса. Это позволяет автоматически расширять базу данных для фильтрации и модерации поисковой выдачи.

2007 Индексация Мультимедиа Патенты Google

Как Google использует структурные разрывы (смены сцен и тишину) для идентификации дубликатов видео и организации видео-поиска

Google использует систему фингерпринтинга видео, которая анализирует не пиксели, а временные метки структурных разрывов — смены сцен (shot boundaries) и моменты тишины (silent points). Это позволяет идентифицировать дубликаты или похожий контент даже при различиях в кодировании, разрешении или частоте кадров, что используется для удаления нарушений авторских прав и организации результатов видео-поиска.

2019 Индексация Краулинг Патенты Google

Как Google предлагает стандарт шифрования для безопасной индексации платного контента (Paywall) без клоакинга

Патент Google описывает метод шифрования платного (premium) контента, позволяющий безопасно передавать весь контент пользователю, скрывая платную часть до авторизации. Ключевое значение для SEO: этот метод позволяет поисковым системам (явно указанным как доверенные стороны) получать доступ и индексировать полный текст контента, соблюдая бизнес-модель издателя и не нарушая правил поиска.

2012 Gal Chechik Индексация Мультимедиа Патенты Google

Как Google классифицирует изображения по сезонам и времени суток на основе визуальных признаков и использует это в поиске

Google использует модели машинного обучения для анализа визуальных характеристик изображений (цвет, текстура, освещение) и определения вероятного времени их съемки (сезон, месяц, время суток), даже если метаданные отсутствуют. Это позволяет фильтровать поиск картинок по времени и находить изображения одного объекта, снятые с одной и той же точки обзора (Location + Direction) в разное время года.

2012 Google Shopping Патенты Google

Как Google рассчитывает «истинную» стоимость товарных предложений, нормализуя скидки, бандлы и услуги для ранжирования

Google использует механизм для объективного сравнения сложных товарных предложений в поиске (например, Google Shopping). Система определяет денежный эквивалент немонетарных бонусов (гарантия, установка, аксессуары) и вычитает его из цены товара. Это позволяет ранжировать предложения по их реальной ценности (Equivalent Value), а не только по заявленной цене.

2014 SERP Мультимедиа Патенты Google

Как Google использует распознавание лиц и кластеризацию для очистки и переранжирования выдачи в Поиске по Картинкам

Google применяет технологию компьютерного зрения для улучшения поиска изображений по именам людей. Система анализирует топ выдачи, распознает лица и группирует похожие изображения. Определив доминирующий кластер (искомого человека), система переранжирует результаты: визуально похожие изображения повышаются, а «выбросы» (фото других людей) понижаются, игнорируя противоречивые текстовые сигналы.

2011 Paul Haahr Безопасный поиск Индексация Патенты Google

Как Google обнаруживает и фильтрует страницы с утечками конфиденциальных персональных данных (PII)

Google использует систему для защиты пользователей от утечек конфиденциальных данных (PII), таких как номера кредитных карт или SSN. Система анализирует контент на соответствие форматам PII и ищет связанные ключевые слова поблизости для подтверждения утечки. Если оценка риска превышает порог, страница классифицируется как угроза и может быть удалена из результатов поиска или понижена в ранжировании.

2012 Мультимедиа Патенты Google

Как Google динамически расширяет результаты поиска на SERP, добавляя превью и контент из других источников

Анализ патента Google, описывающего механизм пользовательского интерфейса (UI), позволяющий пользователям взаимодействовать с результатом поиска (например, свайпом) для отображения «Расширенного контента» прямо на SERP. Этот контент может включать предварительный просмотр страниц сайта или релевантную информацию из других источников («off-page content»), например, карты или изображения. При этом слот результата расширяется, предоставляя больше информации без ухода со страницы выдачи.

2023 E-commerce SEO Патенты Яндекс Поведенческие факторы Яндекс Маркет

Как Яндекс использует поведение пользователей для проверки точности цен и характеристик товаров на электронных платформах (например, Яндекс.Маркет)

Яндекс патентует систему контроля качества данных для электронных платформ. Система группирует идентичные товары от разных продавцов и отслеживает взаимодействие пользователей (например, клики). Если изменение характеристики (например, цены) вызывает аномальный всплеск или падение интереса, выходящее за установленные пороги, система автоматически помечает новое значение как потенциально ошибочное.

2020 SERP Метрики качества поиска Патенты Яндекс Яндекс Директ

Как Яндекс меняет выбор и расположение рекламы в зависимости от качества органической выдачи

Яндекс использует метрику качества всей органической выдачи («Relevance Factor»), чтобы определить, какие рекламные объявления показать и где их разместить. Если органические результаты хорошо отвечают на запрос пользователя, система может выбрать более качественные объявления и разместить их на более заметных позициях (вверху/в центре). Если качество органики низкое, реклама может быть размещена менее заметно (внизу/справа).

2010 Индексация Краулинг Мультиязычность Патенты Google

Как Google генерирует синонимы во время индексации, извлекая числа из токенов и нормализуя слова с префиксами-стоп-словами

Google может генерировать синонимы для слов непосредственно во время индексации документа, чтобы ускорить обработку запросов. Это включает извлечение числовых значений из буквенно-числовых токенов (например, «42» из «e42PC») и нормализацию слов путем удаления префиксов, являющихся стоп-словами (например, артиклей в арабском языке), используя статистические черные списки для предотвращения ошибок. Оба варианта сохраняются в индексе.

2007 Индексация Мультимедиа Патенты Google

Как Google использует транскрибацию и динамическую вставку контента для индексации и монетизации подкастов

Патент описывает платформу для автоматизации подкастинга, которая динамически вставляет аудиоконтент (например, рекламу) в момент загрузки подкаста пользователем. Система также включает механизм преобразования речи в текст (Speech-to-Text) для создания транскриптов, что делает аудиоконтент видимым для поисковых систем и улучшает таргетинг рекламы.

2021 SERP Метрики качества поиска Патенты Яндекс Поисковые подсказки

Как Яндекс выборочно предзагружает выдачу для поисковых подсказок и защищает статистику кликов от «фантомных» показов

Яндекс оптимизирует скорость поиска, предзагружая результаты для наиболее вероятной поисковой подсказки, пока пользователь еще вводит запрос. Система использует метрику PFOP для баланса скорости и нагрузки на сервер. Также патент описывает механизм маркировки предзагруженных, но не показанных пользователю SERP («фантомные показы»), чтобы исключить их из расчета CTR и не искажать поведенческие данные, используемые для ранжирования.