Google анализирует исторические данные о поисковых запросах и введенных URL. Когда пользователь начинает вводить текст, система быстро находит наиболее вероятные варианты завершения, используя эффективные структуры данных (хеш-таблицы и фингерпринты). Подсказки …
Патенты Google
Разборы патентов поисковой системы Google
Google использует автоматизированный анализ геолоцированных изображений (например, Street View) для валидации локальных бизнес-листингов. Система классифицирует окружающую среду и сравнивает ее с заявленной категорией бизнеса. Если категория несовместима с визуальным контекстом …
Google анализирует, является ли общий запрос (без указания места) статистически более популярным в конкретном регионе или часто вводится через интерфейс Карт. Если да, система определяет запрос как «локально значимый», автоматически …
Google определяет, какой формат контента (изображения, видео, текст, аудио) ожидает пользователь, вычисляя «Значение индекса интента» (Intent Index Value). Для этого используются AI-модели или анализ исторических данных (кластеры запросов). Это значение …
Google анализирует, какие результаты поиска выбирают пользователи, чтобы понять, являются ли последовательные слова в запросе единой фразой (например, "Нью Йорк") или отдельными терминами. Если пользователи преимущественно кликают на результаты, содержащие …
Google использует методологию оценки качества, основанную не только на CTR, а на анализе поведения пользователя после клика («Session Features»). Система применяет статистические модели для прогнозирования удовлетворенности пользователя (P(Good Ad)). Хотя …
Google использует двухкомпонентную систему для ранжирования пользовательского контента (UGC) и комментариев. Сначала вычисляется объективная оценка качества, независимая от пользователя (учитывая репутацию автора, грамматику, свежесть). Затем, если пользователь идентифицирован, вычисляется субъективная …
Google улучшает ранжирование в специализированных поисковых вертикалях (например, Музыка, Книги, Товары), где данных для оценки контента недостаточно (Sparse Corpora). Система использует сигналы из основного Веб-поиска (популярность запросов, CTR веб-страниц), чтобы …
Google улучшает понимание сущностей (Instances) путем анализа того, как пользователи их ищут. Патент описывает метод ранжирования категорий (Classes) для сущности, основанный на частоте их совместного упоминания в логах поисковых запросов. …
Патент Google описывает систему автоматической классификации видео, которая не требует ручной разметки и устойчива к неточным метаданным. Система сначала обучает классификаторы на основе аудиовизуального контента. Затем эти результаты используются для …
Google использует механизм для определения интента пользователя по редким или новым (long-tail) запросам, когда исторические данные отсутствуют. Система эффективно "прощупывает" вертикальные индексы (например, картинки), чтобы решить, стоит ли проводить полный …
Патент Google описывает систему оценки контента, основанную на делегировании авторитета. Доверенный источник (Primary Authority) передает количественно измеримый авторитет другим экспертам (Contributing Authorities), которые могут делегировать его дальше. Итоговый рейтинг контента …
Google использует систему для классификации сайтов по уровню качества и авторитетности в рамках конкретных тематик (Knowledge Domains). Система создает векторные представления (эмбеддинги) сайтов и сравнивает их с эталонными векторами высококачественных …
Патент раскрывает методы интерпретации голосового ввода на носимых устройствах. Система анализирует обширный контекст (недавние документы, местоположение, календари), чтобы определить намерение пользователя. Ключевой особенностью является генерация «неявных поисковых запросов» (Implicit Search …
Google группирует ресурсы, относящиеся к одной сущности (человек, продукт, книга), в кластеры. Патент описывает двухуровневую систему ранжирования: сначала ресурсы ранжируются внутри кластера на основе их общего качества (Quality Score) и …
Google использует изображения Street View для валидации локальных бизнес-листингов. Система создает «viewcodes», связывая листинг с изображением его физического местоположения. Это используется для обнаружения спама (фейковых адресов), закрытых предприятий и определения …
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования …
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству …
Анализ патента Google (на основе Search Report A3), описывающего использование исторических данных и данных о трафике для оценки документов. Система анализирует характеристики рекламы на странице: частоту ее обновления, качество рекламодателей …
Google использует автоматизированную систему для обнаружения социальных профилей (Facebook, Twitter и т.д.), связанных с бизнес-сущностями. Система сканирует официальные сайты компаний на наличие ссылок, используя списки ключевых слов и форматов URL. …