Google не использует фиксированный радиус для локального поиска. Система динамически определяет, насколько далеко пользователь готов пойти или поехать, учитывая тип запроса (кофейня или аэропорт), активность пользователя (пешком или за рулем) и популярность бизнеса. Это определяет, какие локальные компании попадают в выдачу (Local Pack и Карты).
Автор: Виктор Репин
Патент Google, описывающий фундаментальную архитектуру локального поиска на мобильных устройствах. Система определяет, как браузер получает доступ к GPS данным через нативное приложение. Описан иерархический механизм определения локации: текущее местоположение устройства, явное указание локации в запросе или использование истории предыдущих поисков. Если текущая локация недоступна, система может инициировать параллельный поиск по нескольким недавним местоположениям.
Google использует графовую модель для расширения знаний о сущностях (Instances). Система строит граф, связывающий сущности, их классы (Classes) и атрибуты (Attributes). С помощью алгоритма случайного блуждания (Random Walks) система вычисляет вероятность того, что атрибут одной сущности применим к другой связанной сущности (через общие классы или контекстное сходство), и переносит (propagates) эти атрибуты для обогащения базы знаний.
Система Google для маркетплейсов услуг в реальном времени (например, видеоконсультаций) использует двухэтапный процесс ранжирования. Сначала система оценивает организации по одному набору критериев, а затем оценивает отдельных экспертов внутри выбранной организации по другому набору критериев. Система напрямую соединяет пользователя с экспертом и использует метрики производительности и обратную связь для корректировки рейтингов.
Google анализирует, как пользователи вводят запросы в интерфейсах с отдельными полями для объекта поиска («Что?») и местоположения («Где?») (например, в Google Maps). На основе этой статистики система определяет «автономные местоположения» (города, которые однозначно идентифицируются по названию) и создает «черный список» терминов, которые звучат как локации, но ими не являются (например, бренды или имена). Это улучшает понимание географического интента в основном поиске.
Google рассчитывает метрику «Domain Video Score», которая оценивает общее качество (на основе Long Clicks) и количество (известных и прогнозируемых) видео на домене. Эта оценка используется для определения приоритета при сканировании видеоконтента (Crawl Budget) и как сигнал качества при ранжировании, особенно для новых видео.
Google использует систему машинного обучения для оценки визуального качества изображений (резкость, цвет, экспозиция). Ключевая особенность — динамическая корректировка веса этого фактора. Если исторические данные показывают, что пользователи по конкретному запросу предпочитают кликать на визуально качественные изображения чаще, чем в среднем, система увеличивает влияние качества на ранжирование именно для этого запроса.
Google использует метод автоматического обнаружения парафраз (фраз с одинаковым значением) путем анализа индекса, связывающего информационные элементы (даты, имена, концепции) с фрагментами предложений из веба. Если разные фрагменты описывают один и тот же элемент, система выравнивает их и извлекает различающиеся части как потенциальные парафразы. Это позволяет Google понимать семантическую эквивалентность запросов и контента в масштабе.
Google анализирует, какие видео пользователи смотрят в рамках одной сессии (Co-Watched Videos). Эти видео группируются в тематические кластеры на основе ключевых слов, в первую очередь — доминирующих поисковых запросов, которые к ним привели. Эти кластеры используются для диверсификации блока «Рекомендованные видео», улучшения таргетинга рекламы, а также для добавления и повышения релевантных видео в результатах поиска.
Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.
Google разработал механизм «Snippet Packet», позволяющий пользователям сохранять определенный контент (текст, изображения) с веб-страницы. Пакет включает сам контент, URL и точные данные о местоположении (например, Text Fragments). Система генерирует интерактивные графические карточки для обмена и потенциальной публикации в вебе, позволяя пользователям возвращаться точно к исходному месту на странице.
Google отслеживает, какие сайты пользователь посещал ранее при поиске информации о конкретной локации (например, при планировании отпуска). Когда пользователь снова ищет информацию об этой же локации, Google подмешивает ссылки на ранее посещенные сайты в новую выдачу, даже если эти сайты не ранжируются по новому запросу. Это работает как динамическая система напоминаний внутри SERP.
Google анализирует названия и категории бизнесов в конкретном географическом регионе. Если определенная часть названия (например, «Joe’s») постоянно ассоциируется с одной категорией (например, «Plumber»), система создает локальную связь. Это позволяет расширять поисковые запросы пользователя, добавляя категорию к названию бизнеса для показа более релевантных локальных результатов и рекламы.
Google использует метрику «полезности» (Utility) для выбора предлагаемых запросов и связанных рекламных блоков. Система ищет запросы, которые часто являются конечной целью пользователя (высокая полезность к исходному запросу), но при этом ведут в разных направлениях (низкая полезность друг к другу). Это позволяет показывать разнообразный набор интентов и рекламы на одной странице выдачи.
Google интегрирует данные из социального графа пользователя и его активность (кто чем поделился, лайкнул, прокомментировал) для модификации ранжирования результатов поиска, особенно видео. Система повышает контент, с которым взаимодействовали контакты пользователя, и добавляет аннотации, объясняющие эту связь (например, «Пользователь X поделился этим 10 минут назад»).
Google использует единую графовую модель для одновременной оценки качества пользовательского контента (например, комментариев или отзывов) и репутации его авторов. В этой модели репутация автора повышает оценку его контента, а качественный контент улучшает репутацию автора. Также учитываются связи между пользователями (подписки) и между единицами контента. Это позволяет точнее ранжировать UGC и выявлять авторитетных участников.
Google анализирует статистику запросов по разным географическим регионам. Если конкретный запрос вводится в определенном регионе значительно чаще, чем ожидалось (по сравнению с базовым регионом), Google классифицирует этот запрос как «локальный» для данной местности. При получении такого запроса от пользователя из этого региона, система автоматически повышает в ранжировании результаты, связанные с местными достопримечательностями или темами, даже если в запросе нет явных указаний на местоположение.
Google динамически изменяет поисковые подсказки (Autocomplete и переписанные запросы), основываясь на текущем контексте пользователя. Система учитывает такие факторы, как погода, время суток, актуальные новости, рекомендации друзей в социальных сетях и их местоположение. Стандартные подсказки переоцениваются и переранжируются в реальном времени, чтобы предложить пользователю наиболее релевантный запрос в данный момент и в данном месте.
Патент Google, описывающий систему автоматического выбора лучшего репрезентативного изображения для сущности (человека, логотипа, продукта). Система кластеризует визуально похожие изображения, чтобы найти самые популярные версии в сети. Затем она рассчитывает «Headshot Score» — метрику, оценивающую, насколько хорошо объект заполняет кадр, особенно при заданном соотношении сторон. Выбирается изображение, которое является одновременно популярным и визуально четким.
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.