Как Google использует пространственное индексирование (Geohashing) для эффективного локального поиска по радиусу

INDEXING DOCUMENTS ACCORDING TO GEOGRAPHICAL RELEVANCE (Индексирование документов в соответствии с географической релевантностью)

US7801897B2
Google LLC
2004-12-30
2010-09-21

Google использует метод предварительного расчета географических областей для ускорения локального поиска. Система делит карту на ячейки (используя пространственный индекс, например, Hierarchical Triangular Mesh) и при индексации связывает документ не только с его фактической ячейкой, но и со всеми соседними ячейками в пределах заданного радиуса. Это позволяет мгновенно находить релевантные результаты без сложных геопространственных вычислений во время выполнения запроса.

Какую проблему решает

Патент решает проблему вычислительной сложности и низкой эффективности выполнения геопространственных запросов в реальном времени. Традиционный поиск документов (например, бизнес-листингов) в пределах заданного радиуса от указанной точки требует сложных вычислений расстояний для большого количества кандидатов. Цель изобретения — обеспечить быстрый поиск по радиусу без необходимости выполнения этих вычислений во время обработки запроса.

Что запатентовано

Запатентован метод индексирования географически релевантных документов, который переносит вычислительную нагрузку с этапа выполнения запроса на этап индексирования. Суть метода заключается в использовании системы пространственного индексирования (например, Hierarchical Triangular Mesh) для разделения поверхности на ячейки. Документ индексируется не только с идентификатором его фактического местоположения, но и с идентификаторами всех окружающих ячеек в пределах заранее определенного радиуса (predetermined range).

Как это работает

Система работает следующим образом:

Разделение пространства: Карта делится на иерархическую сетку ячеек (например, HTM), каждой из которых присваивается уникальный Location Identifier.
Индексирование: При индексации документа (например, пиццерии) определяется его основная ячейка. Затем система вычисляет все соседние ячейки, попадающие в заданный радиус (например, 5 миль). Документ ассоциируется в индексе со всеми этими идентификаторами (Aggregate Geographic Region).
Поиск: Когда пользователь ищет (например, «пицца рядом со мной»), система определяет ячейку местоположения пользователя и добавляет её Location Identifier к запросу.
Извлечение: Поскольку пиццерия была заранее проиндексирована с идентификаторами всех окружающих ячеек, система мгновенно находит её в индексе по идентификатору ячейки пользователя, без необходимости рассчитывать расстояние в реальном времени.

Актуальность для SEO

Высокая. Хотя патент подан в 2004 году и упоминает Hierarchical Triangular Mesh (HTM), описанные принципы пространственного индексирования и гео-хэширования являются фундаментальными для современных систем локального поиска и картографических сервисов. Google может использовать более продвинутые системы (например, S2 Geometry), но базовая концепция предварительного расчета и индексирования географического охвата остается критически важной для производительности.

Важность для SEO

Патент имеет значительное влияние (7/10) на понимание инфраструктуры локального SEO. Он не описывает факторы ранжирования (качество, авторитетность), но детально объясняет технический механизм, с помощью которого Google определяет географические границы выдачи (Retrieval). Это подчеркивает критическую важность точности и консистентности геоданных (NAP, координаты), поскольку любая ошибка в определении основного Location Identifier документа приведет к его некорректному включению (или исключению) из локальной выдачи по радиусу.

Термины и определения

Aggregate Geographic Region (Агрегированный географический регион): Совокупность всех географических ячеек (основной и окружающих), связанных с документом в индексе. Определяет зону, в пределах которой документ может быть найден.
Geographically Relevant Document (Географически релевантный документ): Документ, имеющий привязку к конкретному физическому местоположению. Примеры: бизнес-листинг (business listing) с адресом, веб-страница с обзором конкретного ресторана.
Hierarchical Triangular Mesh (HTM) (Иерархическая треугольная сетка): Система пространственного индексирования, используемая для разделения сферической поверхности (Земли) на иерархию треугольных ячеек приблизительно равного размера. Упоминается в патенте как пример реализации.
Location Identifier (Идентификатор местоположения): Уникальный идентификатор (гео-хэш), присваиваемый каждой ячейке в системе пространственного индексирования (например, N201301 в HTM). Используется для индексирования и поиска документов.
Predetermined Range (Заранее определенный радиус): Фиксированное расстояние (например, 1 миля, 5 миль), используемое на этапе индексирования для определения окружающих ячеек, которые будут связаны с документом.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод индексирования.

Система определяет одну из множества географических областей (ячеек) в сетке, которая ассоциирована с документом (основная ячейка).
Система определяет подмножество окружающих географических областей (ячеек) в сетке. Критерий выбора: каждая ячейка в подмножестве должна хотя бы частично (at least partially) находиться внутри круга определенного радиуса (circle of a particular radius) от основной ячейки.
Система индексирует документ, включая в индекс ссылки как на основную ячейку, так и на все ячейки из определенного подмножества.

Claim 8 (Независимый пункт): Альтернативное описание метода индексирования с акцентом на структуре данных.

Система хранит индекс документов и определяет географическое местоположение документа.
Географический регион разделяется на множество отдельных областей (ячеек).
Идентифицируется основная ячейка, где находится местоположение документа.
Идентифицируются другие (окружающие) ячейки, которые хотя бы частично находятся внутри круга определенного радиуса от основной ячейки.
С документом ассоциируются ссылки (references) на основную и окружающие ячейки, и он индексируется с этими ссылками.

Claim 15 (Независимый пункт): Описывает полный цикл индексирования и поиска.

Выполняются шаги индексирования, аналогичные Claim 1 и 8 (определение основной и окружающих ячеек в пределах радиуса и их индексация с документом).
Система получает поисковый запрос, связанный с географическим регионом.
Определяются Location Identifier для основной ячейки и множественные Location Identifiers для окружающих ячеек.
Выполняется поиск документов, релевантных запросу, на основе сравнения запроса и этих идентификаторов местоположения с индексом документов.

Где и как применяется

Изобретение является инфраструктурным и затрагивает два ключевых этапа работы поисковой системы.

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Процесс происходит офлайн, до получения запроса пользователя.

Геокодирование: Система обрабатывает Geographically Relevant Documents (например, данные из Google Business Profile или веб-страницы с адресами). Физический адрес преобразуется в географические координаты.
Пространственное индексирование (Geohashing): Координаты преобразуются в Location Identifier основной ячейки с использованием пространственного индекса (HTM или аналога).
Расчет радиуса: Система выполняет геопространственные вычисления для определения всех окружающих ячеек, попадающих в Predetermined Range.
Ассоциация и индексация: Все вычисленные Location Identifiers добавляются в индекс документа как специальные токены.

RANKING – Ранжирование (Этап Retrieval)
На этом этапе изобретение используется для быстрого отбора кандидатов (L1 Retrieval).

Обработка локального запроса: Система получает запрос с указанием местоположения и радиуса. Местоположение пользователя геокодируется, и определяется его Location Identifier.
Модификация запроса: Location Identifier пользователя добавляется к тексту запроса.
Быстрое извлечение: Благодаря предварительному индексированию, система может мгновенно извлечь всех кандидатов в заданном радиусе, используя стандартный механизм поиска по инвертированному индексу. Это исключает необходимость сложных геопространственных операций в реальном времени.

Входные данные:

Текст документа и его географические данные (адрес, координаты).
Параметры пространственного индекса (например, HTM).
Заранее определенные радиусы (Predetermined Ranges).

Выходные данные:

Запись в инвертированном индексе, где документ связан как с текстовыми терминами, так и с набором Location Identifiers (Aggregate Geographic Region).

На что влияет

Конкретные типы контента: В первую очередь влияет на бизнес-листинги (Google Business Profile), локальные сервисы, каталоги организаций, а также веб-страницы, имеющие четкую географическую привязку (например, страницы филиалов, обзоры местных заведений).
Специфические запросы: Влияет на локальные запросы, где пользователь явно или неявно задает географическую область поиска (например, «ресторан в Хамовниках», «сантехник рядом со мной», «доставка пиццы 5 км»).
Конкретные ниши или тематики: Критически важно для всех ниш, связанных с локальным бизнесом и услугами (ритейл, услуги, общепит, медицина и т.д.).

Когда применяется

При индексировании: Алгоритм применяется каждый раз, когда система индексирует или обновляет документ, идентифицированный как Geographically Relevant Document.
При поиске: Механизм извлечения используется при обработке любого запроса с локальным интентом, где требуется ограничение выдачи по географическому признаку (радиусу).
Исключения: Если пользователь запрашивает радиус, который не был предварительно проиндексирован, система может использовать комбинацию предварительно рассчитанных данных и дополнительных вычислений в реальном времени.

Пошаговый алгоритм

Процесс А: Индексирование документа (Офлайн)

Идентификация документа: Система определяет документ как географически релевантный.
Определение основного идентификатора: Физическое местоположение документа геокодируется и преобразуется в основной Location Identifier (ячейка, где находится объект).
Определение окружающих идентификаторов: Система вычисляет все Location Identifiers для ячеек, которые хотя бы частично попадают в круг заданного радиуса (Predetermined Range, например, 1 миля) от основной ячейки.
(Опционально) Обработка нескольких радиусов: Шаг 3 повторяется для других заранее определенных радиусов (например, 5 миль, 10 миль). Каждому набору идентификаторов может быть присвоена метка радиуса (например, ID:1, ID:5).
Индексация: Документ индексируется. Все вычисленные Location Identifiers (основной и окружающие) добавляются в индекс как токены, связанные с этим документом.

Процесс Б: Обработка поискового запроса (Реальное время - Простой случай)

Используется, если запрошенный радиус совпадает с предварительно проиндексированным.

Получение запроса: Система получает запрос (например, «кофейня, 1 миля от Точки А»).
Определение идентификатора центра поиска: Точка А геокодируется и определяется её Location Identifier.
Модификация запроса: К запросу добавляется Location Identifier Точки А (и метка радиуса, если используется). Например: «кофейня AND Location_ID_A:1».
Выполнение поиска: Система выполняет стандартный поиск по инвертированному индексу. Благодаря Процессу А, все документы в радиусе 1 мили уже имеют в индексе токен Location_ID_A:1.
Возврат результатов: Система возвращает найденные документы.

Процесс В: Обработка поискового запроса (Реальное время - Сложный случай)

Используется, если запрошенный радиус НЕ совпадает с предварительно проиндексированным.

Получение запроса: Запрос с радиусом, который не был проиндексирован (например, 3 мили).
Поиск ближайшего меньшего радиуса: Система находит ближайший проиндексированный радиус, который меньше запрошенного (например, 1 миля).
Вычисление разницы: Определяется область, представляющая собой разницу между запрошенным радиусом и ближайшим меньшим (область между 1 и 3 милями).
Перечисление идентификаторов в разнице: Система в реальном времени вычисляет все Location Identifiers ячеек, попадающих в эту область разницы.
Модификация запроса (Сложная): Запрос модифицируется путем добавления перечисленных идентификаторов через логическое ИЛИ (OR).
Выполнение поиска: Поиск выполняется с использованием комбинации предварительно проиндексированных данных (для 1 мили) и данных, вычисленных в реальном времени (для области 1-3 мили).

Какие данные и как использует

Данные на входе

Географические факторы: Критически важные данные. Используются почтовые адреса (Postal Address) и/или координаты широты и долготы (Latitude/Longitude) документа для определения его точного физического местоположения.
Контентные факторы: Текст документа (бизнес-листинга, веб-страницы) используется для индексации терминов и последующего мэтчинга с запросом пользователя.

Какие метрики используются и как они считаются

Location Identifiers (Гео-хэши): Основная метрика патента. Вычисляется путем преобразования географических координат с помощью алгоритма пространственного индексирования (например, HTM). Представляет собой уникальный идентификатор географической ячейки.
Predetermined Range (Радиус): Заранее заданные константы расстояния (например, 1, 5, 10 миль), используемые во время индексации.
Геопространственные вычисления: Используются на этапе индексирования для определения того, какие ячейки сетки пересекаются с кругом заданного радиуса вокруг основной ячейки документа. Также могут использоваться в реальном времени (Процесс В).

Перенос нагрузки на индексацию: Основная идея патента — выполнить сложные геопространственные вычисления один раз на этапе индексации, чтобы максимально ускорить этап поиска (Retrieval). Это компромисс между скоростью ответа и объемом индекса.
Пространственное индексирование как основа локального поиска: Патент демонстрирует, что локальный поиск фундаментально зависит от эффективной системы разделения пространства на дискретные ячейки (гео-хэширования).
Аппроксимация радиуса: Система не гарантирует идеальную точность поиска по радиусу. Поскольку радиус (круг) аппроксимируется набором ячеек (треугольников или квадратов), объекты на границе могут быть ошибочно включены или исключены. Эффективность важнее абсолютной точности на границах.
Критичность точного геокодирования: Весь механизм зависит от способности системы точно определить основную ячейку (Location Identifier) документа. Ошибки в адресе или геокодировании напрямую влияют на видимость объекта в локальном поиске.
Инфраструктурный характер: Патент описывает механизм эффективного извлечения (Retrieval) локальных результатов, но не затрагивает методы их ранжирования (Ranking) по релевантности или качеству.

Best practices (это мы делаем)

Обеспечение абсолютной точности и консистентности NAP: Данные о Названии, Адресе и Телефоне (NAP) должны быть идентичными на сайте, в Google Business Profile и во всех внешних каталогах. Это критически важно для того, чтобы система могла корректно геокодировать объект и присвоить ему правильный основной Location Identifier.
Использование точных геокоординат: Необходимо предоставлять максимально точные данные о широте и долготе объекта. Это можно делать через микроразметку Schema.org (GeoCoordinates в LocalBusiness), KML-файлы и ручную корректировку маркера на картах Google. Это помогает системе точнее определить основную ячейку.
Четкое указание адреса на сайте: Физический адрес должен быть легко доступен для краулеров и однозначно интерпретируем на всех релевантных страницах сайта (контакты, футер, страницы филиалов).
Мониторинг локальной видимости (Grid Tracking): Понимание того, что карта разделена на ячейки, помогает при анализе результатов инструментов Local Grid Tracking и интерпретации резких изменений видимости на границах зоны обслуживания.

Worst practices (это делать не надо)

Использование некорректных или неоднозначных адресов: Ошибки в индексе, номере дома, названии улицы или использование неточных ориентиров может привести к ошибкам геокодирования и, как следствие, к неправильному расчету Aggregate Geographic Region в индексе.
Привязка к виртуальным офисам или абонентским ящикам: Попытка ранжироваться в локальном поиске по адресу, где бизнес физически не присутствует. Система полагается на физическое местоположение для расчета пространственного индекса, и такие манипуляции часто приводят к пессимизации.
Игнорирование ошибок маркера на карте: Если Google неправильно определил местоположение объекта на карте, это означает, что система использует неверный Location Identifier для индексации. Это необходимо исправлять вручную.

Стратегическое значение

Патент подтверждает, что локальный поиск использует отдельную инфраструктуру, основанную на структурированных данных и пространственном индексировании. Для Senior SEO-специалистов это означает, что стратегии локального продвижения должны в первую очередь фокусироваться на обеспечении точности и полноты данных о физическом местоположении бизнеса. Без корректного включения в пространственный индекс (описанный в патенте) никакие другие факторы ранжирования не помогут объекту появиться в локальной выдаче по соответствующему радиусу.

Практические примеры

Сценарий: Оптимизация видимости ресторана в зоне доставки

Задача: Ресторан хочет обеспечить максимальную видимость в локальном поиске для пользователей, находящихся в радиусе 5 км (зона доставки).
Действия (на основе патента): SEO-специалист должен убедиться, что Google корректно индексирует ресторан для этого радиуса.
Шаг 1 (Точность геокодирования): Проверить консистентность NAP во всех источниках. Вручную скорректировать положение маркера в Google Business Profile, чтобы он максимально точно соответствовал физическому входу. Добавить координаты в разметку LocalBusiness на сайте. Это гарантирует правильное определение основного Location Identifier.
Шаг 2 (Понимание механизма индексации): Осознать, что Google предварительно рассчитает все ячейки (Location Identifiers) в радиусе 5 км и свяжет их с листингом ресторана.
Ожидаемый результат: Когда пользователь, находящийся в любой точке этого радиуса, выполняет поиск, система мгновенно найдет листинг ресторана на этапе Retrieval, так как Location Identifier пользователя уже связан с листингом в индексе Google. Если бы геокодирование было неточным, зона покрытия в индексе сместилась бы, и ресторан потерял бы видимость в части зоны доставки.

Описывает ли этот патент факторы ранжирования в локальном поиске?

Нет, патент не касается факторов ранжирования, таких как качество, релевантность, известность или поведенческие сигналы. Он описывает исключительно инфраструктурный механизм для эффективного извлечения (Retrieval) кандидатов в пределах заданного географического радиуса. Это система, которая определяет, какие документы вообще будут рассматриваться для ранжирования в локальной выдаче.

Что такое Hierarchical Triangular Mesh (HTM) и гео-хэширование?

HTM — это один из алгоритмов пространственного индексирования (гео-хэширования). Гео-хэширование — это процесс разделения пространства (например, поверхности Земли) на иерархическую сетку ячеек. Каждой ячейке присваивается уникальный идентификатор (Location Identifier или гео-хэш). Это позволяет преобразовывать двумерные географические координаты в одномерную строку, что значительно упрощает и ускоряет хранение и поиск геоданных.

Почему Google предварительно индексирует радиус, а не рассчитывает его во время поиска?

Для обеспечения максимальной скорости ответа. Расчет расстояний между местоположением пользователя и миллионами потенциальных объектов в реальном времени — это вычислительно дорогая операция. Предварительный расчет радиуса на этапе индексации позволяет заменить сложные геопространственные вычисления на быструю операцию поиска по стандартному инвертированному индексу.

Насколько точен поиск по радиусу, описанный в этом методе?

Он не абсолютно точен, а является аппроксимацией. Поскольку идеальный круг (радиус) аппроксимируется набором дискретных ячеек (треугольников или квадратов), всегда существует погрешность на границах. Объекты, находящиеся рядом с границей радиуса, могут быть ошибочно включены или исключены в зависимости от того, как ячейки пересекаются с кругом. Патент жертвует точностью на границах ради скорости.

Что произойдет, если Google неправильно определит местоположение моего бизнеса?

Если система неправильно геокодирует ваш адрес, она присвоит вашему бизнесу неверный основной Location Identifier. Следовательно, Aggregate Geographic Region (набор окружающих ячеек) также будет рассчитан неверно. Это приведет к тому, что ваш бизнес не будет отображаться в результатах поиска для пользователей, находящихся рядом с вашим фактическим местоположением, но может отображаться в несвязанных областях.

Каков главный практический вывод для SEO из этого патента?

Главный вывод — критическая важность обеспечения точности и консистентности ваших географических данных (NAP) и координат (широта/долгота) во всех источниках. Точность геокодирования является фундаментом для корректного включения вашего бизнеса в пространственный индекс Google, что является необходимым условием для видимости в локальном поиске.

Актуален ли этот патент, если Google сейчас использует библиотеку S2 Geometry, а не HTM?

Да, патент абсолютно актуален. Хотя конкретная реализация пространственного индекса могла измениться (с HTM на S2, которая использует квадраты вместо треугольников), фундаментальный принцип, описанный в патенте — предварительное индексирование окружающих ячеек для ускорения поиска по радиусу — остается неизменным и критически важным для работы локального поиска.

Как система обрабатывает запросы с разными радиусами поиска?

Патент предлагает два метода. Первый — предварительно индексировать несколько фиксированных радиусов (например, 1, 5, 10 миль) и использовать соответствующий набор данных при запросе. Второй — если запрошен нестандартный радиус (например, 3 мили), система использует ближайший меньший проиндексированный радиус (1 миля) и выполняет дополнительные вычисления в реальном времени для покрытия оставшейся области.

Применяется ли этот механизм к Service Area Businesses (SAB), у которых нет физического адреса?

Патент в первую очередь фокусируется на документах с конкретным физическим местоположением. Однако базовые принципы пространственного индексирования, вероятно, используются и для SAB. Вместо радиуса вокруг точки, система может индексировать набор Location Identifiers, которые покрывают заявленную зону обслуживания (например, город или район), указанную бизнесом.

Влияет ли этот механизм на органическую выдачу или только на Local Pack/Maps?

В первую очередь он предназначен для Local Pack и Maps, где поиск по радиусу является стандартной функцией. Однако он также может применяться к любым документам в органическом индексе, которые были идентифицированы как Geographically Relevant Document (например, обзор конкретного заведения), если система решит ограничить их видимость по географическому признаку.

Как Google группирует локальные результаты поиска вокруг физических адресов и динамически определяет радиус поиска

Google использует систему для организации локальной выдачи, кластеризуя веб-документы вокруг конкретного физического адреса или номера телефона. Система определяет «область интереса», используя динамический радиус поиска, который меняется в зависимости от типа запроса (например, поиск ресторана или автодилера). Результаты ранжируются на основе баланса близости и релевантности.

US8346770B2
2013-01-01

Local SEO
SERP

Как Google использует "Массу Локации" и гео-подсказки для точного геокодирования запросов и извлечения адресов из контента

Патент Google, раскрывающий фундаментальные механизмы геокодирования и извлечения адресов. Система преобразует текстовые описания мест в точные координаты, используя "Массу Локации" (количество адресов в регионе) для оценки значимости. При наличии "Гео-подсказки" (например, местоположения пользователя) система отдает приоритет ближайшим результатам. Также описан процесс автоматического извлечения адресов с веб-страниц.

US8959084B2
2015-02-17

Local SEO

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест

Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.

US7716162B2
2010-05-11

Local SEO
Семантика и интент
Индексация

Как Google выбирает, какое местоположение использовать для локализации поисковой выдачи, когда сигналы конфликтуют

Google использует иерархическую систему правил для выбора единственной «геолокации запроса» из множества доступных сигналов. Система анализирует физическое местоположение пользователя, локации в тексте запроса, историю поиска и настройки профиля. Затем она применяет строгую логику приоритетов, чтобы определить, какая локация наиболее релевантна для текущего интента, и соответствующим образом корректирует (смещает) ранжирование результатов.

US20150234889A1
2015-08-20

Local SEO
Персонализация

Как Google оптимизирует инфраструктуру своего индекса для ускорения поиска подстрок и фраз

Этот патент описывает инфраструктурную оптимизацию поискового индекса Google. В нем представлена «гибридная структура данных», которая ускоряет извлечение информации (например, местоположение фраз в документах) путем объединения бинарных деревьев с таблицами поиска и использования высокоэффективных методов сортировки. Это делает поиск быстрее, но не влияет на алгоритмы ранжирования.

US8856138B1
2014-10-07

Индексация

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче

Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.

US9424360B2
2016-08-23

Local SEO
Поведенческие сигналы

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа

Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.

US8307005B1
2012-11-06

Поведенческие сигналы
Ссылки
SERP

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей

Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.

US8442965B2
2013-05-14

Мультиязычность
Поведенческие сигналы

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам

Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.

US10481861B2
2019-11-19

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов

Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.

US8423538B1
2013-04-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов

Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.

US8868565B1
2014-10-21

Поведенческие сигналы
SERP

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи

Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.

US8538970B1
2013-09-17

Персонализация
Поведенческие сигналы
SERP

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта

Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.

US9348846B2
2016-05-24

Структура сайта
SERP
Ссылки

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска

Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.

US20150006290A1
2015-01-01

Поведенческие сигналы
Персонализация
Local SEO

Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика

Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.

US7716225B1
2010-05-11

Ссылки
Поведенческие сигналы
SERP