SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует логи поисковых запросов для поиска похожих сайтов и генерации лидов для рекламодателей

LEAD GENERATION SYSTEM AND METHODS (Система и методы генерации лидов)
  • US8612459B1
  • Google LLC
  • 2011-07-13
  • 2013-12-17
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для поиска сайтов, похожих на заданный "примерный ресурс". Система анализирует логи поисковых запросов, чтобы определить, по каким запросам пользователи находили этот ресурс, а затем находит другие сайты, которые также появлялись в выдаче по этим же запросам. Это позволяет генерировать списки потенциальных клиентов (лидов) или площадок для рекламодателей.

Описание

Какую проблему решает

Патент решает задачу идентификации ресурсов (например, веб-сайтов), которые похожи на заданный набор "примерных ресурсов" (example resources). Основная цель, описанная в патенте, — это генерация лидов (leads) для бизнеса или для рекламодателей (advertisers) с целью таргетинга промо-кампаний. Система помогает пользователям (таким как торговые представители или рекламодатели) находить похожие компании или веб-сайты на основе общего интереса пользователей, выраженного через общие поисковые запросы.

Что запатентовано

Запатентована система генерации лидов, которая определяет похожие веб-сайты (matching resources) на основе анализа логов поисковых запросов (query logs). Ключевая идея заключается в том, что если Сайт А и Сайт Б часто появляются в результатах поиска (и выбираются пользователями) по одному и тому же набору запросов, они, вероятно, являются похожими или конкурирующими ресурсами.

Как это работает

Система работает следующим образом:

  • Входные данные: Пользователь (например, рекламодатель) предоставляет example resource (например, сайт конкурента или клиента).
  • Анализ логов: Система изучает query logs, чтобы найти все запросы, которые привели пользователей на этот примерный ресурс.
  • Поиск соответствий: Система идентифицирует другие веб-сайты (matching resources), которые также были результатом этих же запросов.
  • Фильтрация и Ранжирование: Найденные ресурсы фильтруются (например, по местоположению, размеру бизнеса, рекламным расходам, удаляются каталоги) и ранжируются (например, по частоте появления в ответ на общие запросы).
  • Вывод: Финальный список предоставляется пользователю в качестве лидов.

Актуальность для SEO

Средняя. Хотя патент датирован 2013 годом, концепция использования поисковых данных для анализа конкурентов и таргетинга аудитории остается высоко актуальной, особенно в рамках рекламных платформ (например, Google Ads — таргетинг на места размещения или особые аудитории по интересам). Механизм, вероятно, эволюционировал, но базовый принцип остается в силе.

Важность для SEO

Влияние на SEO минимальное (2/10). Этот патент не описывает механизмы ранжирования веб-сайтов в органических результатах поиска. Он описывает инструмент для генерации лидов и анализа конкурентов/рынка, который, вероятно, используется в экосистеме Google для рекламодателей. Хотя SEO-специалисты могут использовать эту концепцию для анализа конкурентов, сам патент не влияет на стратегии SEO для повышения позиций в поиске.

Детальный разбор

Термины и определения

Advertiser (Рекламодатель)
Конечный пользователь системы. Субъект, который предоставляет примерный ресурс с целью таргетирования промо-кампании.
Consumer / Sales Representative (Потребитель / Торговый представитель)
Другие типы конечных пользователей системы, использующие ее для генерации лидов.
Example Resource (Примерный ресурс)
Входные данные, предоставляемые пользователем (например, URL веб-сайта). Ресурс, используемый как эталон для поиска похожих ресурсов.
Lead (Лид)
Соответствующий ресурс с высоким рейтингом, предоставляемый рекламодателю для таргетинга промо-кампании.
Matching Resource (Соответствующий ресурс)
Выходные данные. Ресурсы, идентифицированные системой как похожие на Example Resource, поскольку они были результатом тех же запросов.
Query Logs (Логи запросов)
Исторические данные, содержащие полученные запросы и ресурсы (например, результаты поиска или рекламу), которые были выбраны или предоставлены в ответ на эти запросы.
Sponsor (Спонсор)
Субъект (организация, бизнес, рекламодатель), связанный с ресурсом.
Vertical Classification (Вертикальная классификация)
Бизнес-категория, связанная с ресурсом. Используется для фильтрации.

Ключевые утверждения (Анализ Claims)

Патент описывает инфраструктуру для бизнес-аналитики и генерации лидов, а не алгоритмы ранжирования поиска.

Claim 1 (Независимый пункт): Описывает основной процесс с точки зрения рекламодателя.

  1. Система получает от рекламодателя указание на example resource (цель для кампании).
  2. Система идентифицирует query logs (запись включает полученный запрос и выбранный в ответ ресурс).
  3. Система определяет запросы, которые привели к example resource.
  4. Используя эти запросы и логи, система идентифицирует matching resources, которые также были решением для этих запросов.
  5. Система фильтрует matching resources. Фильтрация включает ранжирование, основанное на частоте (frequency), с которой соответствующий ресурс возвращался в ответ на эти запросы (согласно логам).
  6. Ресурсы с наивысшим рейтингом идентифицируются как leads.
  7. Система предоставляет предложения рекламодателю, включая эти лиды для таргетинга кампании.

Claim 16 (Независимый пункт): Описывает альтернативный вариант применения.

Ресурс определяется как веб-ресурс с рекламными слотами. Query logs содержат "критерии выбора" (selection criteria) и выбранную в ответ рекламу. Цель — найти соответствующие ресурсы на основе этих критериев. (Это больше похоже на механизм контекстной рекламы или AdSense).

Claim 17 (Независимый пункт): Описывает систему, реализующую процесс из Claim 1. Упоминаются компоненты: Resource Identifier, Query Log Evaluator, Matching Resource Identifier, и Matching Resource Filter.

Где и как применяется

Этот патент не вписывается в стандартную архитектуру Google Поиска (Сканирование, Индексирование, Ранжирование), поскольку он не предназначен для формирования поисковой выдачи для конечных пользователей. Он предназначен для анализа результатов поискового процесса с целью бизнес-аналитики.

Система Рекламы / Бизнес-аналитики (Вне основного поиска)
Описанная система, вероятно, является отдельным инструментом для бизнес-аналитики или рекламы (например, частью Google Ads или Analytics).

Система взаимодействует со следующими данными:

  • Данные этапов RANKING / RERANKING: Система в значительной степени полагается на данные, генерируемые на этих этапах, в частности на Query Logs, которые записывают, какие запросы привели к каким результатам или выборам пользователей.
  • Данные этапа INDEXING: Система использует данные, которые могли быть собраны во время индексирования, для фильтрации результатов: например, Vertical Classification, идентификация Sponsors и определение того, является ли ресурс каталогом (directory).

Входные данные:

  • Example Resource (например, URL).
  • Критерии фильтрации (опционально, например, местоположение, размер бизнеса).

Выходные данные:

  • Отфильтрованный и ранжированный список Matching Resources (Leads).
  • Возможно, Sponsor Information (контактная информация спонсора).

На что влияет

  • Рекламные кампании: В первую очередь влияет на рекламодателей, ищущих цели (конкурентов или площадки для размещения), и отделы продаж, ищущие лиды.
  • Инструменты анализа рынка: Влияет на функциональность инструментов для анализа конкурентной среды.
  • Органическое ранжирование: Патент не указывает на влияние на органическое ранжирование.

Когда применяется

  • Триггеры активации: Алгоритм применяется, когда пользователь (рекламодатель или торговый представитель) явно использует инструмент для поиска похожих ресурсов на основе введенного примера (example resource).

Пошаговый алгоритм

Процесс генерации лидов:

  1. Получение Входных Данных: Система получает "Примерный ресурс" (Example Resource) от пользователя (например, рекламодателя).
  2. Анализ Логов Запросов: Система анализирует Query Logs, чтобы найти все исторические запросы, которые приводили к выбору Примерного ресурса.
  3. (Опционально) Очистка Запросов: Удаление общих слов (стоп-слов), нечастотных терминов или терминов, связанных со спам-запросами, из найденного набора запросов.
  4. Идентификация Соответствующих Ресурсов: Система ищет другие ресурсы ("Соответствующие ресурсы", Matching Resources), которые также являлись решением (были предоставлены в выдаче и/или выбраны) для того же набора очищенных запросов.
  5. (Опционально) Идентификация Спонсоров: Определение организаций (Sponsors), связанных с Соответствующими ресурсами, и сбор информации о них (контакты, профиль, финансы).
  6. Фильтрация Ресурсов: Применение критериев для удаления нерелевантных результатов. Это может включать:
    • Удаление каталогов (directories).
    • Фильтрацию по бизнес-категории (Vertical Classification).
    • Фильтрацию по геолокации (geo-location) спонсора.
    • Фильтрацию по размеру бизнеса (size of a business).
    • Фильтрацию по рекламным расходам (spend data) спонсора.
  7. Ранжирование Ресурсов: Сортировка оставшихся ресурсов. Основной критерий ранжирования — частота (frequency), с которой ресурс возвращался в ответ на общий набор запросов (согласно логам). Также может учитываться количество исторических кликов (historical clicks).
  8. Генерация Лидов: Идентификация топовых ранжированных ресурсов как Leads.
  9. Предоставление Результатов: Вывод списка лидов и связанной с ними информации о спонсорах пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании логов и бизнес-метрик для анализа сходства.

  • Поведенческие факторы: Критически важны. Используются Query Logs (запросы и выбранные в ответ ресурсы) и historical clicks (исторические клики или CTR за определенный период времени).
  • Географические факторы: Geo-location спонсора ресурса или пользователя системы используется для фильтрации результатов.
  • Бизнес-метрики (не являются SEO-факторами):
    • Size of a business (размер бизнеса, например, количество сотрудников, прибыль, продажи).
    • Spend data (данные о расходах спонсора, например, на рекламные кампании).
  • Контентные/Структурные факторы: Используются для идентификации типа ресурса (например, для исключения directories) и определения Vertical Classification.

Какие метрики используются и как они считаются

  • Frequency of return (Частота возврата): Метрика, показывающая, как часто ресурс возвращается в ответ на набор общих запросов. Используется как основной сигнал для ранжирования лидов.
  • Historical Clicks / CTR: Количество кликов или CTR за период времени. Используется для фильтрации (например, удаление ресурсов с низким CTR) или ранжирования.
  • Сравнение бизнес-метрик: Система сравнивает размер бизнеса и spend data между примерным ресурсом и соответствующими ресурсами. Ресурсы с "существенно отличающимися" (substantially different) показателями отфильтровываются.

Выводы

ВАЖНО: Этот патент является чисто инфраструктурным и описывает внутренние инструменты Google для бизнес-аналитики. Он не дает практических выводов для улучшения органического ранжирования в SEO.

  1. Фокус на генерации лидов и рекламе: Основная цель патента — предоставить рекламодателям и отделам продаж инструмент для поиска потенциальных клиентов или площадок для рекламы на основе анализа поведения пользователей в поиске.
  2. Определение сходства через общие запросы: Ключевая концепция заключается в том, что веб-сайты, которые часто появляются в выдаче по одним и тем же запросам, считаются похожими (конкурентами или релевантными одной тематике).
  3. Использование не-SEO данных для фильтрации: Система активно использует бизнес-метрики, такие как размер компании (size of a business) и рекламные расходы (spend data), а также геолокацию для уточнения списка лидов, что подчеркивает ее коммерческую направленность.
  4. Ранжирование лидов по частоте показов: Лиды ранжируются не по их качеству или релевантности контента, а по частоте их появления в ответ на общие запросы в логах.
  5. Подтверждение анализа SERP Overlap: Патент подтверждает, что Google анализирует пересечение выдачи (SERP overlap) для понимания взаимосвязей между веб-сайтами и рыночной конъюнктуры.

Практика

ВАЖНО: Патент описывает внутренние инструменты для генерации лидов, а не алгоритмы SEO-ранжирования. Практическое применение для SEO является косвенным и связано с анализом конкурентов.

Best practices (это мы делаем)

  • Анализ пересечения выдачи (SERP Overlap): Патент подтверждает важность анализа пересечения выдачи для идентификации истинных семантических конкурентов. SEO-специалистам следует использовать инструменты (например, Ahrefs, Semrush) для анализа того, какие сайты постоянно появляются рядом с вашим сайтом по ключевым запросам. Google считает вас похожими, если вы часто появляетесь по одним и тем же запросам.
  • Расширение семантического ядра для пересечения с лидерами: Для того чтобы система считала ваш сайт похожим на авторитетные ресурсы в нише, необходимо стратегически расширять семантическое ядро, чтобы оно пересекалось с семантикой лидеров рынка.

Worst practices (это делать не надо)

  • Патент не направлен на борьбу с SEO-манипуляциями и не выделяет каких-либо худших практик в контексте органического продвижения.

Стратегическое значение

Патент демонстрирует, как Google монетизирует данные о поведении пользователей в поиске, создавая инструменты для бизнес-аналитики и рекламы. Для SEO это имеет значение как подтверждение того, что анализ пересечения запросов (SERP overlap) является валидным методом для понимания того, как поисковая система группирует сайты по тематикам и интентам.

Практические примеры

Сценарий: Использование концепции патента для анализа конкурентов в SEO

  1. Определение эталона (Input): SEO-специалист определяет свой сайт (или сайт ключевого конкурента) как Example Resource.
  2. Сбор данных о видимости (Аналог Query Logs): С помощью внешних SEO-инструментов собирается список всех запросов, по которым ранжируется эталонный сайт.
  3. Идентификация конкурентов (Аналог Matching Resources): Используются функции анализа конкурентов (например, "Competing Domains" в Ahrefs), чтобы найти другие сайты, которые также ранжируются по значительному количеству этих же запросов.
  4. Ранжирование конкурентов (Аналог Ranking): Конкуренты сортируются по степени пересечения семантики (количеству общих ключевых слов) и общей видимости по этим запросам.
  5. Результат: Получается список истинных семантических конкурентов, основанный на том же принципе, который описан в патенте Google для генерации лидов.

Вопросы и ответы

Влияет ли описанный в патенте механизм на органическое ранжирование сайта?

Нет, патент не описывает алгоритмы ранжирования в органическом поиске. Он описывает систему генерации лидов (Lead Generation System), которая анализирует логи поисковых запросов для поиска похожих сайтов. Это инструмент для рекламодателей и отделов продаж, а не часть основного поискового алгоритма.

Как система определяет, что два сайта похожи?

Сходство определяется на основе анализа Query Logs. Если два разных сайта часто появляются в результатах поиска (и выбираются пользователями) в ответ на один и тот же набор поисковых запросов, система считает их похожими или конкурирующими.

Что означает, что запрос "resolved to" (привел к) ресурсу?

Это означает, что ресурс был предоставлен в качестве решения на запрос. В контексте патента и Query Logs это, как правило, подразумевает, что ресурс был показан в результатах поиска и, возможно, был выбран (кликнут) пользователем в ответ на этот запрос.

Какие методы фильтрации использует система для уточнения списка лидов?

Система использует несколько критериев фильтрации, чтобы убедиться в релевантности лидов для пользователя. К ним относятся: геолокация спонсора (geo-location), размер бизнеса (size of a business), рекламные расходы (spend data), вертикальная классификация (Vertical Classification), а также исключение каталогов (directories).

Как ранжируются найденные лиды?

Основной метод ранжирования, описанный в патенте (Claim 1), основан на частоте (frequency), с которой соответствующий ресурс возвращался в ответ на общие запросы, согласно данным из Query Logs. Чем чаще сайт появлялся по этим запросам, тем выше его рейтинг в списке лидов.

Могут ли SEO-специалисты получить доступ к этому инструменту?

Патент описывает внутреннюю систему. Прямого доступа к инструменту "Lead Generation System" в том виде, как он описан, у внешних пользователей может не быть. Однако концепции, лежащие в его основе (анализ сходства на основе общих запросов), вероятно, используются в инструментах Google Ads (например, при подборе аудиторий или мест размещения) и Google Analytics.

Какие данные Google использует для фильтрации по "размеру бизнеса" или "рекламным расходам"?

Патент упоминает, что размер бизнеса может определяться по количеству сотрудников, прибыли или продажам, а также используются данные о рекламных расходах (spend data). Однако патент не детализирует источники этих данных. Вероятно, они агрегируются из рекламных аккаунтов Google, данных Google Мой Бизнес или оценочных моделей.

Помогает ли этот патент лучше понять, как идентифицировать семантических конкурентов?

Да, это основная косвенная ценность патента для SEO. Он подтверждает, что анализ пересечения выдачи (SERP overlap) — то есть поиск сайтов, которые ранжируются по тому же набору ключевых слов, что и ваш сайт, — является эффективным методом для определения ваших реальных конкурентов с точки зрения поисковой системы.

Использует ли система анализ контента или ссылок для определения сходства сайтов?

Нет. Основной механизм определения сходства, описанный в этом патенте, базируется исключительно на анализе Query Logs и общих поисковых запросов. Анализ контента используется только для фильтрации (например, для определения категории или исключения каталогов), но не для первичного поиска соответствий.

Отличается ли этот механизм от рекомендательных систем типа "Похожие запросы" (Related Searches)?

Да, отличается. "Похожие запросы" предлагают альтернативные формулировки запросов на основе семантической близости или поведения пользователей в сессии. Этот патент предлагает похожие сайты на основе того, что они удовлетворяют одним и тем же запросам в течение длительного времени.

Похожие патенты

Как Google динамически генерирует фильтры (теги) в выдаче на основе контента ранжируемых страниц
Google использует механизм для автоматического создания фильтров поисковой выдачи (например, в виде тегов или «пузырьков»). Система анализирует контент страниц, уже отобранных для показа по запросу, извлекает из них ключевые слова и проверяет их полезность, используя данные о поведении пользователей. Затем система отбирает наиболее релевантные и разнообразные фильтры, позволяя пользователю уточнить свой интент в один клик.
  • US10242112B2
  • 2019-03-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google автоматически определяет язык, страну и тип устройства по структуре URL и переранжирует выдачу под пользователя
Google анализирует шаблоны в структуре URL сайта (например, поддомены или папки) и сопоставляет их с фактическим контентом страниц. Система вычисляет вероятность того, что определенный шаблон указывает на язык, страну или тип устройства. При поиске эти данные используются для расчета оценки соответствия (Alignment Score) и повышения в ранжировании той версии страницы, которая лучше всего подходит пользователю, при одновременном понижении дубликатов.
  • US8600993B1
  • 2013-12-03
  • Структура сайта

  • Персонализация

  • Техническое SEO

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует профили пользователей для персонализации и изменения порядка показа рекламы в поиске
Google создает детальные профили интересов пользователей на основе истории поиска, поведения и взаимодействия с контентом. Эти профили используются для персонализации выдачи, в частности, для изменения порядка показа рекламы (Placed Content). Система вычисляет показатель сходства между профилем пользователя и профилем рекламы, корректируя стандартный рейтинг (CTR * Ставка), чтобы показывать пользователю наиболее релевантные объявления.
  • US7693827B2
  • 2010-04-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google использует историю уточнений запросов для выявления и повышения авторитетных сайтов по широким запросам
Google анализирует последовательности запросов пользователей, чтобы понять, как они уточняют свои поисковые намерения. Если пользователи часто переходят от широкого или неточного запроса к более конкретному, который ведет на авторитетный ресурс, Google связывает этот ресурс с исходным широким запросом. Это позволяет показывать авторитетный сайт выше в выдаче, даже если пользователь сформулировал запрос неточно.
  • US8326826B1
  • 2012-12-04
  • Семантика и интент

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

seohardcore