SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче

INFORMATIONAL BOOK QUERY (Информационный запрос о книгах)
  • US8392429B1
  • Google LLC
  • 2008-11-26
  • 2013-03-05
  • Ссылки
  • SERP
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.

Описание

Какую проблему решает

Патент решает проблему поиска релевантных книг по общим информационным запросам. Пользователи часто ищут информацию по теме (например, "история сан-франциско"), а не конкретную книгу или автора. Стандартный поиск может не выявить лучшие книги по этой теме. Изобретение предлагает механизм для автоматического определения и ранжирования авторитетных книг, релевантных теме запроса, используя данные из веба.

Что запатентовано

Запатентована система, которая использует результаты веб-поиска как доказательство авторитетности и релевантности книг. Система анализирует топовые веб-страницы, найденные по запросу, чтобы определить, цитируют ли они какие-либо книги. На основе этих цитирований и ранга цитирующих страниц система вычисляет Book Score для каждой книги и подмешивает наиболее релевантные книги в общую поисковую выдачу.

Как это работает

Механизм работает следующим образом:

  • Стандартный поиск: Система получает запрос и генерирует ранжированный список веб-страниц.
  • Идентификация Reference Pages: Анализируется топ-N веб-страниц. Система определяет, является ли страница "Reference Page" для конкретной книги. Для этого страница должна цитировать книгу и удовлетворять Citation Criterion (критерию цитирования), который гарантирует, что страница в значительной степени посвящена именно этой книге.
  • Расчет Book Score: Для идентифицированных книг рассчитывается Book Score. Эта оценка агрегирует данные со всех Reference Pages, учитывая их ранг в веб-поиске и силу цитирования (Citation Score).
  • Ранжирование и смешивание: Книги ранжируются по Book Score, и лучшие из них (например, топ-3) отображаются в SERP в виде Book References, часто в отдельном блоке.

Актуальность для SEO

Высокая. Этот патент описывает фундаментальный механизм того, как результаты из вертикальных поисков (в данном случае Google Books) интегрируются в основную веб-выдачу (Universal Search/Blending). Использование сигналов из веба (цитирований и авторитетности страниц) для ранжирования контента в других корпусах остается ключевой технологией Google, особенно актуальной для Google Books и Google Scholar.

Важность для SEO

Патент имеет значительное влияние на SEO (7/10), особенно для издателей, авторов и специалистов, занимающихся продвижением публикаций (книг, научных статей). Он четко демонстрирует, что видимость книги в поиске напрямую зависит от того, насколько часто и контекстуально она цитируется на авторитетных веб-страницах, ранжирующихся по целевым темам. Авторитет веб-страницы передается цитируемой книге.

Детальный разбор

Термины и определения

Book Metadata (Метаданные книги)
Информация о книге, такая как название, подзаголовок, автор, ISBN, год публикации. Используется для идентификации цитирований и расчета Citation Score.
Book Query Processor (Процессор запросов о книгах)
Компонент поисковой системы, отвечающий за анализ веб-результатов, идентификацию Reference Pages и расчет Book Scores.
Book Reference (Ссылка на книгу)
Специальный формат результата в SERP, идентифицирующий книгу. Включает цитатную информацию и ссылку на просмотр или покупку книги (например, в Google Books).
Book Score (Оценка книги)
Итоговая оценка, присваиваемая книге для конкретного запроса. Рассчитывается путем агрегации данных со всех Reference Pages, цитирующих эту книгу в топе веб-выдачи. Учитывает ранг Reference Page и ее Citation Score.
Citation Criterion (Критерий цитирования)
Набор условий, которым должна удовлетворять веб-страница, чтобы считаться Reference Page для книги. Включает превышение порога Citation Score и доминирование этой книги среди других цитируемых на странице работ.
Citation Score (Оценка цитирования)
Метрика, измеряющая релевантность метаданных книги (Book Metadata) контенту веб-страницы. Показывает, насколько тесно содержание страницы связано с цитируемой книгой.
Reference Page (Страница-источник цитирования)
Веб-страница, которая цитирует книгу и удовлетворяет Citation Criterion для этой книги.
Web Content Reference (Ссылка на веб-контент)
Стандартный результат поиска ("синяя ссылка"), ведущий на веб-страницу.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод идентификации и интеграции книг в результаты поиска.

  1. Система получает поисковый запрос.
  2. Определяется, является ли каждая из множества веб-страниц, удовлетворяющих запросу, Reference Page для книги.
  3. Детализация определения Reference Page: Страница является таковой, если (i) она содержит ссылку на книгу и имеет Citation Score, удовлетворяющий Citation Criterion, (ii) Citation Score для этой книги превышает порог, И (iii) Citation Scores для любых ДРУГИХ книг, цитируемых на этой же странице, НИЖЕ, чем Citation Score для этой книги. Citation Score определяется как мера релевантности метаданных книги контенту страницы.
  4. Выбирается подмножество веб-страниц, которые являются Reference Pages.
  5. Присваивается Book Score каждой книге, для которой существует хотя бы одна Reference Page. Каждая Reference Page вносит вклад в Book Score соответствующей книги.
  6. Книги выбираются на основе Book Scores.
  7. Генерируются Book References (включая цитатную информацию или ссылку на страницу книги).
  8. Book References предоставляются в ответ на запрос в дополнение к стандартным Web Content References.

Ключевым элементом является пункт 1(iii) – требование доминирования. Страница не считается Reference Page, если она просто перечисляет много книг (например, библиография). Она должна быть сфокусирована на конкретной книге, что подтверждается тем, что Citation Score этой книги выше, чем у всех остальных.

Claim 2 (Зависимый от 1): Уточняет требование доминирования.

Citation Scores других книг должны быть по крайней мере на определенный процент ниже, чем Citation Score основной книги.

Claims 3 и 4 (Зависимые): Определяют состав Book Metadata.

Метаданные включают название, подзаголовок и автора книги.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя предварительно вычисленные данные и влияя на финальное смешивание результатов.

INDEXING – Индексирование и извлечение признаков
На этом этапе система может выполнять предварительную обработку веб-страниц для идентификации Reference Pages. Поскольку определение Reference Page и расчет Citation Score не зависят от запроса пользователя, эти вычисления могут быть выполнены офлайн. Система анализирует контент страниц, сравнивает его с Book Metadata из библиотеки, рассчитывает Citation Scores и сохраняет классификацию страниц.

RANKING – Ранжирование
На этом этапе происходит стандартное ранжирование веб-страниц по запросу пользователя. Генерируется ранжированный список кандидатов.

METASEARCH – Метапоиск и Смешивание
Основное применение патента. Book Query Processor активируется для анализа результатов этапа RANKING.

  1. Анализ Топа: Система берет Топ-N результатов ранжирования.
  2. Идентификация книг: Используя данные из индекса (или вычисляя на лету), система определяет, какие из этих страниц являются Reference Pages и для каких книг.
  3. Расчет Book Score: Система рассчитывает Book Score для каждой книги, агрегируя Citation Scores и учитывая ранг (Relevance Score) каждой Reference Page.
  4. Смешивание: Лучшие книги выбираются и интегрируются в SERP как Book References.

Входные данные:

  • Поисковый запрос.
  • Ранжированный список веб-страниц с их оценками релевантности (Relevance Scores).
  • База данных Book Metadata.
  • (Опционально) Предварительно рассчитанные Citation Scores и классификация страниц как Reference Pages.

Выходные данные:

  • Список Book References, интегрированный в общую страницу результатов поиска.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на информационные запросы, связанные с темами, по которым существуют авторитетные публикации (академические темы, история, наука, технологии).
  • Конкретные типы контента: Влияет на видимость книг и потенциально других типов публикаций (например, научных статей) в основном поиске. Также влияет на веб-страницы, которые содержат обзоры, рецензии или глубокий анализ книг.

Когда применяется

Алгоритм применяется при выполнении следующих условий:

  • Триггер активации: Когда в Топ-N результатов веб-поиска присутствует достаточное количество страниц, которые удовлетворяют Citation Criterion для одной или нескольких книг.
  • Условия качества цитирования: Citation Score должен превышать порог, и книга должна быть доминирующей цитатой на странице.
  • (Опционально) Фильтрация релевантности: Патент упоминает возможность фильтрации, если метаданные книги недостаточно пересекаются с терминами исходного запроса пользователя (overlapping ratio).

Пошаговый алгоритм

Процесс А: Офлайн-подготовка (Индексирование)

  1. Сканирование и анализ контента: Система анализирует контент веб-страницы.
  2. Идентификация цитирований: Система ищет упоминания книг, сравнивая контент с базой Book Metadata.
  3. Расчет Citation Score: Для каждой найденной книги рассчитывается Citation Score. Это мера релевантности метаданных книги контенту страницы (например, путем выполнения внутреннего запроса метаданных книги к контенту страницы).
  4. Проверка Citation Criterion: Проверяется, превышает ли Citation Score порог И является ли он самым высоким (с запасом) среди всех книг на странице.
  5. Классификация: Если критерий выполнен, страница помечается как Reference Page для этой книги, и Citation Score сохраняется в индексе.

Процесс Б: Обработка запроса в реальном времени

  1. Получение запроса и веб-результатов: Система выполняет стандартный поиск и получает ранжированный список веб-страниц (с оценками релевантности).
  2. Анализ Топ-N результатов: Система анализирует верхнюю часть выдачи (например, топ-60).
  3. Идентификация Reference Pages: Система извлекает из индекса данные о том, какие из этих страниц являются Reference Pages и связанные с ними Citation Scores.
  4. Расчет Book Score: Для каждой идентифицированной книги рассчитывается Book Score. Это агрегация вклада от всех ее Reference Pages в Топ-N. Вклад может быть функцией от Оценки Релевантности страницы и ее Citation Score (например, их произведением).
  5. Ранжирование книг: Книги сортируются по Book Score.
  6. (Опционально) Фильтрация: Проверяется релевантность метаданных книги исходному запросу (например, по пересечению терминов).
  7. Выбор и генерация результатов: Выбираются Топ-K книг (например, 3). Для них генерируются Book References.
  8. Смешивание (Blending): Book References интегрируются в финальную SERP.

Какие данные и как использует

Данные на входе

Система использует следующие типы данных:

  • Контентные факторы: Полный текст веб-страниц. Он необходим для расчета Citation Score – определения того, насколько контент страницы релевантен цитируемой книге.
  • Системные данные (Ранжирование): Оценки релевантности (Relevance Scores, IR scores, PageRank) веб-страниц для текущего запроса. Ранг страницы критически важен для расчета Book Score.
  • Структурированные данные (Metadata): Book Metadata (название, автор, подзаголовок, ISBN и т.д.). Эти данные используются как для идентификации цитирований, так и для расчета Citation Score.

Какие метрики используются и как они считаются

  • Citation Score: Измеряет релевантность книги к странице. Рассчитывается путем оценки релевантности Book Metadata по отношению к контенту веб-страницы. В патенте предлагается вариант расчета через IR score, где метаданные книги выступают как запрос, а контент страницы – как документ.
  • Citation Criterion: Набор условий для классификации страницы как Reference Page.
    1. Citation Score > Порог.
    2. Доминирование: Citation Score книги А значительно выше (например, на X%), чем Citation Score любой другой книги Б на той же странице.
  • Book Score: Измеряет релевантность книги к исходному запросу на основе веб-доказательств. Рассчитывается как агрегация (например, сумма) вкладов от всех Reference Pages. Вклад может рассчитываться как произведение Релевантности Reference Page (для исходного запроса) и Citation Score (для книги).
  • (Опционально) Relevancy Score (Фильтрация): Метрика, измеряющая прямое соответствие между исходным запросом и Book Metadata (например, коэффициент пересечения терминов). Используется для финальной фильтрации.

Выводы

  1. Использование веба для ранжирования вертикалей: Патент демонстрирует, как Google использует сигналы из основного веб-индекса (авторитетность и контент веб-страниц) для ранжирования элементов в другом корпусе (Google Books). Это ключевой механизм Universal Search.
  2. Передача авторитета через цитирование: Авторитет (ранг) веб-страницы напрямую передается книге, которую она цитирует. Чем выше ранжируется цитирующая страница по запросу, тем выше будет Book Score у цитируемой книги.
  3. Важность контекста цитирования (Citation Score): Недостаточно просто упомянуть книгу. Контент страницы должен быть тесно связан с содержанием книги. Citation Score измеряет эту связь.
  4. Требование доминирования (Citation Criterion): Система фильтрует "шумные" цитирования. Чтобы страница считалась Reference Page, книга должна быть основным фокусом или самой релевантной цитатой на странице, значительно опережая другие упомянутые работы. Это предотвращает манипуляции с помощью длинных списков литературы.
  5. Возможность офлайн-вычислений: Ключевые метрики качества цитирования (Citation Score) не зависят от запроса и могут быть рассчитаны на этапе индексирования, что ускоряет работу системы в реальном времени.

Практика

Best practices (это мы делаем)

Эти рекомендации применимы для SEO-специалистов, работающих с издательствами, авторами или продвигающих конкретные публикации (книги, исследования).

  • Стимулирование контекстуальных цитирований на авторитетных ресурсах: Ключевая стратегия. Необходимо добиваться, чтобы авторитетные сайты, которые уже хорошо ранжируются по целевым тематикам, цитировали вашу книгу.
  • Создание качественных страниц обзора/рецензий: Создавайте или стимулируйте создание страниц, которые глубоко анализируют книгу. Такие страницы с большей вероятностью будут иметь высокий Citation Score, так как их контент тесно связан с метаданными и содержанием книги.
  • Обеспечение доминирования цитирования: При размещении контента убедитесь, что ваша книга является основным предметом обсуждения на странице. Если на странице цитируются другие работы, ваша книга должна быть явно выделена как наиболее релевантная, чтобы удовлетворить Citation Criterion.
  • Оптимизация Book Metadata: Убедитесь, что метаданные книги (название, подзаголовок, автор) в базах данных (например, Google Books) точны и содержат релевантные ключевые слова. Это влияет как на расчет Citation Score, так и на финальную фильтрацию релевантности.

Worst practices (это делать не надо)

  • Спам цитированиями на низкокачественных сайтах: Размещение ссылок на книгу на сайтах, которые не ранжируются по теме запроса, не даст эффекта, так как вклад в Book Score зависит от ранга цитирующей страницы.
  • Создание страниц с длинными списками литературы: Страницы, которые просто перечисляют десятки книг, скорее всего, не будут классифицированы как Reference Pages ни для одной из них из-за требования доминирования в Citation Criterion.
  • Цитирование книги вне контекста: Упоминание книги на странице, содержание которой не связано с темой книги, приведет к низкому Citation Score, и страница не станет Reference Page.

Стратегическое значение

Этот патент подтверждает стратегию Google по интеграции данных из разных источников (Universal Search). Он показывает, что SEO для вертикальных поисков (Books, Scholar, возможно, Images) часто зависит от сигналов в основном веб-поиске. Стратегически важно понимать, что авторитетность в вебе можно конвертировать в видимость специфических сущностей (книг), если обеспечить сильную контекстуальную связь (цитирование).

Практические примеры

Сценарий: Продвижение новой книги по машинному обучению

  1. Целевой запрос: "основы машинного обучения".
  2. Анализ выдачи: В топе находятся статьи из Wikipedia, курсы Coursera, университетские страницы.
  3. Стратегия (Плохая): Разместить упоминание книги в разделе "Рекомендуемая литература" на странице университетского курса, где перечислены еще 20 книг.
    Результат: Страница курса ранжируется высоко, но из-за большого количества книг ни одна не удовлетворяет требованию доминирования. Страница не становится Reference Page.
  4. Стратегия (Хорошая): Опубликовать детальный обзор книги в авторитетном блоге по Data Science. Убедиться, что контент обзора тесно связан с главами и терминологией книги.
    Результат: Блог ранжируется в Топ-20 по запросу. Контент тесно связан с книгой (высокий Citation Score). Книга является единственной цитируемой работой (удовлетворяет Citation Criterion). Страница становится Reference Page.
  5. Итог: Вклад от этой страницы значительно повышает Book Score, и книга появляется в блоке "Book results" в основной выдаче по запросу "основы машинного обучения".

Вопросы и ответы

Что такое Citation Score и как он рассчитывается?

Citation Score — это метрика, которая определяет, насколько тесно контент веб-страницы связан с книгой, которую она цитирует. Патент предлагает рассчитывать его как меру релевантности метаданных книги (название, автор и т.д.) к тексту страницы. Например, можно представить метаданные книги как запрос, а текст страницы как документ, и вычислить IR-оценку для этой пары.

Почему недостаточно просто получить цитирование с высокоранжирующейся страницы?

Необходимо выполнить два дополнительных условия. Во-первых, контент страницы должен быть релевантен книге (высокий Citation Score). Во-вторых, цитирование должно быть доминирующим (Citation Criterion): Citation Score этой книги должен быть значительно выше, чем у любых других книг, упомянутых на этой же странице.

Будет ли страница со списком литературы (библиографией) считаться Reference Page?

Скорее всего, нет. Если на странице перечислено много книг с примерно одинаковой релевантностью к контенту страницы, ни одна из них не удовлетворит требованию доминирования в Citation Criterion. Reference Page должна быть в значительной степени сфокусирована на одной конкретной книге.

Как рассчитывается итоговый Book Score?

Book Score рассчитывается путем агрегации (например, суммирования) вкладов от всех Reference Pages, найденных в топе веб-выдачи по данному запросу. Вклад каждой страницы обычно является функцией (например, произведением) ее ранга в веб-поиске (Relevance Score) и ее Citation Score для данной книги.

Влияет ли этот патент только на Google Books?

Патент сфокусирован на книгах, но описанная методология — использование веб-доказательств и цитирований для ранжирования контента из другого корпуса — с высокой вероятностью применяется и в других вертикалях, особенно в Google Scholar для ранжирования научных статей по информационным запросам.

Может ли система работать, если метаданные книги не содержат ключевых слов из запроса?

Да, основной механизм основан на том, что цитирующие веб-страницы релевантны запросу. Однако патент упоминает опциональный шаг фильтрации: если пересечение между запросом и метаданными книги слишком мало (overlapping ratio), книга может быть отфильтрована, даже если ее Book Score высок.

Как SEO-специалист может использовать этот патент для продвижения сайта?

Если ваш сайт посвящен обзорам или анализу книг, этот патент подчеркивает важность создания глубокого, сфокусированного контента. Если ваш сайт будет классифицирован как Reference Page и займет высокие позиции в поиске, он не только получит трафик, но и поможет продвинуть соответствующую книгу, что может быть полезно для партнерских программ или издательского бизнеса.

Рассчитывается ли Citation Score в реальном времени?

Патент указывает, что Citation Score и определение Reference Page не зависят от запроса пользователя. Поэтому они могут быть рассчитаны заранее, на этапе индексирования. В реальном времени рассчитывается только Book Score, который зависит от ранга страниц в текущей выдаче.

Что важнее для Book Score: ранг цитирующей страницы или Citation Score?

Важны оба компонента. Высокий ранг страницы необходим, чтобы она вообще попала в анализ (Топ-N). Высокий Citation Score необходим, чтобы страница была классифицирована как Reference Page. Итоговый Book Score часто зависит от произведения этих двух показателей, поэтому необходимо максимизировать оба.

Как обеспечить выполнение критерия доминирования (Citation Criterion)?

Чтобы обеспечить доминирование, страница должна быть явно сфокусирована на одной книге. Например, это может быть детальная рецензия, страница с описанием содержания книги или статья, которая использует одну книгу как основной источник. Избегайте страниц, где ваша книга упоминается в ряду многих других без явного выделения.

Похожие патенты

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google обогащает оцифрованные документы (например, книги), автоматически находя и встраивая связанный веб-контент
Google улучшает представление оцифрованных документов (книг, статей), определяя их атрибуты (автор, название) и автоматически выполняя веб-поиск связанной информации (обзоров, биографий). Эта информация затем представляется вместе с исходным документом на «Справочной странице» (Reference Page), иногда путем прямого извлечения данных с релевантных веб-сайтов.
  • US8386453B2
  • 2013-02-26
  • Индексация

  • Ссылки

  • Семантика и интент

Как Google использует статистический анализ текста для автоматического сопоставления отсканированных книг с библиотечными каталогами (Google Books)
Патент описывает инфраструктурный процесс Google для каталогизации оцифрованных документов (Google Books). Система статистически сравнивает текст книги, полученный через OCR (особенно страницу авторских прав), с базой библиотечных метаданных. Используя вероятностный анализ, который придает больший вес редким терминам, система находит наилучшее совпадение и связывает структурированные данные (автор, название, ISBN) с отсканированным контентом.
  • US8510312B1
  • 2013-08-13
  • Индексация

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
  • US20210125108A1
  • 2021-04-29
  • Поведенческие сигналы

  • SERP

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.
  • US8005716B1
  • 2011-08-23
  • Поведенческие сигналы

  • Семантика и интент

  • Антиспам

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

seohardcore