SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов

METHODS AND SYSTEMS FOR CORRELATING CONNECTIONS BETWEEN USERS AND LINKS BETWEEN ARTICLES (Методы и системы для корреляции связей между пользователями и ссылок между статьями)
  • US8060405B1
  • Google LLC
  • 2004-12-31
  • 2011-11-15
  • Антиспам
  • Ссылки
  • SERP
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).

Описание

Какую проблему решает

Патент решает две ключевые проблемы манипулирования поисковыми системами и онлайн-рекламой:

  • Поисковый спам (Search Spamming): Ситуации, когда администраторы сайтов вступают в сговор для простановки ссылок друг на друга с целью искусственного завышения ранжирования своих ресурсов.
  • Рекламный спам/Кликфрод (Ad Spamming): Ситуации, когда администраторы или пользователи вступают в сговор для чрезмерного клика по рекламе на сайтах друг друга с целью увеличения дохода (накрутка кликов).
Изобретение направлено на оценку независимости (independence) ссылок и кликов.

Что запатентовано

Запатентована система, которая сопоставляет данные из социальных сетей (связи между пользователями) с данными, полученными при сканировании веба (ссылки между статьями и их администраторами). Цель — выявить, существуют ли реальные отношения между администраторами связанных ссылками сайтов. Если такая связь обнаружена, система может скорректировать вес ссылки (Searching Weight) или идентифицировать клики как рекламный спам.

Как это работает

Система работает в несколько этапов:

  • Анализ социальных связей: Система собирает и анализирует данные из социальных сетей для определения связей (дружба, бизнес и т.д.) между пользователями и силы этих связей.
  • Сканирование и идентификация: Система сканирует веб-страницы (articles), идентифицирует ссылки между ними и, что критически важно, пытается идентифицировать администраторов (Article Administrators) этих страниц.
  • Корреляция: Система сопоставляет администраторов связанных страниц с пользователями в базе данных социальных связей.
  • Принятие мер: Если между администраторами существует сильная социальная связь, ссылка между их сайтами может быть признана предвзятой (не независимой), и ее поисковый вес может быть снижен. Аналогично, клики по рекламе между связанными сторонами могут быть классифицированы как спам.

Актуальность для SEO

Средняя. Патент очень старый (подан в 2004 году) и ссылается на ныне не существующие или неактуальные социальные сети (Orkut, Friendster, Tribe). Прямой доступ Google к данным основных современных социальных сетей (например, Facebook/Instagram) сильно ограничен. Однако базовый принцип — обнаружение сговора и оценка независимости ссылок — крайне актуален для современных алгоритмов Google (например, Penguin, SpamBrain). Патент описывает раннюю попытку решить эту фундаментальную проблему, даже если конкретная реализация устарела.

Важность для SEO

Патент имеет значительное стратегическое влияние (7/10). Он демонстрирует стремление Google вознаграждать независимые, редакционные ссылки и пессимизировать искусственные ссылочные схемы или сговор. Хотя конкретный метод (использование API социальных сетей) может быть менее распространен сейчас, он подчеркивает важность естественности ссылочного профиля и риски, связанные с взаимным обменом ссылками или ссылочными сетями среди тесно связанных лиц.

Детальный разбор

Термины и определения

Ad Spamming (Рекламный спам / Накрутка кликов)
Любая неестественная манипуляция доступом к рекламе или мониторингом доступа к ней. Например, клики по рекламе, мотивированные не искренним интересом, а желанием увеличить доход (кликфрод).
Article (Статья)
Любой документ или единица контента. Включает веб-страницы, PDF-файлы, аудио, видео, а также рекламные объявления.
Article Administrator (Администратор статьи)
Лицо или организация, ответственная за дизайн, внедрение и/или поддержку статьи (например, вебмастер, владелец сайта, рекламодатель).
Association Weight (Вес ассоциации)
Метрика, определяющая силу или значимость социальной связи между двумя пользователями (например, лучший друг имеет больший вес, чем знакомый).
Connections Information (Информация о связях)
Данные, хранящиеся в базе и описывающие связи между пользователями в социальной сети, включая типы ассоциаций, уровни и веса.
Degree of Separation (Степень разделения)
Минимальное количество связей (ребер графа), разделяющих два профиля в социальной сети. Может быть специфичным для типа связи.
Search Spamming (Поисковый спам)
Неавторизованная или неестественная манипуляция методологией поиска с целью повлиять на ранжирование. Например, сговор вебмастеров для простановки ссылок друг на друга.
Searching Weight (Поисковый вес)
Вес или значимость, присваиваемая ссылке между статьями для целей ранжирования в поиске. Этот вес корректируется на основе корреляции с социальными связями.
Social Network (Социальная сеть)
Сеть, соединяющая людей или организации посредством набора отношений, таких как дружба, совместная работа или обмен информацией.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс использования социальных связей для корректировки веса ссылок в поиске.

  1. Система определяет связи между пользователями в сети (социальной сети).
  2. Информация об этих связях сохраняется в базе данных.
  3. Система обнаруживает целевую веб-страницу.
  4. Идентифицируется первый администратор (Admin 1) этой страницы.
  5. Идентифицируется ссылка на этой странице, ведущая на другую (ссылающуюся) веб-страницу. (Примечание: в тексте патента есть некоторая путаница в терминах linking/desired webpage в Claim 1, но суть ясна из описания и других Claims — анализируется связь между источником и целью ссылки).
  6. Идентифицируется второй администратор (Admin 2) ссылающейся страницы.
  7. Система ищет в базе данных информацию о связи между Admin 1 и Admin 2.
  8. На основе этой связи ссылке присваивается вес (weight).
  9. Ранжирование целевой веб-страницы определяется, в том числе, на основе этого веса.

Это ключевой механизм: вес ссылки модулируется реальными отношениями между владельцами сайтов.

Claim 3 (Независимый пункт): Более общая версия, фокусирующаяся на классификации ссылки.

  1. Система идентифицирует веб-страницу и ссылку на ней, ведущую на другую страницу.
  2. Определяется первая сущность (Entity 1), связанная с первой страницей.
  3. Определяется вторая сущность (Entity 2), связанная со второй страницей.
  4. Определяется отношение между Entity 1 и Entity 2 на основе информации о связях в сети.
  5. Ссылка классифицируется на основе этого отношения (например, как независимая или предвзятая).

Claim 13 (Независимый пункт): Описывает процесс обнаружения рекламного спама (Ad Spamming).

  1. Система идентифицирует рекламное объявление.
  2. Определяется первая сущность (Entity 1), связанная с рекламой (например, хост сайта или рекламодатель).
  3. Идентифицируется точка доступа (access point) к рекламе (источник клика, IP-адрес).
  4. Определяется вторая сущность (Entity 2), связанная с точкой доступа (пользователь, совершивший клик).
  5. Определяется отношение между Entity 1 и Entity 2 на основе информации о связях в сети.
  6. Точка доступа (клик) классифицируется на основе этого отношения (например, как легитимный или спамный).

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры и требует интеграции внешних данных.

CRAWLING – Сканирование и Сбор данных
На этом этапе система должна не только обнаружить контент и ссылки, но и собрать данные для идентификации администраторов статей (Article Administrators). Это может включать поиск контактной информации, данных об авторстве на страницах или использование внешних сервисов (например, WHOIS).

INDEXING – Индексирование и извлечение признаков
Система должна обработать собранные данные для точной идентификации администраторов и проиндексировать эту информацию вместе со структурой ссылок в Article Index. Также на этом этапе (или в рамках отдельного процесса сбора внешних данных) система должна обработать данные социальных сетей для построения базы данных связей (Social Network Database).

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение для борьбы с поисковым спамом. При расчете ценности ссылки (например, при расчете PageRank или аналогичных метрик) система выполняет корреляцию. Searching Weight, полученный на основе социальных связей, применяется для модуляции значения, передаваемого по ссылке. Если социальная связь сильная, вес ссылки, вероятно, будет снижен.

Рекламные системы (Не показано на схеме, но описано в патенте)
Используется для обнаружения кликфрода (Ad Spamming) в режиме реального времени или при постобработке логов кликов.

Входные данные:

  • Данные из социальных сетей (профили, связи).
  • Данные сканирования веба (статьи, ссылки).
  • Данные для идентификации администраторов (WHOIS, контент-анализ, паттерны доступа).

Выходные данные:

  • Скорректированные Searching Weights для ссылок.
  • Классификация ссылок (например, предвзятая/независимая).
  • Классификация рекламных кликов (спам/легитимный).

На что влияет

  • Типы контента и Ссылочные факторы: Влияет на оценку ценности ссылок между любыми типами контента (веб-сайты, отдельные статьи).
  • Конкретные ниши: Потенциально может влиять на ниши, где распространено сотрудничество и сговор (например, локальные услуги, партнерский маркетинг), если участники социально связаны и эта связь может быть обнаружена.
  • Рекламные системы: Влияет на доходы от рекламы путем выявления и игнорирования мошеннических кликов.

Когда применяется

  • Условия применения: Алгоритм применяется, когда системе удается идентифицировать администраторов или сущности, стоящие за двумя связанными ссылкой статьями (или за рекламным кликом), И когда эти сущности присутствуют в анализируемых данных социальной сети.
  • Триггеры активации: Наличие социальной связи между идентифицированными сущностями.
  • Пороговые значения: Сила и тип социальной связи (Association Weight) определяют степень влияния на Searching Weight. Например, связь уровня "лучший друг" приведет к большему снижению веса ссылки, чем связь уровня "знакомый".

Пошаговый алгоритм

Процесс А: Борьба с поисковым спамом (на основе FIG. 3)

  1. Определение связей (Офлайн): Система анализирует социальную сеть для определения связей между пользователями, включая типы ассоциаций, уровни и веса (Association Weights).
  2. Хранение информации о связях: Connections Information сохраняется в базе данных (Social Network Database).
  3. Сканирование сети: Поисковая система выполняет обход сети для обнаружения желаемых статей (веб-страниц).
  4. Идентификация администратора (Admin 1): Для каждой статьи идентифицируется ее администратор (например, через контент-анализ, WHOIS или анализ паттернов доступа).
  5. Идентификация исходящих ссылок: В каждой статье выявляются ссылки, ведущие на другие (целевые) статьи.
  6. Идентификация администратора (Admin 2): Идентифицируются администраторы целевых статей.
  7. Индексирование данных: Исходные статьи, их администраторы (Admin 1), целевые статьи и их администраторы (Admin 2) индексируются в Article Index.
  8. Корреляция и Взвешивание: Система сопоставляет информацию из Article Index с Social Network Database. Определяется, существует ли связь между Admin 1 и Admin 2. На основе типа и веса этой связи определяется Searching Weight для ссылки. Например, если Admin 1 и Admin 2 — лучшие друзья, вес ссылки снижается.

Процесс Б: Борьба с рекламным спамом (на основе FIG. 5)

  1. Определение и Хранение связей: Аналогично Процессу А (шаги 1-2).
  2. Обнаружение рекламы: Система обнаруживает желаемые рекламные объявления в сети.
  3. Идентификация администратора рекламы (Admin 1): Идентифицируется администратор (например, хост сайта или рекламодатель).
  4. Идентификация точек доступа: Отслеживаются доступы (клики) к рекламе и определяются точки доступа (например, IP-адреса, cookies).
  5. Идентификация пользователей точек доступа (User 2): Идентифицируются пользователи или администраторы, связанные с этими точками доступа.
  6. Индексирование данных: Реклама, ее администраторы и пользователи точек доступа индексируются.
  7. Корреляция и Определение спама: Система сопоставляет Admin 1 и User 2 с базой социальных связей. Если обнаружена сильная связь, доступ (клик) может быть классифицирован как Ad Spamming и проигнорирован.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Содержимое статей анализируется для поиска информации, идентифицирующей администратора (контактная информация, данные об авторстве).
  • Технические факторы: Доменные имена используются для запросов к службам регистрации (WHOIS) для идентификации владельцев. IP-адреса и cookies используются для идентификации пользователей в процессе анализа Ad Spamming.
  • Ссылочные факторы: Наличие ссылки между двумя статьями является основой для анализа в контексте поискового спама.
  • Поведенческие факторы (Access Patterns): Патент упоминает, что администратора можно идентифицировать по паттернам доступа к сайту (например, администратор может регулярно проверять определенные страницы или получать доступ к большему количеству страниц для тестирования). При анализе Ad Spamming используются данные о кликах (click-through rates).
  • Внешние данные (Social Network Data): Персональная информация пользователей социальных сетей, данные профилей, типы связей (дружба, бизнес, сообщество), уровни связей (например, "лучший друг", "знакомый", "коллега") и степени разделения (Degree of Separation).

Какие метрики используются и как они считаются

  • Association Weight (Вес ассоциации): Метрика, рассчитываемая на основе данных социальной сети. Определяет силу социальной связи. Более близкие отношения (например, "лучший друг") весят больше, чем отдаленные (например, "знакомый" или большая Degree of Separation).
  • Searching Weight (Поисковый вес): Итоговая метрика, присваиваемая ссылке для использования в ранжировании. Рассчитывается путем корреляции Association Weight между администраторами. Патент предполагает обратную зависимость: чем выше Association Weight (сильнее связь), тем ниже может быть Searching Weight, так как ссылка считается менее независимой.

Выводы

  1. Независимость ссылок как ключевой фактор оценки: Патент подчеркивает стремление Google оценивать не просто наличие ссылки, а ее независимость (independence). Ссылки, возникающие на основе существующих личных или деловых отношений, могут рассматриваться как предвзятые (biased) и, следовательно, менее ценные для ранжирования.
  2. Использование внешних данных для понимания веба: Google демонстрирует готовность использовать данные из источников за пределами самого веба (в данном случае, социальных сетей), чтобы понять взаимоотношения в реальном мире и применить эти знания к оценке ссылочного графа.
  3. Борьба со сговором (Collusion Detection): Описанный механизм является инструментом для обнаружения сговора как в контексте поискового спама (искусственные ссылки), так и рекламного мошенничества (кликфрод).
  4. Критичность идентификации сущностей: Успех системы сильно зависит от способности точно идентифицировать администраторов или владельцев сайтов (Article Administrators) и сопоставить их с профилями в социальных сетях. Это нетривиальная задача, которая может ограничивать применимость алгоритма.
  5. Устаревшие методы, но вечные принципы: Хотя конкретная реализация через API устаревших социальных сетей не актуальна, принцип обнаружения неестественных связей и сговора остается фундаментальным для алгоритмов борьбы со спамом Google. Современные системы используют другие сигналы для достижения той же цели.

Практика

Best practices (это мы делаем)

  • Фокус на получении редакционных и независимых ссылок: Патент подтверждает стратегическую важность получения ссылок от источников, которые не имеют личных или прямых деловых отношений с вашим сайтом. Ссылки должны быть заработаны благодаря ценности контента, а не через договоренности.
  • Диверсификация ссылочного профиля: Необходимо стремиться к получению ссылок из широкого круга не связанных между собой источников. Это снижает риск того, что значительная часть ссылочного профиля будет девальвирована из-за обнаружения скрытых связей или сговора.
  • Прозрачность аффилиации (с оговорками): Если ссылки ставятся на основе деловых отношений (например, спонсорство), использование атрибутов rel="nofollow" или rel="sponsored" соответствует рекомендациям Google и устраняет необходимость для системы угадывать природу связи.

Worst practices (это делать не надо)

  • Схемы обмена ссылками (Reciprocal Linking): Особенно рискованно участвовать в схемах обмена ссылками с людьми или компаниями, с которыми у вас есть тесные личные или деловые связи. Если Google сможет идентифицировать эту связь (через социальные сети, как в патенте, или другими методами), эти ссылки будут обесценены.
  • Участие в узких ссылочных сетях или сообществах: Ссылки, циркулирующие внутри небольшого сообщества или группы тесно связанных лиц, могут быть легко идентифицированы и девальвированы как предвзятые.
  • Использование личных связей для линкбилдинга: Просьба к друзьям или коллегам поставить ссылку с их сайтов может привести к получению ссылок с низким Searching Weight, если система определит вашу связь.

Стратегическое значение

Патент подтверждает, что Google стремится интерпретировать ссылочный граф не просто как техническую структуру, но и как отражение социальных и деловых отношений. Цель — понять намерение, стоящее за ссылкой. Долгосрочная стратегия линкбилдинга должна быть направлена на создание естественного профиля, который выглядит как результат независимых редакционных решений. Хотя реализация через API социальных сетей сейчас маловероятна из-за ограничений доступа к данным, Google использует множество других методов для выявления связей и сговора (например, анализ паттернов ссылок, общий хостинг, данные WHOIS, общие идентификаторы аналитики/рекламы).

Практические примеры

Сценарий: Детекция локального ссылочного спама

  1. Ситуация: Владелец компании А (Иван) и владелец компании Б (Петр) в одном городе являются близкими друзьями и активно взаимодействуют в социальной сети (например, Facebook).
  2. Действие (SEO): Иван и Петр решают помочь друг другу с SEO и обмениваются прямыми ссылками между своими корпоративными сайтами.
  3. Анализ Google (согласно логике патента):
    • Google сканирует оба сайта.
    • Google идентифицирует Ивана как администратора сайта А и Петра как администратора сайта Б (например, через страницы "О нас", данные WHOIS или публичные реестры).
    • Google имеет доступ к данным социальной сети (гипотетически, как описано в патенте) и видит, что Иван и Петр имеют сильную социальную связь (Association Weight высокий).
  4. Результат: Система определяет, что ссылка является предвзятой (не независимой). Searching Weight этой ссылки значительно снижается. Ссылка передает минимальный или нулевой ранжирующий вес.

Вопросы и ответы

Означает ли этот патент, что Google активно шпионит за моими социальными сетями?

Патент описывает механизм использования данных социальных сетей, поданный в 2004 году, когда доступ к этим данным был проще, и Google активно развивал свои сети (например, Orkut). В настоящее время доступ Google к данным крупнейших социальных сетей (Facebook, Instagram, LinkedIn) сильно ограничен из-за настроек приватности и ограничений API. Маловероятно, что Google использует этот конкретный механизм в широком масштабе сегодня, но он ищет публичные сигналы связей.

Что важнее согласно патенту: сама ссылка или отношения между сайтами?

Ключевым нововведением патента является именно анализ отношений между администраторами сайтов. Если стандартные системы оценивают саму ссылку (ее релевантность, авторитетность источника), то этот механизм предлагает модулировать ценность ссылки на основе независимости (independence) связи между владельцами. Сильная личная связь может обесценить даже релевантную ссылку.

Как система идентифицирует администратора сайта?

Патент упоминает несколько методов: поиск контактной информации или данных об авторстве в контенте статьи, использование служб регистрации доменных имен (WHOIS), а также анализ паттернов доступа (пользователь, который часто и равномерно обращается ко многим страницам сайта, может быть его администратором). Это самая сложная часть реализации патента.

Если я дружу с владельцем авторитетного сайта, и он на меня сошлется, эта ссылка будет бесполезна?

Согласно логике патента, если Google сможет идентифицировать вас обоих и вашу дружбу, вес этой ссылки (Searching Weight) может быть снижен, так как она не считается полностью независимой. Степень снижения зависит от силы вашей связи (Association Weight). Однако это не обязательно делает ее полностью бесполезной, но она будет менее ценной, чем ссылка от независимого источника.

Как этот патент связан с современными алгоритмами борьбы со спамом, такими как Penguin или SpamBrain?

Патент демонстрирует раннюю попытку решить проблему ссылочного спама и сговора. Современные алгоритмы, такие как Penguin и SpamBrain, также направлены на выявление неестественных ссылочных паттернов и манипуляций. Хотя они, вероятно, не используют данные социальных сетей напрямую, они следуют тому же принципу: обнаружение и нейтрализация связей, созданных для манипулирования ранжированием, а не для пользы пользователей.

Стоит ли избегать обмена ссылками с деловыми партнерами?

Если ссылка естественна и полезна для пользователей (например, ссылка на поставщика или клиента), она допустима. Однако, если обмен ссылками происходит исключительно в целях SEO, это рискованно. Патент показывает, что Google стремится выявлять такие предвзятые ссылки. Рекомендуется использовать атрибуты nofollow/sponsored, если связь носит коммерческий характер, или убедиться, что ссылка имеет реальную ценность для посетителей.

Что такое "Вес ассоциации" (Association Weight) и как он влияет на SEO?

Association Weight — это мера силы социальной связи (например, лучший друг имеет больший вес, чем знакомый). В контексте этого патента предполагается обратная зависимость: чем выше Association Weight между двумя администраторами, тем ниже Searching Weight ссылки между их сайтами. Сильная связь подразумевает предвзятость.

Применяется ли этот механизм для борьбы с PBN (Private Blog Networks)?

Патент напрямую не описывает борьбу с PBN, так как фокусируется на социальных связях между разными людьми. Однако он иллюстрирует общий подход Google к выявлению неестественных связей. Если Google сможет идентифицировать, что все сайты в PBN принадлежат одному администратору (что является формой максимальной связи), все ссылки внутри сети будут обесценены.

Описывает ли патент только поисковый спам?

Нет, патент также подробно описывает механизм борьбы с рекламным спамом (Ad Spamming) или кликфродом. Если пользователь, кликающий на рекламу, имеет тесную социальную связь с владельцем сайта, на котором размещена реклама, этот клик может быть классифицирован как мошеннический и не засчитан.

Какова главная сложность в реализации этого патента для Google?

Главная сложность заключается в двух аспектах. Во-первых, точная идентификация администраторов произвольных веб-сайтов (Article Administrators) является нетривиальной задачей. Во-вторых, получение надежных и полных данных о социальных связях между этими администраторами, особенно в условиях современных ограничений приватности и закрытости социальных платформ.

Похожие патенты

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок
Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.
  • US7509344B1
  • 2009-03-24
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google использует социальные связи и действия пользователей для персонализации и аннотирования поисковой выдачи
Google использует механизм для персонализации поисковой выдачи путем добавления аннотаций к результатам, которые связаны с социальными группами пользователя (друзья, коллеги, жители города). Система определяет, как участники этих групп взаимодействовали с контентом (создали, поделились, одобрили), приоритизирует эти действия и добавляет пояснения к сниппетам. Также описаны механизмы агрегации действий и защиты конфиденциальности при показе аннотаций.
  • US10142441B2
  • 2018-11-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи для персонализации и повышения в ранжировании онлайн-форумов в результатах поиска
Google использует механизм для персонализации поисковой выдачи путем интеграции данных из социальной сети. Если система определяет, что результат поиска является онлайн-форумом, она проверяет, являются ли социальные контакты пользователя участниками этого форума. При обнаружении таких связей система повышает рейтинг форума в выдаче и добавляет социальные аннотации, указывая, кто из контактов пользователя активен на этом ресурсе.
  • US8862598B1
  • 2014-10-14
  • Персонализация

  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы
Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.
  • US20120278171A1
  • 2012-11-01
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
  • US10303684B1
  • 2019-05-28
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
  • US7296016B1
  • 2007-11-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
  • US9268880B2
  • 2016-02-23
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц
Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.
  • US7308643B1
  • 2007-12-11
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства
Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.
  • US8868592B1
  • 2014-10-21
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

seohardcore