Как Google интерпретирует выделенный пользователем текст в поисковые запросы и отдает предпочтение более длинным формулировкам

TOUCH TO SEARCH (Поиск по касанию)

US20140188894A1
Google LLC
2012-12-27
2014-07-03

Семантика и интент

Google использует механизм для преобразования контента, выделенного пользователем на экране (например, жестом обводки), в оптимизированный поисковый запрос. Система генерирует несколько кандидатов и оценивает их вероятность. Ключевая особенность — нормализация оценок по длине запроса. Это позволяет системе отдавать предпочтение более длинным и точным запросам, а не коротким и частотным, улучшая релевантность выдачи при использовании функций типа "Circle to Search".

Какую проблему решает

Патент решает несколько ключевых проблем, возникающих при инициировании поиска через взаимодействие с контентом на экране (особенно на мобильных устройствах):

Неоднозначность ввода: Интерпретация контента (текста, изображений), выделенного пользователем с помощью неточного жеста (например, обводки или долгого нажатия).
Смещение в сторону коротких запросов (Bias towards short queries): Пользователи склонны вводить короткие запросы из-за неудобства интерфейса. Система, основанная только на частотности запросов в логах, будет предпочитать эти короткие запросы, даже если выделенный контент предполагает более длинный и точный интент. Патент предлагает механизм компенсации этого смещения.
Сложность ввода: Устраняет необходимость ручного набора текста в поисковую строку.

Что запатентовано

Запатентована система (в частности, компонент Query Selector), которая преобразует данные о жесте пользователя (Gesture Data) в релевантный поисковый запрос. Суть изобретения заключается в методе оценки и нормализации кандидатов в запросы. Система рассчитывает вероятность (Likelihood Score) для каждого кандидата, а затем корректирует эту оценку с помощью Normalization Factor, основанного на длине запроса (количестве символов и/или слов). Это позволяет повысить приоритет более длинных и специфичных запросов.

Как это работает

Система работает следующим образом:

Ввод данных: Пользователь выделяет контент на экране жестом. Устройство генерирует Gesture Data, включающие выделенный контент и контекст (proximal content).
Генерация кандидатов: Query Selector анализирует контент и генерирует набор кандидатов в поисковые запросы (Candidate Search Queries).
Оценка вероятности: Для каждого кандидата рассчитывается исходный Likelihood Score, основанный на частоте его использования в исторических логах поиска или частоте встречаемости в корпусе документов.
Нормализация: Рассчитывается Normalization Factor, основанный на длине запроса (например, насколько часто встречаются запросы именно такой длины).
Корректировка: Исходный Likelihood Score делится на Normalization Factor. Это уменьшает влияние популярности коротких запросов и повышает вес длинных.
Бустинг: Оценка может быть дополнительно повышена при наличии семантических сигналов или совпадении с метаданными.
Выбор и Поиск: Выбирается кандидат с наивысшей скорректированной оценкой, и по нему выполняется поиск.

Актуальность для SEO

Высокая. С развитием мобильного поиска и внедрением функций типа "Circle to Search" (Обвести и найти) и Google Lens, механизмы точного преобразования визуального и текстового контекста в поисковый запрос стали критически важными. Принципы интерпретации интента и компенсации смещения в сторону коротких запросов остаются фундаментальными для систем понимания запросов (Query Understanding).

Важность для SEO

Влияние на SEO умеренное (4/10). Патент не описывает алгоритмы ранжирования, а фокусируется на пользовательском интерфейсе (UI) и понимании запросов (Query Understanding). Однако он имеет важное стратегическое значение: Google активно развивает методы, позволяющие пользователям легко формулировать (или системе формулировать за них) длинные и точные запросы. Это подчеркивает важность оптимизации контента под специфичные (long-tail) интенты и использования структурированных данных, поскольку Semantic Signals и Meta Information используются для уточнения выбора запроса.

Термины и определения

Candidate Search Queries (Кандидаты в поисковые запросы): Набор потенциальных поисковых запросов, сгенерированных системой на основе контента, выделенного пользователем.
Gesture Data (Данные о жесте): Данные, сгенерированные устройством в ответ на жест пользователя (касание, обводка). Включают информацию о выделенном контенте и проксимальном контенте.
Historical Data (Исторические данные): Хранилище данных о ранее полученных поисковых запросах. Используется для определения частотности запросов и частотности длин запросов.
Likelihood Score (Оценка вероятности): Метрика, указывающая на вероятность того, что данный кандидат является запросом, который подразумевал пользователь. Изначально часто основана на частотности запроса в логах или корпусе документов.
Meta Information Label (Метка метаинформации): Метаданные, связанные с документом или ресурсом (например, теги, заголовки, alt-тексты), которые могут использоваться для уточнения релевантности кандидата в запросы.
Normalization Factor (Коэффициент нормализации): Метрика, используемая для корректировки Likelihood Score. Основана на длине запроса (количестве символов/слов). Служит для компенсации смещения в сторону более коротких запросов.
Proximal Content (Проксимальный контент / Контекст): Контент, окружающий область, выделенную жестом. Используется для уточнения контекста и генерации более точных кандидатов.
Query Selector (Селектор запросов): Компонент системы, отвечающий за анализ Gesture Data, генерацию, оценку и выбор финального поискового запроса.
Semantic Signal (Семантический сигнал): Индикатор того, что кандидат в запросы имеет определенное семантическое значение (например, является адресом, именем человека, названием продукта). Используется для повышения оценки кандидата.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы.

Получение Gesture Data, определяющих взаимодействие пользователя с частью отображаемого контента.
Идентификация подмножества контента на основе Gesture Data.
Идентификация набора Candidate Search Queries.
Для каждого кандидата:
- Определение Likelihood Score (вероятность того, что это и есть предполагаемый запрос).
- Корректировка Likelihood Score с использованием Normalization Factor. Ключевой момент: Normalization Factor основан на количестве символов в кандидате.
Выбор одного или нескольких кандидатов на основе скорректированных оценок.

Claim 4 (Зависимый): Уточняет, что исходный Likelihood Score основан на количестве вхождений этого запроса в наборе ранее полученных поисковых запросов (исторические логи).

Claim 5 и 7 (Зависимые): Детализируют расчет Normalization Factor. Он основан на количестве поисковых запросов в исторических логах, которые имеют такое же количество символов (Claim 5) и/или такое же количество слов (Claim 7), что и кандидат.

Claim 8 (Зависимый): Уточняет механизм корректировки. Скорректированная оценка определяется как соотношение (ratio) между Likelihood Score и Normalization Factor (т.е. деление).

Claim 9 (Зависимый): Описывает дополнительный бустинг. Если для кандидата идентифицирован Semantic Signal (указывающий на конкретное семантическое значение), его скорректированная оценка повышается.

Claim 10 (Зависимый): Описывает другой дополнительный бустинг. Если кандидат соответствует Meta Information Label, связанному с исходным документом, его скорректированная оценка повышается.

Claim 11 (Зависимый): Предоставляет конкретный пример расчета для кандидата с 'n' словами и 'x' символами.

Normalization Factor определяется как вероятность получения любого поискового запроса, имеющего 'n' слов и 'x' символов.
Скорректированная оценка = (Likelihood Score кандидата) / (Normalization Factor).

Где и как применяется

Изобретение применяется преимущественно на этапе понимания запроса, используя исторические данные и данные, полученные при индексировании.

INDEXING – Индексирование и извлечение признаков
На этом этапе система собирает данные, которые могут использоваться для оценки кандидатов:

Частота встречаемости фраз в корпусе документов (может использоваться для расчета Likelihood Score).
Извлечение Meta Information Labels из документов.
Идентификация Semantic Signals и сущностей в контенте.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Query Selector выполняет следующие функции:

Интерпретация Gesture Data (выделенный контент и proximal content), полученных от пользователя в реальном времени.
Генерация Candidate Search Queries.
Расчет Likelihood Scores с использованием Historical Data (логов запросов).
Расчет и применение Normalization Factor для корректировки оценок по длине запроса.
Применение бустингов на основе Semantic Signals и Meta Information.
Выбор оптимального запроса для передачи на этап ранжирования.

RANKING – Ранжирование
Система ранжирования получает на вход уже оптимизированный запрос, выбранный Query Selector, и выполняет стандартный поиск.

Входные данные:

Gesture Data (выделенный контент, proximal content).
Historical Data (частотность запросов, частотность длин запросов).
Данные об источнике контента (Meta Information Labels).

Выходные данные:

Один или несколько выбранных Candidate Search Queries, передаваемых поисковой системе.

На что влияет

Типы устройств: Наибольшее влияние на устройства с сенсорным вводом (смартфоны, планшеты), где ввод текста затруднен, а использование жестов интуитивно понятно.
Типы контента: Влияет на любой отображаемый контент (веб-страницы, приложения, документы, изображения с текстом/метаданными), который может быть выделен пользователем для инициации поиска.
Специфические запросы: Механизм нормализации напрямую влияет на предпочтение более длинных и точных (long-tail) запросов коротким и общим (head queries) при интерпретации выделенного контента.

Когда применяется

Триггеры активации: Алгоритм активируется, когда пользователь инициирует поиск с помощью определенного жеста (например, долгое нажатие, обводка контента, функция "Touch to Search" или "Circle to Search").
Условия работы: Применяется в ситуациях, когда необходимо разрешить неоднозначность выделенного контента и выбрать наиболее вероятный интент пользователя, компенсируя при этом склонность пользователей к коротким запросам.

Пошаговый алгоритм

Этап 1: Сбор данных и инициализация

Система получает Gesture Data от устройства пользователя, указывающие на выделенный контент.
Идентифицируется выделенный контент и proximal content (контекст).

Этап 2: Генерация кандидатов

На основе выделенного контента и контекста генерируется набор Candidate Search Queries. Это может включать удаление стоп-слов, исправление орфографии, использование синонимов или генерацию N-грамм.

Этап 3: Исходная оценка вероятности

Для каждого кандидата определяется исходный Likelihood Score.
Оценка рассчитывается на основе частоты получения такого запроса в Historical Data (логах поиска) или частоты встречаемости фразы в корпусе документов.

Этап 4: Нормализация по длине

Для каждого кандидата определяется его длина (количество слов 'n' и/или количество символов 'x').
Определяется Normalization Factor. Это значение представляет собой общую вероятность того, что система получит любой запрос длины (n, x), на основе Historical Data.
Рассчитывается скорректированная оценка (Adjusted Likelihood Score) путем деления исходного Likelihood Score на Normalization Factor. $Score_{Adjusted} = \frac{LikelihoodScore}{NormalizationFactor}$

Этап 5: Дополнительные корректировки (Бустинг)

Проверяется наличие Semantic Signal (например, является ли кандидат адресом, названием продукта). Если да, скорректированная оценка повышается.
Проверяется соответствие кандидата Meta Information Label исходного документа. Если да, скорректированная оценка повышается.

Этап 6: Выбор и выполнение

Кандидаты ранжируются по итоговой скорректированной оценке.
Выбирается один или несколько лучших кандидатов.
Выбранные запросы передаются поисковой системе для выполнения поиска, и результаты возвращаются пользователю.

Какие данные и как использует

Данные на входе

Контентные факторы: Текст, выделенный пользователем. Proximal content (текст, расположенный в непосредственной близости), используемый для контекста.
Технические факторы: Meta Information Labels (метки метаинформации), связанные с исходным документом или медиафайлами (изображениями, видео) на странице.
Поведенческие факторы: Historical Data (журналы запросов). Они критически важны для определения как частотности конкретных запросов (для Likelihood Score), так и частотности запросов определенной длины (для Normalization Factor).
Пользовательские факторы: В патенте упоминается возможность использования истории поиска конкретного пользователя для корректировки оценок кандидатов.

Какие метрики используются и как они считаются

Likelihood Score (Исходная оценка вероятности): Рассчитывается как вероятность или частота встречаемости кандидата в запросы. Основана на данных из логов поиска или частоте в корпусе документов.
Длина запроса (Query Length): Измеряется в количестве символов (x) и/или количестве слов (n).
Normalization Factor (Коэффициент нормализации): Рассчитывается как вероятность получения любого запроса определенной длины (n, x) на основе анализа исторических логов. Более длинные запросы обычно имеют меньший Normalization Factor, чем короткие.
Adjusted Likelihood Score (Скорректированная оценка вероятности): Рассчитывается по формуле: (Исходный Likelihood Score) / (Normalization Factor). Это ключевая метрика для выбора финального запроса.
Semantic Signal Match: Коэффициент бустинга, применяемый, если запрос имеет определенное семантическое значение.
Meta Information Match: Коэффициент бустинга, применяемый, если запрос совпадает с метаданными документа.

Предпочтение точности над популярностью: Ключевой вывод — Google осознает, что частотность запроса не всегда равна его релевантности в конкретном контексте. Механизм нормализации создан для борьбы со смещением в сторону коротких, популярных запросов.
Компенсация поведения пользователей: Система признает, что пользователи предпочитают короткие запросы (особенно на мобильных устройствах) и активно компенсирует это поведение, чтобы выявить более длинные и точные интенты, скрытые в выделенном контенте.
Нормализация по длине как основной механизм: Normalization Factor, основанный на количестве символов и слов, является ядром изобретения. Он позволяет сравнивать запросы разной длины на равных условиях, повышая вес long-tail запросов.
Важность контекста и структурированных данных: Патент подтверждает использование контекста (proximal content) и, что более важно для SEO, использование Semantic Signals (сущностей, типов данных) и Meta Information для повышения уверенности в выборе правильного запроса.
Фокус на Query Understanding: Это патент о том, как формируется запрос, а не о том, как ранжируются результаты. Он дает понимание процессов, происходящих до этапа ранжирования.

Best practices (это мы делаем)

Оптимизация под длинные и точные интенты (Long-Tail): Создавайте контент, который содержит четкие, описательные фразы и полные наименования сущностей. Поскольку система нормализует оценки по длине, более длинные и точные фразы на вашем сайте имеют больше шансов быть выбранными в качестве поискового запроса при выделении пользователем.
Четкое выделение сущностей и семантическая разметка: Активно используйте структурированные данные (Schema.org) для идентификации ключевых сущностей (продуктов, персон, адресов). Патент прямо указывает, что наличие Semantic Signal повышает оценку кандидата в запросы.
Оптимизация метаданных и заголовков: Убедитесь, что мета-теги (Title, Description), заголовки и Alt-тексты изображений точно отражают содержание. Совпадение кандидата с Meta Information Label также повышает его оценку.
Использование естественных формулировок и обеспечение контекста: Пишите так, чтобы отдельные предложения или фразы могли служить готовыми поисковыми запросами. Обеспечивайте релевантное окружение (proximal content) для ключевых фраз, чтобы система могла правильно интерпретировать контекст.

Worst practices (это делать не надо)

Фокус исключительно на коротких ВЧ запросах: Стратегия, основанная на оптимизации только под короткие фразы, неэффективна. Данный патент показывает, что Google активно борется с этим смещением и стремится генерировать более точные запросы из контента.
Игнорирование структурированных данных: Отсутствие четкой семантической разметки снижает шансы на идентификацию Semantic Signals, что может привести к выбору менее оптимального запроса при взаимодействии пользователя с контентом.
Неоднозначный или переоптимизированный текст: Текст, из которого сложно выделить четкий интент или который насыщен ключевыми словами без естественного контекста, будет плохо работать с системами типа "Touch to Search" или "Circle to Search".

Стратегическое значение

Патент подтверждает стратегию Google по переходу от буквального понимания запросов к глубокому пониманию интента и контекста. Для SEO это означает, что создание авторитетного контента, отвечающего на специфические и детальные вопросы пользователей, становится все более приоритетным. Механизмы, подобные описанному, позволяют Google направлять трафик по более сложным и конверсионным запросам, даже если пользователь изначально не планировал их вводить. Это также подчеркивает важность мобильной оптимизации и UX.

Практические примеры

Сценарий: Использование "Circle to Search" на странице обзора техники

Контент на странице: "...Мы протестировали новый робот-пылесос Xiaomi Robot Vacuum X10+ и сравнили его с предыдущей моделью..."
Действие пользователя: Пользователь использует функцию (например, Circle to Search) и обводит фразу "Xiaomi Robot Vacuum X10+".
Генерация кандидатов (Пример):
- Кандидат 1: "Xiaomi" (Короткий, очень частотный)
- Кандидат 2: "Robot Vacuum" (Средний, частотный)
- Кандидат 3: "Xiaomi Robot Vacuum X10+" (Длинный, менее частотный, но точный)
Оценка без нормализации: Кандидат 1 и 2 имеют гораздо более высокий исходный Likelihood Score из-за высокой частотности в логах.
Применение нормализации:
- Кандидаты 1 и 2 получают большой Normalization Factor (запросы такой длины очень часты). Их относительная оценка снижается.
- Кандидат 3 получает маленький Normalization Factor (запросы такой длины редки). Его относительная оценка значительно возрастает.
Дополнительный бустинг: Система идентифицирует Semantic Signal для Кандидата 3 (Название продукта). Оценка повышается еще больше.
Результат: Система выбирает "Xiaomi Robot Vacuum X10+" как поисковый запрос, предоставляя пользователю максимально релевантные результаты, а не общую информацию о бренде Xiaomi.

Что такое Normalization Factor и почему он так важен в этом патенте?

Normalization Factor — это коэффициент, основанный на длине запроса (количестве слов и символов). Он отражает, насколько часто встречаются запросы именно такой длины в общей массе. Он критически важен, потому что компенсирует естественное смещение в сторону коротких запросов. Деление исходной оценки вероятности на этот фактор позволяет более длинным и точным запросам конкурировать с короткими и популярными, улучшая тем самым релевантность поиска.

Означает ли этот патент, что Google предпочитает длинные запросы коротким?

Не совсем. Google предпочитает точность и релевантность. Поскольку пользователи склонны вводить короткие запросы (особенно на мобильных), этот механизм помогает системе выявить более длинный и точный интент из контекста взаимодействия. Если короткий запрос является наиболее релевантным, он будет выбран. Но если есть более точный длинный кандидат, система не будет его игнорировать только из-за его низкой общей частотности.

Что такое Semantic Signal и как это влияет на SEO?

Semantic Signal — это индикатор того, что система распознала во фразе конкретную сущность или тип данных (например, адрес, имя человека, название продукта). Если сигнал обнаружен, вероятность выбора этой фразы в качестве запроса повышается. Для SEO это подчеркивает критическую важность использования микроразметки (Schema.org) и четкого структурирования контента для помощи Google в идентификации ключевых сущностей на странице.

Как Meta Information Label используется в этом алгоритме?

Meta Information Label (например, заголовки, мета-теги документа или alt-тексты изображений) используется как дополнительный сигнал подтверждения. Если сгенерированный кандидат в запросы совпадает с метаданными исходного документа, система повышает его оценку вероятности. Это подтверждает важность точной и релевантной оптимизации метаданных на сайте.

Применяется ли этот алгоритм только для текста?

Патент в основном описывает обработку текста, выделенного жестом. Однако он упоминает, что выделенный контент может включать текст, изображения, видео. Для медиаконтента система может использовать связанную с ним метаинформацию (например, alt-текст или подписи) и контекст для генерации и оценки кандидатов в запросы.

Какое отношение этот патент имеет к функции "Circle to Search"?

Этот патент описывает базовую технологию, которая лежит в основе современных функций, таких как "Circle to Search" (Обвести и найти) или "Touch to Search". Он предоставляет механизм для интерпретации того, что именно пользователь обвел на экране, и преобразования этого в наиболее эффективный поисковый запрос, используя описанные методы нормализации и оценки.

Как SEO-специалист может оптимизировать контент под этот механизм?

Ключевая стратегия — использование естественного языка, включающего полные и описательные фразы. Вместо того чтобы просто упоминать ключевые слова, интегрируйте их в предложения, которые сами по себе могут служить точными поисковыми запросами. Это повышает вероятность того, что при выделении текста пользователем система сгенерирует релевантный long-tail запрос.

Использует ли система контекст вокруг выделенного текста?

Да, патент упоминает идентификацию контента, проксимального к жесту (proximal content). Например, если пользователь выделил одно слово, система может проанализировать слова до и после него в предложении, чтобы лучше понять контекст и сгенерировать более точные кандидаты в запросы.

Насколько сильно повышается оценка при наличии Semantic Signal или Meta Match?

Патент не указывает конкретных числовых значений или коэффициентов для этого бустинга. Он лишь утверждает, что скорректированная оценка вероятности улучшается (improving/adjusting the adjusted likelihood score) при выполнении этих условий. Логично предположить, что это дает существенное преимущество при выборе финального запроса.

Зависит ли работа алгоритма от исторических данных пользователя?

Да, в одном из вариантов реализации упоминается, что кандидаты, которые ранее отправлялись конкретным пользователем (пороговое число раз), могут быть также повышены в приоритете. Однако основные механизмы расчета Likelihood Score и Normalization Factor полагаются на агрегированные исторические данные всех пользователей (Historical Data).

Как Google использует жесты на экране (например, «Circle to Search») для генерации мультимодальных поисковых запросов

Google использует технологию, позволяющую инициировать поиск жестами (например, обведением объекта на экране). Система анализирует выбранный контент (текст, изображения, видео), извлекает ключевые темы, учитывает контекст страницы и пользователя (местоположение, время), взвешивает эти данные и автоматически формирует релевантный поисковый запрос.

US9916396B2
2018-03-13

Семантика и интент
Мультимедиа
Персонализация

Как Google реализует функцию «Выделить и Искать» с интеллектуальным уточнением запроса на стороне клиента

Патент Google описывает клиентскую технологию, позволяющую пользователю выделить любой элемент на экране (текст или изображение) и мгновенно инициировать поиск. Система автоматически обрабатывает выделенное: применяет OCR к изображениям, дополняет частично выделенные слова и добавляет контекстные слова из окружающего контента для уточнения запроса перед его отправкой в поисковую систему.

US8838562B1
2014-09-16

Семантика и интент

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента

Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.

US8595619B1
2013-11-26

Поведенческие сигналы
SERP

Как Google использует персональные выделения контента и поведение чтения для гиперперсонализации поисковой выдачи

Google отслеживает, какой текст пользователи выделяют на веб-страницах и как они читают контент (включая скорость прокрутки и потенциально отслеживание взгляда). Эта информация используется для глубокой персонализации будущих поисковых запросов: система аннотирует знакомые результаты, использует содержание выделенного текста для подбора другого релевантного контента и автоматически возвращает пользователя к последнему просмотренному фрагменту.

US11514126B2
2022-11-29

Персонализация
Поведенческие сигналы
SERP

Как Google использует выделенный на странице контент для параллельного поиска в специализированных базах данных (приложения, расширения, товары)

Google патентует механизм «ассистированного поиска» для специализированных баз данных (например, магазинов приложений или расширений). Пользователь выделяет контент (текст/изображение) на веб-странице, и система использует его как запрос. Специальный конвертер анализирует выделенное, определяет несколько возможных интентов, оптимизирует их под конкретную базу данных и выполняет параллельный поиск, выдавая сгруппированные результаты.

US20230214427A1
2023-07-06

Семантика и интент
SERP

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи

Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.

US10579687B2
2020-03-03

SERP
Семантика и интент
Ссылки

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов

Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.

US8738612B1
2014-05-27

Семантика и интент
Поведенческие сигналы
SERP

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками

Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.

US8375025B1
2013-02-12

Мультиязычность
Поведенческие сигналы
Персонализация

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL

Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.

US20140280133A1
2014-09-18

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)

Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.

US20240378237A1
2024-11-14

Мультимедиа
EEAT и качество
Семантика и интент

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации

Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.

US7565358B2
2009-07-21

EEAT и качество
Ссылки

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи

Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).

US9298777B2
2016-03-29

Персонализация
Поведенческие сигналы
SERP

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей

Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.

US8732187B1
2014-05-20

Ссылки
Мультимедиа
Поведенческие сигналы

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов

Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.

US8001118B2
2011-08-16

Поведенческие сигналы
SERP

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)

Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.

US8775434B1
2014-07-08

Local SEO
Поведенческие сигналы