Как Google генерирует синтетические запросы, анализируя шаблоны и структуру HTML на сайте

QUERY GENERATION USING STRUCTURAL SIMILARITY BETWEEN DOCUMENTS (Генерация запросов с использованием структурного сходства между документами)

US8346792B1
Google LLC
2010-11-09
2013-01-01

Google использует структурное сходство между страницами на одном сайте для генерации новых, "синтетических" запросов. Система анализирует, в каких HTML-элементах (например, или <h1>) находятся термины из уже известных эффективных запросов. Затем она создает шаблон и применяет его к другим похожим страницам этого же сайта для извлечения новых фраз, улучшая понимание шаблонного контента. </p> </div> </div> <div class="topb"></div> <div class="description-widget ls-widget" id="description"> <div class="widget-title"> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-scroll-text-icon lucide-scroll-text"><path d="M15 12h-5"/><path d="M15 8h-5"/><path d="M19 17V5a2 2 0 0 0-2-2H4"/><path d="M8 21h12a2 2 0 0 0 2-2v-1a1 1 0 0 0-1-1H11a1 1 0 0 0-1 1v1a2 2 0 1 1-4 0V5a2 2 0 1 0-4 0v2a1 1 0 0 0 1 1h3"/></svg> <h2>Описание</h2></div> <div class="widget-content"> <div class="bgc"> <h3>Какую проблему решает</h3> <p>Патент решает проблему ограниченности традиционных методов улучшения поиска, которые полагаются исключительно на анализ исторических логов запросов пользователей. Система стремится проактивно генерировать "хорошо сформулированные" (<code>well-formulated</code>) или эффективные (<code>well-performing</code>) запросы, которые пользователи, возможно, еще не вводили. Это особенно актуально для шаблонных страниц (например, карточек товаров), для которых может не хватать исторических данных. Цель — улучшить результаты поиска путем генерации точных <code>synthetic queries</code>.</p> <h3>Что запатентовано</h3> <p>Запатентована система генерации <code>synthetic queries</code> на основе анализа структурного сходства (<code>structural similarity</code>) между документами (например, HTML-страницами), размещенными на одном и том же веб-сайте. Система использует известные эффективные запросы (<code>seed queries</code>) для выявления структурных паттернов в связанных документах. Эти паттерны абстрагируются в <code>query templates</code>, которые затем применяются к другим страницам на том же сайте для извлечения новых запросов.</p> <h3>Как это работает</h3> <p>Механизм основан на предположении, что страницы на одном сайте часто используют общие шаблоны.</p> <ul> <li><strong>Идентификация исходных данных:</strong> Выбирается пара: <code>seed query</code> (известный эффективный запрос) и связанный с ним документ.</li> <li><strong>Анализ структуры:</strong> Система определяет, где термины из <code>seed query</code> появляются в HTML-структуре документа (например, внутри <code><title></code> или <code><h1></code>). Эта структура называется <code>embedded coding fragment</code>.</li> <li><strong>Генерация шаблонов:</strong> На основе этого фрагмента создается <code>query template</code>, содержащий правила генерации (<code>generative rule</code>).</li> <li><strong>Валидация шаблонов:</strong> Проверяется, достаточно ли часто этот шаблон встречается на других страницах того же сайта (<code>template threshold</code>).</li> <li><strong>Применение шаблонов:</strong> Шаблон применяется к другим документам на сайте со схожей структурой.</li> <li><strong>Извлечение и оценка:</strong> Извлекаются новые термины, формирующие <code>candidate synthetic queries</code>. Их эффективность оценивается (например, с помощью <code>IR score</code>), и лучшие сохраняются.</li> </ul> <h3>Актуальность для SEO</h3> <p>Высокая. Понимание структуры веб-сайтов, извлечение структурированных данных и идентификация ключевых тем страниц остаются фундаментальными задачами современных поисковых систем. Хотя конкретные методы анализа структуры могли эволюционировать, принцип использования согласованности шаблонов сайта для извлечения семантики и генерации запросов остается крайне актуальным, особенно для E-commerce и крупных каталогов.</p> <h3>Важность для SEO</h3> <p>Патент имеет высокое значение (80/100) для технического SEO и информационной архитектуры, особенно для крупных шаблонных сайтов. Он демонстрирует, что Google анализирует согласованность (consistency) структуры сайта для понимания организации контента. Сайты с четкой, логичной и повторяющейся HTML-структурой получают преимущество, так как система может надежно идентифицировать <code>query templates</code> и генерировать релевантные запросы, ведущие на их страницы.</p> </div> </div> </div> <div class="features-widget ls-widget" id="detailed"> <div class="widget-title"> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-book-open-text-icon lucide-book-open-text"><path d="M12 7v14"></path><path d="M16 12h2"></path><path d="M16 8h2"></path><path d="M3 18a1 1 0 0 1-1-1V4a1 1 0 0 1 1-1h5a4 4 0 0 1 4 4 4 4 0 0 1 4-4h5a1 1 0 0 1 1 1v13a1 1 0 0 1-1 1h-6a3 3 0 0 0-3 3 3 3 0 0 0-3-3z"></path><path d="M6 12h2"></path><path d="M6 8h2"></path></svg> <h2>Детальный разбор</h2> </div> <div class="widget-content"> <h3>Термины и определения</h3> <dl> <dt>Seed Query (Исходный/Посевной запрос)</dt> <dd>Известный эффективный запрос (пользовательский или ранее синтезированный), используемый как отправная точка для анализа. Его эффективность обычно определяется на основе исторических данных о кликах.</dd> <dt>Synthetic Query (Синтетический запрос)</dt> <dd>Сгенерированный системой запрос, который прошел валидацию и показал высокую эффективность. Хранится для последующего использования в поиске (подсказки, уточнение запросов).</dd> <dt>Structured Document (Структурированный документ)</dt> <dd>Документ с встроенным кодированием (<code>embedded coding</code>), например, HTML или XML веб-страница.</dd> <dt>Embedded Coding Fragment (Фрагмент встроенного кода)</dt> <dd>Часть структурированного документа (например, HTML-теги и заключенный в них контент), которая содержит термины из <code>Seed Query</code>. Основа для создания шаблона.</dd> <dt>Query Template (Шаблон запроса)</dt> <dd>Абстрагированное представление структуры (<code>Embedded Coding Fragment</code>). Используется для поиска схожих структур на других страницах того же сайта. Может включать <code>Literals</code> и <code>Wildcards</code>.</dd> <dt>Generative Rule (Генеративное правило)</dt> <dd>Правило внутри <code>Query Template</code>, определяющее, как извлекать контент из структурно похожих документов для формирования новых запросов.</dd> <dt>Literal (Литерал)</dt> <dd>Компонент <code>Query Template</code>, представляющий собой фиксированную строку текста.</dd> <dt>Wildcard (Подстановочный знак/Маска)</dt> <dd>Переменная часть шаблона. Определяется типом (<code>type</code>) и ограничениями (<code>constraint</code>). Например, расположением в определенном теге (<code><title></code>) или частотой встречаемости (<code>count>=3</code>).</dd> <dt>Template Threshold / Template Qualification Value (Порог шаблона)</dt> <dd>Минимальное количество раз, которое структура должна появиться на веб-сайте, чтобы соответствующий <code>Query Template</code> считался действительным. Может зависеть от размера сайта.</dd> <dt>IR Score (Information Retrieval Score, Оценка информационного поиска)</dt> <dd>Метрика, используемая для измерения эффективности (релевантности) сгенерированного запроса по отношению к документу, из которого он был извлечен.</dd> </dl> <h3>Ключевые утверждения (Анализ Claims)</h3> <p><strong>Claim 1 (Независимый пункт):</strong> Описывает основной метод генерации синтетических запросов.</p> <ol> <li>Система получает <code>seed queries</code> и связанный с ними <code>structured document</code>, размещенный на веб-сайте.</li> <li>Идентифицируются <code>embedded coding fragments</code> — структуры в документе, содержащие термины из <code>seed query</code>.</li> <li>Генерируются <code>query templates</code>, включающие структуру фрагмента и <code>generative rule</code>.</li> <li>Генерируются <code>candidate synthetic queries</code> путем применения шаблонов к <strong>другим</strong> документам, размещенным на <strong>том же</strong> веб-сайте. Это включает поиск соответствующей структуры и извлечение текста согласно <code>generative rule</code>.</li> <li>Измеряется эффективность (<code>performance</code>) каждого кандидата.</li> <li>Кандидаты, чья эффективность превышает <code>performance threshold</code>, сохраняются как <code>synthetic queries</code>.</li> </ol> <p><strong>Claim 4 (Зависимый):</strong> Детализирует идентификацию фрагментов в HTML.</p> <p>Идентификация фрагмента происходит, когда контент внутри пары HTML-тегов (например, <code><title></code>) совпадает с термином из <code>Seed Query</code>.</p> <p><strong>Claim 6 (Зависимый от 1):</strong> Детализирует процесс валидации шаблона (Template Validation).</p> <p>Шаблон генерируется (принимается) только при условии, что система подсчитала количество других документов на том же веб-сайте, содержащих эту же структуру (<code>embedded coding fragment</code>), и это количество удовлетворяет порогу (<code>template qualification value</code>). Это предотвращает создание шаблонов на основе уникальных структур.</p> <p><strong>Claim 7 (Зависимый от 1):</strong> Описывает процесс агрегации и оценки шаблонов (Template Evaluation).</p> <ol> <li>Определяется <code>template threshold</code>, который может быть пропорционален общему количеству документов на сайте.</li> <li>Каждый шаблон оценивается (<code>scoring</code>) на основе количества его появлений (<code>number of occurrences</code>) на сайте.</li> <li>Агрегируются (отбираются) только те шаблоны, чья оценка удовлетворяет <code>template threshold</code>.</li> </ol> <h2>Где и как применяется</h2> <p>Изобретение в основном применяется на этапе индексирования и анализа данных для обогащения базы запросов.</p> <p><strong>INDEXING – Индексирование и извлечение признаков</strong><br> Основной этап работы алгоритма. Во время индексирования (вероятно, в офлайн или пакетном режиме) система анализирует HTML-структуру документов в контексте всего сайта (site-level analysis). Происходит генерация, валидация и применение <code>query templates</code> для извлечения <code>synthetic queries</code>, которые сохраняются как признаки (features) документа.</p> <p><strong>QUNDERSTANDING – Понимание Запросов</strong><br> Сгенерированные и сохраненные <code>synthetic queries</code> используются на этом этапе. Они могут применяться для уточнения запросов (query refinement), генерации подсказок (query suggestions) или аугментации исходного запроса пользователя для получения более качественных результатов.</p> <p><strong>Входные данные:</strong></p> <ul> <li>Корпус структурированных документов (<code>Structured Document Corpus</code>), сгруппированных по сайтам.</li> <li>База исходных запросов (<code>Query Store</code>), содержащая <code>seed queries</code> и их связь с документами (на основе исторических данных).</li> </ul> <p><strong>Выходные данные:</strong></p> <ul> <li>Обогащенная база запросов (<code>Query Store</code>) с новыми <code>synthetic queries</code>, привязанными к конкретным документам.</li> </ul> <h3>На что влияет</h3> <ul> <li><strong>Конкретные типы контента и ниши:</strong> Наибольшее влияние оказывается на сайты с большим количеством однотипных страниц и четкой, повторяющейся структурой. Это включает E-commerce (страницы товаров), каталоги, сайты с рецептами, базы данных (фильмы, биографии), новостные порталы (страницы статей).</li> <li><strong>Специфические запросы:</strong> Влияет на генерацию точных запросов, связанных с сущностями, представленными на этих однотипных страницах (например, запросы о конкретных продуктах, людях, местах), улучшая покрытие по НЧ-запросам ("длинный хвост").</li> </ul> <h3>Когда применяется</h3> <ul> <li><strong>Временные рамки:</strong> Процесс генерации происходит офлайн или в рамках процесса индексирования, а не в реальном времени в ответ на запрос пользователя.</li> <li><strong>Условия работы:</strong> Требуется наличие достаточного количества документов с похожей структурой и наличие данных об эффективных <code>Seed Queries</code>.</li> <li><strong>Пороговые значения:</strong> Алгоритм применяется, только если структурный шаблон встречается на сайте достаточно часто (<code>Template Threshold</code>) и если сгенерированный запрос достаточно эффективен (<code>Performance Threshold</code>).</li> </ul> <h3>Пошаговый алгоритм</h3> <p><strong>Фаза 1: Генерация и Валидация Шаблонов (Template Generation & Evaluation)</strong></p> <ol> <li><strong>Сбор данных:</strong> Система получает пару: <code>Seed Query</code> и связанный с ним <code>Structured Document</code> с определенного веб-сайта.</li> <li><strong>Идентификация фрагментов:</strong> В документе идентифицируются <code>Embedded Coding Fragments</code> (HTML-структуры), содержащие термины из <code>Seed Query</code>.</li> <li><strong>Создание кандидатов в шаблоны:</strong> На основе фрагментов генерируются кандидаты в <code>Query Templates</code>. Они могут использовать <code>Literals</code> (фиксированный текст) и <code>Wildcards</code> (переменные с ограничениями, например, текст в теге <code><h1></code> или текст, повторяющийся более 3 раз).</li> <li><strong>Валидация шаблонов:</strong> Система проверяет, насколько часто структура, описанная в кандидате, встречается на других страницах того же веб-сайта (удовлетворяет ли <code>template qualification value</code>).</li> <li><strong>Оценка и отбор шаблонов:</strong> Подсчитывается частота (<code>Template Performance Score</code>) каждого шаблона. Если частота превышает <code>Template Threshold</code> (который может зависеть от размера сайта), шаблон принимается.</li> </ol> <p><strong>Фаза 2: Генерация и Оценка Синтетических Запросов (Query Generation & Evaluation)</strong></p> <ol> <li><strong>Применение шаблонов:</strong> Принятые <code>Query Templates</code> применяются ко всем подходящим документам на данном веб-сайте.</li> <li><strong>Извлечение кандидатов:</strong> Используя <code>Generative Rules</code> из шаблона, система извлекает контент из соответствующих структур, формируя <code>Candidate Synthetic Queries</code>.</li> <li><strong>Оценка эффективности:</strong> Для каждого кандидата рассчитывается <code>Query Performance Score</code> (например, <code>IR score</code>), измеряющий его релевантность документу, из которого он был извлечен.</li> <li><strong>Отбор и сохранение:</strong> Кандидаты, чей score превышает <code>Performance Threshold</code>, обозначаются как <code>Synthetic Queries</code> и сохраняются в <code>Query Store</code>.</li> </ol> <h2>Какие данные и как использует</h2> <h3>Данные на входе</h3> <ul> <li><strong>Структурные факторы:</strong> Критически важные данные. Система анализирует <code>embedded coding</code>, в частности HTML-теги. Явно упомянуты <code><title></code>, <code><h1></code>. Анализируется расположение контента внутри этих тегов.</li> <li><strong>Контентные факторы:</strong> Текст внутри структурных элементов. Анализируется как фиксированный текст (для <code>Literals</code>), так и переменный контент (для <code>Wildcards</code>). Также учитывается частота появления терминов в документе (используется для ограничений типа <code>count>=N</code>).</li> <li><strong>Поведенческие факторы:</strong> Исторические данные о запросах и кликах используются для идентификации исходных <code>Seed Queries</code> (запросов, которые считаются эффективными для определенных документов).</li> <li><strong>Технические факторы:</strong> URL документа используется для определения границ веб-сайта (домена), так как анализ проводится в рамках одного сайта.</li> </ul> <h3>Какие метрики используются и как они считаются</h3> <ul> <li><strong>Template Threshold / Template Qualification Value:</strong> Пороговое значение для принятия шаблона. Гарантирует, что структура достаточно распространена на сайте. Может рассчитываться на основе размера сайта (например, логарифм от количества страниц сайта плюс константа).</li> <li><strong>Template Performance Score:</strong> Метрика, основанная на количестве появлений (<code>number of occurrences</code>) структуры шаблона на веб-сайте.</li> <li><strong>Wildcard Constraints (Ограничения масок):</strong> Используются для определения контекста контента. Примеры: <ol> <li><strong>Расположение:</strong> Нахождение внутри конкретного HTML-тега (например, <code><title></code>).</li> <li><strong>Частота (Count):</strong> Количество повторений термина в документе (например, <code>count>=3</code>).</li> <li><strong>IDF (Inverse Document Frequency):</strong> Упоминается возможность использования IDF для ограничения масок только редкими терминами (с высоким IDF).</li> </ol> </li> <li><strong>Query Performance Score / IR Score:</strong> Метрика для оценки сгенерированного запроса. Измеряет релевантность запроса документу. Может корректироваться с учетом <code>Template Performance Score</code>.</li> </ul> </div> </div> <div class="features-widget ls-widget" id="conclusions"> <div class="widget-title"> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-brain-icon lucide-brain"><path d="M12 18V5"/><path d="M15 13a4.17 4.17 0 0 1-3-4 4.17 4.17 0 0 1-3 4"/><path d="M17.598 6.5A3 3 0 1 0 12 5a3 3 0 1 0-5.598 1.5"/><path d="M17.997 5.125a4 4 0 0 1 2.526 5.77"/><path d="M18 18a4 4 0 0 0 2-7.464"/><path d="M19.967 17.483A4 4 0 1 1 12 18a4 4 0 1 1-7.967-.517"/><path d="M6 18a4 4 0 0 1-2-7.464"/><path d="M6.003 5.125a4 4 0 0 0-2.526 5.77"/></svg> <h2>Выводы</h2> </div> <div class="widget-content"> <ol> <li><strong>Анализ на уровне сайта (Site-Level Analysis):</strong> Google анализирует структуру сайта в целом, а не только отдельные страницы. Система ищет структурное сходство (<code>structural similarity</code>) между документами на одном сайте для выявления шаблонов.</li> <li><strong>Важность согласованной структуры (Consistency):</strong> Алгоритм полагается на повторяющиеся HTML-шаблоны. Если структура встречается недостаточно часто на сайте (не проходит <code>Template Threshold</code>), она игнорируется. Это подчеркивает важность единообразия в дизайне и верстке однотипных страниц.</li> <li><strong>Проактивная генерация запросов:</strong> Цель системы — генерировать эффективные запросы машинным способом, не дожидаясь, пока их введут пользователи, что особенно важно для покрытия "длинного хвоста".</li> <li><strong>Значимость расположения контента:</strong> Система определяет, какие структурные элементы (например, <code><title></code>, <code><h1></code>) содержат ключевые термины. Размещение важной информации в этих элементах критично.</li> <li><strong>Многоступенчатая валидация:</strong> Система имеет два уровня валидации: первый — для шаблонов (на основе частоты на сайте), второй — для сгенерированных запросов (на основе <code>IR score</code>). Это обеспечивает качество генерируемых данных.</li> </ol> </div> </div> <div class="features-widget ls-widget" id="practice"> <div class="widget-title"> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-tractor-icon lucide-tractor"><path d="m10 11 11 .9a1 1 0 0 1 .8 1.1l-.665 4.158a1 1 0 0 1-.988.842H20"/><path d="M16 18h-5"/><path d="M18 5a1 1 0 0 0-1 1v5.573"/><path d="M3 4h8.129a1 1 0 0 1 .99.863L13 11.246"/><path d="M4 11V4"/><path d="M7 15h.01"/><path d="M8 10.1V4"/><circle cx="18" cy="18" r="2"/><circle cx="7" cy="15" r="5"/></svg> <h2>Практика</h2> </div> <div class="widget-content"> <h3>Best practices (это мы делаем)</h3> <ul> <li><strong>Обеспечение абсолютной консистентности HTML-структуры:</strong> Поддерживайте единообразную структуру и верстку для всех страниц одного типа (например, все карточки товаров, все статьи блога). Это помогает системе надежно идентифицировать и валидировать <code>Query Templates</code>.</li> <li><strong>Размещение ключевых идентификаторов в стандартных элементах:</strong> Убедитесь, что основная тема или название сущности страницы (например, название продукта, имя автора) находится в prominent-элементах, таких как <code><title></code> и <code><h1></code>, и что расположение этих элементов консистентно по всему сайту.</li> <li><strong>Использование чистой и семантической верстки:</strong> Применение семантических HTML-тегов помогает системе точнее идентифицировать <code>Embedded Coding Fragments</code> и понимать назначение различных блоков контента.</li> <li><strong>Масштабирование информационной архитектуры:</strong> При разработке крупных сайтов (каталогов, директорий) закладывайте четкую, стандартизированную и масштабируемую структуру шаблонов с самого начала.</li> </ul> <h3>Worst practices (это делать не надо)</h3> <ul> <li><strong>Использование уникальных макетов для однотипных страниц:</strong> Если каждая страница продукта имеет разную HTML-структуру, системе будет невозможно определить общий <code>Query Template</code>, так как порог частоты (<code>Template Threshold</code>) не будет достигнут.</li> <li><strong>Неконсистентное использование заголовков:</strong> Хаотичное использование тегов <code><h1></code>-<code><h6></code> или использование разных тегов для одной и той же информации (например, название продукта то в <code><h1></code>, то в <code><div></code>) помешает системе определить надежный шаблон.</li> <li><strong>Скрытие ключевой информации в нестандартных структурах:</strong> Размещение названия продукта только внутри скриптов, изображений или сложных DIV-структур, которые сильно варьируются от страницы к странице, затруднит извлечение этой информации через <code>Query Templates</code>.</li> </ul> <h3>Стратегическое значение</h3> <p>Этот патент подчеркивает стратегическую важность технического SEO и продуманной информационной архитектуры. Он показывает, что Google рассматривает веб-сайт как структурированную базу данных. Согласованность структуры напрямую влияет на способность Google понимать контент сайта в масштабе и генерировать релевантные поисковые запросы, ведущие на него. Для Senior SEO-специалистов это подтверждает необходимость глубокой проработки шаблонов страниц и контроля за их консистентным внедрением.</p> <h3>Практические примеры</h3> <p><strong>Сценарий: Генерация запросов для E-commerce сайта (Электроника)</strong></p> <ol> <li><strong>Исходные данные (Seed Query):</strong> Google знает из логов, что запрос "Apple iPhone 15 Pro Max 256GB Black" эффективен для страницы <code>/product/123</code>.</li> <li><strong>Анализ структуры:</strong> Система анализирует страницу <code>/product/123</code> и обнаруживает, что термины запроса находятся в <code><h1></code>: <code><h1>Смартфон Apple iPhone 15 Pro Max 256GB Black</h1></code>.</li> <li><strong>Генерация шаблона:</strong> Создается шаблон: Извлечь текст из <code><h1></code>, игнорируя слово "Смартфон". Шаблон: <code>[Brand] [Model] [Storage] [Color]</code>.</li> <li><strong>Валидация шаблона:</strong> Система проверяет другие страницы на сайте и обнаруживает, что 5000 других страниц товаров используют такую же структуру <code><h1></code>. Порог достигнут, шаблон принят.</li> <li><strong>Применение шаблона:</strong> Система находит страницу <code>/product/456</code> с <code><h1>Смартфон Samsung Galaxy S25 Ultra 512GB Silver</h1></code>.</li> <li><strong>Генерация запроса:</strong> Извлекается кандидат "Samsung Galaxy S25 Ultra 512GB Silver".</li> <li><strong>Валидация запроса:</strong> <code>IR score</code> для этого запроса и страницы <code>/product/456</code> высок. Запрос сохраняется как <code>Synthetic Query</code>.</li> </ol> </div> </div> <div class="features-widget ls-widget" id="faq"> <div class="widget-title"> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-message-circle-question-mark-icon lucide-message-circle-question-mark"><path d="M2.992 16.342a2 2 0 0 1 .094 1.167l-1.065 3.29a1 1 0 0 0 1.236 1.168l3.413-.998a2 2 0 0 1 1.099.092 10 10 0 1 0-4.777-4.719"/><path d="M9.09 9a3 3 0 0 1 5.83 1c0 2-3 3-3 3"/><path d="M12 17h.01"/></svg> <h2>Вопросы и ответы</h2> </div> <div class="widget-content"> <div class='qa-item'> <p class='question'>Что такое «Синтетический запрос» (Synthetic Query) и чем он отличается от обычных запросов?</p> <p><code>Synthetic Query</code> — это запрос, сгенерированный системой Google автоматически на основе анализа структуры веб-документов, а не введенный пользователем. В отличие от обычных запросов, которые берутся из логов поиска, синтетические запросы позволяют Google проактивно определять эффективные формулировки для описания контента, даже если пользователи их еще не использовали.</p> </div> <div class='qa-item'> <p class='question'>Что такое «Seed Query» (Исходный запрос) и откуда он берется?</p> <p><code>Seed Query</code> — это отправная точка для анализа. Это запрос, который уже известен системе как эффективный («well-performing») для определенного документа. Он может быть взят из исторических логов поисковых запросов (если пользователи часто кликали на документ по этому запросу) или быть ранее сгенерированным синтетическим запросом.</p> </div> <div class='qa-item'> <p class='question'>Применяется ли этот анализ структурного сходства между разными сайтами?</p> <p>Нет. Согласно патенту (Claim 1), анализ структурного сходства и применение <code>Query Templates</code> происходит строго в рамках одного и того же веб-сайта (<code>hosted on the same website</code>). Система ищет повторяющиеся шаблоны внутри одного домена, чтобы понять его внутреннюю организацию контента.</p> </div> <div class='qa-item'> <p class='question'>Насколько важна консистентность (единообразие) структуры сайта для этого алгоритма?</p> <p>Она критически важна. Алгоритм требует, чтобы шаблон (<code>Query Template</code>) встречался на сайте достаточное количество раз, чтобы превысить порог валидации (<code>Template Threshold</code>). Если каждая страница имеет уникальную структуру, общие шаблоны не будут найдены, и система не сможет генерировать <code>Synthetic Queries</code> на основе структурного сходства.</p> </div> <div class='qa-item'> <p class='question'>Какие HTML-элементы наиболее важны для этого алгоритма?</p> <p>Патент явно упоминает использование HTML-тегов для идентификации структур. В примерах фигурируют <code><title></code> и <code><h1></code>. Логично предположить, что наиболее семантически значимые и консистентно используемые элементы (заголовки, тайтлы, выделенный текст) имеют больший вес при генерации и анализе шаблонов.</p> </div> <div class='qa-item'> <p class='question'>Как система определяет, что сгенерированный запрос является качественным?</p> <p>Система измеряет эффективность (<code>performance</code>) каждого сгенерированного кандидата. В патенте упоминается использование <code>IR score</code> (Information Retrieval score), который оценивает релевантность сгенерированного запроса тому документу, из которого он был извлечен. Если оценка превышает установленный порог, запрос считается качественным.</p> </div> <div class='qa-item'> <p class='question'>Что такое Wildcards (Маски) и как они используются в шаблонах?</p> <p><code>Wildcards</code> — это переменные части шаблона, которые позволяют абстрагироваться от конкретного текста. Например, маска может указывать: «извлечь любой текст, находящийся внутри тега <code><h1></code>» или «извлечь текст, который повторяется в документе не менее 3 раз» (используя ограничение <code>count</code>). Это позволяет применять один шаблон к разному контенту.</p> </div> <div class='qa-item'> <p class='question'>Зависит ли порог принятия шаблона (Template Threshold) от размера сайта?</p> <p>Да. В патенте (Claim 7) указано, что <code>Template Threshold</code> может быть пропорционален общему количеству структурированных документов, размещенных на веб-сайте. Это означает, что на более крупных сайтах шаблон должен встречаться чаще, чтобы считаться значимым и надежным.</p> </div> <div class='qa-item'> <p class='question'>На какие типы сайтов этот патент влияет больше всего?</p> <p>Наибольшее влияние оказывается на сайты с большим количеством шаблонных страниц: E-commerce (карточки товаров), агрегаторы, каталоги, базы данных (рецепты, фильмы) и крупные издательства. Там, где есть повторяющаяся структура HTML, этот механизм может эффективно масштабироваться.</p> </div> <div class='qa-item'> <p class='question'>Какова основная рекомендация для SEO, исходя из этого патента?</p> <p>Ключевая рекомендация — обеспечить максимальную консистентность и семантичность HTML-шаблонов для однотипных страниц на сайте. Размещайте ключевую информацию в стандартных, повторяющихся структурных элементах (<code><title></code>, <code><h1></code>). Это позволит Google эффективно анализировать архитектуру сайта и генерировать релевантные запросы, ведущие на ваши страницы.</p> </div> </div> </div> <div class="features-widget ls-widget" id="similar"> <div class="widget-title"> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-vector-square-icon lucide-vector-square"><path d="M19.5 7a24 24 0 0 1 0 10"/><path d="M4.5 7a24 24 0 0 0 0 10"/><path d="M7 19.5a24 24 0 0 0 10 0"/><path d="M7 4.5a24 24 0 0 1 10 0"/><rect x="17" y="17" width="5" height="5" rx="1"/><rect x="17" y="2" width="5" height="5" rx="1"/><rect x="2" y="17" width="5" height="5" rx="1"/><rect x="2" y="2" width="5" height="5" rx="1"/></svg> <h2>Похожие патенты</h2> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9208232B1/">Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц</a> <div class="text">Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9208232B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-12-08</li> </ul> <ul class="options-list"> <li><p>Ссылки</p></li> <li><p>Структура сайта</p></li> <li><p>Семантика и интент</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9208233B1/">Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта</a> <div class="text">Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9208233B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-12-08</li> </ul> <ul class="options-list"> <li><p>Ссылки</p></li> <li><p>Семантика и интент</p></li> <li><p>Индексация</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9128945B1/">Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных</a> <div class="text">Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9128945B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-09-08</li> </ul> <ul class="options-list"> <li><p>SERP</p></li> <li><p>Поведенческие сигналы</p></li> <li><p>EEAT и качество</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9183323B1/">Как Google может генерировать альтернативные запросы из контента страниц и встраивать их в сниппеты</a> <div class="text">Google использует механизм для помощи пользователям в уточнении их поискового намерения. Система анализирует текст веб-страниц в результатах поиска и находит фразы, похожие на исходный запрос или характеризующие документ. Эти фразы затем встраиваются непосредственно в сниппеты как кликабельные предложения для нового поиска, облегчая навигацию и уточнение запроса.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9183323B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-11-10</li> </ul> <ul class="options-list"> <li><p>Семантика и интент</p></li> <li><p>SERP</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9081831B2/">Как Google генерирует сниппеты для Sitelinks, используя контент целевых страниц, а не исходный запрос</a> <div class="text">Google использует специальный метод для генерации сниппетов в расширенных результатах поиска (Sitelinks). Сниппет для главной страницы часто основан на запросе пользователя, но сниппеты для внутренних ссылок (sub-documents) генерируются на основе "репрезентативных ключевых слов" (например, Title) самой внутренней страницы, а не исходного навигационного запроса. Это позволяет сделать описание Sitelinks более точным и релевантным теме целевой страницы.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9081831B2<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-07-14</li> </ul> <ul class="options-list"> <li><p>SERP</p></li> <li><p>Семантика и интент</p></li> <li><p>Структура сайта</p></li> </ul> </div> </div> </div> </div> </div> <div class="features-widget ls-widget" id="similar"> <div class="widget-title"> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-vector-square-icon lucide-vector-square"><path d="M19.5 7a24 24 0 0 1 0 10"/><path d="M4.5 7a24 24 0 0 0 0 10"/><path d="M7 19.5a24 24 0 0 0 10 0"/><path d="M7 4.5a24 24 0 0 1 10 0"/><rect x="17" y="17" width="5" height="5" rx="1"/><rect x="17" y="2" width="5" height="5" rx="1"/><rect x="2" y="17" width="5" height="5" rx="1"/><rect x="2" y="2" width="5" height="5" rx="1"/></svg> <h2>Популярные патенты</h2> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US8972391B1/">Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи</a> <div class="text">Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).</div> </div> <div class="bottom-box"> <ul class="info"> <li>US8972391B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-03-03</li> </ul> <ul class="options-list"> <li><p>Персонализация</p></li> <li><p>Поведенческие сигналы</p></li> <li><p>SERP</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9223868B2/">Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)</a> <div class="text">Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9223868B2<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-12-29</li> </ul> <ul class="options-list"> <li><p>Поведенческие сигналы</p></li> <li><p>SERP</p></li> <li><p>Антиспам</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US8463772B1/">Как Google динамически регулирует влияние фактора близости в локальном поиске в зависимости от тематики запроса и региона</a> <div class="text">Google использует систему для определения того, насколько важна близость (расстояние) для конкретного поискового запроса и региона. Анализируя исторические данные о кликах и запросах маршрутов, система вычисляет «Фактор важности расстояния». Для запросов типа «Кофе» близость критична, и удаленные результаты пессимизируются. Для запросов типа «Аэропорт» близость менее важна, и качественные результаты могут ранжироваться высоко. Система также учитывает плотность региона (город или село), адаптируя ожидания пользователей по расстоянию.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US8463772B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2013-06-11</li> </ul> <ul class="options-list"> <li><p>Local SEO</p></li> <li><p>Поведенческие сигналы</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US8280881B1/">Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)</a> <div class="text">Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US8280881B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2012-10-02</li> </ul> <ul class="options-list"> <li><p>Поведенческие сигналы</p></li> <li><p>Семантика и интент</p></li> <li><p>Мультимедиа</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9092510B1/">Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи</a> <div class="text">Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9092510B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-07-28</li> </ul> <ul class="options-list"> <li><p>Свежесть контента</p></li> <li><p>Поведенческие сигналы</p></li> <li><p>SERP</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US20150154610A1/">Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)</a> <div class="text">Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US20150154610A1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-06-04</li> </ul> <ul class="options-list"> <li><p>Local SEO</p></li> <li><p>Антиспам</p></li> <li><p>Поведенческие сигналы</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US10180965B2/">Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций</a> <div class="text">Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US10180965B2<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2019-01-15</li> </ul> <ul class="options-list"> <li><p>Персонализация</p></li> <li><p>Семантика и интент</p></li> <li><p>Local SEO</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9135317B2/">Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам</a> <div class="text">Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9135317B2<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2015-09-15</li> </ul> <ul class="options-list"> <li><p>Поведенческие сигналы</p></li> <li><p>Мультимедиа</p></li> <li><p>Семантика и интент</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US9235653B2/">Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени</a> <div class="text">Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US9235653B2<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2016-01-12</li> </ul> <ul class="options-list"> <li><p>Knowledge Graph</p></li> <li><p>Свежесть контента</p></li> <li><p>Семантика и интент</p></li> </ul> </div> </div> </div> </div> <div class="listing-block-five"> <div class="image-box"> <div class="se-icon"><img src="/static/img/google-logo-png-29534.png" alt=""></div></div> <div class="inner-box"> <div class="image-box"> </div> <div class="content-box"> <div class="upper-box"> <a class="pat-listing-item-headlink" href="http://seohardcore.ru/patents/google/US8458196B1/">Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент</a> <div class="text">Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.</div> </div> <div class="bottom-box"> <ul class="info"> <li>US8458196B1<li> <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-calendar-clock-icon lucide-calendar-clock"><path d="M16 14v2.2l1.6 1"></path><path d="M16 2v4"></path><path d="M21 7.5V6a2 2 0 0 0-2-2H5a2 2 0 0 0-2 2v14a2 2 0 0 0 2 2h3.5"></path><path d="M3 10h5"></path><path d="M8 2v4"></path><circle cx="16" cy="16" r="6"></circle></svg> 2013-06-04</li> </ul> <ul class="options-list"> <li><p>EEAT и качество</p></li> <li><p>Семантика и интент</p></li> </ul> </div> </div> </div> </div> </div> </div>   </div> </div> </div>   <footer class="main-footer style-two">  <div class="footer-bottom"> <div class="text"><a class="tglink" target="_blank" href="https://t.me/seohardcore"><svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-telegram" viewBox="0 0 16 16"> <path d="M16 8A8 8 0 1 1 0 8a8 8 0 0 1 16 0M8.287 5.906q-1.168.486-4.666 2.01-.567.225-.595.442c-.03.243.275.339.69.47l.175.055c.408.133.958.288 1.243.294q.39.01.868-.32 3.269-2.206 3.374-2.23c.05-.012.12-.026.166.016s.042.12.037.141c-.03.129-1.227 1.241-1.846 1.817-.193.18-.33.307-.358.336a8 8 0 0 1-.188.186c-.38.366-.664.64.015 1.088.327.216.589.393.85.571.284.194.568.387.936.629q.14.092.27.187c.331.236.63.448.997.414.214-.02.435-.22.547-.82.265-1.417.786-4.486.906-5.751a1.4 1.4 0 0 0-.013-.315.34.34 0 0 0-.114-.217.53.53 0 0 0-.31-.093c-.3.005-.763.166-2.984 1.09"></path> </svg> seohardcore</a></div> </div>  <div class="scroll-to-top scroll-to-target" data-target="html"><span class="flaticon-up"></span></div> </footer>  </div> <script src="/js/jquery.js?v=1.04"></script>  <script src="/js/bootstrap.min.js?v=1.04"></script> <script src="/js/jquery-ui.min.js?v=1.04"></script> <script src="/js/jquery.fancybox.js?v=1.04"></script> <script src="/js/jquery.modal.min.js?v=1.04"></script> <script src="/js/jquery.hideseek.min.js?v=1.04"></script> <script src="/js/mmenu.polyfills.js?v=1.04"></script> <script src="/js/mmenu.js?v=1.04"></script> <script src="/js/appear.js?v=1.04"></script> <script src="/js/wow.js?v=1.04"></script> <script src="/js/script.js?v=1.04"></script> <script src="/js/listing-nav-sticky.js?v=1.04"></script> <script src="/js/back-ignoring-hash.js?v=1.04"></script> <script src="/js/patents-readmore.js?v=1.04"></script> </body> </html>