Анализ патента, лежащего в основе Google News. Google оценивает качество новостных источников по оригинальности и скорости реакции на события. Статьи группируются в кластеры (сюжеты), которые ранжируются по свежести и авторитетности. …
Ссылки
Google использует механизм дедупликации для повышения разнообразия выдачи. Если несколько разных URL в результатах поиска перенаправляют пользователя на одну и ту же целевую страницу (например, из-за редиректа на мобильную версию, …
Патент Google описывает два ключевых механизма. Первый — автоматическое расширение набора запросов (триггеров), активирующих структурированные карточки, с помощью графового анализа и передачи весов между запросами и сущностями. Второй — процесс …
Google применяет алгоритмы диверсификации для предотвращения доминирования похожих результатов в выдаче или лентах, отсортированных по времени или местоположению. Система идентифицирует элементы с общими признаками (источник, автор, тип контента) и применяет …
Google выявляет поисковый спам, анализируя группы (кластеры) документов, а не только отдельные страницы. Система ищет подозрительные структуры, такие как сети ссылок (плотные двудольные графы), и агрегирует сигналы манипуляции (скрытый текст, …
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет …
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор …
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется …
Google использует итеративный алгоритм для обеспечения разнообразия в результатах поиска и рекомендациях. Система выбирает первый результат с наивысшей релевантностью, а затем штрафует оставшиеся результаты, если они слишком похожи на уже …
Патент Google, описывающий трехэтапный алгоритм для идентификации "выдающихся личностей" (экспертов) в темах, интересующих пользователя. Система анализирует контент, социальные взаимодействия между экспертами (кто на кого ссылается) и расширяет охват на связанные …
Google использует механизм для уточнения ранжирования, анализируя ссылочные связи исключительно между документами, уже попавшими в топ выдачи по конкретному запросу. Система рассчитывает оценку локальной авторитетности (LocalScore), повышая документы, на которые …
Google использует механизм для расчета оценок качества документов (Ranking Scores), который учитывает аффилированность между ссылающимися источниками. Если несколько ссылок исходят от сайтов, контролируемых одной организацией (например, PBN), система учитывает только …
Патент Google, описывающий систему извлечения информации о бизнесе (название, телефон) из неструктурированного текста веб-страниц. Система находит адрес в документе, определяет кандидатов на роль названия и телефона поблизости и использует статистическую …
Google использует алгоритм для определения наиболее авторитетной (официальной) страницы для конкретного бизнеса или адреса. Система анализирует кластер связанных страниц, изучая, как они ссылаются друг на друга, а также совпадение названия …
Google может обрабатывать запросы, включающие определенные метки (labels). Система идентифицирует домены, связанные с этими метками через внешние аннотации (annotations), которые определяют соответствие метки и шаблона URL (URL pattern). Поисковая выдача …
Патент Google описывает систему, которая анализирует ссылки на любой веб-странице и присваивает им оценку (Score), используя метрики, такие как PageRank, CTR и популярность. На основе этих оценок система может динамически …
Google использует метрику Codomain Relationship Measure (CDR), чтобы определить, какой сайт показать в качестве целевой страницы в Поиске по Картинкам. Система анализирует связь между доменом контента и доменом хостинга изображения. …
Google использует механизм "псевдо-рендеринга" для анализа геометрической структуры веб-страницы и ее разделения на семантически различные области (чанки), такие как основное содержимое, навигация, футер и реклама. Это позволяет системе определять важность …
Google может персонализировать выдачу, определяя сайты, которые пользователь предпочитает (Document Bias Set) и которые одновременно являются глобально авторитетными (High Quality Document Set). Если эти авторитетные и предпочитаемые сайты ссылаются на …
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и …