2004

Google расширяет понимание тематики документа за пределы его контента, анализируя внешние сигналы. Система косвенно выводит концепции, изучая, откуда приходят пользователи (входящие ссылки и запросы), куда они уходят (исходящие ссылки, клики …
Google использует метод обнаружения искусственного завышения рейтинга (например, PageRank) путем вычисления математической производной функции ранжирования по отношению к "фактору связности" (coupling factor). Резкие изменения этой производной (сильно положительные или отрицательные) …
Google анализирует запросы, введенные в адресную строку браузера. Если система с высокой степенью уверенности определяет один «очень релевантный» результат, основываясь на высоком историческом CTR и значительном отрыве его оценки релевантности …
Google использует инфраструктуру для масштабируемой оценки электронных документов (включая веб-страницы и рекламу) с помощью распределенной сети асессоров. Система присваивает асессорам «Trust Score» (Оценку Доверия) и агрегирует их отзывы, учитывая контекстуальную …
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор …
Google использует механизм для расчета оценок качества документов (Ranking Scores), который учитывает аффилированность между ссылающимися источниками. Если несколько ссылок исходят от сайтов, контролируемых одной организацией (например, PBN), система учитывает только …
Патент Google, описывающий систему извлечения информации о бизнесе (название, телефон) из неструктурированного текста веб-страниц. Система находит адрес в документе, определяет кандидатов на роль названия и телефона поблизости и использует статистическую …
Google использует алгоритм для определения наиболее авторитетной (официальной) страницы для конкретного бизнеса или адреса. Система анализирует кластер связанных страниц, изучая, как они ссылаются друг на друга, а также совпадение названия …
Google использует механизм "псевдо-рендеринга" для анализа геометрической структуры веб-страницы и ее разделения на семантически различные области (чанки), такие как основное содержимое, навигация, футер и реклама. Это позволяет системе определять важность …
Google может персонализировать выдачу, определяя сайты, которые пользователь предпочитает (Document Bias Set) и которые одновременно являются глобально авторитетными (High Quality Document Set). Если эти авторитетные и предпочитаемые сайты ссылаются на …
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих …
Google использует механизм для динамического обогащения просматриваемых веб-страниц. Система анализирует контент страницы и персональные данные пользователя (история поиска, местоположение, интересы), формирует комбинированный внутренний поисковый запрос, находит релевантные внешние документы или …
Google использует механизм для корректировки показателей популярности документов (например, кликов). Система определяет «широту» (Query Breadth) запроса. Клики, полученные по широким, общим запросам, считаются менее значимыми индикаторами популярности, чем клики по …
Google использует статистический анализ для обнаружения спама и переоптимизации. Система определяет ожидаемое количество связанных концепций (фраз) в типичном документе. Если документ содержит неестественно большое количество связанных фраз по сравнению с …
Google использует внешние «офлайн-сигналы» для ранжирования документов с плохой ссылочной структурой (книги, журналы). К ним относятся: попадание в списки бестселлеров (с учетом локации пользователя), данные о тиражах, общие продажи издателя …
Патент Google, описывающий интеграцию поисковой системы с социальной сетью (Member Network). Система позволяет пользователям одобрять (Endorse) контент. При поиске система идентифицирует одобрения от связанных пользователей (друзей) и, что критически важно, …
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить ее уникальный контекст. Ранжирование улучшается …
Google использует модель машинного обучения для прогнозирования вероятности того, что пользователь перейдет по конкретной ссылке. Эта модель анализирует характеристики ссылки (положение, размер шрифта, анкорный текст) и данные о поведении пользователей. …
Google анализирует исторические данные о том, как пользователи уточняют свои запросы. Система определяет семантическое значение каждого уточнения, анализируя контент возвращаемых документов. Уточнения с похожими результатами кластеризуются. Затем система выбирает лучший …
Google использует механизм «Boost Vectors» для персонализации поиска. Система классифицирует интересы пользователя или тематику сайта-источника, и на основе этих категорий повышает в выдаче результаты, предварительно ассоциированные с этими темами. Это …