Что такое PageRank

Введение

Понятие Google PageRank является одним из ключевых моментов в работе поисковой машины Google. Наряду с другими параметрами, влияющими на выдачу (сортировку) сайтов в результатах поиска, знание модели PageRank необходимо как для понимания процесса поиска, так и для использования оптимизаторами при продвижении своих сайтов в поисковой системе.

Истории появления этого параметра будет посвящена другая статья. Здесь я, как автор, хочу лишь изложить математические основы вычисления PageRank, используемые повсеместно. Для начала, примем за аксиому, что при расчете Google PR, не будет учитываться "рассовая" принадлежность ссылок, их "языковая группа" или "внешний вид", а будем полагать, что все страницы в интернете равны (как мы с вами), и вес ее будет определяться лишь весом ссылающихся страниц-доноров.

Представьте себе, что вы Учитель (или свою профессию - сапожник, программист, оптимизатор, доктор с пиявками ...), и что вам надо делать свою работу. Перед вами стоит задача: как найти тех людей, которым вы нужны, и которые будут рады воспользоваться вашими услугами?! Для этого можно либо сделать себе рекламу (баннеры, adsense, директ и др.), либо устроиться в какую-нибудь контору, которая будет поставлять вам клиентов (фриленсерские сайты, статьи, социальные закладки). Единственное, когда клиенты сами будут к вам приходить, это если другие скажут им о вас, посоветуют, расхвалят и т.д. Здесь вы не тратите средства на рекламу, и это самые эффективные клиенты, которым действительно нужна ваша помощь.

Говоря другими словами, мы подошли к понятию PageRank, который отражает вес вашей страницы по ссылкам ("слухам") с других страниц. И понятно, что чем больше ссылающихся на вас страниц, тем больше у вас вес.

Определение PageRank

PageRank (далее просто PR) это числовая величина -- мера "важности" страницы в поисковой системе Google. Зависит от числа внешних ссылок на данную страницу и от их веса (важности). Другими словами от количества и качества ссылающихся страниц. А если говорить математическим языком, то PR это алгоритм расчёта авторитетности страницы, используемый поисковой системой Google. PR не является основным, но является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска.

Следует отметить, что при расчете PR Google учитывает не все ссылки, а отфильтровывает ссылки с сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут не только не учитываться, но и отрицательно сказаться на ранжировании ссылающегося сайта (такой эффект назвается поисковой пессимизацией).

Классическая модель представления PageRank

Документ (на англ. языке), подробно описывающий модель PageRank, введеной Сергеем Брином и Ларри Пейджем, можно скачать по ссылке: The PageRank Citation Ranking.

Основная формула, описывающая PR выглядит следующим образом.

Уравнение PR

где d -- демпфирующий коэффициент, отражающий какую долю веса может передать страница-донор на страницу-акцептор. Обычно его принимают равным 0.85, что означает, что страница может передать 85% веса (распределяется между всеми акцепторами, на которые ссылается донор). В других источниках d является вероятностью, с которой пользователь перейдет на один из акцепторов, а не закроет браузер, что, в принципе, то же самое. Какое числовое значение у этого параметра в Google знают только там, остальные принимат его равным 0.85 (видимо из эксперементальных данных);
n -- количество страниц, ссылающихся на страницу-акцептор (на которые не наложен фильтр);
Ti -- i-ая ссылающаяся страница;
C -- количество внешних ссылок на странице-доноре.

Тулбарное представление PageRank

Поскольку ссылающихся страниц может быть много, и общее количество страниц в поисковой системе Google достаточно велико (около десятка биллионов штук) а также их количество постоянно растет, то представлять вес страницы в абсолютных значениях для вебмастеров было бы весьма неправильно. Для этого ввели понятие TLPR -- ToolBar PageRank, который имеет значение от 0 до 10 (зелененькая шкала в Google Toolbar).

Вы можете скачать Firefox с тулбаром, если у вас еще не имеется такового:

Для того, чтобы уложить все веса страниц между значениями от 0 до 10 используют логарифмическую шкалу.

TLPR = Logbase(PR) * a

где base -- основание логарифма, которое зависит от количества страниц в поисковой машине (возможно и от ряда других факторов). Некоторые принимают его равным 7;
a -- некий коэффициент приведения, который удовлетворяет неравенству 0 < a ≤ 1. Оптимизаторам его можно принять равным единице для упрощения расчетов.

Из вышесказанного неверно делать выводы, что нулевой TLPR означает нулевой реальный PageRank. По первой формуле видно, что даже при n = 0, мы получим минимальный PRmin = (1-d) = 0.15. Это значение соответствует TLPR ≈ -1. При таких (отрицательных) значениях тулбарного PR считается что PR = N/A (или еще не определен), однако он также оказывает влияние на распределение веса между ссылками-акцепторами. Также следует заметить, что тулбарное значение предназначено только для отображения вебмастерам в Google Toolbar и никак не влияет на выдачу в серпе. На выдачу в серпе влияние оказывает реальный PR страницы!

Выводы

Исходя из принципов расчета Google PageRank можно теперь легко расчитать, с каких ссылок нужно ссылаться и сколько нужно ссылок, чтобы получить тот или иной PR. Также можно прогнозировать PR. Один из важных выводов, который я для себя сделал заключается в следующем. Если мы имеем новый сайт со страницами более 10,000, они правильно перелинкованы и каждая ссылается на главную страницу, то главная страница получит хороший вес от этих ссылок. Вот немного математики по этому поводу.

PRmin = 0.15;
PR = 0.15 + 0.85 * 20000/10; (при учете в среднем 10 ссылок на странице)
TLPR = Log(1700.15, 7) = 3.823 ≈ 4

Вот вам и пример хорошего PR без единой внешней ссылки с других сайтов :)
Теперь понятно, почему у таких систем как Digg.com, Del.icio.us и других подобных весьма большой PageRank.

На вышеизложенной теории я посторил JavaScript калькулятор для расчета PR (правда без учета ссылок с PR0). Калькулятор можно разместить на своем сайте. Код прилагается.

Часто задаваемые вопросы

Как повысить PR моего сайта?

Существует множество способов повышения веса своих страниц, но главная идея -- это качественные ссылки с других сайтов. Для этого можно использовать каталоги, социальные закладки, статьи, форумы, блоги и другие типы сайтов. Однако не следует глупо расставлять множество ссылок на других сайтах, так как помимо PageRank существует множество других ранков, влияющих на выдачу страницв в результатах поиска (например TrustRunk).

Бывает ли отрицательный PR?

Нет, не бывает. Реальный PR минимум равен 0.15, минимальный тулбарный PR равен нулю.

Нужно ли ставить ссылки на своем сайте и как это влияет на PR моей страницы?

Ссылки на своем сайте на другие сайты ставить необходимо, так как своими ссылками вы увеличиваете PR страниц-акцепторов и тем самым, по первой формуле, к вам возвращается еще больший вес из огромной системы ссылок.

Когда происходят апдейты PageRank?

Апдейты для тулбарного PR происходят раз в 2-4 месяца, для реального PR я уверен, что апдейты происходят чаще. В Google каталоге Dmoz можно посмотреть TLPR на текущий момент для вашего сайта, если он размещен в каталоге.

Влияет ли язык ссылки на PR?

Ни коим образом язык на передачу веса PR не влияет. Влияет только качество и количество ссылающихся на вас страниц.

Сергей Кокшаров.
© OptSiteTM

P.S. Любые комментарии можно оставлять на блоге автора: что такое pagerank

 

Хостинг от uCoz