Google PageRank – теоретические основы

Впервые алгоритм учета внешних ссылок был запатентован компанией Google. Он был назван PageRank. В этом разделе вы узнаете, какое влияние он может оказывать на ранжирование результатов поиска.

Расчет PageRank каждой страницы ведется отдельно, причем определяется он исходя из значений PageRank веб-страниц, которые ссылаются на оцениваемую. Своего рода замкнутая цепь.

Чтобы рассчитать этот показатель, необходимо найти критерий, по которому будет определяться важность страницы. Для PageRank был выбран критерий теоретической посещаемости страницы.

Предположим, что некий пользователь путешествует по сети, переходя с одной страницы на другую по ссылкам. Начав просмотр веб-страниц со случайного ресурса, он постепенно переходит на другие. Причем существует вероятность, что пользователь уйдет с сайта и опять начнет просматривать документы со случайной страницы. Для алгоритма PageRank вероятность подобного действия составляет на каждом шаге 0.15. Итак, пользователь продолжит свое путешествие по Сети с вероятностью 0.85, перейдя по одной из ссылок, имеющихся на странице (в данной ситуации все ссылки имеют равное значение). Путешествуя таким образом бесконечно, пользователь попадет на популярные ресурсы намного большее число раз, чем на малоизвестные.

Фактически PageRank веб-страницы – это вероятность нахождения на ней посетителя. Причем сумма таких вероятностей по всем ресурсам Интернета равна 1, поскольку пользователь непременно находится на какой-нибудь странице.

Работать с вероятностями не слишком удобно, поэтому после некоторых преобразований с показателем PageRank можно работать в форме конкретных чисел (так, в Google ToolBar каждой странице присваивается значение PageRank от 0 до 10).

Выводы:
- любая веб-страница изначально имеет PageRank выше нуля (правда, очень маленький), даже если на нее нет ссылок с внешних ресурсов;
- любая веб-страница, на которой имеются исходящие ссылки, передает долю своего PageRank тем страницам, куда ведут ссылки. Причем значение переданного PageRank обратно пропорционально количеству ссылок на странице (чем их больше, тем меньше передаваемый по каждой из них PageRank);
- PageRank передается не полностью, а уменьшается с каждым шагом (тут включается в расчет 15-процентная вероятность того, что пользователь начнет просмотр с новой случайной страницы).

Каким же образом PageRank оказывает влияние на ранжирование результатов поиска (собственно, PageRank в чистом виде уже давно не задействован в алгоритме Google, но об этом будет сказано далее)? После того, как поисковая система отсортировала документы по релевантности (согласно текстовым критериям), логично далее произвести сортировку по PageRank,так как, по идее, ресурс, на которого приводит больше всего качественных ссылок, содержит самую качественную и полезную информацию.

Иными словами, алгоритм PageRank «проталкивает» в топ поиска именно те страницы, которые и без поисковика пользуются наибольшей популярностью.

Постовой: продвижение сайта в поисковых системах.

Смотрите также