Топ контрибуторов
loading
loading
Знаете ли Вы, что

Вы можете подписаться на RSS ленту новых тестов сервиса Quizful, в том числе и отдельно по каждой категории

Лента обновлений
ссылка Nov 24 17:03
Комментарий от fortulyar:
1. Сравнивем ключ с нулом.
2. Формируем хеш с ключа.
3...
ссылка Nov 24 00:27
Комментарий от anniemt6:
а какая разница между var и let в ДАННОМ случае, ЧТО им...
ссылка Nov 24 00:25
Комментарий от anniemt6:
запустите это в консоле, проверьте, выводит от 0 до 9, ...
ссылка Nov 23 23:13
Комментарий от henrikhakobyan:
Ghuh
ссылка Nov 23 13:48
Комментарий от freddylink:
Публичный конструктор класса B не вызывается
Статистика

Тестов: 153, вопросов: 8596. Пройдено: 473035 / 2306691.

Что такое PageRank от Google и с чем его едят?

head tail Статья
категория
SEO / i-marketing
дата17.07.2009
авторDrRu
голосов69

[Disclaimer: Данная статья была переведена в рамках "Конкурса на лучший перевод статьи" на сервисе Quizful. Ссылка на оригинал находится внизу страницы.]

PageRank это числовая величина, которая является показателем «важности» веб-страницы в сети. Специалисты Google считают, что, когда одна страница имеет ссылку на другую, первая отдает голос в копилку второй. Чем больше голосов у страницы, тем она «важнее». Кроме того, показатель «важность» голосующей страницы определяет «важность» самого голосования. Google вычисляет показатель «важность» страницы, анализируя голоса, отданные ей. Когда PageRank страницы посчитан, принимается во внимание «важность» каждого голоса.

PageRank придуман компанией Google, чтобы решить вопрос о «важности» страницы. Необходимость такого решения заключается в том, что PageRank является одним из факторов, определяющих порядковый номер страницы в результатах поискового запроса. Это важный, но не единственный фактор, применяемый Google для ранжирования страниц.

Далее для удобства будем писать вместо “PageRank” - “PR”.


Примечание:

Google учитывает не все ссылки при вычислении PR. Поисковая система отфильтровывает ссылки с сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут отрицательно сказаться на ранжировании сайта. В Google понимают, что вебмастера не в состоянии повлиять на входящие внешние ссылки, но они могут полностью контролировать исходящие ссылки со своего сайта. Поэтому ссылки на сайт не могут повредить ему, но ссылки с него на «оштрафованные» сайты - могут. Поэтому следует внимательно относиться к сайтам, на которые вы делаете ссылки. Если у сайта PR0, это обычно оштрафованный сайт и было бы странно делать ссылку на него.


Как вычисляется PageRank?

Для вычисления PR страницы учитываются все ссылки на нее. Среди них ссылки с самого сайта и с других веб-сайтов.

PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))

Так выглядит уравнение, позволяющее вычислять PR страницы. Это уникальная формула, полученная в ходе разработки понятия “PageRank”, и, вероятно, сам Google использует измененную версию, которую держит в строжайшем секрете. Хотя это не имеет большого значения, поскольку представленное выше уравнение достаточно хорошо.

В уравнении t1…tn - страницы, ссылающиеся на страницу A; C – число исходящих ссылок страницы; d - коэффициент демпфирования, обычно равный 0.85.

Теперь можем слегка упростить выражение:

PR страницы = 0.15 + 0.85 * («относительная величина» PR каждой страницы, на которой есть ссылка на данную)

«Относительной величиной» назовем отношение PR страницы к количеству исходящих с нее ссылок.

Страница отдает голоса за итоговый PR каждой странице, на которую она ссылается. Итоговое значение PR, которым страница может воспользоваться для голосования немного меньше фактического значения PR (фактическое значение * 0.85). Эта значение разделено одинаково между всеми страницами, на которые ссылается отдающая голоса страница.

Поэтому можно сделать вывод, что ссылка со страницы с PR4 и 5 исходящими ссылками имеет больший вес при голосовании, чем ссылка со страницы с PR8 и 100 исходящими ссылками. PR страницы, которая ссылается на Вашу важен, но число ссылок на той странице также важно. Чем больше ссылок на ней, тем меньше итоговое значение PR Ваша страница получит в результате.

С выводами пришлось бы подождать, если бы разница между значениями PageRank PR1, PR2, ... PR10 была одна и та же, но многие считают, что значения между PR1 и PR10 (максимальное значение) расположены на логарифмической шкале, и есть очень серьезное причины верить этому. Никто за пределами Google не знает наверняка так это или нет, но вероятность того, что шкала является логарифмической или подобной ей, высоки. Если это так, то странице требуется намного больше дополнительного PR, чтобы достигнуть следующего уровня PR, чем потребовалось для перехода на текущий с предыдущего. Суть в том, что это полностью противоположно предыдущему выводу, и тогда ссылка со страницы с PR8, у которой есть много ссылок на другие сайты, дает большее итоговое значение, чем ссылка со страницы с PR4, у которой только несколько исходящих ссылок.

Какую бы шкалу не использовал Google, мы можем быть уверены в одном: ссылка с другого сайта увеличивает PR нашего сайта. Только не забудьте, что ссылок с сайтов, специально предназначенных для скопления ссылок, нужно избегать.

Заметьте, что, когда страница отдает в качестве голоса значение PR другим страницам, ее собственный PR не уменьшается на значение, которое она отдает при голосовании. Голосующая страница не отдает свой PR и тем самым не остается ни с чем. Это не передача PR. Это просто голосование согласно значению PR страницы. Это похоже на собрание акционеров, где каждый акционер голосует согласно количеству акций, которыми он владеет, но сами акции не отдает. Так или иначе, позже мы увидим, что страницы действительно теряют некоторую часть значения PR косвенным путем.

Пока все ясно и понятно? Отлично! Теперь мы наконец посмотрим, как на самом деле происходят вычисления.

Для вычисления PR страницы его текущее значение (если у нее таковое имеется) обнуляется, а новый пересчет делается на основе значений PR участвующих в голосовании страниц, которые могли измениться после последнего вычисления PR страницы.

Из уравнения видно, как получается PR страницы. Но вот что не сразу очевидно, так это то, что это уравнение не будет корректным, если вычисления сделаны однократно. Предположим, что у нас есть 2 страницы: A и B, которые имеют ссылки друг на друга, и у них больше нет других ссылок. Вот, что получается:

Шаг 1: Вычислить PR страницы А по значениям PR входящих ссылок

У страницы A теперь есть новое значение PR. При вычислении использовалось значение PR ссылки со страницы B. Но у страницы B есть входящая ссылка (со страницы A), и ее новая значение PR еще не было вычислено, поэтому при подсчете нового значения PR страницы А используются неточные данные и, соответственно, это значение также не может быть точным.

Шаг 2: Вычислить PR страницы B по значениям PR входящих ссылок

У страницы B теперь есть новое значение PR, которое не может быть точным, потому что при вычислении использовалось новое значение PR входящей ссылки страницы A, которое также неточно.

Получили зацикливание. Мы не можем посчитать PR А, пока не знаем PR B, и мы не можем посчитать PR B, пока не знаем PR А.

А не можем ли мы, имея на руках пересчитанные значения PR для обеих страниц, заново произвести вычисления, чтобы получить точный результат? Нет. Мы можем произвести вычисления снова, используя новые значения PR, и результат будет более точным, но мы будем всегда использовать неточные значения для последующих вычислений, вот почему результат будет всегда неточным.

Проблема преодолена путем большого числа итераций вычислений. В результате каждой итерации получаются немного более точные значения PR. Фактически 100% точности мы никогда не получим, потому что для вычислений всегда используются неточные значения. 40-50 итераций достаточно, чтобы получить результат, дальнейшее уточнение которого не даст значительных изменений. Google всегда делает это при каждом обновлении, вот почему они такие длительные.

Следует принять во внимание то, что в результате вычислений получаются пропорции. Потом значения должны быть нанесены на шкалу (известную только Google), чтобы получить фактические значения PR каждой страницы. Даже в этом случае мы можем применить вычисления для того, чтобы распределить PR среди страниц сайта так, чтобы некоторые из них получили большую его часть, чем другие.

ПРИМЕЧАНИЕ:

Вы можете столкнуться с такими объяснениями PR, где описано то же самое уравнение, но результат каждой итерации добавляется к текущему значению PR страницы. Новое значение (результат + текущий PR) впоследствии используется для распределения PR с другими страницами. Такие описания являются неверными по следующим причинам:

1. Они ссылаются на то же самое известное уравнение, но потом изменяют

PR(A) = (1-d) + d(......) на

PR(A) = PR(A) + (1-d) + d(......)

Это неверно и в этом нет необходимости.

2. Рассмотрим, как организовать ссылки так, чтобы определенные страницы получили большую пропорцию PR, нежели другие. Добавление к текущему значению PR страницы результатов последующих итераций дает разные пропорции по сравнению с пропорциями, вычисленными по известной формуле. Так как сложение не является частью исходного уравнения, результаты являются неверными, и разделение на пропорции неточное.

Согласно исходному уравнению, у страницы, для которой производятся вычисления, обнуляется текущее значение PR при каждой итерации. Значение PR основано исключительно на его входящих ссылках. Метод с «добавлением текущего PR» этого не делает, поэтому его результаты абсолютно точно неверные.


Внутренние ссылки

Утверждение 1: значение PR всего сайта распределяется между страницами сайта с помощью внутренних ссылок.

Максимальное значение PR сайта эквивалентно количеству страниц сайта. Оно увеличивается входящими ссылками с других сайтов и снижается исходящими ссылками на другие сайты. Имеется ввиду значение PR всего сайта, а не каждой отдельной страницы. Конечно, Вы можете мне не поверить. Вы и сами можете прийти к тому же самому заключению, взяв карандаш и лист бумаги, и произведя небольшие расчеты.

Утверждение 2: значение PR сайта прямо пропорционально количеству страниц сайта.

Чем больше страниц имеет сайт, тем выше его PR. И снова вы можете прийти к такому же выводу, воспользовавшись карандашом и листом бумаги. При этом помните, что учитываются только те страницы, о существовании которых Google знает.

Утверждение 3: неграмотная расстановка внутренних ссылок ведет к снижению PR сайта, но чересчур грамотная расстановка не способна его повысить.

Плохая постановка внутренних ссылок снижает PR сайта, а повысить PR за счет внутренних ссылок невозможно. Единственный способ повысить PR — это получить большее число входящих ссылок и/или увеличить количество страниц на сайте.

Обратите внимание: пока я настоятельно рекомендую создавать и добавлять новые страницы для увеличения общего PR сайта так, чтобы это повлияло на определенные страницы, потому что существуют некоторые страниц, которые не следует добавлять. Это такие страницы, которые абсолютно идентичны либо очень похожи, их еще называют cookie-cutter’ами. Google определяет их как спам, и из-за них страницы и даже весь сайт могут быть «оштрафованы». Страницы должны быть с хорошим контентом.

Рассмотрим некоторые примеры вычислений, чтобы понять как вычислять PR сайта. Но прежде чем это сделать, следует обратить внимание на тот факт, что веб-страница индексируется Google только тогда, когда существует хотя бы одна страница в интернете, которая на нее ссылается. Так заявляет сам Google. Если страницы нет в индексе Google, то никакие ссылки с нее не учитываются при проведении вычислений. 

Мы не будем учитывать этот факт, главным образом потому, что авторы других статей о PageRank не учитывают его в своих вычислениях, что может внести путаницу в расчеты при сравнении статей. Калькулятор PageRank работает в двух режимах: Simple (простой) и Real (реалистичный). В простом режиме при расчетах предполагается, что все страницы сайта индексированы Google, независимо от того, ссылаются на них другие страниц или нет. В реалистичном режиме при расчетах игнорируются страницы, на которые нет ссылок. Дальнейшие примеры показывают результаты вычислений в простом режиме.

Давайте представим себе сайт, состоящий из трех страниц (страницы A, B и C), на которые нет ссылок с других сайтов. Мы присвоим каждой странице изначальное значение PR=1, хотя, на самом деле, не важно, с какого значения мы начнем — с 1, 0 или 99. Даже если приравнять это число к нескольким миллионам, после ряда итераций конечный результат будет тем же самым. Просто, стартуя с 1, нам понадобится меньше итераций, нежели начиная с 0 или любого другого значения. Вы можете проверить расчеты с помощью карандаша и бумаги, или использовать калькулятор PR.

Максимальный PR сайта – это значение PR сайта. В нашем случае, у нас есть 3 страницы, значит максимальный PR для него равен 3.

Вначале ни на одной из страниц нет ссылки на другую, и никакие другие страницы не ссылаются на эти три. После первой итерации для каждой страницы вы получите значение PR, равное 0.15. Независимо от того, сколько итераций вы сделаете, PR каждой страницы будет равен 0.15. Общий PageRank сайта равен 0.45, тогда как мог быть равен 3. Таким образом сайт теряет большую часть своего потенциально возможного PR.


Пример 1

Теперь начнем снова с каждой страницы, которой присвоен PageRank 1. Поставим со страницы A на страницу B и произведем вычисления вновь для каждой из страниц. В итоге получим:
Страница A = 0.15
Страница B = 1
Страница C = 0.15 

Страница A отдала голос за страницу B и, как следствие, PR страницы B увеличился. Этот результат будет хорошим для страницы B, но это всего лишь результат одной итерации и мы не проверяли условие зацикливания. Взгляните, что происходит со значениями после большего числа итераций:


Такие получаются значения после 100 итераций:
Страница A = 0.15 
Страница B = 0,2775 
Страница C = 0.15
 

Результат по-прежнему хороший для страницы B, но далеко не так , как хотелось бы. Эти цифры являются более реалистичными. Полное значение PR сайта равно 0.5775 – это немного лучше, но все еще не так хорошо, как могло быть.

ПРИМЕЧАНИЕ:

С технической точки зрения, эти результаты неверны в связи со специфическим отношением Google к так называемым «dangling links» («висящие ссылки» - это такие ссылки, которые указывают на страницы, не содержащие ни одной ссылки), но их можно использовать в качестве примера.


Пример 2

Попробуем другую структуру ссылок. Разместим на каждой странице ссылки на все остальные страницы. Снова присвоим каждой из страниц PR, равный 1. Получим:

Страница A = 1

Страница B = 1

Страница C = 1

Теперь мы достигли максимума. Неважно, сколько итераций вычислений будет произведено, - для каждой страницы PR будет оставаться равным 1. Те же самые результаты мы получим при создании цикличной ссылочной структуры (то есть когда A ссылается на B, B ссылается на C, C ссылается на D). Можете посмотреть, как это выглядит в калькуляторе PageRank.

Полученный нами результат свидетельствует о том, что из-за плохой структуры ссылок, очень легко потерять PR, тогда как при разумном расположении ссылок мы можем достичь максимально возможной величины PR. Но мы не ставим себе целью прийти к результату, когда каждая страница сайта будет иметь одинаковую долю PR. Мы хотим, чтобы одна или несколько страниц имели большую долю PR за счет других страниц. К таким страницам относятся индексированные страницы, главные страницы и страницы, которые оптимизированы под определенные поисковые запросы. Сейчас мы располагаем всего тремя страницами, поэтому наращиваем PR индексированной страницы - страницы A. Это прекрасная иллюстрация идеи с перераспределением PR.


Пример 3

Теперь попробуем поступить следующим образом. Разместим на странице A ссылки на B и C. Также на страницах B и C разместим ссылки на страницу A. Начнем расчеты со значения PR, равного 1, для каждой из страниц. После первой итерации получим:

Страница A = 1.85
Страница B = 0.575
Страница C = 0.575


Результат после 100 итераций:

Страница A = 1.459459

Страница B = 0.7702703

Страница C = 0.7702703

В обоих случаях общее значение PR сайта составляет 3 (это максимум), то есть ничего не теряется. Кроме того, наглядно видно, что страница A имеет гораздо большую долю PR, чем две другие. Так происходит потому, что страницы B и C передают свои доли PR только странице A и никаким другим страницам. Иными словами, мы получили управляемый механизм передачи доли PR в нужную часть сайта.

----------
Оригинальный текст статьи: Google's PageRank Explained

Если Вам понравилась статья, проголосуйте за нее

Голосов: 69  loading...