Kiến Thức SEO

Phát Minh PageRank – Lược Sử Hình Thành Và Cập Nhật

December 03, 2018

Năm 2019, rất có thể các phương pháp tăng pagerank cũ sẽ không còn hiệu quả. Nhất là khi nhiều ý kiến cho rằng, gần đây dường như không cần đi backlinks quá nhiều, các từ khóa vẫn đứng top?

Vâng, những nghi ngờ đó không sai đâu. Một số diễn đàn đang bàn tán về việc rò rỉ 1 chút về phát minh bổ sung cho thuật toán PageRank năm 2015 được công bố ngày 24/04 mà bạn có thể tham khảo bên dưới, cho thấy chỉ số về số lượng links đã không còn quan trọng.

Liệu phương pháp xây dựng quyền lực cũ có còn hiệu quả?

Vì sao vậy? Chúng ta hãy cùng tìm hiểu nhé ?

Tóm tắt nội dung bài viết

Còn bây giờ, xin điểm qua 1 số khái niệm căn bản về PageRank cho các bạn newbie nắm bắt.

PageRank Là Gì? Lược Sử Hình Thành Và Phát Triển

Trước kia PageRank gần như chỉ là 1 trị số liên quan tới việc số lượng liên kết đổ về trang đó. Mặc dù PageRank được nghiên cứu và phát minh bởi Lary Page và phát triển bởi Sergrey Brin trong 1 dự án phán minh công cụ tìm kiếm mới năm 2001, nhưng khi nói tới PageRank thì người ta thường nghĩ tới Google PageRank nhiều hơn là phát minh năm 2001.

Từ năm 2003 tới năm 2006, tôi cũng không chắc lắm nhưng hồi mới nghiên cứu SEO năm 2007 thì tôi đọc tài liệu là vậy, ? thuật toán này dường như vô cùng đơn giản đúng như những gì PageRank được phát minh năm 2001: đo lường khối lượng liên kết giữa các trang với trang đích, tính cộng và trừ dựa trên dofollow và nofollow.

 

Mặc dù trang C có ít liên kết hơn trang E, nhưng PR của trang E chưa chắc bằng trang C.

 

Khoảng năm 2007 tới 2008, một số update mới được bàn tán khá nhiều trên các diễn đàn SEO lúc bấy giờ. Google PageRank đã không đơn giản là số lượng liên kết mà còn có những giá trị đi kèm theo kiểu phân loại như: reciprocal links, forum links, blog links, web category links,… Nghe có vẻ phức tạp hơn nhưng thực ra chuối vẫn là chuối, cho đến năm 2009, mặc dù thuật toán Google PageRank đã phân biệt được links từ forum là new topic hay link from reply, các backlinks đã được nhận dạng rõ từ free 2.0 blog cho tới pumper sites nhưng số lượng vẫn có thể đề át chất lượng.

Tuy nhiên, từ năm 2009 tới năm 2014, đặc biệt là năm 2012, với sự góp mặt của những thuật toán nổi tiếng như Panda và Penguin, lúc này thuật toán Google PageRank (sau đây viết tắt là GGPR) thực sự đã thông minh hơn. Ngoài việc phân loại ra, GGPR còn kiểm soát rất kỹ vấn đề chất lượng của đường links.

Và từ 2014 cho tới nay, hầu như những thuật toán nào được cập nhật cũng đều ảnh hưởng tới GGPR nói riêng và SERP nói chung. Thậm chí các yếu tố như giao diện website, địa chỉ IP của website, cấu trúc mã nguồn front-end, email của webmaster,… còn rất nhiều yếu tố mà các diễn đàn SEO trên thế giới đều xác nhận là GGPR có quan tâm, tuy nhiên, Google chưa và sẽ không bao giờ xác nhận hay phủ nhận.

Google Đã Loại Bỏ Thuật Toán PageRank?

Tại một số nơi, người ta lấy cái clip này ra và bảo rằng “PageRank không còn là cơ sở để tính toán SERP”

 


Tôi không nghĩ vậy. Tất nhiên về SERP thì hiện nay đã đa dạng tiêu chí hơn rất nhiều, nhưng nói không còn tính đến PageRank thì quá vội phán xét. Xưa nay mọi người cũng biết rồi, trong mọi cuộc nói chuyện, các thánh Google luôn trả lời kiểu huề vốn, lolz. Cũng phải thông cảm, khi bạn làm trong 1 công ty lớn như vậy, bạn có thể tùy tiện nói ra bí mật dự án của công ty hay không?

 

“We will probably not going to be updating it PageRank, going forward, at least in the Toolbar PageRank”. Okay, có 2 vấn đề ở đây:

  • Not going to be updating it: không update nữa không có nghĩa là không còn tác dụng.
  • At least in the Toolbar PageRank: yeah, nhớ là at least. Không update Toolbar PageRank không có nghĩa là PageRank sẽ không ảnh hưởng đến SERP.

Nếu Google PageRank đã bị không còn được phát triển thì chắc chắn biến thể thành 1 thuật toán riêng nào đó không đi theo công thức cũ nhưng chức năng là tương đương, có thể là Laevis PageRank chẳng hạn, (j/K).

Tức là 1 thuật toán mang ý nghĩa PageRank sẽ bao hàm rộng lớn hơn, trong đó những phát minh thuật toán cũ và mới chỉ là những điểm số chấm theo hệ số. Áp dụng 1 thời gian dài, các chuyên gia của Google sẽ cân đối lại các hệ số này giống như môn Toán hệ số 3, môn văn hệ số 3, môn Lý, Hóa hệ số 2 và tính ra học lực cả tháng của 1 học sinh vậy.

Hãy là người làm SEO thông minh và chủ động nghiên cứu bằng nhiều phương pháp test khác nhau, quan trọng nhất là tiếp nhận thông tin 1 cách có chủ động tìm hiểu.

PageRank Cập Nhật Thuộc Tính Phát Minh Mới, Hãy Cẩn Thận

Thông bằng sáng chế đăng ký từ năm 2015, mới được công bố ngày 24/04 năm 2018 (Tôi nhấn mạnh là: Phát minh này đăng ký năm 2015, không phải năm 2018, vì nhiều bạn pm hỏi linh tinh quá -.-) với thông tin như sau:

Inventors: Hajaj; Nissan (Emerald Hills, CA)
Applicant: Google LLC
Assignee: Google LLC (Mountain View, CA)
Family ID: 1000001478409
Appl. No.: 14/886,990

Nội dung tóm tắt của bằng phát minh này:

“One Embodiment Of The Present Invention Provides A System That Produces A Ranking For Web Pages. During Operation, The System Receives A Set Of Pages To Be Ranked, Wherein The Set Of Pages Are Interconnected With Links. The System Also Receives A Set Of Seed Pages Which Include Outgoing Links To The Set Of Pages. The System Then Assigns Lengths To The Links Based On Properties Of The Links And Properties Of The Pages Attached To The Links.

The System Next Computes Shortest Distances From The Set Of Seed Pages To Each Page In The Set Of Pages Based On The Lengths Of The Links Between The Pages. Next, The System Determines A Ranking Score For Each Page In The Set Of Pages Based On The Computed Shortest Distances. The System Then Produces A Ranking For The Set Of Pages Based On The Ranking Scores For The Set Of Pages.”

“One Possible Variation Of PageRank That Would Reduce The Effect Of These Techniques Is To Select A Few “Trusted” Pages (Also Referred To As The Seed Pages) And Discovers Other Pages Which Are Likely To Be Good By Following The Links From The Trusted Pages. For Example, The Technique Can Use A Set Of High Quality Seed Pages (S.Sub.1,  S.Sub.2,  . . . ,  S.Sub.N),  And For Each Seed Page I=1,  2,  . . . ,  N, The System Can Iteratively Compute The PageRank Scores For The Set Of The Web Pages P Using The Formulae:

.A-Inverted..  Noteq..  Di-Elect Cons..  Function..  Times..  Fwdarw.. Times.. Function.. Times.. Function.. Fwdarw. ##EQU00002## Where R.Sub.I(S.Sub.I)=1, And W(Q.Fwdarw.P) Is An Optional Weight Given To The Link Q.Fwdarw.P Based On Its Properties (With The Default Weight Of 1).

Generally, It Is Desirable To Use A Large Number Of Seed Pages To Accommodate The Different Languages And A Wide Range Of Fields Which Are Contained In The Fast Growing Web Contents. Unfortunately, This Variation Of PageRank Requires Solving The Entire System For Each Seed Separately. Hence, As The Number Of Seed Pages Increases, The Complexity Of Computation Increases Linearly, Thereby Limiting The Number Of Seeds That Can Be Practically Used.

Hence, What Is Needed Is A Method And An Apparatus For Producing A Ranking For Pages On The Web Using A Large Number Of Diversified Seed Pages Without The Problems Of The Above-Described Techniques.”

Nguồn: Producing A Ranking For Pages Using Distances In A Web-Link Graph

 

Mô hình liên kết trang từ nguồn tới đích

 

Tóm lại: Như vậy bằng 1 cách nào đó, Google sẽ chọn ra 1 nhóm những trang mà nó tin tưởng và nó sẽ chấm điểm thủ công (Laevis tôi tạm gọi là Google Trust Page nhé, trong văn bản phát minh thì nó tên là Trust Page). Từ đó nó sẽ follow theo các đường links để đo khoảng cách các tầng links và gán điểm số cho chúng. Cuối cùng, việc chấm PageRank sẽ thu thập thêm những số liệu này như là 1 yếu tố điểm cộng hưởng cho PageRank và tất nhiên là SERP.

Thú vị quá phải không? Từ đây hoàn toàn có thể đoán được họ sẽ phát triển theo hướng nào. Chi tiết hơn về thuật toán có trong đường dẫn về phát minh đó, mọi người chịu khó đọc và tìm hiểu vì tôi cũng không viết chi tiết ra đâu. Chẳng may Google giận thì mệt lắm, he he. ? Nhưng ai tấp cho tôi cỡ chục chai bia thì có khi sẽ phọt ra đó.

Nhìn Về Hướng Phát Triển Của PageRank

Dựa vào thông tin phát minh này, có thể hình dung là những trang được liên kết layer gần nhất sẽ nhanh chóng được điểm số cao nhất. Việc chi tiền đăng báo cho các website làm SEO có lẽ sẽ là 1 phần khá quan trọng sau này. Rất có thể, ngay sau đó, những website ở layer gần nhất cũng sẽ được đưa vào danh sách GG Trust Page, tại sao không? Khi danh sách trust page của Google ngày 1 nhiều, rất có thể phát minh pagerank này sẽ chuyển hệ số chấm điểm cao hơn các thuật toán pagerank cũ và không loại trừ nó trở thành thuật toán PageRank chính thức.

Nếu như vậy, phương pháp tự xây dựng site vệ tinh sẽ gần như phá sản kể cả là bắn GSA :v

Và Chúng Ta Sẽ Phải Làm Gì?

Thực ra nãy giờ chỉ là những phỏng đoán. Phát minh trên đã được đăng ký sở hữu trí tuệ tư năm 2015, mãi bây giờ mới leak ra thôi. Cũng có nghĩa là mấy năm nay nó đã áp dụng mà chúng ta không biết. Thậm chí có lẽ nó đã có 1 thuật toán mới hơn đang chờ cấp bản quyền trí tuệ =)) Tuy chúng ta không bao giờ biết Google sẽ nâng cấp chúng như thế nào, nhưng hãy đặt mình vào hoàn cảnh: người viết ra công cụ tìm kiếm, điều bạn muốn là gì?

Chắc chắn là kết quả tìm kiếm phải đáp ứng đúng người dùng. Vì nếu công cụ tìm kiếm trả về kết quả tào lao, người dùng bỏ đi thì chính công cụ tìm kiếm đó sẽ trở nên mất uy tín. Và vị vậy, bạn sẽ tìm cách chặn những người nào tìm cách qua mặt bạn đúng không?

Bạn muốn ngủ ngon bất kỳ múi giờ nào, mùa nào trong năm kể cả có những phát minh mới thông minh hơn nữa? Câu trả lời sẽ vẫn luôn là phương pháp SEO mũ trắng. Và đó cũng là lựa chọn của tôi. Nhưng làm SEO mà không biết phương pháp mũ đen thì cũng chỉ mới biết phân nửa thôi, vì sao thì hãy tham khảo bài viết này: 2018: SEO Mũ Trắng Hay Mũ Đen?