QUAN TRỌNG

Tối ưu nền tảng WordPress

Để tối ưu nền tảng WordPress, bạn nên tập trung những mục sau:

  1. Tạo file robots.txt và khai báo sitemaps.
  2. Backup dữ liệu.
  3. Tối ưu tốc độ.
  4. Chống spam và tối ưu bảo mật.

P/S: Quang đã mua các gói theme & plugin WordPress chính hãng như Theme Junkie, My Themeshop, WP Rocket..., bạn có thể xem ở đây.

Xem thêm:

 

1. Tạo file robots.txt và sitemaps

Để tạo robots.txt và sitemaps trên WordPress, bạn có thể dùng Yoast SEO.

 

SITEMAP

Sau khi cài đặt, Yoast SEO sẽ tự động tạo sitemap cho trang web của bạn.

Để tìm đường dẫn sitemap, bạn vào Yoast SEO, phần General.

Sau đó, bạn chuyển qua tab Features, kéo xuống phần XML sitemaps, click vào dấu hỏi, chọn See the XML sitemap.

Bạn sẽ tìm được đường dẫn sitemap của mình, tương tự thế này:

https://quangsilic.com/sitemap_index.xml

 

ROBOTS.TXT

Bạn vào Yoast SEO, phần Tools, chọn File editor.

Ở khung robots.txt là nơi để bạn khai báo nội dung.

Với file robots.txt, bạn có thể chặn bọ độc hại, chặn bọ Ahrefs, chặn index thư mục nhạy cảm, xử lý trùng lặp nội dung…. Nội dung chi tiết, bạn có thể đọc bài viết Cách dùng file robots.txt.

Nếu là người mới bắt đầu, bạn có thể chọn cách khai báo đơn giản với hai mục đích sau:

  • Mở cổng cho các bot
  • Khai báo đường dẫn sitemap

Ví dụ như file robots.txt của blog Quang Silic như sau:

User-agent: *

Allow: https://quangsilic.com/sitemap_index.xml

File robots.txt của anh Hoàng, cũng có cấu trúc đơn giản như vậy. Bạn có thể xem tại đây.

 

Hiểu nhầm thường gặp

Một số bạn nạp khai báo vào robots.txt Tester trong GWT, sau đó bấm Submit Google, và nghĩ rằng mình đã tạo thành công file robots.txt.

Robots.txt Tester là thứ để kiểm tra cú pháp, không phải công cụ để tạo file robots.txt.

Để tạo file robots.txt, bạn có thể dùng Yoast SEO, hoặc tạo file robots.txt trực tiếp trên hosting.

Yoast SEO sẽ tự động tạo file robots.txt, như Quang nói ở trên. Bạn không phải làm.

Còn với mã nguồn không phải WordPress, bạn có thể phải tạo thủ công file robots.txt trên hosting. Bạn xem hướng dẫn ở đây nhé.

 

CHƠI NGU

Dưới đây là 3 cách để bạn chơi ngu:

Cách 1: Block Google bot trong file robots.txt

Bạn khai báo trong file robots.txt như sau:

User-agent: *

Disallow: /

Hiệu quả: Ngay lập tức. Nhưng các trang Google đã index, thì không bị ảnh hưởng.

 

Cách 2: Xóa URL trang chủ bằng Remove URLs trong GWT

Bạn chỉ cần dán tên miền trang chủ vào Remove URLs trong GWT, và submit Google.

Hiệu quả: Chết ngay, chỉ sau 2 – 3h đồng hồ, toàn bộ trang web.

 

Cách 3: Xóa data dữ liệu

Bạn vào cPanel / File Manager, thư mục public_html, và xóa toàn bộ nội dung trong đó.

Thời gian hiệu quả: 2 – 3 ngày sau khi tác động, hiệu quả lên toàn bộ trang web.

 

Khi nào bạn nên chơi ngu?

Khi bạn làm dịch vụ cho khách hàng.

Nhưng khi tới hạn trả tiền, khách hàng kì kèo õng ẹo.

Cách số 3 là hiệu quả nhất, vì vừa làm mất luôn data của khách hàng, và Google sẽ deindex toàn bộ trang web, vì nó không thể crawl bất kỳ dữ liệu nào trên trang web của bạn. Tuy nhiên, cách này cũng lộ liễu nhất, vì khi đó người dùng sẽ không truy cập được vào trang web, và khách hàng có thể sẽ phát hiện ra bạn là hung thủ.

Cách số 2 hiệu quả không kém, chết cực nhanh ( 2 – 3h đồng hồ sau là chết ngay) và kín đáo nhất. Người dùng vẫn vào trang web đọc bình thường, chỉ có điều toàn bộ trang web sẽ biến mất khỏi Google. Chết mà không biết lí do chính là đây.

Blog Quang Silic, đã hoàn toàn biến mất khỏi Google 

 

2. Backup dữ liệu

Để backup dữ liệu trên WordPress, bạn thường có ba cách:

  1. Backup tự động trên hosting
  2. Backup tự động bằng plugin
  3. Backup thủ công

Bạn nên dùng tối thiểu hai cách backup để bảo vệ sự an toàn cho dữ liệu của mình.

 

BACKUP TRÊN HOSTING

Để backup tự động trên hosting, bạn chỉ cần đăng ký sử dụng dịch vụ backup dữ liệu tự động của nhà cung cấp hosting.

Hiện tại, hầu hết các nhà cung cấp hosting lớn ở Việt Nam ( như AZDIGI, HostVN, Nhơn Hòa, Vhost.VN…) đều đã tích hợp việc backup dữ liệu tự động cho bạn, một cách miễn phí.

Riêng một số nhà cung cấp có thương hiệu lớn, họ sẽ tính tiền dịch vụ này, chứ không cho free.

Ví dụ như Mắt Bão có gói backup Linux Backup Pro, backup 2 ngày / lần, dung lượng 1.5 GB, 19.000 đồng / tháng.

Nếu bạn dùng VPS, hoặc thuê hosting ở nước ngoài (như HawkHost, A2Hosting, Digital Ocean, Vultr, …), bạn hãy luôn dùng dịch vụ backup dữ liệu tự động của họ.

Nếu miễn phí thì quá tốt. Còn nếu có phí, bạn cũng nên sử dụng, để bảo vệ chính bản thân mình.

Backup VPS tự động của Digital Ocean (và cả Vultr), 20% chi phí vận hành một Droplet. Đắt lòi, nhưng vẫn nên chơi.

 

BACKUP TỰ ĐỘNG BẰNG PLUGIN

Để backup tự động trên WordPress, bạn có thể dùng plugin.

Một số plugin backup dữ liệu tốt như: UpdraftPlus, BackWPUp, Duplicator, All-in-One WP Migration

Trước đây, Quang có dùng BackWPup. Nhưng BackWPup hay lỗi, và lưu mã nguồn trên DropBox. Tài khoản DropBox miễn phí chỉ được 2GB dữ liệu.

Sau này, Quang chuyển qua dùng UpdraftPlus. UpdraftPlus chia nhỏ dữ liệu để nén, nên ít lỗi hơn. Ngoài ra, nó cho phép kết nối với Google Drive, miễn phí 15GB dữ liệu.

Các bước đơn giản sẽ như sau:

  1. Cài plugin UpdraftPlus.
  2. Vào Tab Setting, chỉnh phần Files backup scheduleDatabase backup schedule từ Manual sang Weekly / Daily… Nếu trang web bạn tương đối nhỏ, chọn Weekly là vừa vặn.
  3. Kéo xuống, bạn chọn Google Drive, sao đó chọn Save. Sau đó, bạn bấm xác thực cho phép UpdraftPlus sao lưu dữ liệu vào Google Drive.

  1. Qua tab Current Status, bấm Backup Now.

Xong.

 

BACKUP THỦ CÔNG

Cách thứ ba là backup thủ công. Bạn có thể xem hướng dẫn của anh Thạch Phạm ở đây.

Theo kinh nghiệm của Quang, nếu là người mới bắt đầu, bạn nên ưu tiên backup tự động thay vì tự tay backup thủ công, vì thao tác hơi phức tạp.

Hơn nữa, nếu backup thủ công, bạn sẽ hay quên.

Tốt nhất là backup tự động, và cài đặt ngày cố định để phần mềm tự chạy.

 

CHUYỆN XƯA

Pha này lâu rồi, năm ngoái, 2017, và cũng là vào mùa hè nóng bức.

Bạn có thể xem thông tin tại đây.

Tóm tắt nội dung như sau:

Ngày đó, server Ten Ten bị sự cố, và làm mất dữ liệu khách hàng.

Ten Ten dùng bản backup để khôi phục dữ liệu, nhưng trong quá trình khôi phục lại xảy ra lỗi, và làm tạch luôn các bản backup này.

Kết quả cuối cùng: Dữ liệu của khách hàng bị mất trắng. Trong đó, có nhiều dữ liệu của khách hàng đã có từ 5 – 7 năm.

Ten Ten đã xin lỗi, và đền bù cho khách hàng.

Nhưng dữ liệu là vô giá.

Một số dữ liệu không thể khôi phục được + tốn nhiều thời gian và bực mình + Google sẽ deindex trang web trong thời gian khôi phục.

Một số bài học rút ra:

  1. Không bao giờ được tin tuyệt đối vào nhà cung cấp hosting.
  2. Nên tự backup dữ liệu thêm một bản, rồi lưu trên Google Drive / Dropbox / One Drive… hoặc download dữ liệu định kỳ về máy ( hàng tuần, hoặc hàng tháng).

 

3. Tối ưu tốc độ

Để tối ưu tốc độ trên WordPress, bạn có thể làm tối thiểu 3 điều sau:

  1. Nâng cấp hosting
  2. Dùng plugin tạo cache
  3. Nén ảnh

 

NÂNG CẤP HOSTING

Công việc này rất dễ, không liên quan nhiều tới kỹ thuật. Bạn chỉ cần bơm tiền là được.

Có ba gói hosting phổ biến hiện nay, đó là:

  • Gói số 1: 3 USD / tháng, tương ứng với 30 – 40 USD / năm.
  • Gói số 2: 4 USD / tháng, tương ứng với 40 – 50 USD / năm.
  • Gói số 3: 5 USD / tháng, tương ứng với 60 – 70 USD / năm.

Các gói hosting của Việt Nam, hay nước ngoài, đều có giá tương đương như nhau.

Bạn cứ nhân 1 USD = 22.000 đồng, là sẽ ra được số tiền Việt.

Nếu trang web của bạn dùng gói số 1 và chạy chậm, hãy nâng cấp lên gói số 2.

Nếu đang dùng số 2 mà chạy chậm, hãy nâng lên số 3.

Bạn  hãy nâng lên từ từ, và dừng lại ở gói mà mình cảm thấy hài lòng.

 

DÙNG PLUGIN TẠO CACHE
Hiện tại, có rất nhiều plugin tạo cache tốt như:

  • Miễn phí: LiteSpeed Cache, WP Super Cache, W3 Total Cache, WP Fastest Cache
  • Có phí: WP Rocket, Hummingbird

WP Rocket hiện tại được xem là plugin tạo cache tốt nhất cho WordPress.

Bạn có thể mua hàng chính hãng 39 USD /năm tại đây, hoặc mua chợ đen, 60k/năm (bên TheDevkit) hay 199k/năm (bên WP Căn Bản).

Quang gọi là chợ đen cho vui tai, chứ thực chất các bạn ấy là nhà phân phối lại. Mấy bạn đó mua hàng chính hãng, rồi bán lẻ lại để kiếm lời. Hợp pháp cả, vì có bản quyền GNU. Bạn cứ mua, không sao cả.

Nếu không có nhiều tiền, bạn có thể dùng plugin tạo cache miễn phí.

Bài viết này, Quang sẽ hướng dẫn bạn dùng Lite Speed Cache, là plugin tạo cache miễn phí tốt nhất hiện nay, theo trải nghiệm của Quang.

 

Nếu bạn là NewBie

Nếu là newbie, bạn chỉ cần cài đặt plugin Lite Speed Cache, rồi active nó là xong.

Mọi thứ còn lại, nhà sản xuất đã testing kỹ lưỡng mới ra được cách cấu hình hiệu quả và an toàn như thế.

Vậy là xong. Bạn giải quyết một vấn đề vô cùng phức tạp, chỉ với 30 giây.

Còn người khác nói gì, khuyên bạn thế nào, bạn cứ kệ họ. Hehe.

 

Nếu bạn là người có kinh nghiệm

Bạn vào Lite Speed Cache, và chuyển qua Tab Advanced View.

Sau đó, bạn chọn Tab [5] Optimze.

Đây là nơi để bạn cấu hình những phần quan trọng nhất.

Bạn có thể bật từ OFF sang ON những lựa chọn sau:

  1. CSS Minify
  2. Inline CSS Minify
  3. CSS HTTP/2 Push
  4. JS Minify
  5. Inline JS Minify
  6. JS HTTP/2 Push
  7. HTML Minify

Còn lại những mục sau, bạn nên thận trọng. Chúng bao gồm:

  1. CSS Combine
  2. JS Combine
  3. Load CSS Asynchronously
  4. Load JS Deferred
  5. Remove Comments

Những mục này, nếu bạn chuyển từ OFF sang ON, sẽ có hai điều xảy ra:

  1. Điểm số Google Speed Insight của bạn sẽ tăng.
  2. Giao diện của bạn có thể bị vỡ, nhất là khi bạn chọn CSS CombineJS Combine.

Nhà cung cấp đã cảnh báo bạn trước rồi nha

Nếu vẫn muốn dùng những tùy chọn nâng cao, bạn phải testing từng mục một.

Bật sang ON, sau đó xóa Cache, rồi dùng trình duyệt ẩn danh để kiểm tra trang web mình có điều gì bất thường không?

Nếu mọi thứ okie, nghĩa là tính năng đó an toàn.

Nếu bị vỡ giao diện, nghĩa là bạn không thể cố đấm ăn xôi được. Nên chuyển về OFF, để bảo toàn tính mạng.

Những mục khác nâng cao, bạn từ mò nhé.

 

NÉN ẢNH

Để nén ảnh trên WordPress, có hai cách chính, đó là dùng plugin nén ảnh, hoặc thao tác trực tiếp trên hosting.

 

Dùng plugin

Trên WordPress, có một số plugin nén ảnh nổi tiếng như: EWWW Image Optimizer, WP Smush, Imagify, TinyPNG, Kraken, ShortPixel

Cá nhân Quang chọn Imagify, bản trả phí, vì nó dễ sử dụng, nén ảnh tốt, và chi phí thấp.

Imagify, cũng như mọi plugin nén sảnh khác, có 3 chế độ nén ảnh, đó là:

  • Normal. Chất lượng ảnh giữ nguyên, dung lượng giảm một tí.
  • Aggressive. Chất lượng ảnh giảm một chút, bù lại dung lượng ảnh giảm đáng kể.
  • Ultra. Chất lượng ảnh giảm nhiều, bù lại dung lượng ảnh giảm tụt quần.

Nếu bạn làm về nhiếp ảnh, ảnh cưới, ảnh đồ ăn thức uống… cần chất lượng ảnh cao, hãy chọn Normal.

Nếu bạn quan trọng tốc độ lên trên hết, bạn có thể chọn Ultra, nhưng bạn sẽ trả giá là chất lượng ảnh sẽ giảm đi rất nhiều.

Nếu là người dùng bình thường, lựa chọn Aggressive là tốt nhất. Nó sẽ không làm giảm đi chất lượng ảnh quá đáng, và giảm đáng kể dung lượng ảnh (khoảng 30%).

Khi đăng ký tài khoản miễn phí, Imagify sẽ cho bạn 25 MB nén ảnh miễn phí / tháng.

Nếu muốn nén nhiều ảnh hơn, bạn có thể mua thêm dung lượng, nén được 1GB ảnh / tháng, giá 5 USD.

Nếu khó khăn kinh tế, bạn có thể dùng chung tài khoản với Quang.

Đây là tài khoản có thể nén 1GB ảnh / tháng.

API đăng nhập là 67059bfd5c1f69119ba0729dabfbde366da1b661

 

Thao tác trên Hosting

Tại sao bạn lại thao tác trên Hosting, trong khi đã có plugin nén ảnh tự động bằng WordPress?

Vì nén ảnh thủ công, luôn nhanh hơn nén ảnh bằng plugin.

Và nếu nén ảnh số lượng lớn, bạn phải tốn tiền mua API của plugin nén ảnh, trong khi nén ảnh trực tiếp trên hosting gần như là miễn phí.

Trên CPanel, bạn làm như sau:

  1. Vào File Manager.

  1. Vào public_html / wp-content / uploads / year. Đây chính là nơi chứa thư mục ảnh. Bạn vào đó, bạn download thư mục về.

Sau khi download thư mục ảnh về, bạn có thể nén ảnh như bình thường bằng các phần mềm nén ảnh.

Nếu muốn nén ảnh online, bạn có thể dùng TinyPNG. Họ cho phép bạn nén 20 tấm ảnh / lần nén, không giới hạn số lần nén trong ngày, và hoàn toàn miễn phí.

Nếu muốn dùng phần mềm offline, bạn có thể dùng phần mềm FILEminimizer Pictures  hoặc Caesium. Cũng miễn phí luôn.

Sau khi nén ảnh xong, bạn upload ảnh ngược lên thư mục, và cho phép ghi đè lên file ảnh ban đầu.

 

Một số thông tin thú vị

  1. Nếu WP Rocket được chấm 10 điểm, thì LiteSpeed Cache được 9.5 điểm. WP Rocket cao điểm hơn LiteSpeed Cache, vì WP Rocket là hàng trả phí, còn LiteSpeed Cache miễn phí. Người dùng có tâm lý cho rằng hàng trả phí có chất lượng tốt hơn hàng miễn phí, cho dù chúng đều có chất lượng tương đương nhau.
  2. Google Speed Insight là công cụ đo hiệu suất web (web performance), và không phải là công cụ đo tốc độ (speed) tốt nhất. WP RocketWPMudev cũng đồng ý với điều này. Muốn đo tốc độ chính xác hơn, bạn hãy dùng Pingdom, hoặc Chrome DevTool.
  3. Nếu bạn nén một tấm ảnh có dung lượng 50kB còn 49kB, chỉ để tăng Google Speed Insight từ 90 lên 95 điểm, thì bạn đang chạy theo điểm số một cách mù quáng.
  4. Đừng vội vã chuyển lên AMP, chỉ vì tốc độ load nhanh hơn và Google đang ưu tiên AMP trên mobile. Cứ 10 người chuyển lên AMP, thì đã có 9 người phải quay về phiên bản cũ, vì nó đem trải nghiệm người dùng quá tệ hại. Bạn có thể thử AMP, khi bạn, hoặc người hỗ trợ cho bạn, có kiến thức tốt về lập trình và thiết kế web chuyên nghiệp.

 

4. Chống spam và tối ưu bảo mật

 

CHỐNG SPAM

Để chống spam, bạn chỉ cần cài plugin chống spam.

Akismet hoặc Antispam Bee đều là lựa chọn tốt.

Quang chọn Antispam Bee, vì nó chống spam hiệu quả, dễ dùng, nhẹ, và không cần phải lấy API như Akismet. Chỉ cần cài đặt là xong, không cần điều chỉnh gì thêm là vừa đủ.

Bạn có biết, ai là người spam trang web bạn không?

Thông thường, đó chính là những người anh em đang làm SEO với bạn, đến từ khắp nơi trên thế giới.

Chỉ cần tiêu đề của bạn chứa từ khóa SEO tiếng Anh (như Travel VietNam, SEO Tutorial, SEO Google Map…), bạn sẽ tự động nhận được vô số những spam. Tiếng Anh có, tiếng Tàu có, tiếng Ả Rập có.

Họ sẽ dùng những phần mềm tự động như GSA Search Engine / Scrapbox / Senuke / RankerX… để spam vào trang web của bạn, với một mục đích duy nhất: lấy backlink.

 

TỐI ƯU BẢO MẬT

Để tối ưu bảo mật trên WordPress, Quang làm 3 điều sau:

  • Đặt password mạnh
  • Dùng plugin bảo mật
  • Luôn luôn backup dữ liệu

 

Đặt Password mạnh

Để đặt password mạnh, bạn có thể dùng trang web Secure Password Generator.

Nó sẽ sản sinh ra password mạnh, với những đặc điểm là chứa kí tự, số, in thường in hoa, và vô nghĩa. Bạn có thể chọn passord dài khoảng 16 kí tự là ổn.

Ví dụ như: 8V?*K_k9;e&hBU,q

Trên thực tế, bạn sẽ phải sử dụng rất nhiều tài khoản đăng nhập và mật khẩu trên nhiều nền tảng như: WP-Admin, CPanel, tên miền, Gmail, Facebook, PayPal, e-banking ngân hàng Vietcombank, Techcombank, Sacombank….

Do đó, bạn có thể lưu tất cả thông tin lại trong một file .txt, để dễ dàng truy cập mỗi khi cần. Khỏi phải nhớ, và chạy đi chạy lại.

 

Dùng plugin bảo mật

Một số plugin bảo mật tốt trên WordPress như: iTheme Security, Sucuri Security, WordFence, All In One WP Security & Firewall

Cá nhân Quang chọn Sucuri Security, vì nó miễn phí, nhẹ, và vừa đủ nhu cầu của Quang.

Các bước cấu hình như sau:

  1. Cài đặt plugin Sucuri Security.
  2. Vào Dashboard, chọn Generate API Key để tạo API.
  3. Qua mục Setting, Tab Hardening, bạn chọn Apply Hardening cho mọi mục, ngoại trừ mục Website Firewall Protection.

Bạn bật cho lên xanh hết nhé, trừ thằng Website Firewall Protection ra. Không phải nó lởm, mà có tiền bạn mới xài nó được

 

2h sáng, một chú cố tình đăng nhập nhưng thất bại. Vì username chính xác là e634fs323535, chứ không phải là admin

 

Luôn luôn backup dữ liệu

Cho dù bạn bảo mật tốt tới đâu, thì bạn vẫn chỉ là một con gà trong mắt hacker chuyên nghiệp.

Họ có thể lấy đi của bạn bất kì thứ gì, vào bất kì lúc nào, chỉ cần bạn sơ suất.

Họ lợi hại thế nào, bạn có thể hai đọc bài viết sau:

Do đó, Quang không bao giờ tin tuyệt đối vào sự bảo mật của hệ thống WordPress, cũng như bảo mật của nhà cung cấp hosting.

Quang luôn nghĩ tới trường hợp xấu nhất xảy ra, đó là khi trang web của mình bị hack.

Và thứ quý giá nhất mình sống chết mình phải giữ cho bằng được, đó chính là dữ liệu.

Nếu còn dữ liệu, mình vẫn còn có thể chuyển qua hosting khác, và bắt đầu lại mọi thứ từ đầu.

Và để bảo vệ dữ liệu, cách duy nhất, chính là backup dữ liệu tự động, và thường xuyên.

Chúc bạn thành công!

Xem thêm:

QUAN TRỌNG

Xác định và phân tích đối thủ SEO

SEO là một cuộc đấu đối kháng.

Để chiến thắng, bạn cần vượt qua được đối thủ.

Chứ không đơn thuần chỉ cần đạt được một cột mốc cố định nào đó.

Vì vậy, việc xác định và phân tích đối thủ SEO là một trong những phần quan trọng nhất.

Nó giúp bạn biết được mức độ cạnh tranh của thị trường.

Đồng thời giúp bạn tính toán được tương đối khối lượng công việc, thời gian, cũng như chi phí SEO.

Nếu thấy vừa sức, bạn có thể dồn lực tập trung đầu tư SEO.

Nếu thấy thị trường cạnh tranh đã quá khốc liệt, bạn có thể không cần đầu tư quá mạnh vào SEO để tránh lãng phí, hoặc chọn một kênh marketing khác hiệu quả hơn.

——-

Để phân tích đối thủ trong SEO, bạn có thể làm 3 bước sau:

  • Bước 1: Xác định đúng đối thủ
  • Bước 2: Phân tích đối thủ về mặt SEO
  • Bước 3: Phân tích đối thủ về mặt tổng thể

Trong bài viết này, Quang sẽ hướng dẫn bạn làm từng bước cụ thể.

Trong lĩnh vực SEO mảng Học & Luyện thi IELTS.

Let’s go!!!

Note: FILE DEMO, bạn xem Ở ĐÂY nhé.

 

Xem thêm:

 

1. Xác định đối thủ

Để xác định được tập đối thủ với độ chính xác cao, bạn có thể làm 3 bước sau:

  • Nghiên cứu từ khóa
  • Tìm tập đối thủ của từng từ khóa
  • Tổng hợp kết quả

 

Bước 1: Nghiên cứu từ khóa

Để xác định đối thủ SEO, bạn cần phải có trước bộ từ khóa.

Vì đối thủ trong SEO được xác định dựa vào bộ từ khóa bạn chọn.

Để nghiên cứu từ khóa, bạn cần một chút tư duy, cộng với sự hỗ trợ của các công cụ nghiên cứu từ khóa như Ahrefs, KeywordIOTool, Keyword Planner…

Sau khi làm xong, bạn sẽ có kết quả tương tự như hình.

Bộ từ khóa Luyện thi IELTS

 

Bước 2: Tìm đối thủ của từng từ khóa

Sau khi có bộ từ khóa, bạn bắt đầu đi tìm tập đối thủ cho mình.

Trước khi làm, bạn cần nhớ một nguyên tắc quan trọng sau đó là:

Mỗi từ khóa, sẽ có một tập đối thủ riêng.

Do đó, bạn cần tìm tập đối thủ của từng từ khóa một, rồi tổng hợp lại.

Bạn sẽ có kết quả chính xác nhất.

Để dễ hình dung, bạn có thể đi tìm tập đối thủ của 5 từ khóa sau:

  • luyện thi ielts
  • luyện thi ielts online
  • thi ielts
  • trung tâm luyện thi ielts
  • đăng ký thi ielts

Cách tìm rất đơn giản.

Bạn bật Chrome trình duyệt ẩn danh, sau đó bạn từ khóa vào.

Ví dụ, Quang cần tìm đối thủ của từ khóa luyện thi ielts, Google cho kết quả hiển thị sau.

Để dễ quản lý, bạn có thể dùng file Excel (bạn download TẠI ĐÂY ) để lưu lại kết quả.

Bạn nhập vào Excel đường dẫn URL + Domain TOP 10 đối thủ như bảng sau.

Vậy là xong!

Sau khi làm xong từ khóa luyện thi IELTS, bạn có thể làm thao tác tương tự với các từ khóa còn lại.

Kết quả sẽ như hình:

Danh sách URL, Domain TOP 10 đối thủ của các từ khóa luyện thi ielts, luyện thi ielts online, trung tâm luyện thi ielts

Trên dự án thực tế, Quang thường tìm đối thủ của khoảng 20 – 30 từ khóa có lượng tìm kiếm và CPC cao nhất, sau đó tổng hợp lại.

Vì sao lại chọn các từ khóa có lượng tìm kiếm cao và CPC cao?

Vì đó là những từ khóa có độ cạnh tranh cao nhất.

Khi tìm được đối thủ của từng từ khóa này, thì đó cũng là những đối thủ mạnh nhất trong lĩnh vực mà bạn đang SEO.

Để lọc được nhanh các từ khóa đó, bạn có thể dùng đồng thời hai chức năng:

  • Sort Volume Search từ cao xuống thấp.
  • Filter CPC cao hơn một giá trị nào đó (ví dụ như trong lĩnh vực này, Quang chọn CPC > 10.000 đồng).

Danh sách các từ khóa có độ cạnh tranh cao nhất

 

NOTE

Các bước trên, bạn có thể làm hoàn toàn thủ công.

Tuy nhiên nếu đã quen thao tác và muốn làm nhanh hơn, bạn có thể dùng hai công cụ sau:

  • SERPLAB, để tìm nhanh TOP 10 URL đối thủ của từng từ khóa.

Bạn nhập danh sách URL như hình trên, kết quả domain trả về như hình dưới

Các thao tác, bạn thử mò nhé.

 

Bước 3: Tổng hợp đối thủ

Sau khi xong bước 2, bạn sẽ chuyển qua bước tổng hợp đối thủ.

Thông thường, Quang sẽ đếm số lần xuất hiện domain của từng đối thủ trong TOP 10 URL kết quả.

Đối thủ nào xuất hiện càng nhiều lần, thì họ sẽ là đối thủ mạnh nhất của chúng ta.

Để đếm số lần xuất hiện, Quang dùng hàm COUNTIF trong Excel ( nếu chưa biết dùng, bạn xem thêm ở đây nhé).

Kết quả như hình.

Như vậy dựa vào số lần xuất hiện của từng đối thủ, bạn sẽ có được tập các đối thủ như:

  • ielts-fighter.com
  • britishcouncil.vn
  • ippeducation.vn
  • etest.edu.vn
  • idp.com
  • ktdcgroup.vn
  • wallstreetenglish.edu.vn
  • elingo.edu.vn
  • ieltstolinh.vn

Trong danh sách trên, Quang sẽ loại các trang báo chí (như vnexpress.net), nền tảng review (edu2review.com), trang tổng hợp (top10tphcm.com, toplist.vn) hay nền tảng dạy trực tuyến (unica.vn), vì họ không phải là đối thủ cạnh tranh trực tiếp.

 

2. Phân tích đối thủ

Để phân tích đối thủ, bạn nên phân tích dưới 2 góc độ:

  • Góc độ SEO, thiên nhiều về thực thi
  • Góc độ phân tích tổng thể, thiên nhiều về chiến lược

Thông thường là SEOer, bạn sẽ làm tốt ở góc độ đầu tiên.

Tuy nhiên để có cái nhìn tổng quát, bạn cần làm thêm góc độ thứ hai ( nhờ chị trưởng phòng marketing / sếp làm giùm).

 

2.1.Phân tích đối thủ SEO

Theo công bố của Google, họ dựa vào 3 yếu tố chính để xếp hạng vị trí từ khóa, đó là:

  • Nội dung (Content)
  • Liên kết (bao gồm Internal Link và Backlink)
  • RankBrain (trải nghiệm người dùng + … + ….)

Như vậy, bạn có thể phân tích 3 yếu tố trên của từng đối thủ.

Trong các yếu tố này, Quang thường sẽ phân tích Content và Backlink, vốn là hai yếu tố quan trọng và dễ đo lường nhất.

Với mỗi yếu tố, bạn cần phân tích hai thứ, đó là số lượngchất lượng.

Về chất lượng, bạn cần phân tích thủ công.

Về số lượng, bạn có thể dùng Ahrefs để lấy số liệu.

Quang sẽ hướng dẫn bạn cách lấy số liệu ngay dưới đây nhé.

Ngoài ra, bạn cũng cần xác định thêm về đội ngũ SEO, và thế mạnh của họ để bạn biết đường mà đánh đấm.

 

Số lượng

Về số lượng, bạn dùng Ahrefs để lấy các số liệu sau:

  • RefDomain, là số Domain trỏ về trang web
  • RefBacklink, là số Backlink trỏ về trang web
  • Organic Keywords, là số Keyword đứng TOP 100 theo dự đoán của Ahrefs
  • Organic Traffic, là Traffic tự nhiên theo dự đoán của Ahrefs
  • Số lượng bài viết, Quang thường lấy theo số lượng URL mà Ahrefs đo được (lấy ở mục Top Page)
  • Traffic Value, là giá trị của bộ từ khóa SEO

Để lấy số liệu, bạn chỉ cần dán domain của đối thủ vào Ahrefs.

Hầu hết các chỉ số đều hiện ra như trong hình số 1.

Riêng chỉ số về số lượng bài viết, bạn vào phần Top Page để lấy nhé (như hình số 2).

 IELTS Fighter, họ có khoảng 1777 bài viết

Sau khi có được các số liệu xong, bạn điền vào bảng Excel.

Sau đó bạn làm tương tự cho các đối thủ khác, và bạn sẽ có được kết quả như hình.

Bước tiếp theo, là bạn đánh giá số liệu.

Thông thường, Quang sẽ đánh giá mức độ đầu tư, và hiệu suất SEO của đối thủ.

Để đánh giá mức độ đầu tư, Quang dựa vào các chỉ số về RefDomainSố lượng bài viết.

Để đánh giá hiệu suất SEO của đối thủ, Quang dựa vào Traffic Value, KeywordsOrganic Traffic.

Bước này khá quan trọng và đau đầu.

Bạn làm cẩn thận nhé.

Chú ý nhỏ: Với idp.com, Quang chỉ lấy số liệu tại thị trường Việt Nam thôi nhé.

 

RefDomain

RefDomain là một trong những yếu tố quan trọng nhất để giúp bạn đánh giá độ cạnh tranh thị trường.  Vì RefDomain tác động trực tiếp tới PageRank, vốn là thuật toán xếp hạng lõi và có tầm ảnh hưởng nhất tới vị trí từ khóa của Google.

Theo kinh nghiệm của Quang, dựa vào số RefDomain trung bình, bạn có thể dự đoán được một phần mức độ cạnh tranh của thị trường. Cụ thể:

  • Nếu chỉ số RefDomain từ 30 – 50 Domain: thị trường có độ cạnh tranh thấp. Để SEO mảng này, bạn chỉ cần có kiến thức SEO ở mức cơ bản + cày cuốc tầm 4 – 5 tháng, bạn sẽ TOP 5 – 10.
  • Nếu chỉ số RefDomain từ 100 – 200 Domain: thị trường bắt đầu có sự cạnh tranh. Để SEO mảng này, bạn cần có kinh nghiệm thực tế (tầm 1 – 2 năm) + 1 ContentSEO hỗ trợ + cày cuốc tầm 6 – 9 tháng, bạn mới có cơ hội vào TOP 5 – TOP 10.
  • Nếu chỉ số RefDomain từ 300 – 400 Domain: thị trường có độ cạnh tranh cao. Bạn cần có tối thiểu 1 SEOer cứng ( 2 – 3 năm kinh nghiệm) + 1 SEOer hỗ trợ ( 6 tháng – 1 năm) + 1 ContentSEO nội bộ + vài bạn freelancer ContentSEO + cày cuốc từ 9 – 12 tháng để đạt được TOP 5 – TOP 10.

Nhìn thị trường này, bạn sẽ thấy đa phần các đối thủ có từ 350 – 500 RefDomain tại thời điểm hiện tại, nên đây là một thị trường có độ cạnh cao.

 

Số lượng bài viết

Bạn sẽ thấy, các đối thủ như idp.com, britishcouncil.vn, ielts-fighter.com, wallstreetenglish.edu.vn, luyenthiielts.com sở hữu một lượng ContentSEO khá lớn (trung bình khoảng hơn 1.000 bài viết).

Các đối thủ tiếp theo cũng lượng ContentSEO cũng tương đối lớn, dao động từ 300 – 400 bài viết.

Từ đó bạn rút ra được hai nhận xét:

  • Thị trường học và luyện thi IELTS có rất nhiều chủ đề để viết kéo traffic. Do đó, đầu tư mạnh vào số lượng và chất lượng ContentSEO, là một giải pháp bền vững và có hiệu quả lâu dài.
  • Nếu muốn cân bằng với đối thủ, bạn có thể cần đầu tư vào ContentSEO tầm 400 – 500 bài viết là hợp lý.

 

Hiệu quả SEO

Để đánh giá hiệu quả SEO, bạn có thể nhìn các chỉ số về Organic Keyword + Organic Traffic, và đặc biệt là Traffic Value.

Đầu tiên, bạn nên tìm hiểu cách Ahrefs định nghĩa các giá trị này như thế nào, để bạn không hiểu sai.

Xin mời bạn đọc qua bài viết Ahrefs’ SEO Metrics: What They Mean and How to Use Them trước.

Tiếp theo, Quang sẽ giải thích cụ thể nhé.

  • Organic Keywords, là số từ khóa ranking trong TOP 100. Ví dụ như ielts-fighter.com đang có 30.371 từ khóa ở TOP 100. Bạn càng có nhiều bài viết, bài viết càng đa dạng chủ đề thì thường chỉ số này càng cao. Tuy nhiên, chỉ số không nói lên được nhiều về hiệu suất SEO, vì nó không thống kê được số lượng từ khóa trong từng phân khúc TOP 3, TOP 10, TOP 30, TOP 50… Bạn thấy ielts-fighter.com có chỉ số Organic Keyword thấp hơn britishcouncil.vn ( 30k < 50k), nhưng hiệu suất SEO của ielts-fighter.com gần như gấp đôi britishcouncil.vn  ( Quang sẽ giải thích ngay phía sau).

 

  • Organic Traffic, là lượng truy cập vào trang web của bạn tính tương đối theo Ahrefs. Nếu bạn có càng nhiều từ khóa có lượng tìm kiếm cao + vị trí từ khóa cao, chỉ số này càng cao. Bạn sẽ thấy idp + ielts-fighter là TOP đầu (200k traffic), BC + WSE + IDP TOP 2 ( từ 80k – 130k traffic), còn lại là các đối thủ khác (dưới 20k traffic).

 

  • Traffic Value, là giá trị của các từ khóa SEO tính theo giá CPC. Hiểu nôm na, nếu bạn SEO được càng nhiều từ khóa có lượng tìm kiếm cao + vị trí từ khóa cao + CPC từ khóa cao, thì chỉ số này càng cao. Ielts-fighter vẫn là TOP 1 ( hơn 50.000 USD), tới IDP (tầm 30.000 USD), tới BC + WSE (tầm 20.000 USD), và cuối cùng là các đối thủ còn lại.

Trong các chỉ số này, theo Quang, Traffic Value là chỉ số thể hiện hiệu suất SEO tốt nhất.

Vì đối thủ có Traffic Value càng cao, nghĩa là họ đã ranking được rất nhiều từ khóa có mức độ cạnh tranh cao nhất (lượng search cao + chuyển đổi đơn hàng cao vì CPC cao).

Một số từ khóa ranking TOP 3 của IELTS Fighter

Cuối cùng, bạn có thể làm một bảng nhỏ nhỏ đánh giá lại về mức độ thương hiệu, nguồn lực tài chính, mức độ đầu tư và hiệu suất SEO của các đối thủ.

Những ý chính thôi là tạm ổn rồi, tương tự như bảng sau.

Đánh giá tổng quan các đối thủ

  • Đối thủ IDP và British Council. Thương hiệu mạnh + toàn cầu + đầu tư chiến dịch media + nguồn lực tài chính rất mạnh. Rất khó để bạn cạnh tranh trực tiếp với các đối thủ này.
  • Đối thủ Wall Street English. Thương hiệu mạnh và của nước ngoài + tài chính mạnh + có đầu tư SEO.
  • Đối thủ IELTS Fighter. Thuộc hệ thống IMAP (đơn vị sở hữu MSHoa TOEIC) + mức độ đầu tư SEO và hiệu suất đạt cực cao. Vô địch, vô địch, vô địch ))).
  • Đối thủ ACET, YOLA. Họ đã có thương hiệu mạnh + lâu đời, tuy nhiên đầu tư SEO chưa quá mạnh. Nếu họ sẵn sàng đầu tư SEO, họ sẽ trở thành một đối thủ rất mạnh trong tương lai.
  • Các đối thủ còn lại như IPP, KTDC, IELTS TỐ LINH. Họ có lượng Backlink khá khiêm tốn nhưng hiệu quả SEO cao (Traffic Value cao). Chứng tỏ họ có sẵn dàn PBN mạnh hậu thuẫn phía sau, hoặc chất lượng ContentSEO cao và đầu tư bài bản. Bạn cũng nên phân tích kỹ hơn để dò được nguồn lực của họ.

 

Chất lượng

Để phân tích chất lượng, bạn cần đánh giá thủ công.

Vì nó phức tạp hơn, phải đánh giá chi tiết, nên không thể chỉ dựa vào một vài chỉ số là đánh giá được.

Bạn cần vào từng bài viết một, ngồi đọc, soi từng link, rồi đánh giá lại theo kinh nghiệm của mình.

Đại khái là sẽ mất khá nhiều thời gian, nhưng vẫn rất có ích cho bạn.

Cụ thể, bạn vào đánh giá chất lượng nội dung bài viết của từng Landing Page SEO của đối thủ, hệ thống backlink, cũng như dò tìm đội ngũ và trường phái SEO của đối thủ đó.

 

ContentSEO

Để đánh giá chất lượng bài viết, bạn có thể vào Top Page của đối thủ, sắp xếp lại cột Value, và lọc ra những Landing Page là Page bán hàng hoặc trang có giá trị Value cao nhất để đánh giá.

Lọc lại cột Value để đánh giá chất lượng bài viết của đối thủ

Bài viết Trọn bộ tài liệu IELTS Simon (ielts-simon.com)

Bạn có thể đánh giá dựa vào một số tiêu chí như:

  • Nội dung có sự khác biệt không, về mặt từ ngữ lẫn ý tưởng?
  • Người viết là ai, họ có phải là chuyên gia trong ngành đó không, hay chỉ là một người viết có kiến thức cơ bản?
  • Văn phong của người viết thế nào, là trang trọng, hài hước, hay gần gũi tự nhiên?
  • Bài viết có chi tiết không, có hướng dẫn step-by-step không, có trả lời được thắc mắc có người dùng không?
  • Sự hỗ trợ về media có tốt không (hình ảnh có chất lượng tốt không, có bản quyền không, có video hỗ trợ không, chất lượng video như thế nào…) ?
  • Cách bố trí liên kết nội bộ có thỏa mãn hành vi tìm hiểu thông tin của người dùng, và thân thiện với Google hay không?
  • Website của họ có đẹp không, chạy nhanh không, dễ sử dụng hay không?
  • Và thêm các yếu tố khác…

 

BacklinkSEO

Đầu tiên, bạn xem thử đối thủ có những nguồn backlink mạnh hay không?

Đó thường là backlink từ báo chí, cơ quan chính phủ, trường đại học, PBN (nước ngoài / Việt Nam) và hệ thống vệ tinh. Cụ thể:

  • Có book bài PR trên báo không, như VNExpress, Dân Trí, Tuổi Trẻ, Kênh 14, 24H, Zing New, CafeF, Elle….. Nếu đối thủ book báo nhiều, thì ngân sách đầu tư marketing của họ sẽ tương đối lớn.

Nguồn backlink từ báo của WallStreetEnglish

  • Có mua textlink từ cơ quan chính phủ, các trường đại học không? Link dạng này khá mạnh, nhưng thường không thể tự có, mà chỉ có thể đi mua trả phí theo tháng J
  • Có hệ thống vệ tinh không, vệ tinh có traffic người dùng thật sự không, chất lượng bài viết trên vệ tinh có tốt không?

Vệ tinh của luyenthiielts.com (RES), trong đó có rất nhiều tên miền đẹp trùng từ khóa

  • Có PBN không, thông thường sẽ là PBN từ tên miền nước ngoài / tên miền Việt Nam được phục hồi, và backlink trỏ từ trong bài viết. Loại này bạn cần soi hơi kỹ mới thấy được.
  • Có mua link không, thường là backlink trong bài viết rải rác từ các domain nước ngoài ( chỉ tầm 2 – 3 link / domain), hoặc textlink của những trang Việt Nam cùng chủ đề có lượt traffic lớn.

Sau khi đánh giá tổng quan về backlink của đối thủ, bạn đặt câu hỏi là mình có thể có được những backlink tương tự như đối thủ không?

Và nếu có thì mình làm bằng cách nào?

Ví dụ như để có được backlink từ VNExpess, bạn cần có ngân sách để book báo.

Để có link từ forum, bạn có thể tự build.

Còn để có link từ vệ tinh chất lượng, bạn có thể đi mua tên miền trùng từ khóa / PBN, sau đó cần có nhân sự để xây dựng cho vệ tinh mạnh lên.

Cứ thế, cứ thế…

 

Đội ngũ và chiến lược SEO

Bước tiếp theo, bạn xác định xem nhân sự SEO bên đối thủ là ai.

Họ có nhân viên SEO nội bộ, hay là thuê dịch vụ SEO bên ngoài.

Và nếu thuê dịch vụ SEO bên ngoài, thì đó là đơn vị nào.

EILTS Tố Linh, tối ưu bởi South Edge Digital của Mr. Trí Dũng

Sau khi biết được đối thủ của mình là ai, bạn có thể dự đoán được năng lựcsở trường SEO của họ.

Có đơn vị cực mạnh về ContentSEO (như Vinalink), có bên chuyên chơi PBN (như GTVSEO), có bên chuyên mua tên miền trùng từ khóa rồi xây vệ sinh (hệ thống của Mr. Trần Ngọc Thùy), có bên chơi signal ( như của Mr. Hà Tuấn Khang), có bên chơi Social và Google Map (như Mr. Đình Tỉnh), có bên chơi Verify (như Mr. Trịnh Thành SEVA), có bên chơi marketing tổng thể, cũng có bên chuyên chơi blackhat dập đối thủ….

Khi đó, bạn nên tránh đối đầu trực tiếp trên những sở trường của họ, vì bạn sẽ không đủ năng lực.

Thay vào đó, bạn hãy tìm ra được ưu điểm của mình, và phát huy tối đa nguồn sức mạnh đó.

 

2.2. Phân tích đối thủ tổng thể

Cuối cùng, SEO cũng chỉ là một trong rất nhiều kênh để tiếp cận khách hàng.

Trước khi quyết định có đầu tư SEO hay không, bạn cần phân tích thị trường, khách hàng tiềm năng và phân tích đối thủ về mặt tổng thể trước.

Để làm điều đó, bạn cần một nền tảng về Marketing vững chắc.

Riêng về mặt phân tích đối thủ, bạn có thể dùng mô hình phân tích 6Ps.

Mục đích là tìm ra điểm mạnh / điểm yếu của từng đối thủ,  và đề xuất phương án hành động phù hợp để vượt trội hơn.

Phân tích 6Ps về sản phẩm kem đánh răng

Nếu bạn từng học bên nhóm ngành Kinh tế / Marketing / Quản trị kinh doanh, đây là kiến thức bạn từng đã được học hồi đại học.

Bạn có thể về xem lại phần này.

Còn nếu xuất thân là các nhóm ngành khác, bạn có thể tự tìm hiểu, hoặc đi học một số khóa về Marketing căn bản như:

Quang đã từng học khóa Handon Marketing của AIM Academy, và cảm thấy hài lòng với những gì mình học được.

Chúc bạn thành công!

 

 

QUAN TRỌNG

Cách tính PageRank

1. CÁCH TÍNH PAGERANK

PageRank là thuật toán cổ xưa và quan trọng nhất của Google.

PageRank được viết ra bởi chính Larry Page và Sergey Brin, cha đẻ của Google.

Nhờ sự ưu việt của PageRank, Google đã vượt mặt những đối thủ sừng sỏ như Yahoo và Bing, để trở thành search engine tốt nhất thế giới tính tới thời điểm hiện nay.

Sau này, Google đưa thêm yếu tố nội dung (Content) và trí tuệ nhân tạo (RankBrain), cùng với PageRank, để biến chúng trở thành bộ ba thuật toán xếp hạng lõi của Google.

Vậy trong ba yếu tố trên, yếu tố nào quan trọng nhất?

………………………

Qua bài viết này, Quang sẽ giúp bạn biết được cách tính PageRank bằng tay, và tính bằng Excel.

Nhờ vào hiểu được PageRank, bạn sẽ trả lời được những câu hỏi sau:

  • SILO là cấu trúc tốt. Nhưng nếu không thích SILO, bạn chọn cấu trúc khác được không?
  • Tại sao anh em lại đi spam link, đi tìm backlink chất lượng, và luôn hạn chế link out ở các trang quan trọng?
  • Nếu bạn bắn backlink về trang chủ / thư mục , thì trang chủ / thư mục đó sẽ trở thành trang mạnh nhất chứ?
  • Nếu muốn tối ưu trang chủ / thư mục / bài viết nào đó, thì bạn sẽ tạo liên kết nội bộ như thế nào?
  • Tại sao trên thanh Menu Header / Sitebar / Footer, lại hay là thư mục / bài viết chứa từ khóa chính xác?
  • Trước giờ các mô hình liên kết đều được tạo ra dựa trên sự suy luận định tính. Vậy có tính toán ra được thành số, để so sánh các mô hình liên kết với nhau được không?

Xin mời bạn đọc bài viết….

Xem thêm:

 

2. TÍNH PAGERANK TAY

Công thức PageRank, nếu viết đúng chuẩn, có dạng như sau:

Tuy nhiên, công thức này nhìn hơi khó hiểu.

Do đó, Quang sẽ viết lại dưới định dạng khác dễ hiểu hơn, kiểu như thời học Toán cấp 3, thì PageRank tính như sau:

PR(A) = (1-d) / N + d*PR(B)/C(B) + d*PR(C) / C(C) + d*PR(D) /C(D)+…

Trong đó:

  • d: hằng số Google quy định. Thông thường, d=0.85
  • PR(A), PR(B), PR(C), PR(D): PageRank lần lượt của A, B, C, D
  • C(A), C(B), C(C), C(D): số link out lần lượt của A, B, C, D

Ví dụ như hình vẽ:

Mô hình ban đầu

Khi tính PageRank bằng tay, bạn cần nhập giá trị khởi tạo, rồi tính lần lượt theo vòng lặp.

 

Bước 1: Khởi tạo

Ban đầu, bạn cho PageRank của hệ thống bằng bao nhiêu cũng được.

Vì qua quá trình lặp, kết quả sẽ tiến dần tới giá trị chính xác, và không phụ thuộc vào giá trị khởi tạo ban đầu.

Để cho dễ tính, Quang cho PageRank ban đầu của chúng bằng nhau, và đều bằng 1, tức là:

PR(A) = PR(B) = PR(C) = PR(D)=1

Giá trị PageRank sau bước khởi tạo

 

Bước 2: Vòng lặp đầu tiên

Quay lại với công thức tính PageRank:

PR(A) = (1-d)/N + d*PR(B)/C(B) + d*PR(C) / C(C) + d*PR(D) /C(D)

Trong đó, các giá trị vòng lặp 1 là:

  • d = 0.85
  • N = 4, vì hệ thống có 4 Page (A, B, C, D)
  • PR(A) = PR(B) = PR(C) = PR(D) = 1 (lấy từ bước khởi tạo đem xuống)
  • Page A có 2 link out (sang Page B và Page C), do đó C(A) = 2
  • Page B có 2 link out (sang Page A và Page C), do đó C(B) = 2
  • Page C có 1 link out (sang Page D), do đó C(C) = 1
  • Page D không có link out, do đó C(D) = 0

Khi đó, ta sẽ có:

  • PR(A). Page A chỉ được Page B trỏ tới. Khi đó:
    • PR(A) = (1 – d) / 4 + d*PR(B)/C(B) = (1 – 0.85) / 4 + 0.85 * 1 / 2 = 0.4625
  • PR(B). Page B chỉ được Page A trỏ tới. Khi đó:
    • PR(B) = (1 – d) / 4+ d*PR(A)/C(A) = (1 – 0.85) / 4 + 0.85 * 1 / 2 = 0.4625
  • PR(C). Page C được cả Page A và Page B trỏ tới. Khi đó:
    • PR (C) = (1 – d) /4 + d*PR(A)/C(A) + d*PR(B)/C(B) = (1 – 0.85) / 4 + 0.85 * 1 / 2 + 0.85 * 1 / 2= 0.8875
  • PR(D). Page D chỉ được Page C trỏ tới. Khi đó:
    • PR(B) = (1 – d) /4 + d*PR(C)/C(C) = (1 -0.85) / 4 + 0.85 * 1 / 1 = 0.8875

Như vậy, sau vòng lặp đầu tiên, giá trị PageRank của các trang như sau:

  • PR (A) = 0.4625
  • PR (B) = 0.4625
  • PR (C) = 0.8875
  • PR (D) = 0.8875

Bạn cứ tiếp tục tính như vậy.

Sau khoảng  20 – 40 vòng lặp, bạn sẽ có kết quả tương đối chính xác.

Dưới đây đây là kết quả sau 20 vòng lặp.

Kết quả PageRank sau 20 vòng lặp

Bạn nào trâu bò thì tính bằng tay cũng được.

Tuy nhiên, sẽ không ai vĩ đại thế.

Khi khối lượng tính toán quá lớn, bạn cần viết chương trình để tính tự động.

Bạn viết một lần thôi.

Sau đó muốn tính cái gì, bạn chỉ cần nhập số liệu đầu vào là chương trình sẽ chạy ra kết quả.

Nếu biết lập trình, bạn có thể viết mã C / C++ / Java để tính.

Nếu không, bạn có thể dùng Excel để tính.

Để đơn giản, Quang sẽ dùng Excel, vì nó phổ thông hơn.

 

3. TÍNH PAGERANK BẰNG EXCEL

PageRank được tính dựa trên các ma trận.

Để tính được kết quả cuối cùng, bạn cần tạo 3 ma trận, đó là:

  • Ma trận cạnh
  • Ma trận chuẩn hóa
  • Ma trận Google

Kết quả cuối cùng, bạn sẽ có một file Excel như sau:

File Excel cuối cùng sẽ như thế này

 

Bước 1: Tạo ma trận cạnh

Ma trận cạnh (hyperlink matrix) là ma trận thể hiện liên kết nội bộ giữa các Page.

Bạn nhìn vào mô hình bên dưới.

Mô hình ban đầu

Sơ đồ có 4 Page. Như vậy, bạn sẽ có một ma trận vuông 4 cạnh như sau:

Ma trận vuông 4 cạnh

Giá trị các ô trong ma trận là 0 hoặc 1, tùy vào có liên kết nội bộ hay không.

Nếu Page A có liên kết trỏ tới Page B, thì giá trị ô đó là 1, nếu không có liên kết thì giá trị bằng 0.

Ví dụ như giá trị hàng ngang của Page A sẽ như sau:

Các giá trị 0, 1 của ma trận cạnh

Vì Page A, có liên kết trỏ tới Page B và Page C.

Do đó,  giá trị các ô tương ứng tại cột B và C sẽ là 1, còn cột A và D sẽ là 0.

Bạn làm tương tự cho hàng ngang của các Page còn lại. Kết quả sẽ được như hình trên.

Cột C(X) để tính số link out tương ứng của mỗi Page. Chúng bằng tổng giá trị các ô hàng ngang.

Bạn dùng hàm SUM để cộng chúng lại nhé.

 

Bước 2: Tạo ma trận chuẩn hóa

Ma trận chuẩn hóa cũng là một ma trận vuông 4 cạnh.

Tên tiếng Anh của nó là stochastic matrix, nhưng Quang không biết dịch sang tiếng Việt nó nghĩa là gì, nên gọi lụi là ma trận chuẩn hóa.

Giá trị của từng ô, sẽ bằng chỉ số của ma trận cạnh (tính ở bước 1) chia cho cột C(X).

Cách tính giá trị các ô trong ma trận chuẩn hóa

Ví dụ như hàng ngang Page A.

Giá trị các ô tương ứng của cột Page A, B, C , D sẽ là:

  • 0 : 2 = 0
  • 1 : 2 = 0.5
  • 1 : 2 = 0.5
  • 0 : 2 = 0

Riêng hàng ngang Page D, vì C (D) = 0, nên phép chia vô nghiệm.

Khi đó, giá trị các ô của sẽ bằng 1: số cạnh ma trận.

Vì ma trận có 4 cạnh, nên giá trị tương ứng sẽ bằng 1 : 4 = 0.25.

 

Bước 3: Tạo tham số d

Tham số d thường là hằng số. Thông thường, Google lấy chỉ số này bằng 0.85.

Tham số d của Google, d = 0.85

Tại sao lại là 0.85 chứ không phải số khác?

Vì Larry Page và Sergey Brin đã tính, và được như thế.

Còn tính thế nào thì bạn hỏi mấy ổng nha, Quang tất nhiên là không biết rồi.

Hi mấy cu…

 

Bước 4: Ma trận Google

Ở bước này, công thức tính PageRank sẽ được nhồi vào từng ô.

Quay lại công thức PageRank:

PR(A) = (1-d) + d*PR(B)/C(B) + d*PR(C) / C(C) + d*PR(D) /C(D)

Giá trị của mỗi ô, khi đó sẽ bằng (1 – d) / số cạnh ma trận + d * giá trị của ô tương ứng trong ma trận chuẩn hóa.

Trong Excel, giá trị tại ô D17 sẽ là:

D17=(1-$C$14)/$F$14+$C$14*D9

Trong đó:

  • ô C14 là tham số d
  • F14 là số cạnh ma trận (bằng 4)
  • D9 là giá trị lấy từ ma trận chuẩn hóa của Page A

Nhập ma trận Google

 

Bước 5: Tính PageRank

Vì PageRank là phép tính lặp (iterations method) nên lặp càng nhiều, kết quả càng chính xác.

Theo kinh nghiệm của Quang, bạn có thể lặp 20 vòng là có kết quả tương đối chính xác.

Vòng lặp 0:

Đây chính là giá trị PageRank khởi tạo. Bạn nhập cho chúng đều bằng 1 nhé (như bước tính Excel bằng tay).

Nhập giá trị PageRank khởi tạo. PR(A)=PR(B)=PR(C)=PR(D) = 1

Vòng lặp 1:

Bạn cần nhân ma trận vòng lặp với ma trận Google lại nhau.

Giá trị PageRank của Page A, vòng lặp số 1 (ô số K4) sẽ như sau:

K4=MMULT(K3:N3,$D$17:$G$20)

Nhân hai ma trận với nhau. Sẽ có tới 90% các bạn sẽ phải xem video để biết cách nhân ma trận trong Excel cho đúng

Để biết cách nhân hai ma trận với nhau trong Excel, bạn xem qua video này nhé.

Bạn nên xem qua, vì thao tác nó hơi lạ. Bạn không tưởng tượng nổi đâu.

Sau đó, bạn kéo bảng Excel xuống tới vòng lặp 20, bạn sẽ có được kết quả như hình vẽ.

Kết quả PageRank ở vòng lặp số 20

Và đây là kết quả tính PageRank, sau khi loop 20 vòng:

Giá trị PageRank sau 20 vòng lặp

Như vậy, Page D sẽ có PageRank cao nhất, mặc dù Page C có nhiều liên kết trỏ tới hơn.

Lí do  là vì Page D, không có link out,  sức mạnh được hội tụ lại, nên PageRank của nó đạt giá trị cao nhất.

 

Bước 6: Testing

Sau khi tính xong, bạn cần testing để xem kết quả mình tính đúng hay sai.

Có 2 lỗi thường gặp:

  • Lỗi số 1, do bạn nhập sai ma trận cạnh. Mọi bước còn lại đều do Excel tính, riêng bước nhập ma trận cạnh ban đầu là bạn cần nhập tay. Quy tắc rất đơn giản. Có liên kết thì nhập 1, không có thì nhập 0 bạn nhé. Bước này bạn tự nhập, chứ máy móc không làm giùm được.
  • Lỗi số 2, do bạn xây dựng công thức bị sai. Nó có thể xảy ra nhiều nhất ở bước tạo ma trận chuẩn hóa và ma trận Google. Lí do vì bạn không quen thao tác trên Excel mà thôi.

Để kiểm soát được lỗi thường gặp số 2, bạn cần testing.

ma trận chuẩn hóama trận Google đều là một loại ma trận đặc biệt (Nó tên gì, Quang cũng chả nhớ nữa, trả thầy hết rồi).

Nó có tính chất là tổng các giá trị hàng ngang, LUÔN BẰNG 1.

Do đó, Quang tạo thêm một cột tên là Testing ở cuối mỗi ma trận trên.

Quang viết hàm SUM để cộng các giá trị hàng ngang lại.

Nếu tổng bằng 1 là đúng, khác 1 là sai.

Trong quá trình làm, Quang phải vẽ khá nhiều mô hình, tính đi tính lại, và tính sai là chuyện bình thường.

Rất may mắn là nhờ bước Testing này, mà Quang đã phát hiện được lỗi, và sửa được chúng.

Rất hữu ích.

Testing. Nếu giá trị ô Testing = 1 là đúng

File tính PageRank của ví dụ trên, bạn xem tại đây.

 

4. TÍNH PAGERANK CHO CÁC SƠ ĐỒ LIÊN KẾT

Dưới đây là một số mô hình liên kết thường gặp.

Màu xanh là Page có PageRank thấp nhất, màu đỏ là Page có PageRank cao nhất.

Nguyên tắc là bạn cứ vẽ mô hình liên kết mà bạn định xây dựng ra trước.

Sau đó, bạn dùng file Excel để tính PageRank cho toàn bộ hệ thống.

Bạn liên kết nội bộ sao cho, Page bạn muốn lên TOP, sẽ có PageRank cao nhất là được.

Quang có đính kèm file Excel tính PageRank cho mỗi mô hình.

Bạn chỉ cần vẽ lại sơ đồ, rồi nhập lại giá trị vào ma trận cạnh (nhập 0 hoặc 1).

File Excel sẽ tự động xuất ra kết quả chính xác cho bạn.

 

Mô hình 1: Tối ưu bài viết

Mô hình 1

Mô hình này, thư mục cha sẽ trỏ liên kết tới toàn bộ các bài viết con nằm trong nó.

Khi đó, các bài viết, sẽ là những trang mạnh nhất.

Vì chúng nằm dưới tầng dưới cùng, nên nhận được sức mạnh nhiều tầng trỏ về. Hơn nữa, chúng không có link out.

 

Mô hình 2: SILO 1

SILO 1

Mô hình này, các bài viết chỉ trỏ về nhau trong cùng một thư mục.

Bài viết cuối cùng trong thư mục này, sẽ trỏ liên kết nội bộ về bài viết trong thư mục khác.

Các trang thư mục sẽ mạnh nhất, vì nó nhận được nhiều liên kết nhất.

 

Mô hình 3: SILO 2

SILO 2.1

Mô hình này có giá trị thực tế hơn SILO 1.

Trang thư mục cha sẽ trỏ liên kết nội bộ tới toàn bộ các bài viết con. Và các bài viết, chỉ trỏ liên kết nội bộ tới các bài viết khác trong cùng thư mục.

Các trang mạnh nhất là các bài viết. Và các trang thư mục cha sẽ trở nên vô cùng yếu (PageRank = 0.19).

Một biến thể của nó sẽ như kết này. Và kết quả cũng tương tự.

SILO 2.2. Giá trị cũng không thay đổi gì so với SILO 2.1

 

Mô hình 4: SEO thư mục

Dưới đây là hai biến thể của chúng:

SEO thư mục 1

SEO thư mục 2

Nguyên tắc rất đơn giản.

Bạn muốn SEO cái gì, thì cứ trỏ liên kết nội bộ nhiều nhất tới nó, và hạn chế link out.

Hai hình trên, bạn sẽ thấy Quang dẫn liên kết nội bộ từ các bài viết và trang chủ về trang thư mục.

Trang thư mục vẫn link out về các bài viết (để người dùng dễ tìm đọc bài viết), nhưng sẽ không có link out về trang chủ.

Trang thư mục trong mô hình số 2 sẽ mạnh hơn mô hình số 1, vì nó nhận được nhiều liên kết nội bộ hơn.

 

Mô hình 5: SEO trang chủ

SEO trang chủ

Nguyên tắc cũng như trên. Bạn cứ nhồi liên kết nội bộ về trang chủ là được.

Trang chủ trong mô hình trên, nhận được liên kết từ cả trang thư mục, và cả một số bài viết.

Trên đây là các mô hình thường gặp.

Số mô hình là rất nhiều, Quang không thể làm hết, và cũng không thể test hết được xem cách liên kết nào là tốt nhất cho bạn.

Bạn tự vận động nhé.

Bạn thích liên kết kiểu gì, cứ vẽ ra, rồi dùng Excel để tính thử coi có ổn không, rồi sửa lại.

Toàn bộ các file Excel tính toán, bạn xem tại đây.

 

5. PAGERANK KHI CÓ BACKLINK

PageRank còn được dùng để tính toán khi có backlink bắn về.

Nếu bạn muốn SEO trang chủ, thì bạn chỉ cần bắn link về trang chủ.

Nếu bạn muốn SEO thư mục, bạn chỉ cần bắn link về thư mục.

Liệu điều đó có đúng không?

Quang cũng thắc mắc điều đó, và làm thử một bộ test.

Quang bắn một backlink A vào trang chủ của mô hình.

Đây là một backlink rất mạnh.

PageRank(A) = 20, còn cao hơn cả tổng PageRank của toàn bộ hệ thống hiện tại (PR = 13).

Và đây là kết quả:

Mô hình 1

SILO 1

SILO 2

SEO thư mục

SEO trang chủ

File Excel tính toán tại đây.

Như vậy, trong cả 5 trường hợp bắn backlink trực tiếp về trang chủ, chỉ có 2 trường hợp sẽ làm trang chủ trở thành trang có PageRank cao nhất.

Trong 2 trường hợp đó, có một cấu trúc (mô hình SEO trang chủ) đã được liên kết nội bộ để tối ưu trang chủ từ trước đó.

Nghĩa là, không phải bạn backlink về trang nào, thì trang đó sẽ có PageRank cao nhất.

Mà chính xác hơn, bạn cần tối ưu liên kết nội bộ TRƯỚC KHI bắn backlink về.

Nếu liên kết không tốt, bạn bắn backlink về trang A, sức mạnh sẽ được truyền qua trang B do tác dụng của liên kết nội bộ.

Thế là, bạn lên nhầm TOP.

 

6. TRÊN THỰC TẾ

Trên thực tế, việc điều phối liên kết nội bộ phức tạp hơn, vì còn yếu tố trải nghiệm người dùng, anchor text, và cả cấu trúc trang web. Việc lên mô hình dự đoán, đo lường để tối ưu, cũng khó hơn nhiều.

Tuy nhiên, nếu là người mới bắt đầu, Quang có một kinh nghiệm nhỏ có thể giúp bạn.

Đó là khi bạn muốn SEO cho bài viết / sản phẩm / danh mục / từ khóa nào, bạn hãy đưa chúng lên thanh Menu Header / Footer / Sitebar.

Những trang web bình thường không bao giờ đưa bài viết “ Nâng mũi S Line giá bao nhiêu” lên thanh menu. Trừ khi, họ đang SEO chính xác từ khóa đó

Vì đây là vị trí nhận được liên kết nội bộ nhiều nhất, một cách tự động.

Nghĩa là, bạn không cần phải chèn thêm liên kết nội bộ trong những bài viết khác để trỏ về nó nữa.

Bạn xem source code, là sẽ hiểu được điều này. Nếu dùng Chrome, bạn nhấn Ctrl + U là sẽ thấy được source.

Chúc bạn thành công!

 

Xem thêm:

 

Tham khảo:

  • Hướng dẫn Trình khởi động Tối ưu hóa Công cụ Tìm kiếm của Google, Google Inc (nên đọc). Xem tại đây.
  • The Anatomy of a Large-Scale Hypertextual Web Search Engine của Larry Page và Sergey Brin, đồng sáng lập Google. Xem tại đây.
  • Search Quality Evaluator Guidelines, Google Inc. Xem tại đây.
  • History of Google Algorithm Updates của Search Engine Journal. Xem tại đây.
  • Relevance vs. authority: Which link has more value? của Andrew Dennis. Xem tại đây.
  • Combating Web Spam with TrustRank của Zoltan Gyongyi, Hector Garcia-Molina và Jan Pedersenm, Stanford University and Yahoo! Inc. Xem tại đây.
  • Topic-Sensitive PageRank: A Context-Sensitive Ranking Algorithm for Web Search của Taher H. Haveliwala, Stanford University. Xem tại đây.

 

 

QUAN TRỌNG

Tác vụ thủ công

Audit Backlink là đánh giá chất lượng hệ thống backlink đang trỏ về trang web của bạn. Đây là công việc bạn phải làm mỗi khi bắt đầu dự án SEO mới và định kỳ mỗi tháng, cũng như khi từ khóa bị rớt hạng do ảnh hưởng tiêu cực của thuật toán Penguin hay dính án phạt tác vụ thủ công của Google.

Có lẽ, Quang sẽ không bao giờ phát triển được kỹ thuật audit backlink này, nếu như Quang không xử lý một tác vụ thủ công do tạo liên kết bất thường cho dự án của khách hàng.

Ngày trang web được Google xóa án phạt là ngày Quang có cảm giác như mình được trở về từ cõi chết. Rất mệt mỏi, nhưng Quang cũng đem về được cho mình những kinh nghiệm vô cùng quý giá. Hôm nay, Quang sẽ giới thiệu trọn vẹn quy trình đó tới bạn. Còn bạn áp dụng nó được thành công tới đâu là dựa vào tiềm năng của bạn.

Xem thêm:

 

AUDIT BACKLINK

Để Audit Backlink được tốt, bạn cần phải có dữ liệu. Đầu tiên, bạn hãy nạp tất cả các API mình có được vào URL Profiler,  và chọn các mục Domain Level Data nhiều nhất có thể. Bạn càng thu thập được nhiều thông tin thì việc ra quyết định càng chính xác.

 

Trang web độc hại

Bạn đăng ký Google Safe Browsing API, rồi gắn vào URL Profiler. Vì đây là dữ liệu của Google, nên kết quả là chính xác tuyệt đối. Các domain Malware and Phishing là những trang web thuộc loại độc hại nhất, bạn cần phải disavow nó ngay lập tức. Trung bình trong khoảng 500 domain trỏ về trang web, sẽ có khoảng từ 2 – 5 domain thuộc dạng này.

 

Trùng lặp địa chỉ IP và IP Class C

Ví dụ: 103.68.82.189 là địa chỉ IP, thì 103.68.82 là IP Class C. Nếu hai trang web có cùng địa chỉ IP thì gần như 100%, chúng thuộc cùng một hệ thống được xây dựng nên để thâu tóm PageRank (ngoại trừ một số ít trường hợp ngoại lệ). Còn nếu trùng lặp IP Class C, thì tỉ lệ này cũng lên tới 90%. Nếu bạn xây dựng hệ thống vệ tinh trên cùng một IP, thì người bình thường như Quang còn phát hiện được, huống chi là Google. Lọc các địa chỉ này hơi lâu, nên Quang có cách nhanh hơn để xác định chúng, đó là nhìn vào chỉ số Domains on IP Address. Nếu chỉ số này lớn hơn 1, nghĩa là trên địa chỉ IP đó có nhiều hơn một domain.

 

Google Index và Đuôi tên miền

Quang thường dùng SpinEditor để quét nhanh Google Index, và loại các domain có số lượng nội dung được Google Index quá thấp ( 100, 200 hoặc hơn tùy vào trường hợp). Các đuôi tên miền giá rẻ, mua tầm vài chục ngàn / năm như .xyz, .top, .club… cũng rất nguy hiểm, vì Google có hệ thống tự động bật cảnh báo spam cho những tên miền loại này.

 

Tín hiệu mạng xã hội và Thông tin đăng ký tên miền

Nếu một domain không hề có bất kỳ một tài khoản mạng xã hội nào, hoặc có tài khoản mạng xã hội nhưng sự tương tác (Social Shares) quá thấp đều đáng ngờ. Ngoài ra, các trang web giấu đi thông tin người đăng ký tên miền, và đặc biệt là email đăng ký tên miền của nhiều domain bị trùng lặp, thì đó chắc chắn là hệ thống được dựng lên bởi cùng một người.

 

Server country và Wayback machine

Nếu bạn phục vụ cho khách hàng từ Việt Nam, thì domain trỏ về từ các nước như Việt Nam, USA, Japan, Singapore… là chuyện bình thường. Nhưng nếu chúng đến từ China, Korea, Russia, Romania, Portugal, Brazil… hay một nước trời ơi nào đó mà đọc tên nước xong bạn cũng không biết nó nằm ở đâu trên bản đồ thế giới, thì tốt nhất, bạn hãy xếp chúng vào danh sách đáng ngờ. Ngoài ra, các tên miền không có dữ liệu trên Wayback Machine, hay mới được mua trong thời gian gần đây (như năm 2017, 2016…), bạn cần cẩn thận với chúng. Vì chúng có thể được tạo nên chỉ để xây dựng hệ thống, chứ không thật sự là một trang web được phát triển tự nhiên.

 

Site Type

Site Type nghĩa là loại trang web. Nếu trang web thuộc dạng Blog, CMS, Shopping, Social…, đó thường là những backlink tự nhiên. Còn nếu trang web thuộc loại Forum, Bookmarking, Profile, Signature, Footer, Sidebar, Comment, Trackback, Wiki… đó thường là backlink thuộc dạng đáng ngờ.

 

Đánh giá các chỉ số của Ahrefs, Majestic, Moz

Bạn cần điều chỉnh các chỉ số này sao cho phù hợp với quy mô trang web của bạn. Với các trang web nhỏ, Quang thường tạo bộ lọc phát hiện liên kết bất thường là: DA, CF < 10, DR < 15, TF < 5, Trust Ratio < 0.5. Nếu bạn xử lý trang web có quy mô lớn hơn, hãy nâng các chỉ số này lên, nhưng vẫn cần sự hài hòa giữa chúng.

 

Đánh giá chỉ số của Alexa và SEMRush

Tuy chỉ số của Alexa và SEMRush không chính xác bằng chỉ số của ba công cụ trên, nhưng nó cũng đáng để đánh giá. Quang thường gán nhãn bất thường các trang web không được Alexa và SEMRush cập nhật dữ liệu, hoặc vị trí xếp hạng Alexa hay số lượng từ khóa ở trong top 100 của SEMRush Keyword quá thấp.

Đánh giá Backlink

Quang dùng riêng chỉ số của Ahrefs để đánh giá backlink, vì Ahrefs là công cụ phân tích backlink chính xác nhất hiện nay. Quang đặt hai cột Ahrefs Backlinks và Ref Domains ở gần nhau, rồi sort Ahrefs Backlinks từ cao tới thấp và quan sát. Khi nhìn từ trên xuống dưới, nếu chỉ số Ahrefs BacklinksRef Domains đang cao, nhưng đột nhiên xuất hiện một domain có số lượng Ahrefs Backlinks cao mà Ref Domains lại thấp, thì đó là một domain bất thường. Ở đây không có một con số cụ thể để làm mốc cho bạn, mà chỉ có cách là bạn nhìn xuôi theo dòng chảy dữ liệu của chúng, rồi phát hiện các điểm dị thường. Bạn có thể tô màu các cột theo dạng Color Scales trong Exel để phát hiện nhanh chóng hơn.

 

Spam Core của MOZ

Đây là một trong những chỉ số tốt nhất của MOZ, và cũng là một trong những chỉ số đáng tin cậy nhất để bạn đánh giá độ spam của domain. Ahrefs và Majestic không có chỉ số tương tự như thế này, mà bạn phải lọc thủ công. Bộ phận R&D của MOZ, đứng đầu là Dr.Matt Peters đã thống kê dữ liệu lớn (500.000 domain) rồi so sánh tỉ lệ phần trăm với các domain nằm trong blacklist của Google, và đưa ra được 17 yếu tố có dấu hiệu spam. Moz khuyến cáo các domain có chỉ số Spam Core từ 5 / 17 trở lên là nguy hiểm. Còn theo kinh nghiệm thực tế của Quang, khi Spam Core từ 3 trở lên, chúng đã có dấu hiệu của sự bất thường. Với tài khoản Moz Pro bình thường, bạn không thể gắn API của Moz vào URL Profiler để lấy được chỉ số Spam Core này, mà bạn phải dán URL domain vào Open Site Explorer để lấy thủ công. Tuy nhiên, do bọ của MOZ ít khi cập nhật, dữ liệu lấy về không đủ, nên Quang thường phải mua thêm dữ liệu của bên thứ ba là My – Addr.

 

Penalty Risk trong SpyGlass

SpyGlass thuộc bộ PowerSuite của Link Assistant, chuyên dùng để phân tích backlink. Phiên bản mới nhất hiện nay dựa trên hơn 8 dấu hiệu (tuổi domain, incoming và outgoing links, PageRank, anchor text và keyword, IP…) để tính toán TỰ ĐỘNG mức độ spam của domain. Nếu chỉ số này trên 30% là ở mức cảnh báo, còn trên 70% là rất nguy hiểm. Với bản miễn phí, bạn chỉ xem được chỉ số, chứ không thể xuất file dữ liệu. Bạn có thể nhờ đàn anh đang dùng bản Spy Glass trả phí, quét domain rồi xuất file kết quả giùm bạn. Còn nếu không có ai giúp thì bạn có thể chụp ảnh màn hình, rồi dùng phần mềm convert hình ảnh sang file excel cũng được. Tuy nhiên, bạn lưu ý là backlink trong SpyGlass được mua từ bên thứ ba là WebMeUp, nên không có độ chính xác cao. Bạn có thể tổng hợp domain từ Ahrefs, sau đó thêm thủ công vào SpyGlass rồi quét để có kết quả chính xác hơn.

Cuối cùng, công cụ đánh giá chính xác nhất vẫn là con người. Bạn vào trang web tình nghi, sau đó xem nội dung trang web có nhất quán không, bài viết có văn phong tự nhiên do con người viết ra không, trang web có hình ảnh minh họa và có liên kết nội bộ không? Những yếu tố này chỉ có con người mới có thể đánh giá được, chứ công cụ thì thua. Tuy nhiên, do nguồn lực về con người luôn hạn chế và rất quý giá, nên bạn chỉ nên dùng nguồn lực này ở bước cuối cùng. Những bước đầu, bạn nên tập trung vào việc thu thập và phân tích số liệu sẽ hiệu quả hơn.

 

TỔNG HỢP DỮ LIỆU

Sau khi đánh giá được từng yếu tố xong, Quang cần tổng hợp các dữ liệu rời rạc lại để ra quyết định cuối cùng. Nhưng tổng hợp bằng cách nào, đồng thời, mỗi yếu tố lại có mức độ quan trọng khác nhau, mình không thể quy đồng tất cả.

Hãy quay về với ý tưởng xếp hạng của Google. Google dựa trên 200 yếu tố khác nhau. Họ đánh giá từng yếu tố xong, sau đó quy định mức độ quan trọng của từng yếu tố bằng các trọng số, rồi viết một giải thuật để tính toán cho ra kết quả cuối cùng. Quang biết được đây chính là thứ mình cần, nhưng cũng phải suy nghĩ mất 1 tuần mới có thể biến ý tưởng thành hiện thực.

Đó là đầu tiên, Quang GẮN NHÃN cho từng yếu tố, sau đó quy định mức độ bất tường của từng yếu tố qua ĐIỂM SỐ. Quang tạo ra 2 loại nhãn là Nguy hiểm và Bất thường. Nhãn Nguy hiểm gồm Malware (10 điểm), Spam Core Moz (Spam Core từ 3 tới 10 tương ứng từ 1 tới 8 điểm), Backlink Ahrefs (2 điểm), trùng lặp IP (2 điểm) và phần Kiểm tra của con người (3 điểm). Nhãn Bất thường gồm tất cả các yếu tố còn lại, 1 điểm cho từng yếu tố. Riêng với SEMRush, Quang chỉ cho 0.5 điểm, vì độ chính xác của nó không quá cao.

Khi đó, công việc tổng hợp các số liệu trở nên rất dễ dàng. Bạn đánh giá sự bất thường của từng yếu tố, rồi cho điểm chúng. Cuối cùng, bạn dùng hàm SUM để cộng các điểm số đó lại, thế là xong.

Bạn có thể tham khảo một file Audit Backlink tại đây: https://tinyurl.com/ybkjc5x4

 

TÁC VỤ THỦ CÔNG

Google có hơn 10 tác vụ thủ công, trong đó Tác vụ thủ công do liên kết bất thường là thường gặp và là một trong những loại nguy hiểm nhất. Có hai loại chính là Tác vụ thủ công toàn phần và Tác vụ thủ công từng phần. Quang xử lý loại thứ hai: Tác vụ thủ công từng phần.

Khi dính tác vụ thủ công, Google sẽ gửi email thông báo tới Google Search Console cho bạn. Sau đó, Google thêm một hệ số vào giải thuật xếp hạng của họ, và làm từ khóa của bạn rớt hạng một phần hay toàn bộ một cách chậm rãi và đều đặn, từ 20, 50 cho tới out khỏi Top 100. Chúng chỉ ngoi lên được, sau khi nhân viên Google gỡ bỏ hình phạt. Mọi nỗ lực viết thêm nội dung hay đi thêm backlink thời điểm này đều vô ích. Công việc của bạn là tìm và xóa đi các backlink bất thường, rồi nộp đơn xem xét lại tới Google.

Ngày nhận hung tin, Quang như một tờ giấy trắng. Con đường xử lý tác vụ thủ công như dài vô tận với vô số những nút kẹt, và không hề dễ dàng như Quang nghĩ lúc đầu. Quang phạm phải vô số sai lầm, và dưới đây là 3 lỗi thường gặp nhất.

 

3 NGỘ NHẬN

  • Không thu thập đủ dữ liệu. Vì Google Search Console không báo về đủ backlink cho bạn, nên bạn cần phải thu thập thêm dữ liệu từ các công cụ thứ ba. Bạn đừng nghĩ Ahrefs là thu thập đủ, vì cơ chế hoạt động của các con bọ là khác nhau. Có backlink chỉ Majestics mới thu thập được còn Ahrefs thì không, và cũng có backlink chỉ Google Search Console mới có báo, chứ không hề có trong các công cụ kia. Cách tốt nhất, là bạn tổng hợp backlink từ mọi nguồn bạn có thể, từ Ahrefs, Majestics, Moz Pro và Google Search Console.
  • Chỉ phân tích tầng domain, bỏ qua phần backlink. Lí do đơn giản, vì số lượng backlink nhiều gấp vài chục lần số lượng domain, nên bạn không thể xử lý thủ công được toàn bộ backlink này. Tuy nhiên, nếu chỉ phân tích domain, bạn đã bỏ qua tỉ lệ Doffolow / Nofollow, mật độ Anchor Text, vị trí Backlink… rất đặc trưng chỉ có trên backlink. Hơn nữa, Google xử lý hình phạt trên đơn vị backlink, chứ không phải đơn vị domain. Để giải quyết vấn đề này, bạn cần phải có một công cụ thu thập dữ liệu backlink đầy đủ và phân loại TỰ ĐỘNG chất lượng backlink. Hiện tại, Quang chỉ biết có duy nhất một công cụ miễn phí như thế: URL Profiler.
  • Disavow toàn bộ các backlink. Đây thường là giải pháp khi bạn đã bị đẩy vào con đường cùng. Làm cách này, chưa chắc Google đã tha cho bạn, đồng thời bạn disavow link thì chỉ tương đương với thêm thuộc tính nofollow cho liên kết, chứ backlink đó vẫn còn đấy, không hề bị mất đi. Và điều nguy hiểm nhất là khi bạn disavow toàn bộ backlink, bạn cũng cho đi luôn những backlink chất lượng mà mình từng rất vất vả mới lấy về được trong đống hỗn mang đó. Cách tốt nhất là bạn phải xác định chính xác backlink độc hại, rồi gỡ nó xuống (tự gỡ nếu backlink đó do mình đặt, hoặc gửi email tới webmaster nhờ họ gỡ giùm). Làm hết mọi cách rồi mà vẫn không gỡ được thì bạn mới dùng tới Google Disavow Tool.

Okie, vậy là xong phần tư tưởng. Tiếp theo, Quang sẽ nói tới phần quan trọng nhất, gồm các bước xử lý tác vụ thủ công. Nó gồm những bước chính sau: thu thập dữ liệu, phân tích backlink, thu thập thông tin liên lạc webmaster và nhờ họ giúp đỡ, tạo file disavow.txt và gửi yêu cầu xem xét lại cho Google.

 

Bước 1: Thu thập backlink

Đầu tiên, bạn dùng Ahrefs, Majestic, Moz Pro và Google Search Console để download toàn bộ các baclink về. Tuy nhiên, nếu số lượng backlink quá lớn, bạn nên xử lý các backlink còn sống trước (live backlink), backlink đã chết sau (dead link), vì trong tổng số toàn bộ backlink có rất nhiều backlink đã chết.

Khi download backlink về, bạn nên chọn định dạng file CSV, vì URL Profiler có chế độ nạp file CSV (chứ không hỗ trợ file Excel) và tự động loại bỏ các backlink bị trùng lặp.

Bước 2: Phân loại Anchor text

Mọi công cụ xử lý tác vụ thủ công chuyên nghiệp trên thế giới hiện nay đều phải có phần phân loại Anchor Text. Bạn cần phân loại thủ công chúng, rồi nạp vào URL Profiler cho nó xử lý. Trong URL Profiler, backlink được chia làm 3 loại: thương hiệu (Branded), anchort text là từ khóa chính xác + thương mại (Commercial) và anhor text chung chung (Generic). Đây là một dữ liệu nguồn bạn bắt buộc phải nạp vào cho URL Profiler.

Bước 3: Nạp Blacklist

Bạn chỉ cần check hai ô IP Address và Site Type ở phần Domain Level Data, để làm giảm thời gian thu thập dữ liệu, vì mỗi lần chạy phần mềm sẽ mất vài giờ cho tới cả ngày trời mới xong.

Sau đó, trong phần Blacklist, bạn nạp vào danh sách các domain bất thường mà bạn có được ở phần đầu tiên của bài viết. Mỗi backlink bạn phân tích sẽ thừa hưởng được kết quả từ tầng domain trả về, từ đó giúp bạn tiết kiệm được rất nhiều sức lực. Đây là một trong những bước quan trọng nhất của quá trình audit backlink.

Bước 4: Setup Connections và Link Analytics

Ở bước này, bạn cần điều chỉnh lại thông số cho URL Profiler, vì cài đặt mặc định của URL Profiler để phân tích DOMAIN, chứ không phải phân tích BACKLINK. Theo khuyến cáo của Patrick Hathaway, một trong hai người lập trình ra URL Profiler, bạn nên điều chỉnh Connect Timeout trong phần Connections tối thiểu là 40s, và Maximum Retries trong phần Link Analysis tối thiểu là 3. Quang thường chỉnh chúng lên 50s và 5 để tăng độ chính xác cho toàn bộ quá trình. Nếu bạn quên điều chỉnh bước này, URL Profiler sẽ không đủ thời gian xử lý, từ đó làm sai đi kết quả cuối cùng của cả vài chục ngàn backlink.

Bước 5: Chạy chương trình

Xong xuôi, bạn bấm nút cho phần mềm chạy. Trung bình, URL Profiler phân tích được khoảng 2.000 backlink / 1h. Nếu phải phân tích số lượng backlink quá lớn, tốt nhất là bạn nên cắm máy tính vào ban đêm rồi đi ngủ hoặc chạy trên máy ảo VPS. Bạn đừng nên chạy phần mềm vào ban ngày, vì nó chạy rất lâu, từ đó làm ảnh hưởng tới công việc và sinh hoạt hàng ngày của bạn.

Bước 6: Đánh giá backlink

Sau khi chạy xong xuôi, phần mềm sẽ báo kết quả cho bạn trong 1 file Exel khoảng 10 tab. Quang thường xóa hết chúng đi, và chỉ giữ lại kết quả trong TAB ALL. Trong tab này, hai thông tin quan trọng nhất chính là phần Link Scoring và Link Score Reason dùng để chú giải lí do phân loại backlink.

URL Profiler phân loại backlink của bạn thành các loại: None, Not Processed, Ignore, Optimized, Review, Low, Suspect, Unnatural và Blacklist. Bốn loại cuối cùng: Low (chất lượng thấp), Suspect (nghi ngờ), Unnatural (không tự nhiên) và Backlist là những loại nguy hiểm nhất. Bạn nên copy toàn bộ các backlink bất thường này sang một tab mới trong Excel để dễ xử lý.

Bước 7: Thu thập thông tin liên lạc của Webmaster

Ở bước này, bạn cần thu thập được thông tin liên lạc của tất cả webmaster có domain trỏ về trang web của bạn. Bạn dùng URL Profiler, rồi check các ô Social Accounts và Email Address. Nếu có tiền, bạn check ô Whois Emails để lấy thêm thông tin. Thực chất, bạn chỉ cần Email của webmaster là đủ. Tuy nhiên, bạn nên thu thập thêm thông tin về Social Accounts của họ, để nếu như bạn liên lạc với họ qua email không được, thì bạn cũng có thể liên lạc với họ qua mạng xã hội. Google muốn thế, nên bạn cứ làm thôi.

Sau khi thu thập email xong, bạn cần viết hàm VLOOKUP trong Excel để ráp thông tin email của các tên miền vào từng backlink một, để sau này khi gửi email đi, bạn không bị sót backlink.

Bước 8: Viết email tới Webmaster

Quang thường dùng Gmail để gửi thư, vì nó miễn phí và dễ sử dụng. Vì bạn có thể phải gửi cả trăm email có nội dung tương tự nhau tới nhiều người cùng một lúc, nên bạn cần tạo một mẫu email có sẵn (template) để gửi cho nhanh. Nếu gửi thủ công, bạn làm cả ngày trời chưa chắc xong. Bạn hãy dùng chức năng Canned Responses trong Gmail (Google để biết thêm chi tiết).

Bạn cần viết hai phiên bản, một bản tiếng Việt cho webmaster người Việt, một bản tiếng Anh cho webmaster người nước ngoài. Nội dung nên lịch sự, ngắn gọn và đi thẳng vào vấn đề. Bạn ghi rõ lý do bạn cần tới sự giúp đỡ của họ, danh sách các backlink bạn cần họ xóa giùm hoặc thêm thuộc tính nofollow (thường thì họ sẽ xóa luôn bài viết đó cho nhanh gọn). Và quan trọng nhất, bạn nên đính kèm thêm ảnh chụp màn hình thông báo tác vụ thủ công của Google tới trang web bạn, để họ thấy bạn thực sự cần tới sự giúp đỡ của họ. Thông thường, các bạn webmaster người Việt phản hồi nhanh chóng, nay gửi mai có reply, và hỗ trợ bạn nhiệt tình. Còn các bạn webmaster người nước ngoài thì Quang ít khi thấy phản hồi.

Bạn đợi tầm 2 – 3 ngày để họ phản hồi cho hết. Sau đó, bạn nhớ chụp ảnh màn hình TẤT CẢ những phản hồi của các webmaster, vì đây là một trong những bằng chứng quan trọng nhất để Google xóa án phạt cho bạn.

Bước 9: Xác nhận tình trạng của backlink

Quang tạo thêm một cột trong Exel, và đặt tên nó là Trạng thái. Bạn có thể phân loại backlink bất thường làm 3 loại: Loại backlink đã gỡ thành công, loại backlink đã liên hệ webmaster gỡ bỏ nhưng không gỡ được (vì bị họ vòi tiền hay webmaster không chịu giúp bạn…) và loại backlink mà bạn không thể thu thập được thông tin liên lạc với webmaster. Hai loại backlink cuối cùng, bạn có thể an tâm dissavow chúng.

Bước 10: Tạo file Disavow

Đầu tiên, Quang tạo hai cột trong Excel. Một cột là các domain trong danh sách domain blacklist, một cột là full URL các backlink bạn quyết định dissavow ở bước số 9. Các backlink đã ổn, bạn không phải sửa, nhưng bạn cần chèn thêm từ “domain:” trước các tên miền cho đúng định dạng của Google. Bạn có thể dùng hàm Concatenate trong Exel để là việc này.

Sau đó, bạn tạo một file dissavow.txt (không được tạo Word hay để nguyên file Excel nhé, vì Google không đọc được). Bạn copy danh sách các domain và baclink độc hại trên vào file, mỗi thằng một dòng. Cuối cùng, bạn lưu file dưới dạng mã UTF8 (đừng chọn ANSI, vì nó lỗi font), sau đó upload lên Google Disavow Tool.

 

Trùm cuối: Gửi thư cho Google

Cuối cùng, bạn cần viết yêu cầu xem xét lại rồi gửi cho Google qua Google Search Console. Phần này là cam go nhất. Nhân viên Google làm việc công minh, và đều là cao thủ, nên bạn đừng mong xin xỏ hay dùng thủ thuật qua mặt họ. Bạn có thể xử lý dữ liệu còn chưa được tốt lắm, nhưng trung thực vẫn là yếu tố quan trọng nhất.

Nếu không rành tiếng Anh, bạn cứ viết tiếng Việt, vẫn tốt như thường. Trong thư yêu cầu, bạn cần dự đoán về nguyên nhân bạn bị tác vụ thủ công, quá trình bạn thu thập và phân tích dữ liệu, liên lạc với các webmaster và sử dụng Google Dissavow Tool như biện pháp cuối cùng để từ chối backlink độc hại. Bạn có thể tham khảo mẫu sau:

“ Xin chào Google.

Tôi tên là Trần Ngọc Quang, là quản trị web của https://quangsilic.com/.

Ngày 28/09/2017, chúng tôi nhận được thông báo tác vụ thủ công do tạo liên kết bất thường từ Google.

Trước đây, chúng tôi đã từng thuê dịch vụ SEO để tối ưu hóa trang web cho chúng tôi. Họ đã dùng phần mềm GSA Search Engine Ranker và hệ thống PBN để tạo ra các liên kết bất thường nhằm thao túng PageRank. Chúng tôi đã vi phạm chính sách của Google, và hiện tại chúng tôi đang nỗ lực để giải quyết những sai lầm đó.

Chúng tôi đã thu thập dữ liệu từ Google Search Console, Ahrefs, Majestic và Moz. Chúng tôi lọc được 750 domain và 41.371 backlink trỏ về trang web của chúng tôi. Sau đó, chúng tôi dùng phần mềm URL Profiler để hỗ trợ việc đánh giá chất lượng backlink, đồng thời nhờ dịch vụ SEO cũ gỡ bỏ các liên kết bất thường mà họ đã từng tạo ra. Cuối cùng, sau khi liên hệ với các webmaster nhờ họ gỡ bỏ hoặc thêm thuộc tính nofollow cho các liên kết bất thường đó, chúng tôi đã disavow 81 domain độc hại và 2.720 backlink bất thường còn lại không thể gỡ bỏ.

Dữ liệu đánh giá chúng tôi đã upload lên Google Drive. Bạn có thể xem ở đây: (Bạn chèn link vào nhé!!!)

Trong file dữ liệu này gồm 9 tab:

  1. File Request Google.
  2. File Domain.
  3. File Đánh giá Domain.
  4. Phân loại Anchor Text.
  5. File Backlink.
  6. File Đánh giá Backlink.
  7. File Thông tin liên hệ webmaster.
  8. Ảnh chụp màn hình một số email mà chúng tôi đã gửi tới các webmaster và toàn bộ phản hồi của họ.
  9. File Disavow.txt

Chúng tôi đã làm mọi thứ có thể để loại trừ các liên kết bất thường theo hướng dẫn của Google Guideline và từ chối liên kết từ chúng. Chúng tôi hi vọng Google chấp nhận nỗ lực này của chúng tôi.

Trân Trọng.

Trần Ngọc Quang – quản trị web https://quangsilic.com/ “

 

ĐỢI CHỜ LÀ HẠNH PHÚC

Thời gian tối đa Google trả lời bạn là 1 tuần. Sau khi gửi yêu cầu xong, bạn nên ra chợ, mua trái cây đem về chưng bàn thờ. Nếu may mắn, sau 3 – 4 ngày, Google sẽ gửi email chấp nhận yêu cầu của bạn, và xóa án phạt tác vụ thủ công. Còn nếu đợi gần 1 tuần mà chưa thấy gì thì xác suất tạch là rất cao. Bạn hãy chuẩn bị tinh thần để làm lại mọi thứ từ đầu.

Bạn thất bại, là do bạn làm bị sót một trong những bước trên. Nguyên nhân thì vô số. Có thể bạn đã đánh giá sai chất lượng domain, bạn chưa thu thập đủ dữ liệu, bạn phân loại nhầm Anchor Text, bạn setup chưa đúng cấu hình cho URL Profiler, bạn điền sai định dạng file dissavow.txt…. Nếu làm lần đầu tiên, quá khó để bạn làm trôi chảy toàn bộ quy trình trên. Tuy nhiên, bạn hãy kiên trì làm lại. Bạn vừa làm, vừa phải tự hỏi vì sao mình lại làm bước này? Có cách nào làm nhanh và hiệu quả hơn không?… Có như vậy, bạn mới có thể hiểu được mình đã bỏ qua những bước gì, và khắc phục chúng.

Ngoài ra, nếu có đủ thời gian và nguồn lực, bạn có thể đánh giá thêm backlink nofollow và backlink đã chết, vì chúng tuy có thể không tạo ra án phạt tác vụ thủ công, nhưng vẫn có thể ảnh hưởng tới vị trí xếp hạng từ khóa của bạn về sau này. Với các ca khó và quá quan trọng, bạn cần viết thêm hàm Excel để tạo ra bộ lọc cao hơn trong bước 6: Phân tích backlink. Bạn phải tự-viết-hàm để xử lý thôi, vì dữ liệu rất lớn, bạn lọc thủ công không nổi đâu. Bạn cần phải đọc thêm tài liệu để hiểu về bản chất backlink, rồi tự viết hàm lọc theo ý muốn của mình. 3 tài liệu rất hay mà bạn nên đọc là:

  • Spam Score: Moz’s New Metric to Measure Penalization Risk của Moz.
  • Link Analysis | URL Profiler Knowledge Base.
  • Step By Step: Unnatural Links Manual Action Removal Guide, tổng hợp của Anamarija Barun.

Ngoài ra, bạn sẽ phải xử lý số liệu trên Excel rất nhiều. Hai điều bạn cần chú ý là:

  • Nên sort dữ liệu (Sort A to Z, Smallest to Largest) trước khi đánh giá, vì khi đó dữ liệu đã được Excel sắp xếp trước cho bạn.
  • Chắc chắn bạn phải dùng tới hàm VLOOKUP, vì bạn phải nối dữ liệu từ nhiều nguồn khác nhau. Ngày học tin học văn phòng, Quang nghĩ rằng đời mình sẽ chẳng bao giờ phải dùng tới mấy cái hàm vớ vẩn ấy. Nhưng Quang đã nhầm.

 

PHƯƠNG ÁN CUỐI CÙNG

Xử lý tác vụ thủ công do liên kết bất thường cũng căng thẳng và hồi hộp như đi xin Visa Mỹ. Tỉ lệ thành công ngay trong lần đầu tiên chỉ là từ 20 – 25%. Bản thân Quang mất 2 tháng trời ròng rã và gửi đơn tới lần thứ 4 mới được Google ân xá. Do đó, nếu thất bại trong lần thứ 2 hoặc thứ 3, bạn nên kiên trì, và làm các bước lại một cách thật cẩn thận, vì lỗi phần nhiều là do sai sót của bạn.

Tuy nhiên, nếu vượt quá lần thứ 4, bạn nên cân nhắc để ra quyết định. Nếu site mới, nhỏ, tốt nhất là bạn nên bỏ tên miền đã bị phạt, mua tên miền mới về, rồi ôm dữ liệu qua xây dựng lại từ đầu, xem như đây là bài học cho bạn vì tội cày link vô tội vạ, dùng PBN không che full và bắn GSA ngu. Nếu site đã quá lâu đời, lớn, quá quan trọng và gắn liền với tên thương hiệu, có thể bạn phải thuê dân SEO chuyên nghiệp về gỡ hoặc sử dụng các gói dịch vụ cao cấp của nước ngoài (như Link Detox, KerBoo, Link QuiDator, ReMoveem…..). Quyết định là do bạn chọn, tùy vào hoàn cảnh và mong muốn của từng người.

Đây là file Excel mà Quang đã từng gửi lên Google. Vì để bảo mật thông tin cho khách hàng, nên Quang đã chọn ngẫu nhiên một trang web khác để phân tích, nhưng ý tưởng vẫn trọn vẹn như trong bài viết trên. Mong bạn thông cảm.

Bạn có thể xem file đó tại đây:  https://tinyurl.com/yavkpj6o

Chúc bạn thành công!

 

QUAN TRỌNG

Tối ưu nền tảng WordPress

Để tối ưu nền tảng WordPress, bạn nên tập trung những mục sau:

  1. Tạo file robots.txt và khai báo sitemaps.
  2. Backup dữ liệu.
  3. Tối ưu tốc độ.
  4. Chống spam và tối ưu bảo mật.

 

1. Tạo file robots.txt và sitemaps

Để tạo robots.txt và sitemaps trên WordPress, bạn có thể dùng Yoast SEO.

 

SITEMAP

Sau khi cài đặt, Yoast SEO sẽ tự động tạo sitemap cho trang web của bạn.

Để tìm đường dẫn sitemap, bạn vào Yoast SEO, phần General.

Sau đó, bạn chuyển qua tab Features, kéo xuống phần XML sitemaps, click vào dấu hỏi, chọn See the XML sitemap.

Bạn sẽ tìm được đường dẫn sitemap của mình, tương tự thế này:

https://quangsilic.com/sitemap_index.xml

 

ROBOTS.TXT

Bạn vào Yoast SEO, phần Tools, chọn File editor.

Ở khung robots.txt là nơi để bạn khai báo nội dung.

Với file robots.txt, bạn có thể chặn bọ độc hại, chặn bọ Ahrefs, chặn index thư mục nhạy cảm, xử lý trùng lặp nội dung…. Nội dung chi tiết, bạn có thể đọc bài viết Cách dùng file robots.txt.

Nếu là người mới bắt đầu, bạn có thể chọn cách khai báo đơn giản với hai mục đích sau:

  • Mở cổng cho các bot
  • Khai báo đường dẫn sitemap

Ví dụ như file robots.txt của blog Quang Silic như sau:

User-agent: *

Allow: https://quangsilic.com/sitemap_index.xml

File robots.txt của anh Hoàng, cũng có cấu trúc đơn giản như vậy. Bạn có thể xem tại đây.

 

Hiểu nhầm thường gặp

Một số bạn nạp khai báo vào robots.txt Tester trong GWT, sau đó bấm Submit Google, và nghĩ rằng mình đã tạo thành công file robots.txt.

Robots.txt Tester là thứ để kiểm tra cú pháp, không phải công cụ để tạo file robots.txt.

Để tạo file robots.txt, bạn có thể dùng Yoast SEO, hoặc tạo file robots.txt trực tiếp trên hosting.

Yoast SEO sẽ tự động tạo file robots.txt, như Quang nói ở trên. Bạn không phải làm.

Còn với mã nguồn không phải WordPress, bạn có thể phải tạo thủ công file robots.txt trên hosting. Bạn xem hướng dẫn ở đây nhé.

 

CHƠI NGU

Dưới đây là 3 cách để bạn chơi ngu:

Cách 1: Block Google bot trong file robots.txt

Bạn khai báo trong file robots.txt như sau:

User-agent: *

Disallow: /

Hiệu quả: Ngay lập tức. Nhưng các trang Google đã index, thì không bị ảnh hưởng.

 

Cách 2: Xóa URL trang chủ bằng Remove URLs trong GWT

Bạn chỉ cần dán tên miền trang chủ vào Remove URLs trong GWT, và submit Google.

Hiệu quả: Chết ngay, chỉ sau 2 – 3h đồng hồ, toàn bộ trang web.

 

Cách 3: Xóa data dữ liệu

Bạn vào cPanel / File Manager, thư mục public_html, và xóa toàn bộ nội dung trong đó.

Thời gian hiệu quả: 2 – 3 ngày sau khi tác động, hiệu quả lên toàn bộ trang web.

 

Khi nào bạn nên chơi ngu?

Khi bạn làm dịch vụ cho khách hàng.

Nhưng khi tới hạn trả tiền, khách hàng kì kèo õng ẹo.

Cách số 3 là hiệu quả nhất, vì vừa làm mất luôn data của khách hàng, và Google sẽ deindex toàn bộ trang web, vì nó không thể crawl bất kỳ dữ liệu nào trên trang web của bạn. Tuy nhiên, cách này cũng lộ liễu nhất, vì khi đó người dùng sẽ không truy cập được vào trang web, và khách hàng có thể sẽ phát hiện ra bạn là hung thủ.

Cách số 2 hiệu quả không kém, chết cực nhanh ( 2 – 3h đồng hồ sau là chết ngay) và kín đáo nhất. Người dùng vẫn vào trang web đọc bình thường, chỉ có điều toàn bộ trang web sẽ biến mất khỏi Google. Chết mà không biết lí do chính là đây.

Blog Quang Silic, đã hoàn toàn biến mất khỏi Google 

 

2. Backup dữ liệu

Để backup dữ liệu trên WordPress, bạn thường có ba cách:

  1. Backup tự động trên hosting
  2. Backup tự động bằng plugin
  3. Backup thủ công

Bạn nên dùng tối thiểu hai cách backup để bảo vệ sự an toàn cho dữ liệu của mình.

 

BACKUP TRÊN HOSTING

Để backup tự động trên hosting, bạn chỉ cần đăng ký sử dụng dịch vụ backup dữ liệu tự động của nhà cung cấp hosting.

Hiện tại, hầu hết các nhà cung cấp hosting lớn ở Việt Nam ( như AZDIGI, HostVN, Nhơn Hòa, Vhost.VN…) đều đã tích hợp việc backup dữ liệu tự động cho bạn, một cách miễn phí.

Riêng một số nhà cung cấp có thương hiệu lớn, họ sẽ tính tiền dịch vụ này, chứ không cho free.

Ví dụ như Mắt Bão có gói backup Linux Backup Pro, backup 2 ngày / lần, dung lượng 1.5 GB, 19.000 đồng / tháng.

Nếu bạn dùng VPS, hoặc thuê hosting ở nước ngoài (như HawkHost, A2Hosting, Digital Ocean, Vultr, …), bạn hãy luôn dùng dịch vụ backup dữ liệu tự động của họ.

Nếu miễn phí thì quá tốt. Còn nếu có phí, bạn cũng nên sử dụng, để bảo vệ chính bản thân mình.

Backup VPS tự động của Digital Ocean (và cả Vultr), 20% chi phí vận hành một Droplet. Đắt lòi, nhưng vẫn nên chơi.

 

BACKUP TỰ ĐỘNG BẰNG PLUGIN

Để backup tự động trên WordPress, bạn có thể dùng plugin.

Một số plugin backup dữ liệu tốt như: UpdraftPlus, BackWPUp, Duplicator, All-in-One WP Migration

Trước đây, Quang có dùng BackWPup. Nhưng BackWPup hay lỗi, và lưu mã nguồn trên DropBox. Tài khoản DropBox miễn phí chỉ được 2GB dữ liệu.

Sau này, Quang chuyển qua dùng UpdraftPlus. UpdraftPlus chia nhỏ dữ liệu để nén, nên ít lỗi hơn. Ngoài ra, nó cho phép kết nối với Google Drive, miễn phí 15GB dữ liệu.

Các bước đơn giản sẽ như sau:

  1. Cài plugin UpdraftPlus.
  2. Vào Tab Setting, chỉnh phần Files backup scheduleDatabase backup schedule từ Manual sang Weekly / Daily… Nếu trang web bạn tương đối nhỏ, chọn Weekly là vừa vặn.
  3. Kéo xuống, bạn chọn Google Drive, sao đó chọn Save. Sau đó, bạn bấm xác thực cho phép UpdraftPlus sao lưu dữ liệu vào Google Drive.

  1. Qua tab Current Status, bấm Backup Now.

Xong.

 

BACKUP THỦ CÔNG

Cách thứ ba là backup thủ công. Bạn có thể xem hướng dẫn của anh Thạch Phạm ở đây.

Theo kinh nghiệm của Quang, nếu là người mới bắt đầu, bạn nên ưu tiên backup tự động thay vì tự tay backup thủ công, vì thao tác hơi phức tạp.

Hơn nữa, nếu backup thủ công, bạn sẽ hay quên.

Tốt nhất là backup tự động, và cài đặt ngày cố định để phần mềm tự chạy.

 

CHUYỆN XƯA

Pha này lâu rồi, năm ngoái, 2017, và cũng là vào mùa hè nóng bức.

Bạn có thể xem thông tin tại đây.

Tóm tắt nội dung như sau:

Ngày đó, server Ten Ten bị sự cố, và làm mất dữ liệu khách hàng.

Ten Ten dùng bản backup để khôi phục dữ liệu, nhưng trong quá trình khôi phục lại xảy ra lỗi, và làm tạch luôn các bản backup này.

Kết quả cuối cùng: Dữ liệu của khách hàng bị mất trắng. Trong đó, có nhiều dữ liệu của khách hàng đã có từ 5 – 7 năm.

Ten Ten đã xin lỗi, và đền bù cho khách hàng.

Nhưng dữ liệu là vô giá.

Một số dữ liệu không thể khôi phục được + tốn nhiều thời gian và bực mình + Google sẽ deindex trang web trong thời gian khôi phục.

Một số bài học rút ra:

  1. Không bao giờ được tin tuyệt đối vào nhà cung cấp hosting.
  2. Nên tự backup dữ liệu thêm một bản, rồi lưu trên Google Drive / Dropbox / One Drive… hoặc download dữ liệu định kỳ về máy ( hàng tuần, hoặc hàng tháng).

 

3. Tối ưu tốc độ

Để tối ưu tốc độ trên WordPress, bạn có thể làm tối thiểu 3 điều sau:

  1. Nâng cấp hosting
  2. Dùng plugin tạo cache
  3. Nén ảnh

 

NÂNG CẤP HOSTING

Công việc này rất dễ, không liên quan nhiều tới kỹ thuật. Bạn chỉ cần bơm tiền là được.

Có ba gói hosting phổ biến hiện nay, đó là:

  • Gói số 1: 3 USD / tháng, tương ứng với 30 – 40 USD / năm.
  • Gói số 2: 4 USD / tháng, tương ứng với 40 – 50 USD / năm.
  • Gói số 3: 5 USD / tháng, tương ứng với 60 – 70 USD / năm.

Các gói hosting của Việt Nam, hay nước ngoài, đều có giá tương đương như nhau.

Bạn cứ nhân 1 USD = 22.000 đồng, là sẽ ra được số tiền Việt.

Nếu trang web của bạn dùng gói số 1 và chạy chậm, hãy nâng cấp lên gói số 2.

Nếu đang dùng số 2 mà chạy chậm, hãy nâng lên số 3.

Bạn  hãy nâng lên từ từ, và dừng lại ở gói mà mình cảm thấy hài lòng.

 

DÙNG PLUGIN TẠO CACHE
Hiện tại, có rất nhiều plugin tạo cache tốt như:

  • Miễn phí: LiteSpeed Cache, WP Super Cache, W3 Total Cache, WP Fastest Cache
  • Có phí: WP Rocket, Hummingbird

WP Rocket hiện tại được xem là plugin tạo cache tốt nhất cho WordPress.

Bạn có thể mua hàng chính hãng 39 USD /năm tại đây, hoặc mua chợ đen, 60k/năm (bên TheDevkit) hay 199k/năm (bên WP Căn Bản).

Quang gọi là chợ đen cho vui tai, chứ thực chất các bạn ấy là nhà phân phối lại. Mấy bạn đó mua hàng chính hãng, rồi bán lẻ lại để kiếm lời. Hợp pháp cả, vì có bản quyền GNU. Bạn cứ mua, không sao cả.

Nếu không có nhiều tiền, bạn có thể dùng plugin tạo cache miễn phí.

Bài viết này, Quang sẽ hướng dẫn bạn dùng Lite Speed Cache, là plugin tạo cache miễn phí tốt nhất hiện nay, theo trải nghiệm của Quang.

 

Nếu bạn là NewBie

Nếu là newbie, bạn chỉ cần cài đặt plugin Lite Speed Cache, rồi active nó là xong.

Mọi thứ còn lại, nhà sản xuất đã testing kỹ lưỡng mới ra được cách cấu hình hiệu quả và an toàn như thế.

Vậy là xong. Bạn giải quyết một vấn đề vô cùng phức tạp, chỉ với 30 giây.

Còn người khác nói gì, khuyên bạn thế nào, bạn cứ kệ họ. Hehe.

 

Nếu bạn là người có kinh nghiệm

Bạn vào Lite Speed Cache, và chuyển qua Tab Advanced View.

Sau đó, bạn chọn Tab [5] Optimze.

Đây là nơi để bạn cấu hình những phần quan trọng nhất.

Bạn có thể bật từ OFF sang ON những lựa chọn sau:

  1. CSS Minify
  2. Inline CSS Minify
  3. CSS HTTP/2 Push
  4. JS Minify
  5. Inline JS Minify
  6. JS HTTP/2 Push
  7. HTML Minify

Còn lại những mục sau, bạn nên thận trọng. Chúng bao gồm:

  1. CSS Combine
  2. JS Combine
  3. Load CSS Asynchronously
  4. Load JS Deferred
  5. Remove Comments

Những mục này, nếu bạn chuyển từ OFF sang ON, sẽ có hai điều xảy ra:

  1. Điểm số Google Speed Insight của bạn sẽ tăng.
  2. Giao diện của bạn có thể bị vỡ, nhất là khi bạn chọn CSS CombineJS Combine.

Nhà cung cấp đã cảnh báo bạn trước rồi nha

Nếu vẫn muốn dùng những tùy chọn nâng cao, bạn phải testing từng mục một.

Bật sang ON, sau đó xóa Cache, rồi dùng trình duyệt ẩn danh để kiểm tra trang web mình có điều gì bất thường không?

Nếu mọi thứ okie, nghĩa là tính năng đó an toàn.

Nếu bị vỡ giao diện, nghĩa là bạn không thể cố đấm ăn xôi được. Nên chuyển về OFF, để bảo toàn tính mạng.

Những mục khác nâng cao, bạn từ mò nhé.

 

NÉN ẢNH

Để nén ảnh trên WordPress, có hai cách chính, đó là dùng plugin nén ảnh, hoặc thao tác trực tiếp trên hosting.

 

Dùng plugin

Trên WordPress, có một số plugin nén ảnh nổi tiếng như: EWWW Image Optimizer, WP Smush, Imagify, TinyPNG, Kraken, ShortPixel

Cá nhân Quang chọn Imagify, bản trả phí, vì nó dễ sử dụng, nén ảnh tốt, và chi phí thấp.

Imagify, cũng như mọi plugin nén sảnh khác, có 3 chế độ nén ảnh, đó là:

  • Normal. Chất lượng ảnh giữ nguyên, dung lượng giảm một tí.
  • Aggressive. Chất lượng ảnh giảm một chút, bù lại dung lượng ảnh giảm đáng kể.
  • Ultra. Chất lượng ảnh giảm nhiều, bù lại dung lượng ảnh giảm tụt quần.

Nếu bạn làm về nhiếp ảnh, ảnh cưới, ảnh đồ ăn thức uống… cần chất lượng ảnh cao, hãy chọn Normal.

Nếu bạn quan trọng tốc độ lên trên hết, bạn có thể chọn Ultra, nhưng bạn sẽ trả giá là chất lượng ảnh sẽ giảm đi rất nhiều.

Nếu là người dùng bình thường, lựa chọn Aggressive là tốt nhất. Nó sẽ không làm giảm đi chất lượng ảnh quá đáng, và giảm đáng kể dung lượng ảnh (khoảng 30%).

Khi đăng ký tài khoản miễn phí, Imagify sẽ cho bạn 25 MB nén ảnh miễn phí / tháng.

Nếu muốn nén nhiều ảnh hơn, bạn có thể mua thêm dung lượng, nén được 1GB ảnh / tháng, giá 5 USD.

Nếu khó khăn kinh tế, bạn có thể dùng chung tài khoản với Quang.

Đây là tài khoản có thể nén 1GB ảnh / tháng.

API đăng nhập là 67059bfd5c1f69119ba0729dabfbde366da1b661

 

Thao tác trên Hosting

Tại sao bạn lại thao tác trên Hosting, trong khi đã có plugin nén ảnh tự động bằng WordPress?

Vì nén ảnh thủ công, luôn nhanh hơn nén ảnh bằng plugin.

Và nếu nén ảnh số lượng lớn, bạn phải tốn tiền mua API của plugin nén ảnh, trong khi nén ảnh trực tiếp trên hosting gần như là miễn phí.

Trên CPanel, bạn làm như sau:

  1. Vào File Manager.

  1. Vào public_html / wp-content / uploads / year. Đây chính là nơi chứa thư mục ảnh. Bạn vào đó, bạn download thư mục về.

Sau khi download thư mục ảnh về, bạn có thể nén ảnh như bình thường bằng các phần mềm nén ảnh.

Nếu muốn nén ảnh online, bạn có thể dùng TinyPNG. Họ cho phép bạn nén 20 tấm ảnh / lần nén, không giới hạn số lần nén trong ngày, và hoàn toàn miễn phí.

Nếu muốn dùng phần mềm offline, bạn có thể dùng phần mềm FILEminimizer Pictures  hoặc Caesium. Cũng miễn phí luôn.

Sau khi nén ảnh xong, bạn upload ảnh ngược lên thư mục, và cho phép ghi đè lên file ảnh ban đầu.

 

Một số thông tin thú vị

  1. Nếu WP Rocket được chấm 10 điểm, thì LiteSpeed Cache được 9.5 điểm. WP Rocket cao điểm hơn LiteSpeed Cache, vì WP Rocket là hàng trả phí, còn LiteSpeed Cache miễn phí. Người dùng có tâm lý cho rằng hàng trả phí có chất lượng tốt hơn hàng miễn phí, cho dù chúng đều có chất lượng tương đương nhau.
  2. Google Speed Insight là công cụ đo hiệu suất web (web performance), và không phải là công cụ đo tốc độ (speed) tốt nhất. WP RocketWPMudev cũng đồng ý với điều này. Muốn đo tốc độ chính xác hơn, bạn hãy dùng Pingdom, hoặc Chrome DevTool.
  3. Nếu bạn nén một tấm ảnh có dung lượng 50kB còn 49kB, chỉ để tăng Google Speed Insight từ 90 lên 95 điểm, thì bạn đang chạy theo điểm số một cách mù quáng.
  4. Đừng vội vã chuyển lên AMP, chỉ vì tốc độ load nhanh hơn và Google đang ưu tiên AMP trên mobile. Cứ 10 người chuyển lên AMP, thì đã có 9 người phải quay về phiên bản cũ, vì nó đem trải nghiệm người dùng quá tệ hại. Bạn có thể thử AMP, khi bạn, hoặc người hỗ trợ cho bạn, có kiến thức tốt về lập trình và thiết kế web chuyên nghiệp.

 

4. Chống spam và tối ưu bảo mật

 

CHỐNG SPAM

Để chống spam, bạn chỉ cần cài plugin chống spam.

Akismet hoặc Antispam Bee đều là lựa chọn tốt.

Quang chọn Antispam Bee, vì nó chống spam hiệu quả, dễ dùng, nhẹ, và không cần phải lấy API như Akismet. Chỉ cần cài đặt là xong, không cần điều chỉnh gì thêm là vừa đủ.

Bạn có biết, ai là người spam trang web bạn không?

Thông thường, đó chính là những người anh em đang làm SEO với bạn, đến từ khắp nơi trên thế giới.

Chỉ cần tiêu đề của bạn chứa từ khóa SEO tiếng Anh (như Travel VietNam, SEO Tutorial, SEO Google Map…), bạn sẽ tự động nhận được vô số những spam. Tiếng Anh có, tiếng Tàu có, tiếng Ả Rập có.

Họ sẽ dùng những phần mềm tự động như GSA Search Engine / Scrapbox / Senuke / RankerX… để spam vào trang web của bạn, với một mục đích duy nhất: lấy backlink.

 

TỐI ƯU BẢO MẬT

Để tối ưu bảo mật trên WordPress, Quang làm 3 điều sau:

  • Đặt password mạnh
  • Dùng plugin bảo mật
  • Luôn luôn backup dữ liệu

 

Đặt Password mạnh

Để đặt password mạnh, bạn có thể dùng trang web Secure Password Generator.

Nó sẽ sản sinh ra password mạnh, với những đặc điểm là chứa kí tự, số, in thường in hoa, và vô nghĩa. Bạn có thể chọn passord dài khoảng 16 kí tự là ổn.

Ví dụ như: 8V?*K_k9;e&hBU,q

Trên thực tế, bạn sẽ phải sử dụng rất nhiều tài khoản đăng nhập và mật khẩu trên nhiều nền tảng như: WP-Admin, CPanel, tên miền, Gmail, Facebook, PayPal, e-banking ngân hàng Vietcombank, Techcombank, Sacombank….

Do đó, bạn có thể lưu tất cả thông tin lại trong một file .txt, để dễ dàng truy cập mỗi khi cần. Khỏi phải nhớ, và chạy đi chạy lại.

 

Dùng plugin bảo mật

Một số plugin bảo mật tốt trên WordPress như: iTheme Security, Sucuri Security, WordFence, All In One WP Security & Firewall

Cá nhân Quang chọn Sucuri Security, vì nó miễn phí, nhẹ, và vừa đủ nhu cầu của Quang.

Các bước cấu hình như sau:

  1. Cài đặt plugin Sucuri Security.
  2. Vào Dashboard, chọn Generate API Key để tạo API.
  3. Qua mục Setting, Tab Hardening, bạn chọn Apply Hardening cho mọi mục, ngoại trừ mục Website Firewall Protection.

Bạn bật cho lên xanh hết nhé, trừ thằng Website Firewall Protection ra. Không phải nó lởm, mà có tiền bạn mới xài nó được

 

2h sáng, một chú cố tình đăng nhập nhưng thất bại. Vì username chính xác là e634fs323535, chứ không phải là admin

 

Luôn luôn backup dữ liệu

Cho dù bạn bảo mật tốt tới đâu, thì bạn vẫn chỉ là một con gà trong mắt hacker chuyên nghiệp.

Họ có thể lấy đi của bạn bất kì thứ gì, vào bất kì lúc nào, chỉ cần bạn sơ suất.

Họ lợi hại thế nào, bạn có thể hai đọc bài viết sau:

Do đó, Quang không bao giờ tin tuyệt đối vào sự bảo mật của hệ thống WordPress, cũng như bảo mật của nhà cung cấp hosting.

Quang luôn nghĩ tới trường hợp xấu nhất xảy ra, đó là khi trang web của mình bị hack.

Và thứ quý giá nhất mình sống chết mình phải giữ cho bằng được, đó chính là dữ liệu.

Nếu còn dữ liệu, mình vẫn còn có thể chuyển qua hosting khác, và bắt đầu lại mọi thứ từ đầu.

Và để bảo vệ dữ liệu, cách duy nhất, chính là backup dữ liệu tự động, và thường xuyên.

Chúc bạn thành công!

Xem thêm: