Tuesday, May 14, 2013
Robots.txt cho nhiều tên miền
Như các bạn đã biết, các Doanh nghiệp thường hay mua nhiều tên miền cho website của họ. Ở đây tôi không thảo luận về lý do tại sao họ lại làm như vậy, nhưng thực tế rõ ràng là có rất nhiều tên miền trỏ về cùng 1 hosting (1 website có nhiều tên miền khác nhau).
Thế thì xét theo nguyên tắc của SEO, chúng ta sẽ có nhiều website và những website này trùng lặp nội dung.
Tôi được 1 số bạn đặt vấn đề cụ thể như sau:
- Họ có 3 domain: abc.com | def.com | xyz.com
- 3 domain này cùng 1 hosting
- Họ chọn abc.com là tên miền chính, họ không muốn spider index các URL xuất phát từ 2 tên miền còn lại
Oh, quá dễ, dùng robots.txt chặn (disallow) là xong
Nhưng khổ nỗi, robots.txt không phân biệt được tên miền, nên chúng ta không thể
- Disallow: /def.com
- Disallow: /zyz.com
Làm sao ?
Và đây là giải pháp. Chúng ta chuẩn bị 3 file robots.txt tương ứng cho từng tên miền và kiểm tra nếu request của user xuất phát từ tên miền nào thì “gọi” file robots.txt cho tên miền đó.
robots_abc.txt <– file robots.txt cho tên miền abc.com
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
robots_def.txt <– file robots.txt cho tên miền def.com
User-agent: *
Disallow: /
robots_xyz.txt <– file robots.txt cho tên miền xyz.com
Nhiệm vụ còn lại của chúng ta là viết lại đường dẫn file robots.txt tương ứng cho từng tên miền tại file .htaccess
RewriteCond %{HTTP_HOST} ^abc.com$ [NC]
RewriteRule ^robots\.txt$ robots_abc.txt [L]
RewriteCond %{HTTP_HOST} ^def.com$ [NC]
RewriteRule ^robots\.txt$ robots_def.txt [L]
RewriteCond %{HTTP_HOST} ^xyz.com$ [NC]
RewriteRule ^robots\.txt$ robots_xyz.txt [L]
Đến đây thì các bạn an tâm, spider chỉ có thể index như chỉ dẫn trong file robots_abc.txt, còn với những URL xuất phát từ tên miền def.com và xyz.com sẽ không bao giờ được index nên việc trùng lặp nội dung không thể xảy ra.
Trùng lập nội dung là một vấn đề rất thường xảy ra trong khi làm SEO. Hãy tận dụng tốt những thủ thuật này để chiến dịch SEO của bạn hiệu quả tốt nhất
Nguồn : Thủ Thuật SEO
Subscribe to:
Post Comments (Atom)
Popular Posts
-
Để quảng bá 1 thương hiệu, hay đơn giản là muốn nhắm đến đối tượng khách hàng thực sự chất của mình thì công việc quảng bá dịch vụ của các...
-
“Đã làm PR – Truyền thông là bước đầu bơi ra biển lớn, được nhiều người biết tới; nhưng cũng có thể bị ném đá, đánh hội đồng bất kì lúc nà...
-
Hotroseo.com - Link structure/architechture của 1 một website thường rất quan trọng đối với SEO bởi vì nó ảnh hưởng lớn tới các search eng...
-
Xin chào các bạn, Hôm nay mình sẽ chia sẻ một trong những bài quan trọng "Top 100 Web 2.0 PR Cao để làm site vệ tinh năm 2015" sẽ ...
-
Blogspot là gì thì không cần phải nói đúng không ? Có gì không hiểu cứ Google nhé. Nền tảng Blogspot chắc không còn xa lạ đối với thế giới...
-
SEO đang ngày một phát triển và trở nên quan trọng hơn, nhà nhà học SEO, người người làm SEO. Tuy nhiên xung quanh câu chuyện học và làm SEO...
-
Những nút MXH là một cách tuyệt vời nhất giúp mọi người dễ dàng kết nối với các trang MXH lớn. “Điều này sẽ giúp gì cho trang web của tôi?” ...
-
Google công bố áp dụng thuật toán tìm kiếm mới mang tên Hummingbird (Chim ruồi) cho Google Search, ảnh hưởng đến khoảng 90% các tìm kiếm trê...
-
Đã 8 năm trôi qua kể từ khi tuyên bố giữ trang chủ của Google Search “sạch” trước các Quảng cáo Banner . Thứ tư vừa qua Google đã công nhận ...
-
Website: Là một tập hợp các trang web (trang con) chứa đựng cácn nội dung khác nhau, nhằm thỏa mãn nhu cầu thông tin, tri thức, giải trí ...
No comments:
Post a Comment