kế hoạch có con

Drupal SEO – Vấn đề vẫn là trung lặp nội dung (duplicate content)

Nói đến Drupal, một số có thể cho rằng nó quá phức tạp để phát triển website vì lý do những thuật ngữ được sử dụng trong drupal khác rất nhiều so với joomla và wordpress. Nhưng có 1 điều chúng ta phải thừa nhận rằng, trong thế giới SEO thì drupal sẻ là 1 lựa chọn hoàn hảo nhất cho việc phát triển webstie mã nguồn mở. Ngoài một bộ sườn uyển chuyển, drupal còn hỗ trợ rất tốt heading tag, tagling keyword là đặc biệt là url sef.

 

Nhưng vẫn còn đó một số vấn đề cần giải quyết đối với việc làm SEO cho  website drupal. Một vấn đề mà các bạn thường hay mắc phải nhất chính là trùng lặp nội dung (duplicate content), đặt biệt là với Drupal. Website drupal sử dụng khá nhiều các mặc định giúp tối ưu hóa công cụ tìm kiếm, những một số chức năng mặc định ấy chính là nguyên nhân dẫn đến việc duplicate content. Hy vọng rằng với một số thủ thuật nhỏ ở bài viết này, SEO Việt Nam sẻ giúp bạn giải quyết ổn thỏa vấn đề này.

drupal seo - Drupal SEO - Vấn đề vẫn là trung lặp nội dung (duplicate content)

Vấn đề duplicate của drupal:

 

Hãy nhìn vào 2 đường link dưới đây:

 

http://www.drupal.com/article/duplicate-content/

http://www.drupal.com/article/duplicate-content

 

Với một website drupal thông thường, được bất chức năng clear url thì việc tạo ra nhưng url vô cùng friendly như trên là hoàn toàn có thể. Những url kiểu này giúp ích rất nhiều trong cả việc SEO tối ưu hóa trên mạng tìm kiếm lẫn hạn chế lỗi 404 cho người đọc. Nhưng nó vẫn còn đó 1 vấn đề đó là duplicate, cả 2 url cùng cho ra 1 kết quả giống nhau, điều này có thể tốt cho người đọc những thật sự là ko tốt cho website của bạn 1 chút nào.

 

May thay, thủ thuật nhỏ với việc sử dụng .htaccess này sẻ giúp bạn loại bỏ hoàn toàn vấn đề trên.
Redirect drupal với .htaccess:

 

Chắc hẳn các bạn đã phần nào hiểu được sức mạnh của .htaccess trong việc chuyển hướng server, tác dụng của .htaccess đã giúp những website joomla cũng như wordpress có thể tạo ra những url cực kì SEF giống SEO Việt Nam Wink

 

Và với drupal chúng ta cũng sẻ sử dụng .htaccess như một công cụ giúp tránh trùng lặp nội dung. Cách giải quyết ở đây là chúng ta sẻ chuyển hướng tất cả các url có dạng:

 

http://www.drupal.com/article/duplicate-content/

 

thành những url có dạng :

 

http://www.drupal.com/article/duplicate-content

 

Với việc sử dụng 301 redirect ở trường hợp này, chúng ta có thể yên tâm rằng sẻ ko còn tồn tại bất cứ link nào có dạng http://www.drupal.com/article/duplicate-content/ mà mọi truy vấn đến đường link này sẻ được tự động redirect về http://www.drupal.com/article/duplicate-content

 

Tất cả việc bạn cần làm là thêm đoạn code sau vào file .htaccess trên server:

 

#get rid of trailing slashes
RewriteCond %{HTTP_HOST} ^(www.)?seovietnam.org$ [NC]
RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]

 

Tham khảo thêm bài viết: .htaccess và redirect 301
Sử dụng file robots.txt để ẩn đi nội dung trùng lặp:

 

Không chỉ có những url như trên, một website drupal còn có thể tồn tại thêm một dạng url như sau:

 

http://www.seovietnam.org/articles/duplicate-content
http://www.seovietnam.org/node/44

 

Và điều chúng ta cần làm trong trường hợp này là thêm đoạn code sau vào file robots.txt

 

Disallow: /node/

 

Việc làm này sẻ giúp chúng ta quy định các bọ tìm kiếm không quét nhứng phận nội dung trên thư mục /node/, vì vậy các bọ tìm kiếm sẻ ưu tiên index những url có cùng nội dùng khác thay vì url có chứa thư mục /node/

 

Đây sẻ không phải là vấn đề của bạn nến bạn sử dung module pathauto và Global Redirect, 2 module này sẻ giúp bạn trong việc loại bỏ url chứa biến /node/. Riêng về phần tôi thì tôi sẻ sử dụng chức năng của .htaccess và robots.txt thay vì những module mở rộng thêm, vì phần nào những module mở rộng cũng sẻ hạn chế một phần tốc độ của website bạn.

 

Hy vọng rằng với những thủ thuật nhỏ trong việc sử dụng .htaccess và robots.txt phía trên, sẻ phần nào giúp các bạn tối ưu hóa webiste drupal của mình tối hơn.

 

Tham khảo thêm các bài viết:

 

1. Cách tránh lỗi duplicate content.
2. Duplicate content và cách phát hiện mới của google.
3. Canonical – Hạn chế trùng lặp nội dung.

 

Chúc các bạn may mắn.

 

Theo: SEO Việt Nam

Website tiêu biểu

Bài viết mới

Top 10+ Truyện Ngôn Tình Hay Nhất được đề cử BXH năm 2022

Say Nhầm Một Ánh Mắt

Tuyển tập 10+ truyện ngôn tình hay nhất trong năm 2022 nên đọc là những tác phẩm nổi bật được […]

Hướng dẫn hồ sơ xin visa Canada cho người làm lần đầu

Visa Canada tùy loại mà hồ sơ sẽ khác nhau

Đến Canada du lịch, học tập là mơ ước của rất nhiều người. Tuy nhiên không mai ai cũng có […]

Hướng dẫn thủ tục xin visa Úc cho người làm lần đầu

Visa du lịch Úc được nhiều người quan tâm

Visa Úc là điều kiện tiên quyết nếu quý khách muốn đặt chân đến quốc gia này. Người nước ngoài […]

Top những bộ phim Shoujo AI hay nhất

Kiniro Mosaic

Anime Shoujo AI là thể loại anime tình cảm, lãng mạn giữa các cặp đôi đồng giới nữ. Nội dung […]

Top 10 siêu phẩm anime hay nhất sắp ra mắt giới trẻ

Vua pháp thuật - Shaman King 

Nhật Bản nổi tiếng với các bộ phim anime thu hút hàng triệu khán giả từ trẻ em đến người […]