Tổng hợp các vấn đề về .htaccess, redirect 301 và SEO URL

Thảo luận trong 'Thế giới WebMaster' bắt đầu bởi bboy_nonoyes, 29 Tháng 6 2012.

  1. (Lượt xem: 3,182)

    Hiểu rõ Redirection 301 và ứng dụng tốt là một kỹ năng cơ bản mà các Webmaster cần nắm bắt để ứng dụng tốt SEO không chỉ cho người dùng thường mà còn cho cả máy tìm kiếm.
    Vấn đề thường gặp của Webmaster và giải pháp

    Kịch bản ứng dụng Redirect 301

    Bạn nâng cấp toàn bộ hay một phần Website. Đơn giản hơn là bạn chỉ di chuyển một vài file hay thư mục hoặc đổi tên đường dẫn bài viết.
    Rủi ro

    Máy tìm kiếm đánh chỉ số toàn bộ website của bạn trong đó có rất nhiều trang có thứ hạng PageRank tốt. Do bị di chuyển hay đổi tên các trang này, mà bạn sẽ mất phần lớn lưu lượng và khách hàng tìm đến các trang nói trên từ máy tìm kiếm, và kết cục là chỉ thấy dòng thông báo “Error 404 – File not found”
    Giải pháp 1 : Tùy biến trang báo lỗi 404

    Bạn tạo một trang báo lỗi riêng. Vấn đề sẽ được giải quyết như sau :
    1. Bạn sẽ vấn mất thứ hạng trên máy tìm kiếm trong lần cập nhật tiếp theo bởi các trang cũ không còn tồn tại. Phải mất một thời gian để máy tìm kiếm đánh chỉ số lại các trang tại địa chỉ mới;
    2. Người dùng cảm thấy không thoải mái khi phải dò tìm website của bạn để tìm được các trang đã bị thay đổi đường dẫn;
    3. Ngoài ra, các trang mới phải mất nhiều thời gian mà chưa chắc lấy lại độ trung thực và duy nhất của thông tin đối với máy tìm kiếm. Và kết quả là các trang đi copy lại nội dung website của bạn rất có thể sẽ có thứ hạng cao các trang mới của bạn. Ngoài ra bạn cũng mất toàn bộ liên kết bên ngoài trỏ tới bài viết cũ.
    Giải pháp 2 : Sử dụng Meta Refresh

    Bạn có thể sử dụng Meta Refresh chèn giữ thẻ <head> trong mã nguồn HTML của một trang trắng nằm tại đường dẫn cũ. Thẻ Meta Refresh này sẽ cho phép chuyển hướng người dùng và bọ tìm kiếm tới trang mới. Ví dụ vietSEO chuyển bài viết từ địa chỉ cũ tới http://www.vietseo.net/seoblog/
    PHP:
    <HEAD>
     
    <
    META HTTP-EQUIV="refresh" content="0;URL=http://www.vietseo.net/seoblog/">
     
    <
    TITLE>Page has moved</TITLE>
     
    </
    HEAD>
    Chú ý : Kỹ thuật này thường bị spammers lạm dụng để đánh lừa máy tìm kiếm. Vì vậy bạn nên tránh sử dụng kỹ thuật này, trừ phi trang của bạn nằm trong vùng mà bọ tìm kiếm kiếm bị chặn hoặc không tiếp cận để đánh chỉ số được.
    Các spammer máy tìm kiếm thường tạo một trang tối ưu với rất nhiều từ khóa và cấu được gắn với sản phẩm và dịch vụ cần quảng bá nhưng thật ra thì không có giá trị nội dung thật sự. Sau đó trang này được đăng ký trên các máy tìm kiếm, nhưng khi người sử dụng nhắp chọn thì sẽ bị chuyển hướng tới trang khác, thường là không có gì liên quan tới chủ đề trang đang hiển thị.
    Đây là một kỹ thuật đã trở nên khá thô sơ và dễ dàng bị các máy tìm kiếm phát hiện và áp dụng các hình thức phạt.
    Đâu là giải pháp đúng ?

    Trên đây chỉ là ví dụ về 2 giải pháp khá phổ biến, tùy thuộc vào ngôn ngữ, host bạn dùng hay phần mềm CMS chẳng hạn mà bạn có thể chọn lựa các giải pháp khác.
    Tuy nhiên một trong những phương pháp hiệu quả nhất và được khuyến khích bởi các máy tìm kiếm trong đó có Google là sử dụng Redirection 301 thông qua .htaccess đối với các web site sử dụng máy chủ Apache (hãy kiểm tra xem máy chủ của bạn có hỗ trợ htaccess hay không tại bài viết sau phần kiểm tra htaccess trên máy chủ). Việc sử dụng htaccess không hề khó khăn và nó sẽ không gây ảnh hưởng xấu tới thứ hạng các trang liên quan. Nếu như bạn phải thay đổi tên hay chuyển các trang, thay đổi đường dẫn URL, thì đây là giải pháp an toàn nhất : Sử dụng htaccess.
    Giới thiệu htaccess và redirect 301

    Tệp tin htaccess là gì ?

    htaccess là một tệp tin cấu hình đặc biệt, htaccess cho phép bạn thay đổi cách hoạt động của máy chủ Apache ở tầng thư mục. Tệp tin htaccess gồm các dòng lệnh, có thể tùy biến theo người dùng, được đặt trong một thư mục nào đó, nó sẽ có tác dụng cho thư mục đó và tất cả các thư mục con. Một trong những ứng dụng phổ biến của htaccess là cho phép viết lại đường dẫn URL (rewrite URL).
    Trở lại ứng dụng SEO của htaccess, khi một khách hay bọ tìm kiếm thăm một trang web, máy chủ sẽ kiểm tra tệp tin đặt biệt để tìm các tùy biến của webmaster, bao gồm cả các tùy biến bảo mật. Máy chủ sau đó sẽ thực thi các lệnh tìm thấy trong tệp tin htaccess thường gồm chuyển hướng redirection, bảo mật và báo lỗi.
    Redirect 301 là gì ?

    Chuyển hướng redirect 301 hay redirection 301 thường được hiểu như việc di rời vĩnh viễn (moved permanently). Nó trả về mã lỗi 301 trong phần header nhằm thông báo cho máy tìm kiếm hay trình duyệt, máy chủ rằng trang web hiện tại đã được chuyển rời tới địa chỉ mới.
    Cài đặt redirect 301

    Điều đầu tiên là bạn phải đảm bào chắc server Apache của bạn hỗ trợ mod_rewrite cho phép sử dụng .htaccess để áp dụng redirect 301 (xem phần trên). Sau đó bạn phải tải tệp tin .htaccess từ thư mục gốc chứa các trang web của bạn. Nếu như bạn không có tệp tin .htaccess trong thư mục gốc thì bạn phải tạo nó với trình soạn thảo text như Notepad, Ultraedit hay EditPadPro, v.v. Phải chắc chắn rằng bạn viết đúng tên và có dấu chấm “.” đầu tệp tin.
    Người sử dụng Windows sẽ không thể tạo được tệp tin .htaccess vì tệp tin đặc biệt này không chứa tên, nó chỉ chứa tên của phần tên mở rộng. Vì thế bạn hãy tải tệp tin text bất kỳ trong window rồi tải lên server qua FTP rồi đổi tên trên sever.
    Sau khi tải tệp tin .htaccess xuống máy, nếu đã có các dòng lệnh trước đó thì hãy cẩn thận đừng thay đổi nếu như bạn không chắc, tốt nhất hãy sao lưu một bản để phòng trường hợp cần thiết bạn vẫn có thể quay trở lại.
    Cài đặt cơ bản

    Dòng lệnh bắt đầu .htaccess

    Dòng lệnh .htaccess của bạn nên bắt đầu như sau :
    PHP:
    Options +FollowSymLinks
     
    RewriteEngine On
    RewriteBase 
    /
    Dòng lệnh cơ bản redirect 301

    Dòng lệnh redirect 301 về cơ bản có dạng như sau trong tệp tin .htaccess :
    PHP:
    redirect 301 /old/old.htm [URL]http://www.vietseo.net/new.htm[/URL]
    Dòng lệnh trên thông báo chuyển rời tệp tin old.htm trong thư mục old đến vị trí mới tại http://www.vietseo.net/new.htm.
    Chú ý : Để bắt đầu thì bạn nên redirect 301 các trang trên cũng host, bạn chỉ nên chuyển các trang cũ đến thư mục gốc tương đối. Có thể thực hiện việc này bằng việc loại bỏ “http://www.vietseo.net/” mà chỉ thêm đường dẫn tương đối đến thư mục gốc.
    Điểm mạnh nhât của việc thay đổi hàng loạt đường dẫn URL chính là mod_rewrite của Apache, đặc biệt là khi thay đổi tên miền hay thư mục
    hay số lượng lớn các tập tin. Chúng ta hãy tìm hiểu phần tiếp theo.
    Chuyển toàn bộ đến tên miền mới

    Nếu bạn quyết định thay đổi tên miền thì các đường dẫn trước đây từ các website bên ngoài, từ máy tìm kiếm và ngay cả các đường dẫn tuyệt đối trên website cũ đều bị thay đổi và khi bạn truy cập, các địa chỉ trên sẽ trỏ bạn đến trang báo lỗi 404 : trang không tìm thấy.
    Vì thế nếu bạn thay đổi tên miền thì đừng để mất các liên kết quí báu và người dùng tiềm năng từ máy tìm kiếm, hãy redirect các liên kết cũ tới tên miền mới :
    PHP:
    Options +FollowSymLinks
    RewriteEngine on
    RewriteRule 
    (.*) [URL]http://www.vietseo.net/$1[/URL] [R=301,L]
    Hãy thay đổi [URL='http://www.vietseo.net']www.vietseo.net[/URLbằng tên miền mới của bạn.
    Redirect toàn bộ trang trong một thư mục đến mọt trang mới

    Giả sử như bạn không còn sử dụng thư mục “thuthuatseo” nữa và muốn chuyển tất cả các trang trong thư mục này đến trang “seoblog.php” thì hãy thêm dòng lệnh sau vào tệp tin .htaccess nằm tại thư mục gốc :
    PHP:
    RewriteRule ^thuthuatseo(.*)$ /seoblog.php [L,R=301]
    Chuyển các trang động tới một trang mới

    Để chuyến trang web động page.php?id=n (với n là giá trị biến) tới một trang tĩnh mới new-page.html thì bạn có thể làm như sau :
    PHP:
    RewriteRule ^page.php?id=(.*)$ /new-page.htm [L,R=301]
    URL với www hay không www

    Đôi khi các bạn bắt gặp việc website sử dụng “www” trong URL (Ví dụ như http://www.vietseo.net), trong khi có những website lại không dùng “www” này như http://aevn.fr. Nên nhớ rằng “tương ứng” với dịch vụ Web. Các bạn có thể lựa chọn riêng cho mình. Nhưng không thể chọn cả hai vì sẽ gây ra trùng lặp nội dung. sau đây là hai ví dụ, hướng dẫn bạn sủ lý triệt để vấn đề này.
    Trường hợp sử dụng www
    PHP:

    Options 
    +FollowSymLinks
    RewriteEngine On
    RewriteBase 
    /
    RewriteCond %{HTTP_HOST} !^www\.vietseo.\.net$ [NC]
    RewriteRule ^(.*)$ [URL]http://www.vietseo.net/$1[/URL] [R=301,L]
    Ngoài ra còn có cách viết sau có thể áp dụng cho tất cả các host và domain, không phải edit lại :
    PHP:
    Options +FollowSymLinks
    RewriteEngine On
    RewriteBase 
    /
    RewriteCond %{HTTP_HOST} !^www\.[a-z-]+\.[a-z]{2,6} [NC]
    RewriteCond %{HTTP_HOST} ([a-z-]+\.[a-z]{2,6})$ [NC]
    RewriteRule ^/(.*)$ [URL]http://%1/$1[/URL] [R=301,L]
    Trường hợp không sử dụng www
    PHP:

    Options 
    +FollowSymLinks
    RewriteEngine On
    RewriteBase 
    /
    RewriteCond %{HTTP_HOST} !^aevn\.fr$ [NC]
    RewriteRule ^(.*)$ [URL]http://aevn.fr/$1[/URL] [R=301,L]
    Bạn có thể thử lại với các tên miền ví dụ trên mà tớ áp dụng thành công đúng như trích dẫn.
    Loại bỏ Query_String

    Đôi khi một trang web của bạn có thể hiển thị hai đường dẫn url khác nhưng ( cùng một nội dung) ví dụ seo-tools.php và seo-tools.php?v=mobile. Tương tự như phần trên, điều này sẽ tạp ra nội dung trùng lặp trên website của bạn. Vì vậy bạn có thể loại bỏ các tham biến như sau :
    PHP:
    RewriteCond %{THE_REQUEST} ^GET\ /.*\;.*\ HTTP/
    RewriteCond %{QUERY_STRING} !^$
    RewriteRule .* [URL]http://www.vietseo.net%{REQUEST_URI}?[/URL] [R=301,L]
    Ngoài ra nếu như tham biến QUERY_STRING không được gấn giá trị nào hết và URl kết thúc bởi biến rỗng “?”, thì bạn nên loại bỏ chúng, ví dụ “index.php?” :
    PHP:
    RewriteEngine On
    RewriteBase 
    /
    RewriteCond %{QUERY_STRING} .
    RewriteRule ^index.php /index.php? [L]
    Chuyển phần đuôi mở rộng từ .php sang .html

    Việc chuyển .php sang .html có tác dụng khi bạn cần viết lại đường dẫn thân thiện với máy tìm kiếm (Friendly URL for SEO).
    PHP:
    RewriteRule ^(.*)\.html$ $1.php [R=301,L]
    Chuyển gạch dưới (_) thành gạch ngang(-)

    Dù Google mới chấp nhận việc sử dụng gạch dưới “_” như là ký tự ngăn cách, nhưng trong thực tế người dùng vẫn quen thuộc với dấu gạch ngang “-”. Bản thân vietSEO cũng ủng hộ dấu gạch ngang vì nó dễ nhìn hơn. Bạn có thể chuyển đổi toàn bộ dấu “_” sang “-” như sau :
    PHP:
    Options +FollowSymLinks
    RewriteEngine On
    RewriteBase 
    /
     
    RewriteRule !\.(html|php)$ - [S=4]
    RewriteRule ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$[E=uscor:Yes]
    RewriteRule ^([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$[E=uscor:Yes]
    RewriteRule ^([^_]*)_([^_]*)_(.*)$ $1-$2-$[E=uscor:Yes]
    RewriteRule ^([^_]*)_(.*)$ $1-$[E=uscor:Yes]
     
    RewriteCond %{ENV:uscor} ^Yes$
    RewriteRule (.*) [URL]http://www.vietseo.net/$1[/URL] [R=301,L]
    Redirect Wordpress Feeds tới Feedburner

    Trong bài viết sử dụng Feedbuner, các bạn có thể sử dụng plugin để quản lý Feeds RSS trên Blog Wordpress. Nếu không các bạn có thể sử dụng code htaccess sau:
    PHP:
    RewriteEngine On
    RewriteBase 
    /
    RewriteCond %{REQUEST_URI} ^/feed\.gif$
    RewriteRule .* - [L]
     
    RewriteCond %{HTTP_USER_AGENT} !^.*(FeedBurner|FeedValidator) [NC]
    RewriteRule ^feed/?.*$ [URL]http://feeds.vietseo.net/quangbaweb/[/URL] [L,R=302]
     
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond 
    %{REQUEST_FILENAME} !-d
    RewriteRule 
    . /index.php [L]
    Đối với người dùng WordPress, các bạn có thể sử dụng plug-in Redirection Permanent Link để chuyến hướng các trang.
    Bào vệ ăn cắp tài nguyên và băng thông

    Đôi khi các tài liệu, film hay hình ảnh mà bạn tải trên host của mình bị người khác dùng và đăng trên website khác sẽ gây tốn băng thông, bạn có thể hạn chế việc ăn cắp bằng cách chỉ cho phép các tài nguyên trên tiếp cận trên những website bạn cho phép như sau (Nếu không sẽ trả về thư mục /feed/) :
    PHP:
    RewriteEngine On
    RewriteBase 
    /
    RewriteCond %{HTTP_REFERER} !^$
    RewriteCond %{HTTP_REFERER} !^[URL]http://(www\.)?vietseo.net/.*$[/URL] [NC]
    RewriteRule \.(gif|jpg|swf|flv|png)$ /feed/ [R=302,L]
    Ứng dụng redirect 301 trên các máy chủ khác (ngoài Apache)

    IIS redirect

    Trong phần quản trị dịch vụ internet, nhấn phải chuột chọn tệp tin và thư mục mà bạn muốn áp dụng redirect;
    Chon nút “a redirection to a URL”;
    Chọn trang Redirection;
    Chon tiếp “The exact url entered above” và “A permanent redirection for this resource”;
    Chon “Apply”.
    ColdFusion Redirect
    PHP:

    <.cfheader statuscode="301" statustext="Moved permanently">
    <.
    cfheader name="Location" value="[URL]http://www.vietseo.net[/URL]">
    PHP Redirect

    PHP:
    <?
     
    Header"HTTP/1.1 301 Moved Permanently" );
     
    Header"Location: http://www.vietseo.net" );
     
    ?>
    ASP Redirec
    PHP:

    <%@ Language=VBScript %>
    <%
    Response.Status="301 Moved Permanently"
    Response.AddHeader "Location","[URL]http://www.vietseo.net/[/URL]"
    %>
    ASP .NET Redirect
    PHP:

    <script runat="server">
    private 
    void Page_Load(object senderSystem.EventArgs e)
    {
    Response.Status "301 Moved Permanently";
    Response.AddHeader("Location","[URL]http://www.vietseo.net/[/URL]");
    }
    </script>
    JSP (Java) Redirect
    PHP:

    <%
    response.setStatus(301);
    response.setHeader"Location""[URL]http://www.vietseo.net/[/URL]" );
    response.setHeader"Connection""close" );
    %>
    CGI PERL Redirect
    PHP:

    $q 
    = new CGI;
    print 
    $q->redirect("[URL]http://www.vietseo.net/[/URL]");
    Ruby on Rails Redirect
    PHP:

    def old_action
    headers
    ["Status"] = "301 Moved Permanently"
    redirect_to "[URL]http://www.vietseo.net/[/URL]"
    end
    Nguyễn Hoài Nam vietSEO.net
    Nguồn: Việt SEO
    chuong_vespa_bl and huongbien198 like this.
  2. Facebook comment - Tổng hợp các vấn đề về .htaccess, redirect 301 và SEO URL

  3. Cái này hay tuyệt...thanks:D
    bboy_nonoyes thích bài này.

Chia sẻ trang này