SEO : Từ đầu tiên, nhiều người quan tâm nhất và cũng hay bị lầm lẫn
nhất là SEO. SEO là từ viết tắt của Search Engine Optimization - dịch
nôm na là tối ưu hóa website cho việc nâng thứ hạng web trên các cỗ máy
tìm kiếm. Với khái niệm này, rất nhiều người làm kinh doanh trực tuyến
thường đánh đồng SEO chính là Quảng bá website. Sự thật không phải vậy.
SEO chỉ là một trong những công đoạn cơ bản và bắt buộc trong cả quá
trình quảng bá một website trên hệ thống tìm kiếm. Để SEO một website,
các webmaster thường phải sử dụng một số công cụ như phần mềm chuyên
dụng hay các công cụ có sẵn trên Net để đo chỉ số Title, Keywords,
Description, Body text, H1, H2,…H7, Các thẻ Alt, thẻ Images, Thẻ
Robots, Refresh, Topic,…. và vô số những thông số kỹ thuật khác. Nguyên
tắc chính của việc SEO một website là phải làm mọi cách để từng trang
web và cả website chạy nhanh hơn, ít lỗi kỹ thuật hơn, mã nguồn trong
sáng hơn, ít script hơn và đặc biệt: Không có các lỗi bị hệ thống tìm
kiếm cho là kỹ thuật Cloaking - kỹ thuật đánh lừa các cỗ máy tìm kiếm.
(Xin tham khảo bài: Các tiểu xảo trong quảng bá website).
SES - Search Engine Submission: Đăng ký website vào các cỗ máy tìm
kiếm. Thuật ngữ này cũng rất được quan tâm vì đây là cách đơn giản và
nhanh nhất giúp một website mới ra đời có thể được liệt kê trong danh
bạ của các cỗ máy tìm kiếm. Các webmaster dạng này thường sử dụng một
phần mềm chuyên về SES như AddWeb Promoter, Hello Search Engines,
Dynamic Submission,… để đăng ký website vào hàng loạt cỗ máy tìm kiếm.
Nhiều webmaster rất tự hào với những phần mềm dạng này khi cho rằng
mình đã đăng ký website của mình (và cả của khách hàng) vào hàng ngàn -
thậm chí hàng triệu “cỗ máy tìm kiếm” chỉ bằng một vài lần nhấn chuột -
và phần mềm sẽ làm thay toàn bộ. Sự thật có đơn giản như thế? Hãy lấy
Google, Yahoo và MSN làm ví dụ: Để đăng ký vào 3 cỗ máy này, bạn bắt
buộc phải làm động tác: nhập mã số an toàn (đối với Google và MSN) hoặc
đăng nhập tài khoản (nếu đăng ký vào Yahoo). Đây là việc chỉ con người
mới làm được - không có một phần mềm nào đủ khả năng làm thay.
Chưa hết, hiện 3 cỗ máy này đang chiếm thị phần tìm kiếm áp đảo với chỉ
số: Google + Yahoo + MSN chiếm xấp xỉ 85% chỉ số tìm kiếm toàn thế
giới. Ngoài ra, các Search Engine khác như AOL (sử dụng kết quả của
Google), Altavista, Alltheweb, Inktomi (sử dụng kết quả của Yahoo),
Ask/Teoma, Lycos, HotBot và Dogpile chiếm khoảng 14,5% thị phần còn
lại. Như vậy hàng “ngàn”, hàng “triệu” “cỗ máy tìm kiếm” còn lại chỉ
chiếm thị phần xấp xỉ 0,5% ! (Tham khảo: Đăng ký website vào Google,
Yahoo, MSN và Ask/Jeeves). Đăng ký thủ công là cách làm đúng và cần
thiết nhất để website của bạn sớm được nhận diện trên hệ thống tìm
kiếm. Về cách đăng ký, xin vui lòng tham khảo bài viết: Đăng ký website
vào Google, Yahoo, MSN và Ask/Jeeves.
SEM: Search Engine Marketing. Đây mới chính là cái mà các nhà quản trị
website và người kinh doanh online nhắm đến. SEM chính là tổng hợp của
tất cả các công đoạn nêu trên, gồm: tối ưu hóa website, đăng ký website
vào hệ thống tìm kiếm và các thư mục internet, đặt liên kết với các
site khác (trong đó bao gồm cả việc mua liên kết bằng cách đặt logo,
banner quảng cáo) và nhiều việc làm khác nữa nhằm giúp website trở nên
thân thiện hơn với các cỗ máy tìm kiếm để thứ hạng các từ khóa trong
website ngày càng được cải thiện, website có nhiều người truy cập hơn.
Keywords: Từ khóa - những từ mà webmaster hoặc chủ nhân trang web cho
là quan trọng đối với website của mình. Thường, mỗi website được chọn
ra những từ đơn hay cụm từ nhau làm từ khóa. Ví dụ, trang web về du
lịch thì các từ vietnam travel, vietnam tours, …; website về giải trí
thì các từ: âm nhạc, phim ảnh, giải trí, am nhac, ca sy, nguoi mau,
thoi trang,… thường được chọn làm từ khóa. Thời gian trước, từ khóa là
vấn đề sống còn đối với một trang web. Nhưng nay với giải thuật mới từ
các cỗ máy tìm kiếm thì từ khóa chỉ đóng vai trò thứ yếu.
Link Back - Link popularity: Mức độ phổ biến liên kết. Một website được
đánh giá cao tại Google hay Yahoo khi nó có nhiều liên kết từ các
website khác đến. Tuy nhiên, không phải cứ có nhiều liên kết là tốt vì
nhiều liên kết hoàn toàn vô nghĩa vì nếu bạn liên kết đến một website
bị liệt vào black list (danh sách đen vì đã sử dụng công nghệ spamming)
hoặc một trang web quá ít người truy cập hay không đúng chủ đề thì lợi
bất cập hại. Website của bạn có thể bị đánh giá là “cùng hội cùng
thuyền” với các website kia và như thế, nguy cơ website của bạn bị rớt
hạng là rất lớn.
Ranking, PageRank: Với ranking, thì Alexa đang chiếm uy tín tuyệt đối
vì tính chính xác và độ tin cậy. Một website có thứ hạng Alexa ranking
cao đồng nghĩa với việc website đó được nhiều người biết đến, nhiều
người truy cập và nó cũng dễ dàng được tìm thấy với vị trí cao trên hệ
thống tìm kiếm. PageRank là một công cụ đo đếm số link back của một
website bất kỳ. nếu website của bạn có PageRank cao thì cũng đồng nghĩa
với việc website được truy cập nhiều hơn nhờ người truy cập bấm trực
tiếp vào link (hay banner, logo) để đến website của bạn và hệ thống tìm
kiếm cũng ưu ái với bạn hơn.
Search Engine: Là các cỗ máy tìm kiếm như Google, Yahoo, Msn,…
Những cỗ máy tìm kiếm này sử dụng một phần mềm gọi là Robot, hay
Spider, hay Bot hoặc Crawler để tự động index và lập chỉ mục tất cả các
website trên đường chúng “bò” qua. Sau đó, những thông tin này được gửi
về Data Center của cỗ máy tìm kiếm để xử lý, sàng lọc, phân loại và đưa
vào lưu trữ. Khi một người dùng internet cần tìm một nội dung, họ sẽ
đánh từ khóa và nhiệm vụ của cỗ máy tìm kiếm là lục tìm trên danh bạ
của nó các kết quả liên quan (đã lập chỉ mục trước đó). Công việc này
được tiến hành hoàn toàn tự động và có thứ tự ưu tiên khác nhau cho
từng site khác nhau. Các site tốt, giàu nội dung (như các trang báo
điện tử, các blog lớn, các diễn đàn đông thành viên) sẽ được index
thường xuyên hơn. Chính vì vậy, kết quả tìm kiếm thường tươi mới đối
với những site lớn.
Internet Directory: Đây là các thư mục internet giống như kiểu Trang
Vàng của Việt Nam. Những thư mục này chứa đựng rất nhiều website theo
từng danh mục, từng chủ đề các nhau. Khác với các Cỗ máy tìm kiếm - các
thư mục internet không hoạt động tự động mà thường do người quản trị
cập nhật thông tin thông qua bản đăng ký của các chủ website gửi đến.
Nếu website của bạn có mặt tại nhiều thư mục internet thì ranking,
pagerank và cả vị trí trên các search engine cũng cao hơn.
Internet chứa hầu như tất cả những thông tin liên quan tới mọi lĩnh
vực, mọi ngõ ngách trong cuộc sống. Nhưng nó rất rộng, rộng đến mức gần
như không ai có thể kiểm soát được. Diện mạo của Internet lại thay đổi
quá nhanh chóng và mạnh mẽ. Hạt nhân của Internet là Word Wide Web, với
số lượng lên tới hàng chục tỉ trang, được lưu trữ trong hàng triệu
server đặt khắp nơi trên toàn thế giới.
Có thể ví Internet như một biển dữ liệu khổng lồ, với muôn vàn những
viên ngọc quí nằm giữa các hạt sạn. Trong đời sống hàng ngày, nhu cầu
tìm kiếm thông tin đóng vai trò vô cùng to lớn, và một trong những vấn
đề bức thiết nhất của công nghệ hiện nay là làm sao “đãi cát tìm vàng”,
khai thác nguồn tài nguyên này một cách hợp lí, đem lại lợi ích tốt
nhất cho con người. Tìm kiếm thông tin trên mạng Internet quả thật là
một thách thức lớn lao. Nó không giống như việc bới các hạt đỗ đen nằm
lẫn lộn trong thùng gạo, bởi dữ liệu trên mạng Internet do con người
đưa vào, chúng cũng có cấu trúc và tổ chức xác định (mặc dù thiếu tính
nhất quán), trong khi đó thì các hạt đỗ đen lại nằm rải rác và lộn xộn,
không có một vị trí hay qui luật nào. Tuy nhiên, bài toán tìm kiếm khó
hơn bài toán nhặt đỗ đen rất nhiều. Muốn tìm tất cả các hạt đỗ đen, bạn
đơn giản chỉ cần thiết kế một cái sàng hình cầu đủ lớn để có thể đổ cả
thùng gạo vào đó, với những chiếc lỗ có kích thước phù hợp sao cho hạt
gạo chui lọt còn hạt đỗ đen thì không, và quay đủ số vòng để tất cả các
hạt gạo đều có cơ hội bay ra ngoài. Việc tìm kiếm thông tin trên
Internet lại hoàn toàn khác.
Có tới hàng chục tỉ trang Web tràn ngập trên mạng Internet (gấp nhiều
lần số hạt gạo trong thùng), và vấn đề là làm sao đưa ra những gì ta
muốn thu thập sao cho đồng thời thỏa mãn hai tiêu chí: Chính xác và
nhanh chóng. Hơn thế nữa, người dùng cũng không đủ kiên nhẫn để ngồi
duyệt qua tất cả các trang web chứa thông tin cần tìm (anh ta cũng
không nhất thiết phải đếm từng hạt đỗ đen, tuy nhiên nếu xét trên tiêu
chí dinh dưỡng thì đa phần những hạt đỗ đen đều giống nhau, do đó hạt
nào cho vào nồi trước cũng không quan trọng). Trên thực tế, người dùng
hiếm khi vào quá mười trang web kết quả, và vì thế, một yêu cầu khó
khăn nữa cần giải quyết, đó là những gì phù hợp nhất phải được đặt lên
hàng đầu.
Trước đây, người ta thường chia dữ liệu cần lưu trữ làm nhiều mục, đến
lượt các mục con này lại được chia nhỏ hơn. Người dùng tìm kiếm thông
tin thông qua việc duyệt qua liên kết giữa các mục. Tuy nhiên, những
chủ đề được nêu trong Internet đã rộng lớn đến nỗi sự phân chia này trở
nên cực kì cồng kềnh và bất tiện. Ngày nay, hầu hết mọi người đều sử
dụng Search Engine để tìm kiếm thông tin trên mạng Internet.
Đối với mỗi Search Engine (Google, Yahoo, MSN, v.v…), người dùng truy
vấn tìm kiếm (hay nói đơn giản hơn là nhập vào một số từ khóa liên quan
đến chủ đề cần tìm), và nhận được một danh sách các trang kết quả
(thông thường là những trang web chứa các từ khóa cần tìm kiếm), được
sắp xếp theo một tiêu chí nào đó. Những tiêu chí này đều nhằm mục đích
đưa ra kết quả phù hợp nhất với yêu cầu tìm kiếm.
Tự xây dựng một Search Engine là một thách thức không nhỏ và rất đáng
để xem xét. Tất nhiên sản phẩm của những sinh viên như chúng ta không
có ý nghĩa gì khi so sánh với Google Search hay Yahoo! Search, và tất
nhiên cũng mang rất ít giá trị về mặt thương mại cũng như thực tiễn
(phải nói là không có thì đúng hơn). Nhưng đối với bản thân mỗi người
học chúng ta thì giá trị học hỏi và kiến thức là rất to lớn, bởi như đã
nói ở trên, những mảng đề tài liên quan đến Search Engine là rất nhiều.