armntech – Bagi orang awam mungkin search engines (mesin pencari) sangat berguna sekali. Mereka cukup tinggal mengetikan keyword (kata kunci) yang diinginkan di mesin pecari, maka resume dari hasil pencarian dari keyword segera akan bermunculan.
Mesin pencari memungkinkan kita untuk meminta content media dengan kriteria yang spesifik (biasanya yang berisi kata atau frasa yang kita tentukan) dan memperoleh daftar file yang memenuhi kriteria tersebut.
Mesin pencari biasanya menggunakan indeks (yang sudah dibuat sebelumnya dan dimutakhirkan secara teratur) untuk mencari file setelah pengguna memasukkan kriteria pencarian.
Mesin pencari mengumpulkan data yang tersedia di newsgroup, database besar, atau direktori terbuka seperti DMOZ.org. Karena pengumpulan datanya dilakukan secara otomatis, mesin pencari berbeda dengan direktori Web yang dikerjakan manusia.
Mesin pencari web bekerja dengan cara menyimpan data tentang banyak halaman web, yang diambil langsung dari WWW, melalui web crawler.
Halaman-halaman ini diambil dengan web crawler — browser web otomatis yang mengikuti setiap tautan yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya, kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta tag).
Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.
Ketika seorang pengguna mengunjungi mesin pencari dan memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen dan terkadang sebagian teksnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frase, sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang lain.
Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan peringkat hasil pencarian agar mampu memberikan hasil “terbaik” lebih dahulu. Cara mesin menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metodenya juga berubah seiring waktu dengan berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Di alam maya (dunia internet) kini banyak tersedia mesin pecari. di antaranya adalah WebCrawler, Hotbot, Excite, Infoseek, Inktomi, dan AltaVista. Mereka bersaing dengan direktori-direktori populer seperti misalnya Yahoo. Belakangan direktori-direktori ini menggabungkan atau menambahkan teknologi mesin pencari agar fungsinya semakin meningkat.
Meskipun mesin pencari cukup banyak jumlahnya, tiga yang utama adalah Google, MSN, dan Yahoo!. Sisanya ada yang menggunakan hasil pencarian dari tempat besar tersebut — misalnya A9 menggunakan hasil dari Google. Sisanya yang lain lagi kurang aktif melakukan pengumpulan halaman Web, sehingga seperti “ketinggalan kereta” dibanding perubahan materi situs Web itu sendiri. Saya tidak menghakimi selain ketiga di atas sebagai “jelek” atau “tidak diperlukan”, melainkan dapat ditangani berikutnya. Tentu ada prioritas dalam sebuah strategi.
Berdasarkan pengalaman saya, dari ketiga mesin pencari utama di atas, Google adalah yang paling agresif dan responnya tercepat. Beberapa situs baru yang saya pasang tautnya di situs lain langsung didatangi oleh robot Google satu atau dua hari kemudian1 — lebih dulu dari robot mesin pencari lainnya. Sedangkan tentang respon yang cepat: tahun lalu pernah server Web yang ditempati situs ini mengalami gangguan, sedemikian parahnya sehingga beberapa hari kemudian Google mengelompokkan entri dari situs ini sebagai Supplemental Result, dan dua pekan kemudian benar-benar hilang dari hasil pencarian Google. Namun demikian, begitu server Web sudah pulih kembali, terjadi lonjakan akses dari Google dan dalam sepekan kemudian, hasil pencarian yang sebelumnya hilang dari halaman Google langsung dimunculkan kembali. Termasuk halaman-halaman yang belum dikunjungi ulang; dengan demikian seolah-olah situs ini dipulihkan statusnya.
Catatan: Materi yang bagus dari sebuah halaman Web merupakan modal paling efektif saat ini, termasuk untuk menghadapi penyalahgunaan peringkat di mesin pencari. K. Paul Mallasch menyebut materi yang baru, relevan, dan menarik sebagai cara kedua dalam menghadapi kasus pembajakan halaman, misalnya.
Oleh : Dadan Rusmawan*)
* Penulis adalah Redaktur CyberMQ