Penelusuran Seek Engine

Posted on

Materi ke-7, Pertemuan ke-five, MK.Komputer.

Materi bentuk PPT (pdf.) : 5-AplikasiSearchEngine

I.       Pokok Bahasan

  • Pengertian Aplikasi Search Engine
  • Komponen Search Engine
  • Jenis Search Engine
  • Cara Kerja Search Engine
  • Mesin Pencari Google
  • Fitur Pencarian Google (Dasar dan Lanjutan)
  • Boolean Logic
  • II.      Uraian Materi

    A.     Pengertian Aplikasi Search Engine

    Search engine (mesin pencari/pelacak/penelusur) adalah salah satu application komputer yang dirancang khusus untuk membantu seseorang menemukan document-file yang disimpan dalam komputer, misalnya dalam sebuah net server umum di net (www) atau komputer sendiri. Mesin pencari memungkinkan kita untuk meminta content material media dengan kriteria yang spesifik (biasanya berisikan frase atau kata yang kita inginkan) dan memperoleh daftar report yang memenuhi kriteria tersebut. Mesin pencari biasanya menggunakan indeks (yang sudah dibuat sebelumnya dan dimutakhirkan secara teratur) untuk mencari document setelah pengguna memasukan kriteria pencarian.

    Mesin pencari yang akan dibahas adalah mesin pencari khusus yang digunakan untuk mencari informasi dan berbagai file di Internet, sehingga mesin pencari sangat berguna bagi para penggunanya untuk mencari berbagai bahan referensi atau lainnya.

    Untuk memudahkan pencarian di database yang begitu besar, mesin pencari menggunakan indeks untuk memilah-milah informasi yang ada di database. Sedangkan untuk memudahkan dan mempercepat pencarian, mesin pencari mempunyai metode pencarian tertentu yang sering di sebut algoritma pencarian, kecepatan dan ketepatan pencarian sebuah mesin pencarian tergantung kepada cara pengindeksan dan algoritma pencarian yang digunakan.

    Secara prinsip, tujuan dari sebuah software searching engine adalah menemukan dokumen atau arsip elektronis di internet yang sesuai dengan kebutuhan atau permintaan pengguna dalam waktu yang sesingkat-singkatnya. Kedua hal inilah, yaitu  kualitas hasil temuan dan waktu pencarian, yang kemudian menjadi pengukur baik tidaknya kinerja sebuah searching engine.

    B.     Komponen Search Engine

    Search engine terdiri atas lima komponen, yaitu:

    1. Query Interface

    Query interface adalah komponen penting pertama yang merupakan bentuk tampilan atau layout situs yang menyediakan fasilitas searching engine. Bentuk yang paling sederhana adalah tersedianya sebuah kotak kosong di situs dimana consumer dapat menuliskan records atau informasi yang ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang harus diketahui oleh consumer adalah bahwa tidak semua situs memiliki kemampuan yang sama dalam membantu person untuk mengekspresikan jenis data atau informasi yang ingin dicari. Dalam bahasa komputer cara mengekspresikan ini disebut sebagai query. Contohnya adalah seseorang yang ingin mencari statistics atau informasi mengenai hal-hal yang berkaitan dengan kesehatan ibu dan anak, dapat menggunakan question semacam: “kesehatan” and “ibu” and “anak”.

    Walaupun secara internasional telah diusulkan dan ditentukan standar baku dalam menuliskan sebuah query, namun terlihat bahwa masing-masing situs menawarkan beragam cara yang berbeda. Yang utama bagi user adalah bahwa Query Interface yang ditawarkan mudah dipergunakan dan efektif.

    2. Query Engine

    Komponen kedua adalah Query Engine, merupakan sebuah program yang bertugas untuk menterjemahkan keinginan person ke dalam bahasa yang dimengerti oleh mesin komputer. Secara teknis, perusahaan-perusahaan penyedia searching engine berlomba-lomba membuat question engine yang baik sehingga selain tepat dalam mengekspresikan keinginan person, dapat pula melakukan tugas pencarian secara cepat. Query Engine ini pulalah yang segera melakukan pencarian arsip dan dokumen yang tepat di dalam sistem basis information (database) yang bersangkutan.

    three. Database

    Database pada dasarnya merupakan kumpulan atau daftar dari dokumen maupun arsip dari seluruh situs yang ada di internet. Semakin besar skala net, akan semakin besar pula kapasitas penyimpan yang dibutuhkan.

    four. Spider

    Spider merupakan komponen terpenting dalam sebuah searching engine. Secara berkala dan kontinyu, spider akan mendata setiap situs yang ada di net, baik yang baru maupun yang lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-kata kunci dari arsip maupun dokumen yang ditemukan. Katakanlah dari situs Bidanku.com akan diambil setiap kata pada kalimat judul artikel, disinilah sebenarnya persaingan antara situs terjadi, yaitu strategi dan teknik apa yang dipergunakan dalam melakukan sampling terhadap kata-kata yang akan menjadi kunci dalam pencarian arsip dan dokumen. Harap diingat bahwa tidak semua situs melakukan proses updating dan sampling ini secara kontinyu (24 jam sehari), yang dapat menyebabkan telah hilangnya beberapa arsip dan dokumen dari internet saat consumer mencarinya.

    five. Indexer

    Indexer merupakan sebuah application untuk mempercepat proses pencarian. Filosofi yang dipergunakan mirip dengan prinsip penggunaan indeks pada kamus atau buku-buku. Perang antar situs pun terjadi di sini, karena teknik melakukan indeks akan sangat berpengaruh terhadap kecepatan pencarian facts atau informasi. Biasanya yang terjadi di sini adalah adu algoritma (alur logika sebuah application) antar para programmer yang direkrut oleh masing-masing perusahaan.

    Berikut disajikan gambar yang memperlihatkan five (lima) komponen utama dari arsitektur sebuah application searching engine (Indrajit, 2000).

    Gambar: Komponen Utama Program Search Engine

     Sedangkan struktur umum sebuah mesin pencari adalah sebagai berikut :

  • Kotak teks pencari, kotak ini digunakan sebagai tempat memasukan kata kunci yang akan dijadikan acuan dilakukan pencarian.
  • Tombol pencari, tombol ini yang akan menjalankan perintah pencarian.
  •  C. Jenis Search Engine

    Berdasarkan cara mengumpulkan information halaman-halaman internet, mesin pencari dapat di kelompokkan menjadi four kategori :

    1.      Human Organized Search Engine

    Mesin pencari yang dikelola sepenuhnya oleh tangan manusia. Mesin pencari ini menggunakan metode dengan memilah-milih informasi yang relevan dan dikelompokan sedemikian rupa sehingga lebih bermakna dan bermanfaaat bagi penggunannya. Situs ini dalam prakteknya memperkerjakan para pakar dalam bidang-bidang tertentu, kemudian para pakar tersebut dapat mengkelompokan situs-situs tertentu sesuai dengan bidangnnya atau kategori situs itu sendiri.

    Contoh: Yahoo!(www.yahoo.com), LooKSmart (www.looksmart.com), About (www.approximately.com) , Open Directory (Dmoz.org).

    2.      Computer Created Search Engine

    Search engine kategori ini banyak memiliki kelebihan karena banyak menyajikan inforrmasi walaupun kadang-kadang ada beberapa informasi yang tidak relevan tidak seperti yang kita inginkan. Search engine ini telah menggunakan software program laba-laba atau spider software program yang berfungsi menyusup pada situs-situs tertentu, kemudian mengumpulkan records serta mengelompokan dengan sedikit bantuan tangan manusia.

    Contoh: WebCrawler (www.webcrawler.com), Excite (www.excite.com), Inktomi (www.inktomi.com), Northen Light (www.northenlight.com), Fast Search (www.altheweb.com).

    three.      Hybrid Seacrh Engine

    Merupakan gabungan antara tangan manusia dengan pc, sehingga menghasilkan hasil pencarian yang relative akurat. Peran manusia dalam hal ini adalah sebagai penelaah dalam proses pengkoleksian database halaman web. Sebenarnya tipe ini lah yang paling mudah pembuatannya karena dapat didesain sesuai dengan keinginan kita.

    Contoh: Google (www.google.com), Lycos (www.lycos.com), AltaVista (www.altavista.com), HotBot (www.hotbot.com), Go To (www.goto.com), Snap (www.snap.com), Direct Hit (www.directhit.com), Go (move.com).

    four.      MetaCrawler/Metasearch

    Merupakan perantara dari mesin pencari yang sebenarnya. Mesin ini hanya akan mengirimkan permintaan pencarian ke berbagai mesin pencari serta menampilkan hasilnya satu di layer browser sehingga akan menampilkan banyak sekali hasil dari ber bagai mesin pencari yang ada.

    Contoh: SavvySearch (savvysearch.com), Dogpile (www.dogpile.com), The Big Hub (www.infind.com), C4 Total Search (www.snap.com).

    Mesin pencari yang cukup populer, yaitu: Google, Yahoo!, Alltheweb, MSN, AskJeeves, AltaVista, dan Lycos. Mesin pencari orang: Infospace, Spock, Yellowpages.com, Zabasearch.com, Zoominfo. Mesin pencari visual: Grokker, Kartoo, Avintura. Mesin pencari multimedia: Blinkx, Find sounds, Pic seek, Podscope, Youtube.

    D.     Cara Kerja Search Engine

    Program Search Engine dalam menjalankan fungsinya sebenarnya bekerja bersamaan dengan Browser. Ketika kita mengetikkan sesuatu lalu Enter,  Search Engine-lah yang bekerja melakukan pencarian di database. Hasil yang didapat diberikan kembali ke Browser, lalu Browser menampilkannya untuk kita dalam format yang mudah kita mengerti. Sebenarnya Search Engine tidak tampak, ia bekerja di balik layar. Search Engine juga sebenarnya bekerja dengan teman-temannya yaitu crawler atau indexer atau robot atau bot.

    Sederhananya, proses yang berlangsung adalah: saat person membuka Browser, dan memerintahkan pencarian, maka browser minta tolong Search Engine untuk mencarikan. Jika sudah didapat, hasilnya dikembalikan ke Browser dan Browser menampilkannya untuk person. Semuanya berlangsung sangat cepat sehingga kita tidak mengetahui proses sesungguhnya yang terjadi.

    Mesin pencari internet bekerja dengan cara menyimpan informasi tentang banyak halaman net, yang diambil secara langsung dari www. Halaman ini di ambil dengan net crawler-browser net yang otomatis mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya kata-kata di ambil dari judul, subjudul, atau field khusus yang di sebut meta tag). Data tentang halaman internet disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya.

    Sebagian mesin pencari seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman net itu sendiri. Ketika seorang pengguna menggunakan mesin pencari dan memasukan question, biasanya dengan memasukan kata kunci, mesin mencari akan mengindeks dan memberikan daftar halaman internet yang paling sesuai dengan kriterianya. Daftar ini biasanya disertai ringkasan singkat menggenai judul dokumen dan terkadang sebagian teks dari hasil pencarian yang kita cari.

    Sangat banyak hasil statistics yang akan di munculkan oleh mesin pencari ketika pengguna mengetikan sebuah kata kunci, urutan yang ada di paling atas atau halaman pertamalah yang mempunyai isi paling akurat. Keakuratan sebuah mesin pencari dalam menyajikan data dan informasi yang dicari oleh pengguna dapat menjadi tolak ukur kualitas sebuah mesin pencari. Semakin tinggi keakuratan facts yang disajikan maka semakin baik mesin pencarian tersebut. Untuk mencari sebuah informasi pada sebuah laman web, juga bisa dituliskan pada query web yang telah kita buka.

    Secara umum, cara kerja mesin pencarian dimulai saat person menulis alamat internet site (URL). Saat alamat internet terisi, maka spider dari seek engine akan menerima dan menganalisa URL. Secara otomatis spider memutuskan internet yang didaftar layak diterima atau tidak. Jika layak, maka spider langsung menambahkan alamat URL tersebut ke sistem database. Rangking segera ditetapkan dengan algoritma dan caranya masing-masing. Jika tidak layak maka customers terpaksa bersabar dan mengulangi pendaftaran diwaktu yang lain.

    E.     Mesin Pencarian Google

    Google merupakan sebuah perusahaan publik Amerika Serikat, berperan dalam pencarian Internet, Cloud Computing, serta teknologi iklan on line & perangkat lunak (mesin pencari terbesar di dunia). Alamat net (http://www.google.com).

    Selain pencarian net, Google juga menyediakan jasa pencarian gambar, pencarian berita serta pencarian pada arsip USENET (newsgroup), serta direktori, seperti Yahoo! Kelemahannya terletak pada tidak tersedianya pencarian file, video, dan audio. Keunggulan Google terutama adalah pada pencarian teks, terutama dari algoritma PageRank, database-nya yang besar serta banyaknya jenis record yang diindeksnya.

    Kelebihan:

  • Kecepatan dan kemudahan dalam mencari
  • lebih canggih dengan fitur yang dimilikinya
  • Tampilan yang sederhana
  • Google merupakan satu-satunya mesin pencari yang memilki cach. Dengan adanya cache ini, si pencari dapat menghemat waktu pencarian, karena hasil pencarian yang akan ditampilkan
  • Dapat mencari segala informasi seperti gambar, berita artikel, hiburan dll.
  • Kekurangan:

    Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer untuk menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada halaman terdepan. Maka, pencarian pun terasa tergangggu.

    F.     Fitur Pencarian Google

    Secara umum, jenis pencarian pada mesin pencarian/website ada dua yaitu: Basic Search dan Advanced Search. Basic Search adalah fitur pencarian yang sudah biasa kita gunakan yaitu ketika mengakses langsung, missal pada google.com. Sedangkan Advanced Search menyediakan berbagai pilihan fitur pencarian baik untuk operator dasar, report format yang ingin kita cari, bahasa, area, dsb.

    Sebenarnya masih sangat banyak fitur pencarian yang bisa kita gunakan, tapi tidak terdapat di menu pilihan Advanced Search. Dengan kata lain kita harus memasukannya query di form pencarian di Basic Search langsung. Di bawah ini akan disajikan permainan question dan operator pencarian.

  • Fitur Pencarian Dasar
  • FRASE: Mencari informasi yang mengandung frase yang dicari dengan menggunakan tanda “”. Contoh: “kesehatan reproduksi”
  • SINONIM (~): Mencari kata beserta sinonim-sinonimnya. Contoh di bawah akan membawa hasil pencarian: bayi baru lahir (little one) dan sinonimnya. Contoh: ~toddler
  • ASTERIK (*): Karakter pengganti kata. Dari contoh di bawah, hasil yang didapat bisa: ikan bakar pedas, ikan goreng pedas, ikan masak pedas, dsb. Contoh: ikan * pedas
  • TANDA TITIK (.): Karakter pengganti huruf, angka dan karakter tunggal. Dari contoh di bawah, hasil yang didapat bisa: kopi, koki, kodi, dsb. Contoh: ko.i
  • CASE INSENSITIVE: Pencarian di Google menganggap kapital dan bukan kapital sebagai sesuatu yang sama. Jadi, kehamilan aterm, Kehamilan Aterm, KEHAMILAN aterm, akan membawa hasil pencarian yang sama
  • PENGABAIAN KATA: Google mengabaikan key-word berupa karakter tunggal dan kata-kata berikut: a, approximately, an, and, are, as, at, b, via, from, how, i , in, is, it, of, on, or, that, the, this, to, we, what, while, wherein, which, with. Apabila kita masih tetap menginginkan pencarian kata tersebut, bisa dengan menggunakan karakter + di depan kata yang dicari (contoh: Love Rain Episode +I), atau bisa juga dengan menganggapnya sebagai frase (contoh: “Love Rain Episode I”)
  • I’M FEELING LUCKY: Akan membawa kita langsung menuju ke hasil pencarian pertama dari question kita.
  • Fitur Pencarian Lanjut
  • DEFINE: Mencari definisi dari sebuah terminologi. Dari contoh di bawah, hasil yang didapat adalah berbagai definisi tentang e-learning dari berbagai sumber. Contoh: define:e-mastering
  • CACHE: Menampilkan situs internet yang telah diindeks oleh Google meskipun sudah tidak aktif lagi. Contoh di bawah akan menghasilkan pencarian kata personal home page pada situs bidanku.com yang ada di indeks Google. Contoh: cache:bidanku.com personal home page
  • LINK: Menampilkan daftar hyperlink yang mengarah ke sebuah situs. Contoh di bawah akan menampilkan daftar link yang mengarah ke situs bidanku.com. Contoh: link:bidanku.com
  • RELATED: Menampilkan daftar situs yang serupa, mirip atau memiliki hubungan dengan suatu situs. Contoh: associated:oshigita.wordpress.com
  • INFO: Menampilkan informasi yang Google ketahui tentang sebuah situs. Contoh: information:oshigita.wordpress.com
  • SITE: Menampilkan pencarian khusus di suatu situs yang ditunjuk. Contoh: java website online:bidanku.com
  • FILETYPE: Menampilkan hasil pencarian berupa suatu jenis (ekstensi) file tertentu. Jenis report yang bisa dicari adalah: doc, xls, rtf, swf, playstation , lwp, wri, ppt, pdf, mdb, txt, dsb. Contoh di bawah akan menampilkan hasil pencarian berupareport PDF yang mengandung keyword preeklamsi berat. Contoh: preeklamsi berat filetype:pdf
  • ALLINTITLE: Menampilkan seluruh kata yang dicari dalam TITLE halaman. Contoh di bawah akan menghasilkan halaman yang memiliki name mola hidatidosa. Allintitle ini tidak dapat digabungkan dengan operator (sintaks) lain. Gunakan intitle untuk keperluan itu. Contoh: allintitle:mola hidatidosa
  • INTITLE: Menampilkan satu kata yang dicari dalam TITLE halaman. Contoh di bawah akan menghasilkan halaman yang memiliki identify kehamilan dan isi halaman yang mengandung kata perdarahanContoh: intitle:kehamilan perdarahan
  • ALLINURL: Menampilkan seluruh kata yang dicari di dalam URL. Contoh di bawah akan menghasilkan daftar URL yang mengandung kata imunisasi dan bayi. Allinurl ini tidak dapat digabungkan dengan operator (sintaks) lain. Gunakan inurl untuk keperluan itu. Contoh: allinurl:imunisasi bayi
  • INURL:  Menampilkan satu kata yang dicari di dalam URL. Contoh di bawah akan menghasilkan daftar URL yang mengandung kata kontrasepsi dan isi halaman yang mengandung kata hormonalContoh: inurl:kontrasepsi hormonal
  • G. Boolean Logic

    Boolean common sense adalah suatu pencarian pelacakan yang menyatakan tentang hubungan antara variabel yang dicari dengan variabel terkait. Boolean common sense juga merupakan identifikasi spesifik tentang artikel yang akan dicari. Boolean logic dikembangkan oleh George Boole (1815-1864), adalah suatu metode pencarian informasi, yang memfokuskan hasil penelusuran dimana pencarian datanya menggunakan kata kunci.

    Boolean logic terdiri dari operasi logika AND, OR dan NOT. Pada fitur pencarian Google, operasi ini merupakan bagian dari fitur pencarian dasar. Penggunaan operasi logika ini dapat memudahkan consumer dalam mendapatkan informasi yang diinginkan. Boolean good judgment gemelli

  • NOT: Hasil pencarian mengandung kata yang di depan, tapi tidak yang dibelakang minus (-). Contoh di bawah akan mencari informasi yang mengandung kata kontrasepsi tapi bukan suntik. Contoh: kontrasepsi –suntik.
  • Pencarian yang kita lakukan akan semakin efektif apabila kita mencoba menggabungkan beberapa operator baik yang ada di fitur pencarian dasar, pencarian lanjut, maupun Boolean good judgment. Misalnya, kita ingin mencari file PDF  tentang kehamilan ektopik (ectopic pregnancy) yang ada di situs www.ncbi.nlm.nih.gov. Maka kita gabungkan tiga operator menjadi; Contoh: ectopic AND pregnancy filetype:pdf web site:www.ncbi.nlm.nih.gov.

    Sumber:

  • http://www.google.com/intl/en/assist/fundamentals.html
  • http://www.google.com/intl/en/help/operators.html
  • http://www.google.com/intl/en/help/cheatsheet.html
  • http://googling-dengan-logika-matematika.html
  • http://logika boolean/index.personal home page.htm
  • http://identity.wikipedia.org/wiki/Mesin_pencari_web.
  • Leave a Reply

    Your email address will not be published. Required fields are marked *