Himam Miladi
Himam Miladi Penulis

Freelance Content Writer| Blogger | Editor | Email : himammiladi@gmail.com

Selanjutnya

Tutup

Digital Artikel Utama

Mendulang Data Ilmiah lewat Mesin Pencari Khusus "Dataset Search"

10 September 2018   12:59 Diperbarui: 10 September 2018   19:00 1517 10 7
Mendulang Data Ilmiah lewat Mesin Pencari Khusus "Dataset Search"
Ilustrasi: World Techpedia

Mesin pencari internet, baik itu Google Search maupun Bing dan lainnya dirancang untuk memuat segala macam informasi. Mulai dari berita (baik fakta maupun hoax) sampai ke kumpulan lagu-lagu berformat mp3. Karena algoritma yang dipakai adalah berdasarkan kata kunci yang umum, mesin pencari seperti ini tidak bisa menelusuri sebuah permintaan khusus. Seperti untuk mencari set data.

Karena itulah, untuk mempermudah pencarian hal-hal yang khusus, Google mengembangkan mesin pencari khusus pula. Jika kita ingin mencari kumpulan hasil penelitian ilmiah, jurnal ilmiah, atau buku-buku ilmiah yang sudah diterbitkan, Google menyarankan untuk mencarinya di Google Scholar. Disini, hasil pencarian berdasarkan kata kunci yang kita inginkan tidak akan tercampur-baur dengan informasi dari situs-situs umum.

Yang terbaru, Google telah meluncurkan jenis mesin telusur baru yang dirancang khusus untuk membantu orang menemukan data. Namanya Dataset Search. Mesin telusur ini menyediakan akses lebih mudah ke jutaan dataset di ribuan repositori data di web.

Bentuknya masih dalam tahap beta atau ujicoba. Karena itu Google belum memberikan alamat tersendiri dari mesin telusur baru. Untuk mengaksesnya, kita bisa meluncur ke alamat toolbox.google.com/datasetsearch.

Siapa pun dapat menggunakan Dataset Search ini. Tetapi Google menekankan manfaatnya bagi para jurnalis dan ilmuwan yang membutuhkan data.

"Di dunia sekarang ini, para ilmuwan di banyak disiplin ilmu dan banyak jurnalis hidup dan bernapas dari sekumpulan data ... Untuk memungkinkan akses mudah ke data ini, kami meluncurkan Dataset Search, sehingga para ilmuwan, jurnalis data, data geeks, atau siapa pun dapat menemukan data yang diperlukan untuk pekerjaan dan cerita mereka, atau hanya untuk memuaskan keingintahuan intelektual mereka. "

Tampilan permukaan Dataset berasal dari situs penayang, pustaka digital, atau laman web pribadi pengarang. Karena dirancang untuk keperluan khusus, yakni kumpulan data,  mesin pencari Google yang terbaru ini  sebagian besar bergantung pada skema dataset markup yang disediakan situs penayang. 

Dataset markup memungkinkan penerbit untuk mendeskripsikan data mereka dengan cara yang Google (dan mesin pencari lainnya) dapat lebih memahami isi halaman mereka. Untuk memudahkan penyedia data, Google menyediakan panduan khusus bagaimana cara menulis sebuah data sehingga bisa dibaca oleh mesin pencari ini, yang bisa diakses di laman developer Google.

Seperti yang tampak dalam tangkapan layar berikut ini:

tangkapan layar Dataset Search (dokumentasi pribadi)
tangkapan layar Dataset Search (dokumentasi pribadi)
Sebelah kiri adalah kumpulan situs penayang yang menyediakan data sesuai dengan kata kunci yang kita ketikkan. Jika kita memilih salah satunya, maka pada bilah sebelah kanan akan termuat deskripsi dari data yang disajikan situs tersebut. Inilah yang dimaksud dataset markup.

Secara lengkap, dataset markup memuat informasi :

Nama situs yang memuat, nama informasi data yang disediakan (berhubungan dengan kata kunci yang kita cari), tanggal data diunggah/diupdate, nama pengunggah/pengarang, jenis lisensi (common creative/public domain, berbayar, atau keanggotaan), format data saat diunduh (bisa berupa zip, pdf, word atau format lainnya yang mendukung), deskripsi singkat (semacam abstrak) dan yang terakhir adalah penjelasan isi data.

Namun, tidak semua situs penayang memuat dataset markup yang lengkap seperti contoh diatas. Karena itu, Google mendorong penyedia dataset untuk memanfaatkan markup ini agar konten mereka dapat disertakan dalam Dataset Search.

Saat ini, Dataset Search dapat digunakan untuk mencari referensi ke sebagian besar dataset dalam ilmu lingkungan, ilmu sosial, serta data pemerintah yang disediakan oleh organisasi berita. Berhubung mesin telusur khusus data ini masih dalam tahap ujicoba, jumlah situs penayang yang terindeks terhitung tidak terlalu banyak. 

Berbeda dengan mesin telusur umum yang jumlahnya bisa mencapai milyaran situs. Bahkan, situs penayang data dari Indonesia saja bisa dihitung dengan jari. 

Yang paling sering muncul saat saya mencoba mencari beberapa data hanya dari LIPI saja. Sayangnya, untuk mengunduh data dari LIPI semacam ini, pengguna harus sudah terdaftar pada situs yang bersangkutan, meskipun dalam deskripsi data di mesin telusur tertera lisensi data adalah Common Creative.

contoh Dataset dari LIPI (dokumentasi pribadi)
contoh Dataset dari LIPI (dokumentasi pribadi)
Dataset Search tersedia dalam beberapa bahasa dan bekerja seperti mesin pencari lainnya. Cukup ketik apa yang ingin kita cari dan Google akan menampilkan kumpulan data yang relevan. Dan sebagaimana mesin telusur biasa, Google juga memberi fitur "saran", artinya saat kita mengetik sebuah kata kunci pada kotak pencarian, secara otomatis akan muncul kata kunci yang relevan pada bagian bawahnya.

Sumber: Blog Google