Cari Blog Ini

Laman

Total Tayangan Halaman

Minggu, 23 Desember 2012


Pengembangan Reposotori Data Antar Lembaga Informasi dengan Protokol Open Archive Initiative

Misi OAI

OAI  (Open Archive Initiative), merupakan upaya bersama untuk menciptakan kerja sama dan interoperability yang memungkinkan pertukaran dan penyebaran informasi secara lebih luas. OAI bermula dari upaya meningkatkan akses pengguna terhadap arsip dokumen digital, terutama yang dapat memperlancar komunikasi ilmiah. Kepedulian terhadap kelancaran akses ini kemudian berhadapan dengan kenyataan bahwa teknologi yang digunakan oleh berbagai institusi seringkali berbeda dan berpotensi mempersulit pertukaran dan akses data. Kemudian OAI memfokuskan diri pada pengembangan teknologi yang dapat mengatasi masalah-masalah tersebut, terutama dengan mengembangkan standar dan kesepakatan antar penyedia teknologi maupun penyedia jasa informasi.

OAI Eksekutif

Eksekutif OAI-BIJIH menyediakan kepemimpinan secara keseluruhan terhadap proyek dan memegang tanggung jawab utama untuk anggaran proyek dan keberhasilan akhir pekerjaan.
Carl Lagoze - Komputasi dan Ilmu Informasi, Cornell University
Herbert Van de Sompel - Penelitian Perpustakaan Digital dan Prototyping, Los Alamos Laboratorium Perpustakaan Riset Nasional

Pendanaan dan Dukungan 

Dukungan dan pendanaan untuk OAI  (Open Archive Initiative) berasal dari Andrew W. Mellon Foundation, the Coalition for Networked Information, the Digital Library Federation, and from the National Science Foundation (IIS-9817416 and IIS-0430906).

Tentang OAI-PMH

Asal mula OAI adalah untuk mengembangkan penampungan e-print (e-print repositories). Himpunan inilah yang diartikan sebagai archives dalam kepanjangan OAI. Istilah e-prints dapat diterjemahkan secara sederhana sebagai “naskah elektronik”, merupakan versi elektronik atau digital dari laporan penelitian ilmiah atau karya sejenis lainnya. Naskah ini dapat merupakan pre-print atau naskah yang belum diperiksa (belum melalui proses per review), atau juga yang merupakan post-print atau sudah diperiksa (tentang hal ini, baca juga Jurnal Elektronik). Termasuk pula di sini segala versi digital dari artikel jurnal, bab dari sebuah buku, makalah yang ditampilkan di seminar ilmiah, atau segala bentuk laporan penelitian yang tergolong technical reports. Semua ini dikaitkan dengan e-print archive atau simpanan (repository) naskah elektronik yang tersedia secara online untuk diakses orang banyak. Profesi arsiparis lebih suka memakai istilah repository karena tidak mengandung fungsi kurator dan preservasi. 

E-print repositories pertama-tama dikembangkan sebagai upaya memperlancar komunikasi antar ilmuwan tentang penelitian mereka sebelum dikirim untuk diperiksa atau diterbitkan di jurnal. Upaya awal ini antara lain dilakukan oleh para ilmuwan di bidang fisika, khususnya dalam penelitian tentang energy pada tahun 1991 yang saat ini menjadi arXiv (http://arxiv.org). Hal ini kemudian diikuti oleh CogPrints yang mengkhususkan diri di bidang psikologi, linguistik, dan ilmu urat syaraf. Setelah itu bermunculan berbagai upaya yang serupa. Inti dari upaya mekanisme ini adalah kesediaan para penulis menyerahkan atau mendepositkan karya mereka, sehingga OAI sebenarnya adalah sebuah praktik penyimpanan kolektif secara individual. Para penulis dan penyimpan ini kemudian menggunakan interface berbasis Web untuk menyimpan dan menemukan kembali berbagai artikel (lihat juga pembahasan tentang cross searching dan harvesting). 

Pada mulanya, berbagai ruang penyimpanan e-print ini memiliki beragam interface, sehingga seorang ilmuwan perlu mencari di berbagai tempat penyimpanan berbeda dan hal itu bearti dia perlu berkali-kali berganti strategi pencarian. Untuk mempermudah pencarian lintas bidang dan lintas e-prints, maka OAI bertekad menyebarluaskan pemakaian protokol atau kesepakatan yang dikenal dengan nama The Open Archives Initiative's Protocol for Metadata Harvesting (OAI-PMH). Ini adalah semacam standar yang dapat diikuti oleh para pembuat Web interface bagi kepentingan penyimpanan dan penemuan kembali e-print. Pada dasarnya OAI-PMH mengandung sebuah kerangka kerja (framework) sederhana yang ditujukan bagi pengembangan apa yang dikenal dengan metadata harvesting. Jika sebuah tempat penampungan e-print mengikuti standar OAI-PMH, maka mesin-mesin pemanen (harvesters) dapat mengumpulkan informasi metadata darinya dan menyelaraskan informasi itu dengan yang didapat dari tempat lain, sehingga seolah-olah berbagai tempat penampungan itu memiliki satu himpunan metadata. Lalu, ketika seorang ilmuwan bermaksud mencari secara lintas bidang, dia tidak perlu mengunjungi semua tempat penampungan tadi, melainkan cukup mencarinya di himpunan metadata tersebut.

Saat ini OAI-PMH sudah diterima secara cukup luas dan terutama memang digunakan bersama-sama metadata Dublin Core untuk karya-karya ilmiah. Dalam perkembangannya, OAI-PMH tidak hanya digunakan untuk berbagai keperluan yang berintikan upaya mempermudah pencarian informasi lintas pangkalan data. Dengan kata lain, OAI-PMH memang memfasilitasi interoperability antar berbagai keragaman dalam penggunaan sistem dan metadata. Sebagai sebuah protokol, ia juga memanfaatkan standar lain yang sudah umum di dunia Web yaitu XML, HTTP dan Dublin Core.

Dalam protokol ini, keseluruhan sistem OAI dilihat sebagai dua bagian besar. Bagian pertama adalah penghimpun atau penyedia data (repositories) yang sejak awal berfungsi untuk menyediakan metadata mereka secara terbuka di Web. Bagian kedua adalah penyedia jasa atau pemanen (service providers atau harvesters), yang mengumpulkan berbagai metadata, baik secara total maupun secara selektif. Protokol OAI menganjurkan para penyedia data untuk menyiapkan metadata, setidaknya merujuk ke Dublin Core berjenis unqualified; walaupun ini bukanlah harga mati. Lebih lanjut lagi, protokol ini juga mengatur sedemikian rupa sehingga penyedia data dapat berkonsentrasi pada penghimpunan dan pengembangan koleksi mereka, sementara pihak penyedia jasa dapat berkonsentrasi pada pengembangan interface yang mempermudah seorang pencari menjelajahi berbagai tempat repositories. Apa yang kemudian dilakukan setelah metadata dihimpun oleh sebuah mesin pemanen, memang tidak diatur di OAI-PMH. Namun biasanya para penyedia jasa mengolah lebih lanjut kumpulan metadata yang dikelolaanya, lalu membuat sistem pengindeksan untuk temu-kembali.

Sebagaimana dikatakan di situs resmi mereka, perlu juga kita catat bahwa dalam model tersebut pihak penyedia jasa memang menghimpun metadata, tetapi tidak ada kegiatan pencarian langsung (live search requests) ke penyedia data. Jika jasa yang tersedia adalah jasa temu kembali, maka permintaan pengguna akan dijawab dari himpunan metadata yang dikelola oleh penyedia jasa. 
Di gambar tersebut juga terlihat bahwa kegiatan pengelolaan metadata, sesuai protokol OAI-PMH, dilakukan dengan permintaan (request) yang berbasis HTTP. Pernyataan atau argumen untuk request ini berupa parameter sederhana, seperti GET atau POST. Di dalam OAI-PMH dikenal ada enam jenis request, yang dikenal juga sebagai “kata kerja” alias “verb”.

Keenam “kata kerja” OAI-MPH itu adalah berupa perintah untuk:
1. Mencari tahu keberadaan dan identitas sebuah penyedia jasa (Identify)
2. Membuat daftar format metadata yang ada (ListMetadataFormats)
3. Membuat daftar sets metadata (ListSets)
4. Membuat daftar penunjuk cantuman (ListIdentifiers)
5. Mengambil serangkaian cantuman metadata (ListRecords)
6. Mengambil satu cantuman saja (GetRecord)

Berdasarkan permintaan dari pihak penyedia jasa, maka pihak penyedia data lalu memberikan respon dalam bentuk kode XML. Sebab itulah, protoko OAI-PMH mensyaratkan bahwa metadata sebaiknya dibuat dengan XML dan setidaknya menggunakan format Dublin Core berjenis unqualified. Sama halnya dengan pihak penyedia jasa atau pemanen yang boleh menentukan apakah akan dilakukan secara total atau secara selektif, maka pihak penyedia data juga boleh menentukan tingkat kehalusan (granularity) metadata yang mereka sediakan. Selain itu, penyedia jasa juga dianjurkan membuat semacam informasi tentang kapan metadata itu terakhir dimodifikasi dalam bentuk tanggal (date stamps).

Berbagai institusi di seluruh dunia kini memanfaatkan protokol-protokol OAI karena sifatnya yang terbuka dan tersedia secara bebas di Internet. Selain itu, tentu saja semakin banyak institusi yang menggunakannya, semakin terciptalah interoperability yang meluas, dan ini menguntungkan semua pihak yang berpartisipasi. Protokol OAI juga mendukung aneka skema metadata, sehingga tidak menghalangi fleksibilitas bagi setiap pihak untuk mengatur sendiri metadata mereka. Institusi yang memiliki beragam jenis sumberdaya digital atau yang ingin mengembangkan jaringan antar berbagai insitusi yang memiliki keragaman sumberdaya, juga menyukai protokol OAI dengan meniru pola OAIster. Misalnya, PictureAustralia (PA)  merupakan sebuah penyedia jasa federated search yang menggunakan OAI-PMH. Lembaga ini menjadi semacam “pintu masuk” jika orang ingin mencari foto tentang Australia yang dihimpun oleh berbagai lembaga budaya di negeri itu, termasuk perpustakaan, kantor-kantor arsip, dan museum. Sebagai kesatuan, jaringan ini memiliki lebih dari 1 juta foto dan gambar digital, melibatkan 31 institusi. 

Secara teknis, PictureAustralia membuat sebuah pangkalan data yang melakukan harvesting ke semua anggota jaringan. Lalu, hasil ini dihimpun di satu pangkalan data di bawah infrastruktur Perpustakaan Nasional Australia. Tentu saja, Perpustakaan Nasional ini tidak menghimpun semua gambar di satu pangkalan data, melainkan hanya metadata-nya. Dengan kata lain pula, sesuai Model OAI di atas, maka Perpustakaan Nasional adalah pihak “penyedia jasa”. Himpunan metadata ini sebenarnya kemudian juga adalah sebuah katalog induk (union catalogue).

Jika kita mencari di situs PictureAustralia dan menemukan apa yang dicarinya, maka kita kemudian dapat menuju institusi yang menyimpan gambar atau foto. Di institusi itulah kita dapat melihat segala penjelasan lebih lanjut tentang tata cara mengambil, menggunakan, atau memahami gambar/foto yang diperlukannya. Untuk dapat menyediakan jasa seperti ini, PictureAustralia melakukan metadata harvesting secara terus-menerus dan bertambahan setiap saat (incremental). Proses seperti ini sangat bergantung kepada pembaruan (updating), sebab tidak berjalan secara real-time . Untuk menghindari kesenjangan data antara penyedia data dan penyedia jasa, maka jangka waktu harvesting harus diperpendek. Itulah memang salah satu kelemahan harvesting.

Dalam kasus PictureAustralia, digunakan cara-cara gabungan (hybrid) sebagaimana terlihat di gambar berikut. Harvesting terhadap institusi-institusi besar dilakukan setiap hari, sementara terhadap institusi yang lebih kecil dilakukan seminggu sekali. Lalu, PictureAustralia sendiri diperbarui setiap minggu.

Berdasarkan kesuksesan PictureAustralia, selanjutnya Perpustakaan Nasional Australia juga menggunakan sistem serupa untuk National Bibliographic Database (NBD)  yang menyediakan akses pencarian dan penemuan kembali terhadap 13 juta data bibliografi yang disimpan oleh berbagai perpustakaan di seluruh negeri itu. Dengan protokol OAI, maka NBD dapat menyediakan fasilitas pemakaian katalog secara bersama (shared cataloguing) dan pinjam antar perpustakaan (inter-library loans). Sebelum menggunakan protokol OAI, para perpustakaan nasional biasanya mengandalkan pengiriman secara aktif oleh perpustakaan-perpustakaan dalam bentuk cantuman MARC melalui file transfer protocol (FTP). Ini tentunya sangat bergantung kepada disiplin pengiriman oleh para anggota. Setelah menggunakan protokol OAI, ‘wajib setor’ ini dapat diganti dengan prosedur Harvesting yang menjungkir-balikkan paradigma, karena sekarang yang aktif ‘menjemput bola’ justru perpustakaan-perpustakaan nasional.

DAFTAR PUSTAKA
Perpuspedia (2010). Open Archive Initiative. http://perpuspedia.digilib.pnri.go.id/index.php/Open_Archive_Initiative, 10 April 2011
OAI PMH. Open Archive Initiative. http://www.openarchives.org/OAI/OAI-organization.php, 10 April 2011

Tidak ada komentar: