Monday, February 18, 2013

Mesin Otomatis untuk Merekonstruksi Bahasa Purba

Bahasa Purba
Model komputasi ini didasarkan pada ketetapan teori linguistik bahwa kata-kata yang berevolusi di sepanjang cabang-cabang pohon keluarga mencerminkan kekerabatan linguistik yang berevolusi dari waktu ke waktu.
Bahasa purba menyimpan harta karun berupa informasi tentang budaya, politik dan perdagangan di masa ribuan tahun lalu. Namun, merekonstruksi bahasa purba untuk mengungkapkan petunjuk tentang sejarah manusia membutuhkan kerja keras selama puluhan tahun. Kini, para ilmuwan dari University of California, Berkeley, telah menciptakan sebuah “mesin waktu” otomatis, yang akan mempercepat dan meningkatkan proses rekonstruksi ratusan bahasa leluhur.
Dalam rangka menghadirkan contoh tentang bagaimana “data besar” dan mesin pembaca mulai menciptakan dampak yang signifikan bagi semua aspek pengetahuan, para peneliti dari UC Berkeley dan University of British Columbia telah menciptakan sebuah program komputer yang dapat merekonstruksi dengan cepat “proto-bahasa”, linguistik nenek moyang yang menjadi asal muasal semua bahasa modern berevolusi. Bahasa paling awal yang baru diketahui meliputi Proto-Indo-Eropa, Proto-Afroasiatik dan, dalam kasus ini, Proto-Austronesia, yang memunculkan bahasa di Asia Tenggara, beberapa bagian di benua Asia, Australasia dan Pasifik.
“Yang mengejutkan saya tentang sistem ini adalah dibutuhkan begitu banyak ide-ide besar yang dimiliki para ahli bahasa dalam hal rekonstruksi sejarah, dan secara otomatis mengubah ide-ide tersebut ke dalam skala baru: lebih banyak data, lebih banyak kata, lebih banyak bahasa, namun dengan lebih sedikit waktu,” kata Dan Klein, profesor ilmu komputer di UC Berkeley.
Model komputasi dari tim peneliti ini menggunakan penalaran probabilistik – yang mengeksplorasi logika dan statistik untuk memprediksi suatu hasil – merekonstruksi lebih dari 600 bahasa Proto-Austronesia dari ketersediaan database yang memuat lebih dari 140.000 kata, mereplikasi apa yang sudah dilakukan secara manual oleh para ahli bahasa dengan tingkat akurasi hingga 85 persen. Sementara rekonstruksi manual merupakan proses ketelitian yang memakan waktu hingga bertahun-tahun, sistem ini dapat melakukan rekonstruksi berskala besar dalam hitungan hari atau bahkan jam, kata para peneliti.



Cabang-cabang bahasa purba pada pohon silsilah Proto-Austronesia menjadi bagian dari bahan rekonstruksi yang secara otomatis diproses dengan model komputasi UC Berkeley. (Kredit: University of California – Berkeley)


Program ini tidak saja akan mempercepat kemampuan para ahli bahasa untuk merombak dunia proto-bahasa dalam skala besar, meningkatkan pemahaman kita tentang peradaban kuno berdasarkan kosakata mereka, namun juga dapat memberi petunjuk pada bagaimana bahasa bisa berubah di tahun-tahun mendatang dari sekarang.
“Model statistik kami dapat digunakan untuk menjawab pertanyaan-pertanyaan ilmiah tentang bahasa dari masa ke masa, tidak hanya untuk membuat kesimpulan tentang masa lalu, tetapi juga untuk memprediksi bagaimana bahasa bisa berubah di masa depan,” kata Tom Griffiths, profesor psikologi dan direktur Computational Cognitive Science Lab di UC Berkeley.
Penemuan UC Berkeley ini bertujuan untuk memaknai data yang besar serta menggunakan teknologi baru untuk dokumentasi dan memelihara bahasa yang terancam punah sebagai sumber daya yang penting bagi pelestarian budaya dan pengetahuan. Sebagai contohnya, para peneliti berencana menggunakan model komputasi yang sama untuk merekonstruksi proto-bahasa asli Amerika Utara.
Catatan tertulis paling awal yang dibuat manusia sudah muncul lebih dari 6.000 tahun yang lalu, lama setelah bermunculannya proto-bahasa. Sementara para arkeolog dapat sekilas menangkap langsung bahasa purba dalam bentuk tulisan, ahli bahasa biasanya menggunakan apa yang dikenal sebagai “metode komparatif” untuk menyelidiki masa lalu. Metode ini menetapkan kekerabatan antar bahasa, mengidentifikasi suara yang berubah dengan keteraturan dari waktu ke waktu untuk menentukan apakah suara tersebut berakar dari bahasa ibu yang sama.
“Untuk memahami bagaimana bahasa berubah – yang terdengar lebih mungkin untuk berubah dan seperti apa jadinya hasil perubahan itu – dibutuhkan rekonstruksi dan analisis sejumlah besar bentuk kata leluhur, di mana rekonstruksi otomatis memainkan peran penting,” kata Alexandre Bouchard-Côté, asisten profesor statistik di University of British Columbia dan penulis utama studi.
Model komputasi UC Berkeley ini didasarkan pada ketetapan teori linguistik bahwa kata-kata yang berevolusi di sepanjang cabang-cabang pohon keluarga – lebih seperti pohon silsilah – mencerminkan kekerabatan linguistik yang berevolusi dari waktu ke waktu, dengan akar dan simpul yang mewakili proto-bahasa serta daun yang mewakili bahasa modern.
Dengan menggunakan algoritma yang dikenal sebagai sampler Markov merantai Monte Carlo, program ini memilah-milah berbagai set rumpun, kata-kata dalam beberapa bahasa yang berakar dari satu suara, sejarah dan asal yang sama, untuk menghitung peluang adanya set yang merupakan turunan dari proto-bahasa tertentu. Pada tiap-tiap langkah, program ini menyimpan rekonstruksi terhipotesis untuk tiap kognitif dan tiap bahasa leluhur.
“Karena perubahan suara dan rekonstruksinya saling terkait erat, maka sistem kami menggunakannya untuk meningkatkan satu sama lain secara berulang-ulang,” jelas Klein. “Sistem ini pertama memperbaiki prediksinya pada perubahan suara dan menyimpulkan rekonstruksi bentuk-bentuk purba yang lebih baik lagi. Selanjutnya memperbaiki rekonstruksi dan menganalisis ulang perubahan suara. Langkah-langkah ini diulang, dan kedua prediksi secara bertahap meningkat sebagai dasar struktur yang muncul dari waktu ke waktu.”

Kredit: University of California – Berkeley
Jurnal: A. Bouchard-Cote, D. Hall, T. L. Griffiths, D. Klein. Automated reconstruction of ancient languages using probabilistic models of sound changeProceedings of the National Academy of Sciences, 2013; DOI: 10.1073/pnas.1204678110

(Sumber http://faktailmiah.com/)

0 comments:

Post a Comment