Nyobain Pengalaman Baru Ikutan Kompetisi Wikisource 2025, Seberapa Kuat Meng-Uji Baca Teks Ejaan Lama?
Berawal dari sebuah notifikasi di grup WAG BAKATUWA dari Kak Qure (bestie satu geng di Komunitas Ibu Profesional, wkwk), berakhir dengan tempelan koyo di punggung selama berhari-hari, wkwk. Loh, apa maksudnya nih?
Awal tahun 2025 ini Kak Qure (sebagai panitia Kompetisi) menginfokan tentang kompetisi Wikisource 2025 yang akan dibuka pendaftarannya di tanggal 5 Januari 2025. Sebelum kita cerita ke mana-mana, agar frekuensi kita seirama, mari saya jelaskan dulu tentang Wikisource, yaaa~ 😊
Wikisource atau Wikisumber (dalam bahasa Indonesia adalah perpustakaan daring yang berisikan naskah bebas. Wikisource ini salah satu proyek dari Yayasan Wikimedia yang bertujuan untuk membangun perpustakaan naskah sumber. Wikisoure berisi teks-teks sumber, terjemahan teks-teks sumber dalam berbagai bahasa, dan naskah-naskah sumber pertama (primary source).
Nah, agar naskah-naskah ini bisa dibaca dengan nyaman, maka dibutuhkan kontributor untuk menyelaraskannya dengan teks asli. Kegiatan menyelaraskan yang dilakukan oleh para kontributor di Wikisource ini disebut dengan uji-baca. Setelah di-uji-baca, naskah akan melalui validasi oleh kontributor lainnya, sampai akhirnya satu buku/naskah selesai di-uji-baca dan validasi.
Loh, kenapa butuh untuk di-uji-baca dan validasi, sih? Hal ini karena hasil transkrip OCR (Optical Character Recognition)-nya engga pleek-ketipleek sama dengan teks aslinya. Oiya, Optical Character Recognition (OCR) adalah teknologi yang mengekstrak teks dari gambar.
Sehingga, dibutuhkan para kontributor yang passionate untuk menyelaraskannya dengan naskah asli agar semirip mungkin. Inilah yang dilakukan oleh para peserta Kompetisi Wikisource dari tanggal 8-19 Januari 2025 lalu.
Info tentang Kompetisi Wikisource 2025 ada di sini 👉 https://id.wikisource.org/wiki/Wikisumber:Kompetisi_Wikisource_2025
Gimana Rasanya Meng-Uji-Baca Teks Ejaan Lama?
Satu kata: suuuuuliiiittttt!
Terasa sulit karena sebagai manusia abad ini, saya terbiasa dengan ejaan bahasa Indonesia yang sudah EYD, sedangkan naskah-naskah ini datang dari tahun 1950-an, 1930-an, atau bahkan lebih lama lagi. Jadi, saya pribadi cukup kesulitan juga nih membaca dan (apalagi) memahami beberapa maknanya.
Seingat saya sih, di naskah fiksi/nonfiksi itu bahasanya gak full Indonesia juga yaa.. saya cukup sering menemukan kosakata dari bahasa Melayu. Terkhusus, untuk naskah Undang-undang yang diterbitkan sebelum tahun 2000-an dan ada lumayan banyak bahasa Belanda yang mewarnai naskah Undang-undang bangsa kita.
Kesulitan selanjutnya adalah mengetahui dan memahami kode-kode html yang cocok untuk naskah tersebut. Sebenarnya, kode html ini mungkin bukan yang rumit kalau udah familiar. Tapi buat kaum newbie, tentu aja jadi tantangan tersendiri.
![]() |
Contoh halaman yang di-uji-baca |
Untuk naskah Undang-undang, ada templat khusus yang sudah dibuat, tinggal kita sesuaikan saja dengan posisi teks aslinya. Sedangkan untuk poin-poin dalam bentuk nomor atau alfabet yang digunakan untuk naskah selain Undang-undang, kode html-nya menggunakan kode yang basic yang sudah ada.
Tambahan lainnya adalah harus memastikan tidak ada backspace yang tertinggal di hasil uji-baca kita. Ini jadi penilaian penting dalam kompetisi di Wikisource, gak cuma banyak-banyakan menng-uji-baca dan validasi naskah tapi kualitasnya pun mesti terjaga.
Ada tiga buku yang buat saya cukup berkesan selama mengikuti kompetisi uji-baca ini, yaitu:
1. Cerita Roman: Yin Lan yang ditulis oleh Chen Wen Zwan dan terbit di tahun 1934
![]() |
Tjerita Roman: Yin Lan |
Ini buku fiksi dengan genre romance, ceritanya cukup klasik sebenarnya tentang kehidupan seorang pemuda bernama Wen Liang yang jatuh cinta kepada seorang gadis bernama Yin Lan. Padahal Wen Liang ini sudah punya istri dan juga dua anak, kemudian terjadilah konflik dan berakhir dengan happy ending, tenang ajaaaa, wkwk.
Tapi, karena buku ini datang dari tahun 1934, tentu saja masih menggunakan ejaan lama dan memang sih ada beberapa kosakata yang saya pun gak begitu tahu artinya tapi kalau dibaca dalam satu kalimat utuh, saya cukup yakin, kita masih bisa memahami maksudnya.
Buku ini bisa dibaca di sini nih 👉 https://id.wikisource.org/wiki/Indeks:Yin_Lan.pdf
2. Hal Bunji Dalam Bahasa-Bahasa Indonesia yang ditulis oleh Renward Brandstetter dan terbit di tahun 1957
![]() |
Hal Bunji Dalam Bahasa-bahasa Indonesia |
Ini buku nonfiksi yang membahas tentang perubahan bahasa dari bahasa asing kemudian diadopsi menjadi kosakata bahasa Indonesia. Ternyata, yaaa... yang namanya bahasa itu dipengaruhi dari berbagai macam bahasa lainnya.
Tapi, tentu aja, yang mengesankannya adalah... meng-uji-baca naskah ini bener-bener bikin pegel mata dan tangan, karena mayoritas dari teks-nya itu menggunakan huruf-huruf atau karakter lain yang gak biasa, kayak misalnya aja huruf a tapi ada tambahan di atasnya tanda bulat atau simbol-simbol lainnya.
Ini sih buat saya, lebih banyak capeknya yaa... wkwk. Tapi mungkin jadi 'harta karun' buat teman-teman yang lagi kuliah bahasa dan sastra terus mau melakukan penelitian tentang perubahan bunyi atau kosakata bahasa Indonesia. Btw, ternyata buku ini buku terjemahan yaa.. kalo liat dari nama penulisnya bisa jadi doi ini orang Belanda?🤔
Bukunya bisa cek di sini 👉https://id.wikisource.org/wiki/Indeks:Hal_Bunji_Dalam_Bahasa-Bahasa_Indonesia.pdf
3. 20 Tahun Indonesia Medeka Jilid IV yang di terbitkan tahun 1965 oleh Kementrian Komunikasi dan Digital
![]() |
20 Tahun Indonesia Merdeka |
Ini mungkin semacam laporan? Gak tahu pasti sih, tapi sekilas baca isi teks dan daftar isinya membahas tentang laporan-laporan tiap Kompartimen (kalo sekarang mungkin kementrian, yaa, namanya) tentang apa saja pencapaian dan data-data yang terjadi di setiap tahunnya pasca 20 tahun Indonesia merdeka.
Nah, di jilid keempatnya ini yang dibahas adalah Kompartimen Pembangunan dan Kompartimen Perindustrian Rakyat. Jadi isinya banyak mengulah tentang pendirian pabrik, produksi barang-barang, upah para pekerja, konflik-konflik yang terkait pekerja-kebijakan, isu pengangguran, dan banyak lagi.
Saya kebetulan cuma menguji-baca secuil naskah dari 900-an halaman, wkwk... Yaa, emang sebanyak itu sih isinya. Berkesan bagi saya karena ternyata isu soal upah pekerja yang minim dan isu pengangguran pun sudah terjadi yaa di tahun-tahun tersebut (lupa tepatnya tahun berapa).
Buku ini belum seluruh halamannya sudah di-uji-baca dan validasi, tapi kalau penasaran bisa cek di sini 👉 https://id.wikisource.org/wiki/Indeks:20_tahun_Indonesia_merdeka.djvu
Kesimpulannya?
Kompetisi ini seru untuk uji-nyali, tapi memang perlu latihan dulu sih supaya lebih familiar. Paling penting, siap-siap aja sama saingannya yang pada semangat dan rajin banget untuk mengejar poin. Siapin juga strategi waktu dan energi biar tetap semangat sampai akhir kompetisi.
Kalo dari klasemen sementara sih, saya ada di rank 8, tapi saya gak yakin sampai akhir kompetisi masih di posisi yang sama atau bahkan bisa tembus top 5. Saingannya dedek-dedek gemes yang ambis, kebanyakan kontributor lama yang berpengalaman, sudah familiar dengan kode-kode yang sering digunakan, dan kuat mantengin laptop nyaris 24 jam (mungkin, wkwk).
![]() |
Klasemen sementara di Kompetisi |
Jujur aja, saya cukup ambis sebenarnya untuk bisa menembus top 5 dari asalnya di peringkat 20 (dari 50-an peserta kalo gak salah). Tapi realitanya, saya gak kuat juga lama-lama di depan laptop, gak sanggup harus mengabaikan urusan domestik dan terutama setelah beberapa hari nyaris seharian mantengin laptop, punggung saya udah give up perlu ditempelin koyo, wkwk.
Salut banget sih sama dedek-dedek yang penuh semangat dan ambisi ini. Untuk peringkat 1 hadiahnya memang menggiurkan, 1 unit laptop seharga 5 juta. Sedangkan untuk peringat 2, 1 unit tablet seharga 3 juta. Gimana gak bikin ambis, yaa gaak sihhhh?
Jadi, kalau tahun depan mau ikutan, saran saya... bikin akun wikisource-nya dari sekarang, mulai latihan meng-uji-baca, dan follow instagram @wikisource.id untuk ikutan berbagai event kompetisi ataupun pelatihan. Selamat mencoba, yaa~
0 komentar