INA-WikiMinerCoreference adalah sebuah kakas Coreference Resolution untuk teks Berbahasa Indonesia dengan pendekatan basis pengetahuan eksternal. Kakas ini dikembangkan dengan memanfaatkan kakas entity linking WikipediaMiner untuk diadaptasikan terhadap persoalan coreference resolution. Kakas INA-WikiMinerCoreference adalah hasil dari penelitian tugas akhir Teknik Informatika ITB pada tahun 2016. Makalah tugas akhir ini dapat dilihat di sini.
Pendekatan basis pengetahuan yang dikembangkan pada kakas coreference resolution kali ini berhasil meningkatkan kinerja sebesar 6.00% CEAFm F-measure. Pengingkatan ini adalah hasil dari pemanfaatan pengetahuan semantik yang didapat dari basis pengetahuan Wikipedia yang dapat menangani persoalan coreference resolution terutama pada jenis variasi proper noun.
- Netbeans 8.0.2
- jdk 1.8.0
/annotationWorkbench
: model dan data latih untuk disambiguation/configs
: konfigurasi bahasa untuk WikipediaMiner/data
: data percobaan INA-WikiMinerCoreference/db
: basis data entity linking Wikipedia Indonesia, dapat diunduh di sini (size : 3.61 GB)./lib
: kakas-kakas tambahan sebagai library/src
: source code/WikiMinerCoreference.jar
: executable file untuk demo
Terdapat beberapa modul dalam project tugas akhir kali ini, antara lain:
arcoref
: baseline project (Indra Budi dkk., 2006)helper
: modul pembantu yang meliputi chain reader/writer, constants, corpus generator, serta penghitung kinerjawikicoref
: modul utama dari tugas akhir yang dikerjakanwikiminer
: modul untuk percobaan WikipediaMiner
- Pastikan pada direktori
/data/corefdata/demo/
minimal terdapat fileraw.txt
dankey.xml
(isi file ini dapat diubah sesuai contoh kasus uji yang ingin dicoba) - Buka command prompt pada root directory project
- Masukkan perintah
java -jar "WikiMinerCoreference.jar"
- Program akan melakukan load database dan selanjutnya akan membaca text yang terdapat pada
raw.txt
dan membaca key chain padakey.xml
untuk kemudian dilakukan proses coreference resolution dan penghitungan nilai kinerja F-measure dengan standar CEAFm
© 2016: Rakhmatullah Yoga Sutrisna