TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB
Sari
ABSTRAK
Plagiarisme dalam penulisan karya ilmiah adalah perilaku curang yang sangat merugikan mahasiswa di sebuah perguruan tinggi. Skripsi adalah sebuah karya ilmiah yang sering menjadi objek plagiat dari kalangan mahasiswa. Banyaknya kasus plagiat dikalangan mahasiswa sudah menjadi rahasia umum sehingga untuk menghindari hal tersebut maka perlunya dilakukan identifikasi kemiripan naskah dokumen skripsi. Dibutuhkan sebuah system yang dapat mendeteksi tingkat kemiripan judul skripsi. Algoritma K-Nearest Neighbor yang digunakan dalam klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek data training yang telah dilatih untuk menghasilkan nilai kemiripan naskah dokumen skripsi. Algoritma text mining dapat digunakan dalam melakukan pendeteksian naskah dokumen skripsi yaitu dengan mencari nilai cosine similarity. Melalui sistem ini, diharapkan mahasiswa prodi Teknik Informatika dan univesitas Almuslim dapat melihat tingkat persentase kesamaan naskah document skripsi dengan document yang telah ada sehingga dapat menghindari plagiasi. Sistem ini diharapkan mampu mengidentifikasi dan menglasifikasikan kemiripan naskah skripsi yang satu dengan yang lainnya dan disertai nilai kemiripan judul berdasarkan bobot serta akan memberikan informasi mengenai daftar judul skripsi yang telah ada. Dalam penerapan text mining dalam mengklasifikasi dokumen naskah skripsi sesuai dengan tingkat kemiripan judul dan studi kasus. Hal ini dilakukan sebelum naskah skripsi tersebut dipublikasikan atau disidangkan sehingga dapat meminimalisir tingkat kecurangan mahasiswa dalam menulis karya ilmiah. Hal ini dengan dilihat dari tingkat presentase kesamaan judul antara satu mahasiswa dengan mahasiswa yang lain. Tujuan penelitian ini adalah agar memudahkan pihak prodi, fakultas dan universitas dalam melihat kesamaan tingkat document skripsi berbasis web dan dari pihak mahasiswa dapat melihat presesntase nilai kemiripan dengan naskah documen skripsi yang telah ada. Sehingga semua dokumen skripsi jurusan informatika unimal dan skripsi yang ada di universitas almuslim terhindar dari tindak plagiarisme.
Kata kunci: Skripsi, Identifikasi, Cosine Similarity, K-Nearest Neighbor
Teks Lengkap:
PDFReferensi
DAFTAR PUSTAKA
Berry, M.W. & Kogan, J. 2010. Text Mining Aplication and theory. WILEY: United Kingdom.
Feldman, R & Sanger, J. 2007. The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press: New York.
Dragut, E., Fang, F., Sistla, P., Yu, S. & Meng, W. 2009. Stop Word and Related Problems in Web Interface Integration. http://www.vldb.org/pvldb/2/vldb09-384.pdf. Diakses tanggal 10 Januari 2016.
T. Winarto Yunita, Karya Tulis Ilmiah Sosial: Menyiapkan, Menulis, dan Mencermatinya, Yayasan Obor Indonesia, Jakarta, 2004.
Hermawati, Fajar Astuti, Data Mining, Edisi I, Penerbit: Andi, Yogyakarta, 2013.
Kusrini, Andi Koniyo, 2007. Tuntunan Praktis Membangun Sistem Informasi Akuntansi dengan Visual Basic dan Microsoft SQL Server.Yogyakarta: ANDI.
Nugroho A, 2011, Perancangan dan Implementasi Sistem Basis Data, Yogyakarta: Penerbit Andi
Sarno, R., dkk, 2012, “Semantic Search”, Yogyakarta. Andi.
Susanto, B., 2011, Text Mining, Teknik Informatika UKDW Yogyakarta.
Silberschatz, 2002, Database System Concept, Fourth Edition, McGraw-Hill Inc., New York
Tala, F.Z., 2003, “A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia”, Master of Logic Project, Institute for Logic, Language and Computation, Universiteit van Amsterdam.