peringkasan teks otomatis pada dokumen berbahasa jawa

dokumen yang dibaca adalah dokumen berbahasa Jawa. Bagi pembaca yang belum paham tentang bahasa Jawa, membaca keseluruhan dokumen untuk...

0 downloads 5 Views 4MB Size

Recommend Stories


Peringkasan Teks
13 Des 2011 - Police and ambulances rushed to the building in downtown. Milan. No further details were immediately available. Julio Adisantoso, ILKOM-IPB.

Sistem Peringkasan Berita Online Otomatis ... - USU Repository
De La Salle University. Belica, M. 2015. Sumy 0.4.0: Module for automatic summarization of text documents and HTML pages. https://pypi.python.org/pypi/sumy.

ANALISIS CLUSTER pada DOKUMEN TEKS - Lecturer
Text dan Web Mining - FTI UKDW - BUDI SUSANTO. 6 http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set#cite_note-0 k ≈ n. 2 ...

sistem peringkasan dokumen berita bahasa ... - IPB Repository
(Puspen) TNI Mayjen Sjafrie Sjamsoeddin hingga saat ini belum mendapat informasi dan otoritas untuk menyampaikan mengenai pergantian pimpinan atas TNI ...

Analisis Teks Berbahasa Indonesia Menggunakan ... - IPB Repository
Memorandum No. 1870, Department of Applied. Mathematics, University of Twente, Enschede, The Netherlands, ISSN. 1874-4850. Hoede C, Nurdiati S. 2008.

kategorisasi dokumen web secara otomatis berdasarkan
menampilkan daftar link dalam sebuah tag, dan melakukan uji coba. 3. ... Indonesia (tidak menggunakan dua bahasa dalam satu dokumen), dengan encoding.

automatic summarizer untuk dokumen tunggal berbahasa indonesia
referensi Ilmu Bahasa Indonesia Sintaksis karangan M. Ramlan, serta kalimat yang digunakan adalah kalimat berita (News), hal ini dilakukan untuk lebih.

aksara jawa dan teks jawa - eLisa UGM
(2) Aksara Murda. (3) Aksara Swara. (4) Aksara Pasangan. (5) Aksara Sandangan dan Tanda Pengganti Aksara c. Hubungan Aksara Jawa Kuna dan Aksara ...

ANALISIS PRINSIP KESANTUNAN BERBAHASA PADA INI TALK
Bapak Sarju Munandar dan Ibu Sunarni. Atas kasih sayang, cinta, doa, yang tulus dari kalian serta dukungan moril maupun materi yang tiada henti untuk.

Story Transcript


PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Informatika (S.Kom) Program Studi Teknik Informatika

Oleh AGUSTINUS WIDIANTORO 105314062

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2014

i

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

AUTOMATIC TEXT SUMMARY IN JAVANESE LANGUAGE DOCUMENT USING TF-IDF METHOD THESIS Presented as Partial Fullfilment of the Requirements To Obtain the Computer Bachelor Degree In Informatics Engineering

By AGUSTINUS WIDIANTORO 105314062

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2014 ii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

iii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

iv

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka sebagaimana layaknya karya ilmiah.

Yogyakarta, 10 November 2014 Penulis

Agustinus Widiantoro

v

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

HALAMAN MOTTO

"Musuh yang paling berbahaya di atas dunia ini adalah penakut dan bimbang. Teman yang paling setia, hanyalah keberanian dan keyakinan yang teguh." (Andrew Jackson)

"Pendidikan merupakan perlengkapan paling baik untuk hari tua." (Aristoteles)

vi

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

HALAMAN PERSEMBAHAN

Hasil karya skripsi ini, kupersembahakan kepada :

Tuhan Yesus dan Bunda Maria Alm. F.X.Susilo S.Pd Christiana Wagiyem S.Pd Veronika Suci Anggraeni S.Pd

vii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

ABSTRAKSI

Membaca keseluruhan dokumen membutuhkan waktu yang lama, apalagi dokumen yang dibaca adalah dokumen berbahasa Jawa. Bagi pembaca yang belum paham tentang bahasa Jawa, membaca keseluruhan dokumen untuk memahaminya akan sangat melelahkan. Namun jika terdapat ringkasan pendek dari sebuah dokumen, maka akan membantu pembaca dalam memahami isi dokumen berbahasa Jawa. Membuat ringkasan secara manual akan membutuhkan waktu yang lama. Oleh karena itu untuk mengatasi masalah waktu baca, akan dibuat sistem peringkasan teks otomatis. Peringkasan ini akan secara otomatis meringkas keseluruhan isi dari sebuah dokumen untuk mendapatkan intisari dari dokumen berbahasa Jawa, sehingga pembaca dapat memahami isi dokumen tanpa harus membaca keseluruhan dokumen berbahasa Jawa. Pada penelitian ini metode yang digunakan untuk peringkasan teks otomatis adalah TF-IDF, dimana metode ini menggunakan cara pembobotan untuk setiap kata dalam kalimat. Sehingga kata dengan kemunculan terbanyak merupakan sebuah kalimat yang penting. Dari perhitungan tersebut akan menghasilkan kumpulan kalimat yang berisi bagian penting dari keseluruhan dokumen berbahasa Jawa. Pengujian sistem dilakukan kepada 3 responden, dimana responden harus mengoreksi secara manual ringkasan yang dihasilkan oleh sistem termasuk

viii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

relevan atau tidak relevan. Terdapat 50 dokumen berbahasa Jawa yang akan diujikan ke dalam sistem, dokumen tersebut bersumber dari DjakaLodang. Dari hasil pengujian sistem yang telah dilakukan kepada 3 responden secara manual, menghasilkan nilai rata-rata akurasi sebesar 64%. Dengan demikian diketahui nilai rata-rata akurasi sistem ini dalam membantu pembaca untuk memperoleh intisari dari dokumen berbahasa Jawa, sehingga dapat membuat keputusan melanjutkan membaca keseluruhan dokumen atau cukup dengan mambaca ringkasan.

ix

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

ABSTRACT

Reading a whole content of a document will take a long time, moreover the document that is being read is Javanese document. For the readers who have not really understand Javanese language well, reading and understanding a whole document will be really tiring. However, if there is a summary of a document, it will be helpful for the readers to understand the content of Javanese document. Making a summary in a manual way will take a long time. Therefore, to solve the problem of timing, itwill be made the system of summarizing the text automatically. This program will summarize the whole content of Javanese documentautomatically and get the main idea from the document, so the readers will understand the content of the Javanese document without reading a whole of it. In this research, the method that is used in the program of summary is TFIDF which means this method use weighting way in every word. So, the word with the highest appearances areconsidered as the important sentence. The calculation will produce the document compilation containing the important part from the whole Javanese document. The system of examination is done by three respondents, which the respondents should check the summary result of the system manually whether the result is the relevant or not relevant. There are 50 Javanese documents which will be examined to the system, the source of those documents is DjakaLodang.

x

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

From the result of examination that was done by 3 respondents manually and it brings out the average value of 64%. Thus, it is known how much the level of accuracy in helping the readers to get the main idea of the Javanese document so that they can make the decision to continue reading a whole document or just read the summary of the document.

xi

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma : Nama

: Agustinus Widiantoro

NIM

: 105314062

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul :

PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF

Beserta perangkat yang diperlukan. Dengan demikian saya memberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengolahnya dalam bentuk pangkalan data, mendistribusikan secara terbatas dan mempublikasikannya di internet atau media lain untuk kepentingan akademis tanpa perlu meminta izin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Yogyakarta, 10 November 2014 Penulis

Agustinus Widiantoro

xii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

KATA PENGANTAR

Puji dan syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa atas segala berkat dan karunianya yang melimpah sehingga penulis dapat menyelesaikan skripsi ini dengan baik. Adapun tujuan penulis adalah untuk memenuhi persyaratan dalam memperoleh gelar Sarjana Teknik Informatika (S.Kom) Universitas Sanata Dharma. Penyusun skripsi ini tidak terlepas dari bantuan, bimbingan, dan peran berbagai pihak. Oleh karena itu pada kesempatan ini penulis mengucapkan terima kasih kepada pihak-pihak berikut : 1. Tuhan Yesus Kristus dan Bunda Maria yang selalu membimbing dan menuntun untuk menyelesaikan skripsi ini. 2. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma. 3. Ibu Sri Hartati Wijono, S.Si., M.Kom., selaku Dosen Pembimbing yang telah meluangkan banyak waktu untuk membimbing dengan sabar, memberikan masukan, saran dan memotivasi selama mengerjakan skripsi ini. 4. Ibu Ridowati Gunawan, S.Kom., M.T., selaku Dosen sekaligus Kepala Program Studi Teknik Informatika. 5. Bapak JB. Budi Darmawan, S.T., M.Sc., dan bapak Puspaningtyas Sanjoyo Adi, S.T., M.T., sebagai Dosen Penguji. 6. Seluruh Staff dan Dosen Program Studi Teknik Informatika Universitas Sanata Dharma yang telah memberikan bekal ilmu kepada penulis.

xiii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

7. Ketiga responden kuesioner yang telah memberikan waktu luang dalam melakukan proses pengujian. 8. Alm. F.X. Susilo S.Pd, Ibu Christiana Wagiyem S.Pd, Kakak Veronika Suci Anggraeni S.Pd serta seluruh keluarga besar yang terus memberikan doa, dukungan dan semangat sehingga dapat menyelesaikan skripsi ini. 9. Sahabat-sahabat, teman-teman Teknik Informatika angkatan 2010 atas kekompakan serta kebersamaan selama ini. 10. Semua pihak yang tidak dapat disebutkan satu per satu yang terlibat dalam penyusunan skripsi ini sehingga dapat selesai dengan baik. Dengan rendah hati penulis menyadari bahwa skripsi ini masih belum sempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan skripsi ini sangat penulis harapkan. Akhir kata, semoga penyusunan skripsi ini bermanfaat bagi pengembangan ilmu pengetahuan. Terima kasih.

Yogyakarta, 10 November 2014 Penulis

Agustinus Widiantoro

xiv

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA ............................................. i HALAMAN JUDUL BAHASA INGGRIS ................................................. ii HALAMAN PERSETUJUAN ................................................................... iii HALAMAN PENGESAHAN .................................................................... iv HALAMAN KEASLIAN KARYA ............................................................. v HALAMAN MOTTO ................................................................................ vi HALAMAN PERSEMBAHAN ................................................................ vii ABSTRAKSI ........................................................................................... viii ABSTRACT ............................................................................................... x LEMBAR PERNYATAAN PERSETUJUAN........................................... xii KATA PENGANTAR ............................................................................. xiii DAFTAR ISI ............................................................................................ xv DAFTAR TABEL .................................................................................... xx DAFTAR GAMBAR ............................................................................... xxi DAFTAR LISTING ............................................................................... xxiii BAB I PENDAHULUAN ........................................................................... 1 1.1 Latar Belakang ............................................................................. 1 1.2 Rumusan Masalah ........................................................................ 3 1.3 Tujuan Penalitian ......................................................................... 3 1.4 Manfaat Penelitian ....................................................................... 3 1.5 Batasan Masalah .......................................................................... 4

xv

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

1.6 Metodologi Penelitian .................................................................. 4 1.7 Sistematika Penulisan ................................................................... 6 BAB II LANDASAN TEORI ..................................................................... 8 2.1 Pemerolehan Informasi................................................................. 8 2.1.1 Konsep Pemerolehan Informasi ........................................... 8 2.1.2 Langkah Pemerolahan Informasi.......................................... 8 2.1.2.1 Text Preprocessing ........................................................... 8 2.1.2.1.1 Tokenizing ......................................................... 8 2.1.2.1.2 Stopword ............................................................ 9 2.1.2.1.3 Stemming ......................................................... 10 2.1.2.2 Indexing ......................................................................... 14 2.1.2.3 LinkedList ...................................................................... 15 2.1.2.4 ArrayList ........................................................................ 16 2.2 Peringkasan Otomatis ................................................................. 16 2.3 Metode Peringkasan Teks Otomatis............................................ 17 2.3.1 Metode Pembobotan TF-IDF ............................................. 17 2.3.1.1 Langkah Pengerjaan ............................................... 20 2.3.1.2 Contoh Pengerjaan ................................................. 21 BAB III ANALISIS DAN PERANCANGAN SISTEM ............................ 33 3.1 Gambaran Sistem Penelitian ....................................................... 33 3.2 Analisis Kebutuhan .................................................................... 35 3.3 Perancangan Sistem.................................................................... 36 3.3.1 Diagram Use Case ............................................................. 36

xvi

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.1.1 Skenario Use Case ....................................................... 37 3.3.1.1.1 Skenario Login ....................................................... 37 3.3.1.1.2 Skenario Memasukkan Data Koleksi Dokumen ...... 38 3.3.1.1.3 Skenario Logout..................................................... 39 3.3.1.1.4 Skenario Memasukkan Data Dokumen ................... 39 3.3.1.1.5 Skenario Melihat Hasil Ringkasan.......................... 40 3.3.1.1.6 Skenario Melihat Data Koleksi Dokumen............... 41 3.3.2 Diagram Aktifitas .............................................................. 42 3.3.2.1 Diagram Aktifitas Login .............................................. 42 3.3.2.2 Diagram Aktifitas Memasukkan Data Koleksi Dokumen ........................................................ 43 3.3.2.3 Diagram Aktifitas Logout ............................................ 44 3.3.2.4 Diagram Aktifitas Memasukkan Data Dokumen .......... 45 3.3.2.5 Diagram Aktifitas Melihat Hasil Ringkasan ................. 46 3.3.2.6 Diagram Aktifitas Melihat Data Koleksi Dokumen ..... 47 3.3.3 Diagram Sekuensial ........................................................... 48 3.3.3.1 Diagram Sekuensial Login ........................................... 48 3.3.3.2 Diagram Sekuensial Memasukkan Data Koleksi Dokumen ....................................................... 49 3.3.3.3 Diagram Sekuensial Logout ......................................... 50 3.3.3.4 Diagram Sekuensial Memasukkan Data Dokumen ....... 51 3.3.3.5 Diagram Sekuensial Melihat Hasil Ringkasan .............. 52 3.3.3.6 Diagram Sekuensial Melihat Data Koleksi Dokumen ... 53

xvii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.4 Diagram MVC (Model View Control) ............................... 54 3.3.4.1 Struktur Kelas MVC .................................................... 54 3.3.4.2 Diagram Analisis Kelas MVC ...................................... 54 3.3.4.3 Diagram Kelas Model .................................................. 56 3.4 Perancangan Antar Muka (User Interface) ................................. 57 3.4.1 Halaman Utama ................................................................ 58 3.4.2 Halaman Memasukkan Data Koleksi Dokumen ................. 59 3.4.3 Halaman Melihat Data Koleksi Dokumen .......................... 50 3.4.4 Halaman Peringkasan Teks Otomatis ................................. 61 3.4.5 Halaman Melihat Hasil Ringkasan ..................................... 62 3.5 Skenario Pengujian Sistem ......................................................... 63 3.6 Data ........................................................................................... 65 BAB IV IMPLEMENTASI....................................................................... 66 4.1 Spesifikasi Software dan Hardware yang Digunakan .................. 66 4.1.1 Spesifikasi Software .......................................................... 66 4.1.2 Spesifikasi Hardware ......................................................... 66 4.2 Implementasi Program ............................................................... 67 4.2.1 Implementasi Text Preprocessing ...................................... 67 4.2.2 Implementasi Penghapusan Kata Umum (Stopword) ......... 69 4.2.3 Implementasi Pengembalian Kata Dasar (Stemming) ......... 70 4.2.4 Implementasi Term Frequency (TF)................................... 76 4.2.5 Implementasi Document Frequency (df) ............................ 77 4.2.6 Implementasi Inverse Document Frequency (IDF) ............. 77

xviii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.7 Implementasi Bobot Kata (W) ........................................... 78 4.2.8 Implementasi Bobot Total Kalimat (D) .............................. 79 4.2.9 Implementasi Pengambilan Kalimat (D) ............................ 79 4.2.10 Implementasi Menampilkan Hasil Ringkasan................... 81 4.3 Implementasi Antar Muka (User Interface) ................................. 82 4.3.1 Halaman Utama ................................................................ 82 4.3.2 Halaman Memasukkan Data Koleksi Dokumen ................. 83 4.3.3 Halaman Melihat Data Koleksi Dokumen ......................... 84 4.3.4 Halaman Peringkasan Teks Otomatis ................................. 86 4.3.5 Halaman Melihat Hasil Ringkasan ..................................... 87 BAB V ANALISIS HASIL DAN PEMBAHASAN .................................. 88 5.1 Analisis Pengujian Sistem .......................................................... 88 5.1.1 Pengujian Kepada Responden ............................................ 88 5.1.2 Hasil Pengujian Sistem ...................................................... 91 5.2 Pembahasan Pengujian Sistem .................................................... 92 BAB VI KESIMPULAN DAN SARAN ................................................. 102 6.1 Kesimpulan .............................................................................. 102 6.2 Saran ........................................................................................ 102 DAFTAR PUSTAKA ............................................................................ 103 LAMPIRAN .......................................................................................... 105

xix

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

DAFTAR TABEL

Tabel 2.1 Aturan Subtitusi/Penghapusan .................................................. 10 Tabel 2.2 Tabel Rule Untuk Suffix ........................................................... 10 Tabel 2.3 Tabel Rule Untuk Prefix ........................................................... 11 Tabel 2.4 Tabel Rule Untuk Infix ............................................................. 12 Tabel 2.5 Tabel Perhitungan TF dan df

................................................. 25

Tabel 2.6 Tabel Perhitungan Bobot Kata (W) ........................................... 28 Tabel 3.1 Tabel Analisis Kebutuhan ......................................................... 35 Tabel 3.2 Skenario Login ......................................................................... 37 Tabel 3.3 Skenario Memasukkan Data Koleksi Dokumen ................................ 38 Tabel 3.4 Skenario Logout ....................................................................... 39 Tabel 3.5 Skenario Memasukkan Data Dokumen .................................... 39 Tabel 3.6 Skenario Melihat Hasil Ringkasan ............................................ 40 Tabel 3.7 Skenario Melihat Data Koleksi Dokumen ................................. 41 Tabel 3.8 Struktur Kelas MVC ................................................................. 54 Tabel 3.9 Diagram Kelas ......................................................................... 56 Tabel 3.10 Contoh Pengujian Sistem ....................................................... 63 Tabel 5.1 Hasil Pengujian Kepada Responden ......................................... 89

xx

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

DAFTAR GAMBAR

Gambar 2.1 Proses Tokenizing .................................................................. 9 Gambar 2.2 Proses Pengindeksan ............................................................ 15 Gambar 2.3 Perhitungan RIDF ................................................................ 17 Gambar 2.4 Perhitungan Wik ................................................................... 19 Gambar 2.5 Perhitungan ntfik ................................................................... 19 Gambar 2.6 Perhitungan nidfk ................................................................. 19 Gambar 3.1 Gambaran Sistem Keseluruhan............................................. 34 Gambar 3.2 Diagram Use Case ................................................................ 36 Gambar 3.3 Diagram Aktifitas Login ..................................................... 42 Gambar 3.4 Diagram Aktifitas Memasukkan Data Koleksi Dokumen ............ 43 Gambar 3.5 Diagram Aktifitas Logout..................................................... 44 Gambar 3.6 Diagram Aktifitas Memasukkan Data Dokumen................... 45 Gambar 3.7 Diagram Aktifitas Melihat Hasil Ringkasan ......................... 46 Gambar 3.8 Diagram Aktifitas Melihat Data Koleksi Dokumen .............. 47 Gambar 3.9 Diagram Sekuensial Login ................................................... 48 Gambar 3.10 Diagram Sekuensial Memasukkan Data Koleksi Dokumen ...... 49 Gambar 3.11 Diagram Sekuensial Logout ............................................... 50 Gambar 3.12 Diagram Sekuensial Memasukkan Data Dokumen ............. 51 Gambar 3.13 Diagram Sekuensial Melihat Hasil Ringkasan .................... 52 Gambar 3.14 Diagram Sekuensial Melihat Data Koleksi Dokumen ......... 53 Gambar 3.15 Diagram Kelas Admin ........................................................ 54

xxi

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Gambar 3.16 Diagram Kelas Pengguna ................................................... 55 Gambar 3.17 Halaman Utama ................................................................. 57 Gambar 3.18 Halaman Memasukkan Data Koleksi Dokumen ......................... 58 Gambar 3.19 Halaman Melihat Data Koleksi Dokumen .......................... 59 Gambar 3.20 Halaman Melihat Ringkasan Data Koleksi Dokumen ......... 60 Gambar 3.21 Halaman Peringkasan Teks Otomatis ................................. 61 Gambar 3.22 Halaman Melihat Hasil Ringkasan ..................................... 62 Gambar 3.23 Rumus Perhitungan Rata-rata ............................................. 64 Gambar 3.24 Contoh Perhitungan Rata-rata............................................. 64 Gambar 4.1 Rangkain Proses Text Preprocessing .................................... 67 Gambar 4.2 Halaman Utama ................................................................... 82 Gambar 4.3 Halaman Memasukkan Data Koleksi Dokumen ........................... 83 Gambar 4.4 Halaman Melihat Data Koleksi Dokumen ............................ 84 Gambar 4.5 Halaman Melihat Ringkasan Data Koleksi Dokumen ........... 85 Gambar 4.6 Halaman Peringkasan Teks Otomatis ................................... 86 Gambar 4.7 Halaman Melihat Hasil Ringkasan ....................................... 87 Gambar 5.1 Hasil Perhitungan Rata-rata .................................................. 91

xxii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

DAFTAR LISTING

Listing Program 4.1 Implementasi Text Preprocessing ............................ 67 Listing Program 4.2 Implementasi Penghapusan Kata Umum ................. 69 Listing Program 4.3 Implementasi Pengembalian Kata Dasar ................. 70 Listing Program 4.4 Implementasi Method delSuffix() ........................... 71 Listing Program 4.5 Implementasi Method delPrefix()............................ 73 Listing Program 4.6 Implementasi Method delDuplikasi() ...................... 75 Listing Program 4.7 Implementasi Term Frequency (TF) ........................ 76 Listing Program 4.8 Implementasi Document Frequency (df) ................. 77 Listing Program 4.9 Implementasi Inverse Document Frequency (IDF) .. 77 Listing Program 4.10 Implementasi Bobot Kata (Wtd)............................. 78 Listing Program 4.11 Implementasi Bobot Total Kalimat (D) ................. 79 Listing Program 4.12 Implementasi Pengambilan Kalimat (D)................ 79 Listing Program 4.13 Implementasi Menampilkan Hasil Ringkasan........ 81

xxiii

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

BAB I PENDAHULUAN

1.1

Latar Belakang Saat ini, kita dapat mengakses dokumen berbahasa Jawa melalui situs-situs

di internet dan banyak juga dokumen, buku dan majalah berbahasa Jawa yang dapat kita peroleh di perpustakaan-perpustakaan. Sementara itu, banyak generasi muda yang berasal dari Jawa tidak memahami bahasa Jawa. Sayang sekali jika bahasa Jawa semakin lama semakin tidak digunakan dan akhirnya punah. Membuat dan membaca dokumen berbahasa Jawa merupakan salah satu cara melestarikan penggunaan bahasa Jawa. Bagi mereka yang belum paham tentang bahasa Jawa, membaca keseluruhan dokumen untuk memahaminya akan sangat melelahkan. Namun jika terdapat ringkasan pendek dari sebuah dokumen, maka akan membantu pembaca mendapatkan intisari dari sebuah dokumen berbahasa Jawa. Membuat ringkasan secara manual membutuhkan waktu lama jika dokumen yang diringkas berjumlah sangat banyak. Maka membutuhkan peringkasan teks otomatis untuk membantu proses ekstraksi dalam penyusunan kalimat mengenai intisari dari dokumen serta menggabungkan menjadi suatu ringkasan (Jezek, Steinberger, 2008). Diharapkan dari membaca ringkasan, akan menumbuhkan niat membaca dokumen berbahasa Jawa menjadi lebih meningkat. Membuat peringkasan teks otomatis dilakukan dengan cara pemberian bobot untuk setiap kata dalam kalimat. Dalam penelitian ini ringkasan yang

1

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

dihasilkan merupakan kumpulan kalimat dari hasil perhitungan dengan metode TF-IDF (Savoy, 1993). Metode ini bertujuan untuk mengambil sebagian kalimat dari keseluruhan dokumen berbahasa Jawa yang penting, ditandai dengan bobot tinggi dari hasil perhitungan dengan metode TF-IDF. Ringkasan yang dihasilkan tersebut akan menampilkan sebuah ringkasan dokumen yang diharapkan sesuai dengan kebutuhan pembaca. Hasil ringkasan dari sistem secara otomatis tersebut akan dilakukan pengujian kepada 3 responden berbahasa Jawa secara manual. Dokumen yang akan diujikan ke dalam sistem berjumlah 50 dokumen berbahasa Jawa yang bersumber dari DjakaLodang. Dari hasil pengujian akan dilakukan perhitungan nilai rata-rata untuk mendapatkan hasil akurasinya. Dengan demikian diketahui nilai rata-rata akurasi sistem ini dalam membantu pembaca untuk memperoleh intisari dari dokumen berbahasa Jawa, sehingga dapat membuat keputusan untuk melanjutkan membaca keseluruhan dokumen atau cukup dengan mambaca ringkasan. Pada penelitian ini akan dibangun sebuah website majalah bahasa Jawa yang berisi kumpulan dokumen berbahasa Jawa serta dapat melakukan peringkasan teks otomatis dokumen berbahasa Jawa secara cepat dan akurat, sehingga dapat menghasilkan ringkasan yang sesuai dengan kebutuhan pengguna. Diharapkan website majalah bahasa Jawa ini dapat diakses secara umum oleh pengguna agar dapat digunakan untuk melakukan peringkasan teks dokumen secara otomatis.

2

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

1.2

Rumusan Masalah Berdasarkan latar belakang di atas maka terdapat rumusan masalah

sebagai berikut : 1. Bagaimana menggunakan metode TF-IDF pada program aplikasi peringkasan teks otomatis pada dokumen berbahasa Jawa? 2. Bagaimana mengukur akurasi sistem peringkasan teks otomatis menggunakan metode TF-IDF pada dokumen berbahasa jawa?

1.3

Tujuan Penelitian Tujuan dari penelitian ini adalah membuat sebuah website majalah bahasa

Jawa yang dapat melakukan peringkasan teks otomatis pada dokumen berbahasa Jawa dengan metode TF-IDF, serta dapat menghasilkan ringkasan dari dokumen berbahasa Jawa yang sesuai dengan kebutuhan pengguna.

1.4

Manfaat Penelitian Manfaat dari penelitian ini adalah menghasilkan ringkasan yang berisi

kumpulan kalimat mengenai intisari dari keseluruhan dokumen berbahasa Jawa. Ringkasan tersebut akan membantu pembaca dalam memahami intisari dari dokumen tanpa harus membaca keseluruhan dokumen berbahasa Jawa. Dengan membaca ringkasan, pembaca dapat membuat keputusan untuk melanjutkan membaca keseluruhan dokumen atau cukup dengan membaca ringkasan. Membaca ringkasan berbahasa Jawa diharapkan dapat meningkatkan minat pembacaan bahasa Jawa, sehingga bahasa Jawa akan semakin di lestarikan.

3

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

1.5

Batasan Masalah Ruang lingkup dibatasi pada : 1. Ekstraksi teks yang digunakan adalah pada dokumen berbahasa Jawa. 2. Dokumen yang digunakan bersumber dari Djakalodang tahun 1978, 2002 dan 2003. 3. Teks input diambil dari file teks. 4. Pengujian sistem akan dilakukan kepada 3 responden secara manual dengan dokumen berjumlah 50, dari hasil pengujian tersebut akan dihitung nilai rata-rata untuk mendapatkan hasil akurasi peringkasan teks otomatis pada dokumen berbahasa Jawa. 5. Sistem berbasis web dengan menggunakan jsp. 6. Pembuatan program aplikasi peringkasan teks otomatis menggunakan java dengan IDE Netbeans 6.9.1.

1.6

Metodologi Penelitian Pada penelitian ini akan dilakukan dengan beberapa tahap sebagai berikut : 1. Studi Pustaka Pada tahap ini dilakukan pengumpulan informasi dengan cara membaca buku referensi, jurnal dan mencari informasi di internet mengenai

pemerolehan

informasi serta

menunjang pembuatan skripsi.

4

metode

TF-IDF

yang

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

2. Pengumpulan Dokumen Berbahasa Jawa Pada tahap ini dilakukan pengumpulan data dokumen berbahasa Jawa, dimana data dokumen tersebut akan digunakan untuk pengujian sistem peringkasan teks otomatis. Dokumen berbahasa Jawa yang digunakan bersumber dari DjokoLodang, mengenai cerita wayang atau artikel berita. 3. Perancangan Sistem Pada tahap ini dilakukan proses perancangan sistem atau rancangan alur jalannya program. Perancangan akan dilakukan secara terstruktur dengan langkah pembuatan diagram use case, diagram aktifitas, diagram sekuensial, diagram kelas untuk memprosesnya, merancang setiap proses dengan algoritma, serta merancang user interface. 4. Implementasi Perangkat Lunak Pada tahap ini membangun sistem berbasis komputer berdasarkan hasil perancangan yang telah dibuat. Sehingga implementasi rancangan ke dalam program komputer dapat menghasilkan perangkat lunak yang sesuai dengan kebutuhan. 5. Pengujian Perangkat lunak Pada tahap ini akan dilakukan analisa perangkat lunak. Apakah luaran yang dihasilkan sudah sesuai dengan rancangan sistem?

5

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

6. Pengujian Sistem Pada tahap ini perangkat lunak yang sudah jadi akan dilakukan pengujian sistem. Pengujian dilakukan kepada 3 responden secara manual dengan dokumen berbahasa Jawa berjumlah 50. 7. Evaluasi Pengujian Sistem Pada tahap ini dilakukan penghitungan dari pengujian sistem yang sudah dilakukan. Dari hasil pengujian tersebut akan dihitung nilai ratarata untuk mendapatkan hasil akurasi sistem. Mengapa hasil dari sistem sesuai? dan Mengapa hasil dari sistem tidak sesuai? akan dianalisa.

1.7

Sistematika Penulisan Sistematika penulisan pada penelitian ini dibagi menjadi beberapa bagian

sebagai berikut : BAB I PENDAHULUAN Bab ini berisi gambaran umum permasalahan yang akan diteliti, meliputi : latar belakang, rumusan masalah, tujuan penelitian, manfaat penelitian, batasan masalah, metodologi penelitian dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini berisi konsep pemerolehan informasi, langkah-langkah pemerolehan informasi, metode yang digunakan dalam penelitian ini, serta langkah-langkah pengerjaan metode tersebut.

6

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

BAB III ANALISIS DAN PERANCANGAN SISTEM Bab ini berisi gambaran umum sistem, analisis kebutuhan, perancangan sistem meliputi : diagram use case, diagram aktifitas, diagram sekuensial, diagram kelas, user interface dan skenario pengujian. BAB IV IMPLEMENTASI Bab ini berisi implementasi dan penjelasan fungsi program yang dibuat berdasarkan analisis dan perancangan sistem. BAB V ANALISIS HASIL DAN PEMBAHASAN Bab ini berisi analisis hasil pengujian sistem dan pembahasan pengujian sistem. BAB VI KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dan saran dari hasil analisis sistem, implementasi sistem dan pengujian sistem.

7

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

BAB II LANDASAN TEORI

2.1

Pemerolehan Informasi ( Information Retrieval )

2.1.1

Konsep Pemerolehan Informasi Pemerolehan informasi (Information Retrieval) adalah menemukan bahan

(biasanya dokumen) dari sesuatu tidak terstruktur (biasanya teks) yang memenuhi kebutuhan informasi dari koleksi besar (biasanya disimpan pada komputer) (Manning, 2009). Adapun tahap dalam memproses data untuk mendapatkan informasi mengenai kalimat penting dalam sebuah dokumen berbahasa Jawa, yaitu pemisahan setiap kata dalam kalimat (tokenizing), penghapusan kata umum (stopword), pemisahan imbuhan kata untuk mendapatkan kata dasar (stemming), dan penataan data (indexing).

2.1.2

Langkah Pemerolehan Informasi

2.1.2.1 Text Preprocessing 2.1.2.1.1 Tokenizing Tokenizing adalah proses pemisahan setiap kata dalam kalimat menjadi kata tunggal. Setiap kata dalam kalimat dipisahkan menggunakan karakter spasi. Pada langkah ini juga menghilangkan tanda baca dan mengubah semua token ke dalam bentuk huruf kecil (lower case). Contoh proses pemotongan kata :

8

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Input

:

Output :

Mataram iku negara kondhang

mataram

iku

negara

kondhang

Gambar 2.1 Proses Tokenizing

Pada Gambar 2.1, masukkan dari sebuah dokumen adalah berbentuk kalimat, kemudian kalimat tersebut dilakukan proses tokenizing maka akan didapat potongan kata tunggal. Dari proses pemisahan inilah yang nantinya digunakan untuk menghitung bobot setiap kata, sehingga dapat menghasilkan hitungan setiap kata dalam kalimat. Langkah berikutnya akan dilakukan proses stopword.

2.1.2.1.2 Stopword Beberapa kata umum yang digunakan akan mengakibatkan suatu nilai menjadi kecil dalam membantu memilih dokumen yang sesuai dengan kebutuhan pengguna. Kata umum tersebut adalah stopword. (Manning, 2009). Contoh stopword dalam bahasa Jawa : "apa", "ana", "amarga", "dadi", "dudu", "gawe", "iki", "iku", "ing", "kabeh", "kalebu", "kang", "kanggo", "karo", "kowe", "lagi", "lan", "mau", "nalika", "nanging", "nganti", "ora", "padha", "punika", "sami", "saka", "sang", "tetep", "utawa", "wae", "yaiku", dll. Pada langkah ini akan dilakukan proses penghapusan kata umum untuk mengurangi jumlah kemunculan kata yang tidak memiliki makna berarti. Setelah proses tokenizing dan stopword selesai maka dilanjutkan dengan proses stemming.

9

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

2.1.2.1.3 Stemming Stemming adalah proses pengembalian sebuah kata yang terdapat dalam suatu dokumen ke dalam bentuk kata dasar. Proses penghilangan semua imbuhan (affix) yang terdiri dari awalan (prefix), sisipan (infix), akhiran (suffix) dan duplikasi. Dalam stemming untuk bahasa Jawa, sebelumnya terlebih dahulu membuat stemmer rule dengan menggunakan simbol sebagai berikut (Wijono, 2011) : 1. Aturan substitusi/ penghapusan menggunakan tanda =>. Tabel 2.1 Aturan Substitusi/ Penghapusan ny =>””

(ny dihapus)

ny => s

(ny diganti s)

2. Simbol <> digunakan untuk menyatakan tingkat (affix) yang mempengaruhi urutan pengecekan pada algoritma stemming.

Rule yang digunakan adalah sebagai berikut : Tabel 2.2 Tabel Rule Untuk Suffix SUFFIX <1> e=>"",n=>"",a=>"",i=>"",ing=>"", ku=>"",mu=>"" <2> ke=>"", ki=>"",wa=>"",

ya=>"",na=>"",ne=>"",en=>"",an=>"",ni=>"",nira=>"", ipun=>"",

on=>"u", ning=>"" <3> ake=>"", en=>"i", kna=>"n", kno=>"n", ana=>"", ono=>"", ane=>"", kne=>"", nan=>"", yan=>"", nipun=>"", oni=>"u", eni=>"i"

10

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

<4> kake=>"n", ken=>"" ,kke=>"",nana=>"",nono=>"", nane=>"", nen=>"",kna=>"",kno=>"", ekne=>"i", onan=>"u",enan=>"i" <5> kake=>"",kken=>"",aken=>"",kke=>"n",enana=>"i",enono=>"i",onen=>"u",enen=>"i",onana=> "u",onono=>"u", ekna=>"i",ekno=>"i",okno=>"u",okna=>"u" <6> ekken=>"i",kaken=>"n",okken=>"u",ekake=>"i",ekke=>"i",okake=>"u",okke=>"u", kaken=>"", kken=>"n" <7> ekaken=>"i",okaken=>"u"

Tabel 2.3 Tabel Rule Untuk Prefix PREFIX <1>

dipun=>"",peng=>"",peny=>"",pem=>"",pam=>"",pany=>"",pra=>"",kuma=>"",kapi=>"", bok=>"",mbok=>"",dak=>"",tak=>"",kok=>"",tok=>"",ing=>"",ang=>"",any=>"", am=>"", sak=>"", se=>"",su=>"",mang=>"",meng=>"",nge=>"",nya=>"",pi=>"",ge=>"",ke=>"",u=>"", po=>"u",ke=>"u"

<2>

mer=>"",mra=>"",mi=>"",sa=>"",ku=>"",an=>"",ka=>"",ny=>"s",ng=>"k",di=>"",peng=>" k",pang=>"k",pany=>"c", pam=>"p",ke=>"i",mang=>"k",meng=>"k"

<3>

a=>"",k=>"",pam=>"w",pan=>"t", pen=>"t",mang=>"w",meng=>"w", ny=>"c",ng=>""

<4>

n=>"t", pan=>"s", pen=>"s",man=>"s",men=>"s"

<5>

pan=>"",pen=>"",man=>"t",men=>"t",n=>""

<6>

pa=>"",pe=>"",man=>"",men=>""

<7>

p=>"",ma=>"",me=>""

<8>

m=>"w"

<9>

m=>"p"

<10>

m=>""

11

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Tabel 2.4 Tabel Rule Untuk Infix INFIX <1>

gum=>"b",gem=>"b",kum=>"p",kem=>"p"

<2>

kum=>"w", kem=>”w”

Algoritma untuk melakukan proses stemming terhadap kata tunggal atau duplikasi. 1. Kata berimbuhan adalah word. Kata sebagai hasil adalah stemW 2. Cek jumlah karakter word, jika < 2. Keluar. 3. Jika word mengandung “-“, maka pecah kata berdasar “-“ menjadi w1 dan w2. Dan lakukan langkah 4-13 4. w11 = w1 tanpa vokal dan w21 = w2 tanpa vokal. 5. Jika w11 = w21 dan panjang w1=w2 maka lakukan langkah 6-8 6. Jika w2 ada di kamus maka stemW=w2 dan keluar. 7. Jika w2 tidak ada di kamus, w22= hilangkan imbuhan(w2). 8. Jika w22 ada di kamus maka stemW=w22, jika tidak stemW=w1-w2 dan keluar. 9. Jika w11 != w21, lakukan langkah 10-13 10. ws11=hilangkan imbuhan(w1) dan ws21 = hilangkan imbuhan(w2). 11. Cek ws21 di kamus, jika ada maka stemW=ws21 dan keluar. 12. Cek ws11 di kamus, jika ada maka stemW=ws11 dan keluar. 13. Jika tidak maka stemW=ws11-ws21 dan keluar.

12

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

14. stemW = hilangkan imbuhan(stemW). Cek stemW di dictionary. Jika ada stemW dikembalikan dan keluar.

Algoritma untuk menghilangkan afiks pada kata berimbuhan. 1. Kata yang akan dihilangkan imbuhan adalah word. 2. ws1=hapus suffix (word). Cek di dictionary. Jika ada kembalikan kata. 3. ws1s2=hapus suffix (ws1). Cek di dictionary. Jika ada kembalikan kata. 4. ws1i1=hapus infix (ws1). Cek di dictionary. Jika ada kembalikan kata. 5. dws1= pengulangan parsial (ws1). Cek di dictionary. Jika ada kembalikan kata. 6. dws1s2= pengulangan parsial (ws1s2). Cek di dictionary. Jika ada kembalikan kata. 7. wp1=hapus prefix (word). Cek di dictionary. Jika ada kembalikan kata. 8. dwp1= pengulangan parsial (wp1). Cek di dictionary. Jika ada kembalikan kata. 9. wp1s1=hapus suffix(wp1). Cek di dictionary. Jika ada kembalikan kata. 10. dwp1s1= pengulangan parsial (wp1s1). Cek di dictionary. Jika ada kembalikan kata. 11. wp1s1s2=hapus suffix (wp1s1). Cek di dictionary. Jika ada kembalikan kata. 12. wp1p2=hapus prefix (wp1). Cek di dictionary. Jika ada kembalikan kata. 13. wp1p2s1=hapus suffix (wp1p2). Cek di dictionary. Jika ada kembalikan kata. 14. wp1p2s1s2=hapus suffix (wp1p2s1). Cek di dictionary. Jika ada kembalikan kata.

13

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

15. wi1=hapus infix (word). Cek di dictionary. Jika ada kembalikan kata. 16. wi1s1=hapus suffix (wi1). Cek di dictionary. Jika ada kembalikan kata.

2.1.2.2 Indexing Indexing (pengindeksan) adalah proses penyimpanan kembali dokumen secara urut dengan aturan tertentu. Proses penyimpanan tersebut berguna untuk mempercepat proses pencarian dokumen yang sesuai dengan kebutuhan pengguna. Langkah-langkah dalam membuat indeks adalah sebagai berikut (Manning, 2009) : 1. Kumpulkan dokumen yang akan di indeks. Friends, Romans, countrymen. So let it be with Caesar 2. Lakukan proses pemisahan kata untuk mendapatkan daftar token. Friends Romans countrymen So 3. Dapat dilakukan aturan tertentu untuk mendapatkan daftar token yang sudah dinormalisasi sebelum dilakukan pengindeksan. friend

roman

countrymen so

4. Indeks dokumen untuk setiap daftar token akan membuat Inverted Index. Pada Gambar 2.2 berikut adalah proses membuat indeks pada kumpulan dokumen. Terdapat 2 bagian yaitu (Doc 1 dan Doc 2). Bagian Doc 1 menggambarkan setiap dokumen telah dipecah menjadi kata (term) tunggal, kemudian dilakukan pengurutan berdasarkan abjad (a-z). Bagian Doc 2 menggambarkan kemunculan setiap kata (term) dan menuliskannya kembali jumlah kemunculan kata (term) dengan menunjuk posting lists.

14

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Gambar 2.2 Proses Pengindeksan

2.1.2.3 LinkedList LinkedList adalah stuktur data yang berbentuk node dimana node lainnya menunju dengan menggunakan pointer. Ukuran LinkedList menjadi dinamis karena ukurannya bertambah mengikuti jumlah node yang dimasukkan ke dalam rantai node (Kruse, 1994).

15

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

2.1.2.4 ArrayList Objek ArrayList adalah perkembangan dari larik (array) satu dimensi. Objek ArrayList mendukung untuk melakukan akses elemen secara acak, dimana setiap elemen dapat diakses dalam waktu yang konstan. Tidak seperti larik (array), objek ArrayList ukurannya dapat dikelola secara otomatis saat program sedang berjalan (Sommerville, 2009).

2.2

Peringkasan Teks Otomatis Ringkasan adalah suatu teks yang dihasilkan dari satu atau lebih teks yang

berisi bagian informasi yang signifikan dalam teks asal, dan yang tidak lebih dari setengah teks aslinya (Hovy, Mitkov, 2005). Ringkasan teks (text summarization) adalah suatu proses penyulingan sebagian besar infromasi penting dari sumber (beberapa sumber) untuk menghasilkan suatu ringkasan bagi pengguna (Mani, House, Klein, 1999). Terdapat 2 teknik kriteria peringkasan teks yaitu peringkasan teks berdasarkan ekstraksi dan abstraksi (Jezek, Steinberger, 2008). Teknik ekstraksi adalah teknik penyusunan kalimat mengenai intisari dari dokumen serta menggabungkan menjadi suatu ringkasan. Sedangkan teknik abstraksi adalah teknik pengambilan intisari dari dokumen serta membuat kalimat dalam bentuk lain sesuai dengan intisari dokumen (Jezek, Steinberger, 2008).

16

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

2.3

Metode Peringkasan Teks Otomatis

2.3.1

Term Frequency-Inverse Document Frequency (TF-IDF) Banyak sekali metode yang digunakan untuk menghasilkan suatu

ringkasan. Metode yang sudah pernah dilakukan adalah dengan menggunakan metode Maximum Marginal Relevance. Data uji coba diambil dari surat kabar berbahasa Indonesia online berjumlah 30 berita. Hasil pengujian dibandingkan dengan ringkasan manual yang menghasilkan rata-rata recall 60%, precision 77% dan f-measure 66% (Mustaqhfitri, Abidin, Kusumawati, 2009). Peringkasan teks otomatis dengan menggunakan metode TF-IDF pada dokumen berbahasa Indonesia. Data yang diujikan berjumlah 50 dokumen teks berbahasa Indonesia. Dari hasil pengujian sistem secara manual terdapat 31 hasil peringkasan yang sesuai. Sehingga nilai akurasinya adalah 62% (Mulyana, Ramadona, Herfina, 2012). Berdasarkan (Orasan, Pekar, Hasler, 2004) metode TF-RIDF adalah salah satu varian dari metode TF-IDF dalam peringkasan teks. Residual IDF, disebut sebagai RIDF (Manning, Schutze, 1999) adalah fungsi yang menjelaskan ke dalam estimasi IDF yaitu bagian dari skema TF-IDF, berikut rumus yang digunakan :

RIDF (t) = IDF - log (1 - p (0; λt)) Gambar 2.3 Perhitungan RIDF

17

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

|D| Dimana IDF adalah log | Dt |, dan p adalah Poisson distribusi dengan parameter λt, jumlah rata-rata kata (t) per dokumen dan 1 - p (0; λt) adalah kemungkinan kata (t) muncul dalam dokumen. Pada percobaan evaluasi, data yang digunakan dari corpus berjumlah 147 teks Newsware (Rose, 2002). Evaluasi dari 15 mahasiswa dengan menerima satu ringkasan dari setiap teks dan diminta untuk menjawab pertanyaan tentang teks tersebut menghasilkan akurasi sebesar 69%. Dalam penelitian ini, metode yang digunakan untuk peringkasan teks otomatis adalah menggunakan metode TF-IDF (Mulyana, Ramadona, Herfina, 2012). Metode ini dilakukan dengan cara pemberian bobot hubungan suatu kata (t) terhadap dokumen (D). Untuk dokumen tunggal, setiap kalimat dianggap sebagai dokumen. Metode ini menggunakan 2 konsep perhitungan bobot yaitu term frequency (TF) dan inverse document frequency (IDF). Term frequency (TF) adalah jumlah frekuensi kemunculan kata (t) pada kalimat (D). Inverse document frequency (IDF) dihitung menggunakan document frequency (df).

Document

frequency adalah jumlah kalimat (D) yang mengandung kata (t). Pada metode ini pembobotan kata dalam sebuah dokumen dilakukan dengan mengalikan nilai TF dan IDF. Bobot suatu istilah semakin besar jika istilah tersebut sering muncul dalam suatu dokumen dan semakin kecil jika istilah tersebut muncul dalam banyak dokumen (Grossman, 1998). Skema normalisasi pembobotan TF-IDF dihitung menggunakan rumus 1 sebagai berikut (Savoy, 1993) :

18

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Wik = ntfik * nidfk

(1)

Gambar 2.4 Perhitungan Wik

Dimana aturan ntfik dan nidfk terdapat pada rumus 2 dan rumus 3 berikut :

tfik ntfik =

(2)

Maxjtfij Gambar 2.5 Perhitungsn ntfik

log

n dfk

nidfk =

(3)

log (n) Gambar 2.6 Perhitungsn nidfk Keterangan : Wik

= bobot istilah k pada dokumen i.

tfik

= frekuensi dari istilah k pada dokumen i.

n

= jumlah dokumen dalam koleksi dokumen.

dfk

= jumlah dokumen yang mengandung istilah k.

Maxj tfij

= frekuensi istilah terbesar pada satu dokumen.

19

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

2.3.2

Langkah Pengerjaan Langkah-langkah

pengerjaan

peringkasan

teks

otomatis

dengan

menggunakan metode TF-IDF yang dilakukan dalam penelitian ini adalah sebagai berikut : 1. Menghitung jumlah kalimat (D) pada dokumen berbahasa Jawa. 2. Proses penghapusan kata umum (stopword) untuk mengurangi jumlah kemunculan kata yang tidak memiliki makna berarti. 3. Proses pengembalian sebuah kata (stemming) yang terdapat dalam suatu kalimat (D) ke dalam bentuk kata (t) dasar. 4. Menghitung term frequency (TF) yaitu jumlah frekuensi kemunculan kata (t) pada kalimat (D). 5. Menghitung document frequency (df) yaitu jumlah frekuensi kalimat (D) yang mengandung kata (t). 6. Menghitung inverse document frequency (IDF) dengan cara log dari jumlah total kalimat (D) dalam dokumen berbahasa Jawa dibagi document frequency (df). 7. Menghitung (W) bobot setiap kata (t) dalam kalimat (D) dengan cara mengalikan term frequency (TF) dengan inverse document frequency (IDF). 8. Menghitung bobot total kalimat (D) dengan cara menjumlahkan (W) bobot setiap kata (t) dalam kalimat (D).

20

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

9. Berdasarkan hasil perhitungan bobot total kalimat (D), akan diambil 40% (Hovy, Mitkov, 2005) dari jumlah bobot kalimat (D) yang memiliki score paling tinggi . 10. Dari langkah-langkah tersebut maka menghasilkan kumpulan kalimat (D) yang berisi bagian penting dari dokumen berbahasa Jawa.

2.3.3

Contoh Pengerjaan

Ora Kena Mlebu Aceh (Dening RS Rudatan)

Indonesia lagi ribet. Propinsi Aceh lagi panas. Perang TNI lumawan kelompok mbalela separatis GAM. Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa. Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM kuwi mau dudu barang sing gampang. Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih NKRI tetep wutuh. Pokoke ribet, tur ya ora gampang. Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing bengok-bengok protes tekan luwar negeri. Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah. LSM mau, klebu LSM Indonesia lan LSM manca sing ora seneng.

21

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Mula banjur nyuwara sing tundhone mung mojokke pemerintah Indonesia Lan mojokke TNI.

Langkah 1. Menghitung jumlah kalimat (D) pada dokumen berbahasa Jawa. Indonesia lagi ribet(D1). Propinsi Aceh lagi panas(D2). Perang TNI lumawan kelompok mbalela separatis GAM(D3). Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa(D4). Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM kuwi mau dudu barang sing gampang(D5). Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih NKRI tetep wutuh(D6). Pokoke ribet, tur ya ora gampang(D7). Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing bengok-bengok protes tekan luwar negeri(D8). Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah(D9). LSM mau, klebu LSM Indonesia lan LSM manca sing ora seneng(D10). Mula banjur nyuwara sing tundhone mung mojokke pemerintah Indonesia Lan mojokke TNI(D11).

Langkah 2. Proses penghapusan kata umum (stopword) Proses : indonesia lagi ribet. propinsi aceh lagi panas. perang tni lumawan kelompok mbalela separatis gam. sing dha gugur wis akeh, kejaba wong-wong gam, anggota tni utawa polri wis ana sing dadi tumbal kelangan nyawa. nalare,

22

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

tumrape tni lan pemerintah, mbrasta kaum pemberontakan kaya gam kuwi mau dudu barang sing gampang. ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih nkri tetep wutuh. pokoke ribet, tur ya ora gampang. ing tengah kahanan ngono mau, akeh lsm (lembaga swadaya masarakat) sing bengok-bengok protes tekan luwar negeri. alesane arep mbiyantu masarakat aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah. lsm mau, klebu lsm indonesia lan lsm manca sing ora seneng. mula banjur nyuwara sing tundhone mung mojokke pemerintah indonesia lan mojokke tni.

Hasil : indonesia ribet. propinsi aceh panas. perang tni lumawan kelompok mbalela separatis gam. dha gugur akeh, kejaba gam, anggota tni polri tumbal kelangan nyawa. nalare, tumrape tni pemerintah, mbrasta kaum pemberontakan gam kuwi barang gampang. ragade nyandhak milyaran rupiah nyawa prajurit dinggo totohan pamrih nkri wutuh. pokoke ribet, tur gampang. tengah, akeh lsm (lembaga swadaya masarakat) bengok-bengok protes tekan luwar negeri. alesane arep mbiyantu masarakat aceh keterak perang, dielikke (dilarang) dening pemerintah. lsm, klebu lsm indonesia lsm manca seneng. mula nyuwara tundhone mojokke pemerintah indonesia mojokke tni.

23

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Langkah 3. Proses pengembalian kata dasar (stemming) Proses : indonesia ribet. propinsi aceh panas. perang tni lumawan kelompok mbalela separatis gam. dha gugur akeh, kejaba gam, anggota tni polri tumbal kelangan

nyawa.

nalare,

tumrape

tni

pemerintah,

mbrasta

kaum

pemberontakan gam kuwi barang gampang. ragade nyandhak milyaran rupiah nyawa prajurit dinggo totohan pamrih nkri wutuh. pokoke ribet, tur gampang. tengah, akeh lsm (lembaga swadaya masarakat) bengok-bengok protes tekan luwar negeri. alesane arep mbiyantu masarakat aceh keterak perang, dielikke (dilarang) dening pemerintah. lsm, klebu lsm indonesia lsm manca seneng. mula nyuwara tundhone mojokke pemerintah indonesia mojokke tni.

Hasil : indonesia ribet. propinsi aceh panas. perang tni lumawan kelompok mbalela separatis gam. dha gugur akeh, jaba gam, anggota tni polri tumbal langan nyawa. nalar, tumrap tni pemerintah, brasta kaum pemberontakan gam kuwi barang gampang. ragad nyandhak milyar rupiah nyawa prajurit dinggo totoh pamrih nkri wutuh. pokok ribet, tur gampang. tengah, akeh lsm (lembaga swadaya masarakat) bengok protes tekan luwar negeri. alesan arep biyantu masarakat aceh terak perang, dielikke (larang) dening pemerintah. lsm, klebu lsm indonesia lsm manca seneng. mula nyuwara tundho mojok pemerintah indonesia mojok tni.

24

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Langkah 4. Menghitung term frequency (TF) yaitu jumlah frekuensi kemunculan kata (t) pada kalimat (D). Langkah 5. Menghitung document frequency (df) yaitu jumlah frekuensi kalimat (D) yang mengandung kata (t).

Tabel 2.5 Tabel Perhitungan TF dan df Kata (t)

D1

indonesia

1

ribet

1

D2

D3

D4 D5

D6

D7 D8

D9 D10 D11 1

1

1

propinsi

1

aceh

1

panas

1

df 3 2 1

1

2 1

perang

1

1

tni

1

lumawan

1

1

kelompok

1

1

mbalela

1

1

separatis

1

1

gam

1

1

1

1

2 1

1

4

3

dha

1

1

gugur

1

1

akeh

1

jaba

1

1

anggota

1

1

polri

1

1

tumbal

1

1

langan

1

1

nyawa

1

1

1

25

2

2

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Kata (t)

D1

D2

D3

D4 D5

D6

D7 D8

D9 D10 D11

df

nalar

1

1

tumrap

1

1

pemerintah

1

brasta

1

1

kaum

1

1

pemberontakan

1

1

kuwi

1

1

barang

1

1

gampang

1

1

1

1

3

2

ragad

1

1

nyandhak

1

1

milyar

1

1

rupiah

1

1

prajurit

1

1

dinggo

1

1

totoh

1

1

pamrih

1

1

nkri

1

1

wutuh

1

1

pokok

1

1

tur

1

1

tengah

1

lsm

1

lembaga

1

1

swadaya

1

1

masarakat

1

bengok

1

1

protes

1

1

tekan

1

1

26

1 1

1

2

2

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Kata (t)

D1

D2

D3

D4 D5

D6

D7 D8

D9 D10 D11

df

luwar

1

1

negeri

1

1

alesan

1

1

arep

1

1

biyantu

1

1

terak

1

1

dielikke

1

1

larang

1

1

dening

1

1

klebu

1

1

manca

1

1

seneng

1

1

mula

1

1

nyuwara

1

1

tundho

1

1

mojok

1

1

27

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Langkah 6. Menghitung inverse document frequency (IDF) dengan cara log dari jumlah total kalimat (D) dalam dokumen berbahasa Jawa dibagi document frequency (df). Langkah 7. Menghitung (W) bobot setiap kata (t) dalam kalimat (D) dengan cara mengalikan term frequency (TF) dengan inverse document frequency (IDF). Langkah 8. Menghitung bobot total kalimat (D) dengan cara menjumlahkan (W) bobot setiap kata (t) dalam kalimat (D).

Tabel 2.6 Tabel Perhitungan Bobot Kata (W) TF * IDF Kata (t)

D1

indonesia

1

ribet

1

D2

D3

D4

D5

D6

D7

D8

D9

D10

D11

1

1

1

propinsi

1

aceh

1

panas

1

1

1

df

D1

IDF

D2

D3

3

0.564

0.564

2

0.740

0.740

1

1.041

1.041

2

0.740

0.740

1

1.041

1.041

2

0.740

0.740

4

0.439

0.439

tni

1

lumawan

1

1

1.041

1.041

kelompok

1

1

1.041

1.041

mbalela

1

1

1.041

1.041

separatis

1

1

1.041

1.041

1

28

D6

D7

D8

D9

D10

D11

0.564

0.564

0.740

1 1

D5

0.740

perang

1

D4

0.740 0.439

0.439

0.439

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

TF * IDF Kata (t) gam

D1

D2

D3

D4

D5

1

1

1

D6

D7

D8

D9

D10

D11

df

D1

IDF

3

0.564

D2

D3

D4

D5

0.564

0.564

0.564

dha

1

1

1.041

1.041

gugur

1

1

1.041

1.041

akeh

1

2

0.740

0.740

jaba

1

1

1.041

1.041

anggota

1

1

1.041

1.041

polri

1

1

1.041

1.041

tumbal

1

1

1.041

1.041

langan

1

1

1.041

1.041

nyawa

1

2

0.740

0.740

1

1

1

1.041

1.041

tumrap

1

1

1.041

1.041

pemerintah

1

3

0.564

0.564

brasta

1

1

1.041

1.041

kaum

1

1

1.041

1.041

pemberontakan

1

1

1.041

1.041

kuwi

1

1

1.041

1.041

barang

1

1

1.041

1.041

gampang

1

2

0.740

0.740

1

D9

0.564

0.740

ragad

1

1

1.041

1.041

nyandhak

1

1

1.041

1.041

milyar

1

1

1.041

1.041

29

D8

D10

D11

0.740

1

1

D7

0.740

nalar

1

D6

0.564

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

TF * IDF Kata (t)

D1

D2

D3

D4

D5

D6

D7

D8

D9

D10

D11

df

D1

IDF

D2

D3

D4

D5

D6

prajurit

1

1

1.041

1.041

dinggo

1

1

1.041

1.041

totoh

1

1

1.041

1.041

pamrih

1

1

1.041

1.041

nkri

1

1

1.041

1.041

wutuh

1

1

1.041

1.041

D7

D8

pokok

1

1

1.041

1.041

tur

1

1

1.041

1.041

1

1.041

1.041

2

0.740

0.740

tengah

1

lsm

1

lembaga

1

1

1.041

1.041

swadaya

1

1

1.041

1.041

masarakat

1

2

0.740

0.740

bengok

1

1

1.041

1.041

protes

1

1

1.041

1.041

tekan

1

1

1.041

1.041

luwar

1

1

1.041

1.041

negeri

1

1

1.041

1.041

1

1

D9

0.740

0.740

alesan

1

1

1.041

1.041

arep

1

1

1.041

1.041

biyantu

1

1

1.041

1.041

terak

1

1

1.041

1.041

30

D10

D11

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

TF*IDF Kata (t)

D1

D2

D3

D4

D5

D6

D7

D8

D9

D10

D11

df

D1

IDF

D2

D3

D4

D5

D6

D7

D8

D9

dielikke

1

1

1.041

1.041

larang

1

1

1.041

1.041

dening

1

1

1.041

1.041

D10

klebu

1

1

1.041

1.041

manca

1

1

1.041

1.041

seneng

1

1

1.041

1.041

D11

mula

1

1

1.041

1.041

nyuwara

1

1

1.041

1.041

tundho

1

1

1.041

1.041

mojok

1

1

1.041

1.041

JUMLAH

1.305

2.823

5.909

9.774

9.598

11.154

3.563

10.552

10.075

4.428

5.733

URUTAN

11

10

6

4

5

1

9

2

3

8

7

31

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Langkah 9. Berdasarkan hasil perhitungan bobot total kalimat (D), akan diambil 40% (Hovy, Mitkov, 2005) dari jumlah bobot kalimat (D) yang memiliki score paling tinggi. Langkah 10. Dari langkah-langkah tersebut maka menghasilkan kumpulan kalimat (D) yang berisi bagian penting dari dokumen berbahasa Jawa.

Hasil : - Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa. - Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih NKRI tetep wutuh. - Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing bengok-bengok protes tekan luwar negeri. - Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah.

32

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

BAB III ANALISIS DAN PERANCANGAN SISTEM

3.1

Gambaran Sistem Penelitian Pada penelitian ini akan dibangun sistem peringkasan teks otomatis pada

dokumen berbahasa Jawa. Sistem ini bertujuan untuk menghasilkan sebuah ringkasan yang berisi bagian penting dari keseluruhan dokumen berbahasa Jawa. Ringkasan tersebut akan membantu pembaca dalam memahami isi dari dokumen tanpa harus membaca keseluruhan dokumen berbahasa Jawa. Untuk arsitektur sistem ini ditunjukan pada Gambar 3.1. Pada sistem ini terdapat 2 aktor yaitu admin dan pengguna. Admin bertujuan untuk memasukkan data dokumen. Data dokumen tersebut akan ditampilkan pada halaman utama sebagai data koleksi dokumen. Sedangkan pengguna dapat melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen berbahasa Jawa. Data dokumen tersebut akan diproses oleh sistem menjadi sebuah ringkasan. Untuk menjadi sebuah ringkasan, sistem akan memprosesnya dengan melakukan preprocessing yaitu pemisahan kata (tokenizing), penghapusan kata umum (stopword), pengembalian kata dasar (stemming). Kemudian sistem akan melakukan perhitungan TF-IDF untuk mendapatkan jumlah bobot kalimat. Bobot kalimat dengan score tinggi merupakan kalimat penting dalam sebuah dokumen berbahasa Jawa. Berdasarkan perhitungan TF-IDF, kalimat-kalimat tersebut yang akan dijadikan sebagai sebuah ringkasan.

33

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Ringkasan adalah suatu teks yang dihasilkan dari satu atau lebih teks yang berisi bagian informasi yang signifikan dalam teks asal, dan yang tidak lebih dari setengah teks aslinya (Hovy, Mitkov, 2005). Maka pada penelitian ini kalimatkalimat yang diambil untuk dijadikan sebuah ringkasan adalah sebesar 40% dari total kalimat yang ada dalam sebuah dokumen. Misalkan ada 50 kalimat dalam sebuah dokumen, maka dalam penelitian ini akan diambil sekitar 20 kalimat yang memiliki score tinggi. Karena jika kalimat yang diambil dalam sebuah dokumen terlalu sedikit maka hasil ringkasan menjadi tidak sesuai dengan isi dokumen, hal ini yang menyebabkan ringkasan tidak relevan. Pengguna

Sistem

Admin

Pengguna

Admin

Input Data Dokumen

Input Data Dokumen

Prepocessing : Tokenizing. Stopword, Stemming

Perhitungan TF-IDF Hasil Ringkasan

Gambar 3.1 Gambaran Sistem Keseluruhan

34

Koleksi Data Dokumen

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.2

Analisis Kebutuhan Dalam sistem ini terdapat 2 aktor yaitu admin dan pengguna. Tabel berikut

menjelaskan kebutuhan setiap aktor :

Tabel 3.1 Tabel Analisis Kebutuhan Pengguna Sistem Admin

Kebutuhan 1. Dapat memasukkan data dokumen ke dalam sistem.

Pengguna

1. Dapat melakukan peringkasan teks otomatis dengan dokumen berbahasa Jawa sesuai kebutuhan. 2. Dapat melihat hasil ringkasan dari sistem. 3. Dapat melihat data koleksi dokumen dan ringkasan dari sistem yang telah dimasukkan Admin.

35

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3

Perancangan Sistem

3.3.1

Diagram Use Case Diagram use case menjelaskan alur penggunaan sistem peringkasan teks

otomatis dokumen berbahasa Jawa. Dalam sistem ini terdapat 2 aktor yaitu admin dan pengguna. Admin bertujuan untuk memasukkan data dokumen. Data dokumen tersebut akan ditampilkan pada halaman utama sebagai data koleksi dokumen. Sedangkan pengguna dapat melihat data koleksi dokumen serta dapat melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen berbahasa Jawa yang ingin diringkas. Subsistem Peringkasan Teks Otomatis

Memasukkan data dokumen

Pengguna

<>

Melihat hasil ringkasan Melihat data koleksi dokumen <>

Login <>

Subsistem Operasi Teks

Memasukkan data koleksi dokumen

Logout

Gambar 3.2. Diagram Use case

36

Admin

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.1.1 Skenario Use Case 3.3.1.1.1 Skenario Login Tabel 3.2 Skenario Login Nama use case

Login

Aktor

Admin

Diskripsi

Admin memasukkan username dan password untuk masuk dan menggunakan sistem.

Prakondisi

Admin mempunyai username dan password.

Langkah kerja

Aksi aktor

Reaksi sistem

1. Admin memasukkan username dan password. 2. Admin menekan tombol "Login". 3. Sistem memverifikasi kebenaran username dan password. 4. Jika benar maka sistem menampilkan halaman Admin. Alternatif

4. Jika salah sistem menampilkan halaman utama untuk login kembali.

37

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.1.1.2. Skenario Memasukkan Data Koleksi Dokumen Tabel 3.3 Skenario Memasukkan Data Koleksi Dokumen Nama use case

Memasukkan Data Koleksi Dokumen

Aktor

Admin

Diskripsi

Admin memasukkan data dokumen ke dalam sistem, data dokumen tersebut akan ditampilkan pada halaman utama sebagai data koleksi dokumen.

Prakondisi Langkah kerja

Admin sudah melakukan login dan masuk ke dalam sistem. Aksi aktor

Reaksi sistem 1. Sistem menampilkan form untuk memasukkan data dokumen.

2. Admin memasukkkan data dokumen ke dalam sistem. 3. Admin menekan tombol "Simpan". 4. Sistem menyimpan data dokumen ke dalam sistem sebagai data koleksi dokumen.

38

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.1.1.3. Skenario Logout Tabel 3.4 Skenario Logout Nama use case

Logout

Aktor

Admin

Diskripsi

Admin menekan tombol logout.

Prakondisi

Admin sudah melakukan login dan masuk ke dalam sistem.

Langkah kerja

Aksi aktor

Reaksi sistem

1. Admin menekan tombol “logout”. 2. Akan keluar dari sistem dan menampilkan halaman utama.

3.3.1.1.4. Skenario Memasukkan Data Dokumen Tabel 3.5 Skenario Memasukkan Data Dokumen Nama use case

Memasukkan Data Dokumen

Aktor

Pengguna

Diskripsi

Pengguna memasukkan data dokumen berbahasa Jawa yang ingin diringkas.

Prakondisi Langkah kerja

Pengguna memiliki data dokumen yang ingin diringkas Aksi aktor 1. Aktor menekan tombol "Summarization".

39

Reaksi sistem

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

2. Sistem menampilkan form untuk memasukkan data dokumen. 3. Aktor memasukkan data dokumen yang ingin diringkas pada sistem. 4. Aktor menekan tombol "Ok". 5. Sistem memproses dokumen menjadi ringkasan serta menampilkan hasil ringkasan.

3.3.1.1.5. Skenario Melihat Hasil Ringkasan Tabel 3.6 Skenario Melihat Hasil Ringkasan Nama use case

Melihat Hasil Ringkasan

Aktor

Pengguna

Diskripsi

Penggina melihat hasil ringkasan dari data dokumen yang dimasukkan ke dalam sistem.

Prakondisi Langkah kerja

Pengguna sudah memasukkan data dokumen untuk diringkas. Aksi aktor

Reaksi sistem 1. Sistem menampilkan hasil ringkasan dokumen.

40

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.1.1.6. Skenario Melihat Data Koleksi Dokumen Tabel 3.7 Skenario Melihat Data Koleksi Dokumen Nama use case

Melihat Data Koleksi Dokumen

Aktor

Pengguna

Diskripsi

Pengguna melihat data koleksi dokumen yang ada pada sistem, terdapat pada halaman utama.

Prakondisi

Pengguna berada pada halaman utama.

Langkah kerja

Aksi aktor

Reaksi sistem

1. Aktor berada pada halaman utama. 2. Aktor menekan tombol “Continue Reading”. 3. Sistem menampilkan data koleksi dokumen.

41

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.2

Diagram Aktifitas

3.3.2.1. Diagram Aktifitas Login Admin dapat melakukan login dengan cara memasukkan username dan password yang sudah ditentukan. Namun jika username dan password tidak sesuai maka sistem akan kembali ke halaman utama. Berikut adalah Diagram Aktifitas Login, Gambar 3.3. Aktor

Sistem

Masukkan username dan password

Verifikasi username dan password

Menekan tombol “Login”

Salah invalid Benar valid Masuk ke sistem

Gambar 3.3 Diagram Aktifitas Login

42

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.2.2. Diagram Aktifitas Memasukkan Data Koleksi Dokumen Setelah melakukan login, admin dapat memasukkan data dokumen sesuai dengan form inputan pada sistem. Data dokumen tersebut akan ditampilkan dalam halaman utama sebagai data koleksi dokumen. Berikut adalah Diagram Akrifitas Memasukkan Data Koleksi Dokumen, Gambar 3.4. Aktor

Sistem

Sistem menampilkan form inputan data koleksi dokumen

Login

Memasukkan data koleksi dokumen

Sistem TIDAK menyimpan dalam data koleksi dokumen

Menekan tombol "Simpan"

tidak ya

Gambar 3.4 Diagram Aktifitas Memasukkan Data Koleksi Dokumen

43

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.2.3. Diagram Aktifitas Logout Admin dapat menghentikan tugasnya memasukkan data koleksi dokumen dengan cara menekan tombol "Logout". Berikut adalah Diagram Aktifitas Logout, Gambar 3.5. Aktor

Sistem

Akan keluar dari halaman admin

Menekan tombol “Logout”

Menampilkan halaman utama

Gambar 3.5 Diagram Aktifitas Logout

44

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.2.4. Diagram Aktifitas Memasukkan Data Dokumen Pengguna dapat memasukkan data dokumen berbahasa Jawa untuk dijadikan sebuah ringkasan. Kemudian sistem akan menampilkan hasil ringkasannya. Berikut adalah Diagram Aktifitas Memasukkan Data Dokumen, Gambar 3.6. Aktor

Sistem

Menekan tombol "Summarization"

Sistem menampilkan form inputan data dokumen

Memasukkan data dokumen yang diringkas

Sistem TIDAKmemproses menjadi ringkasan

Menekan tombol "Ok" YA

tidak Sistem menampilkan hasil ringkasan ya

Gambar 3.6 Diagram Aktifitas Memasukkan Data Dokumen

45

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.2.5. Diagram Aktifitas Melihat Hasil Ringkasan Setelah pengguna memasukkan data dokumen berbahasa Jawa, maka sistem akan menampilkan hasil ringkasan dari dokumen tersebut. Berikut adalah Diagram Aktifitas Melihat Hasil Ringkasan. Gambar 3.7. Aktor

Sistem

Sistem menampilkan hasil ringkasan

Memasukkan data dokumen yang diringkas

Gamabr 3.7 Diagram Aktifitas Melihat Hasil Ringkasan

46

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.2.6. Diagram Aktifitas Melihat Data Koleksi Dokumen Selain dapat memasukkan dokumen berbahasa Jawa untuk diringkas, Pengguna juga dapat melihat data koleksi dokumen yang terdapat pada halaman utama. Berikut adalah Diagram Aktifitas Melihat Data Koleksi Dokumen, Gambar 3.8. Aktor

Sistem

Menekan tombol “Continue Reading” pada halaman utama

Sistem menampilkan data koleksi dokumen

Gambar 3.8 Diagram Aktifitas Melihat Data Koleksi Dokumen

47

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.3

Diagram Sekuensial Diagram Sekuensial adalah suatu diagram yang menjelaskan bagaimana

suatu operasi atau sistem dijalankan secara bertahap.

3.3.3.1. Diagram Sekuensial Login Username dan password yang sudah dimasukkan akan divalidasi oleh sistem. Jika sesuai maka admin akan masuk pada halaman inputDataMajalah.jsp, sedangkan jika salah maka akan kembali pada halaman utama (index.jsp) serta menampilkan pesan invalid. Berikut adalah proses Login, Gambar 3.9.

index.jsp

username & password

Admin







ProcessLoginServlet.java

LoginModel.java

inputDataMajalah.jsp

getParameter (username, password)

cekValidasi (username, password)

Invalid

Request page

Gambar 3.9 Diagram Sekuensial Login

48

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.3.2. Diagram Sekuensial Memasukkan Data Koleksi Dokumen Setelah Login, admin dapat memasukkan data koleksi dokumen yang berisi tanggal, sumber majalah, judul majalah dan data majalah. Data dokumen akan disimpan oleh sistem dan ditampilkan pada halaman utama (index.jsp) sebagai data koleksi dokumen. Berikut adalah proses Memasukkan Data Koleksi Dokumen, Gambar 3.10.

Admin







inputDataMajalah.jsp

ProcessInputMajalah.java

MajalahModel.java

tanggal, sumber, judul, data majalah

getParameter (tanggal, sumber, judul, data majalah) input (tanggal, sumber, judul, data majalah)

)

Request page

Gambar 3.10 Diagram Sekuensial Memasukkan Data Koleksi Dokumen

49

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.3.3. Diagram Sekuensial Logout Admin dapat menghentikan tugasnya memasukkan data koleksi dokumen pada halaman inputDataMajalah.jsp dengan cara menekan tombol "Logout". Kemudian admin akan kembali pada halaman utama (index.jsp). Berikut adalah proses Logout, Gambar 3.11.

inputDataMajalah.jsp

index.jsp

Request Logout

Admin Request page

Gambar 3.11 Diagram Sekuensial Logout

50

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.3.4. Diagram Sekuensial Memasukkan Data Dokumen Pengguna dapat memasukkan data dokumen berbahasa Jawa pada halaman inputDataDokumen.jsp untuk dijadikan sebuah ringkasan. Kemudian sistem akan menampilkan hasil ringkasannya pada halaman viewDataDokumen.jsp. Berikut adalah proses Memasukkan Data Dokumen, Gambar 3.12.











inputDataDokumen.jsp

ProcessSummarization.java

TF-IDFl.java

Stopword

Stemming

viewDataDokumen.java

data dokumen

Pengguna

getParameter (data dokumen) summarization (data dokumen) isStopword (tempKata[j]) setWord (tempKata[j])

Hasil Proprocessing Hasil perhitungan tf-idf

sendRedirect Request page

Gambar 3.12 Diagram Sekuensial Memasukkan Data Dokumen 51

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.3.5. Diagram Sekuensial Melihat Hasil Ringkasan Setelah pengguna memasukkan data dokumen berbahasa Jawa pada halaman inputDataDokumen.jsp, maka sistem akan menampilkan hasil ringkasan dari dokumen tersebut pada halaman viewDataDokumen.jsp. Berikut adalah proses Melihat Hasil Ringkasan. Gambar 3.13.





inputDataDokumen.jsp

viewDataDokumen.jsp

data dokumen

Pengguna

Request page

Gambar 3.13 Diagram Sekuensial Melihat Hasil Ringkasan

52

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.3.6. Diagram Sekuensial Melihat Data Koleksi Dokumen Selain dapat memasukkan dokumen berbahasa Jawa untuk diringkas, pengguna juga dapat melihat data koleksi dokumen yang terdapat pada halaman utama (index.jsp). Berikut adalah proses Melihat Data Koleksi Dokumen, Gambar 3.14.





index.jsp

viewDataMajalah.jsp

Request data koleksi dokumen

Pengguna

Request page

Gambar 3.14 Diagram Sekuensial Melihat Data Koleksi Dokumen

53

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.4

Diagram MVC (Model View Control) Diagram MVC adalah diagram yang menjelaskan bagaimana suatu operasi

dijalankan dengan melihat kelas MVC (Model View Control).

3.3.4.1. Struktur Kelas MVC (Model View Control) Tabel 3.8 Struktur Kelas Model View Control Model

View

Control

LoginModel.java

index.jsp

ProcessInputMajalah.java

MajalahModel.java

inputDataDokumen.jsp

ProcessLoginServlet.java

StemWord.java

inputDataMajalah.jsp

ProcessSummarization.java

StopWord.java

viewDataDokumen.jsp

TF-IDF.java

viewDataMajalah.jsp viewRingkasanMajalah.jsp

3.3.4.1.1. Diagram Analisis Kelas MVC (Model View Control)

index.jsp

ProcessLoginServlet.java

LoginModel.java

inputDataMajalah.jsp

ProcessInputMajalah.java

Admin

MajalahModel.java

Gambar 3.15 Diagram Kelas Admin

54

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

index.jsp

Pengguna

viewDataMajalah.jsp

inputDataDokumen.jsp

viewRingkasanMajalah.jsp

ProcessSummarization.java

TF-IDF.java

viewDataDokumen.jsp

Gambar 3.16 Diagram Kelas Pengguna

55

StopWord.java

StemWord.java

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.3.4.3. Diagram Kelas Model Tabel 3.9 Diagram Kelas MajalahModel.java

LoginModel.java

- tanggalMajalah : String

- username : String

- sumberMajalah : String

- password : String

- judulMajalah : String

<> LoginModel()

- dataMajalah : String

+ setUsername (String) : void

<> MajalahModel()

+ getUsername : String

+ setTanggalMajalah (String) : void

+ setPassword (String) : void

+ getTanggalMajalah : String

+ getPassword : String

+ setSumberMajalah (String) : void

+ getAdmin()

+ getSumberMajalah : String + setJudulMajalah (String) : void + getJudulMajalah : String + setDataMajalah (String) : void + getDataMajalah : String + inputMajalah() + readMajalah() + viewMajalah()

TF_IDF.java

StopWord.java

<>TF_IDF()

- stopword : List

+ summarization()

<>StopWord() + isStopword () : boolean

StemWord.java - word : String - directory : List <>StemWord() + setWord (String) : void + getWord : String + delSuffix () : String + delPrefix () : String + delDuplikasi () : String

56

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.4

Perancangan Antar Muka (User Interface)

3.4.1. Halaman Utama Pada halaman utama terdapat 2 aktor yang menggunakan yaitu admin dan pengguna. Admin dapat melakukan "Login" dengan cara memasukkan username dan password terlebih dahulu. Setelah Login admin dapat memasukkan data dokumen sebagai data koleksi dokumen, kemudian akan disimpan oleh sistem dan akan ditampilkan pada halaman utama. Sedangkan pengguna dapat melihat data koleksi dokumen yang sudah dimasukkan admin sebelumnya. Desain Halaman Utama seperti Gambar 3.17. MAJALAH BAHASA JAWA

username password login

Home

Summarization

MeLorot Maneh

Ora Kena Mlebu Aceh

- Tanggal 2 Mei wis wiwit kesilep, - Sing dha gugur wis akeh, kejaba wongnanging

kegiyatan

Hardhiknas

(Hari wong GAM, anggota TNI utawa Polri

Pendhidhikan) isih katon marak ing saben wis ana sing dadi tumbal kelangan dhaerah. - Lan ing tengah kahanan

nyawa. - Nalare, tumrape TNI

Continue Reading

Continue Reading

"BAYANG-BAYANG"

Ngilangi Pornografi lan Pornoaksi

DISINTEGRASI RI

-Majelis Agama-agama DIY wiwit

-Sawise ambruke Uni Soviet utawa USSR Romadhon taun iki netepake bakal (Uni Soviet Sosialis Republik) taun 1991 ngadani upaya ngilangi pornografi lan sing ditututi negara-negara uni ing laladan pornoaksi sing dianggep saya ngrembrah Balkan (Eropa Tenggara) kaya

lan nggladrah.- Rembug bab

Continue Reading

Gambar 3.17 Halaman Utama

57

Continue Reading

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.4.2. Halaman Memasukkan Data Koleksi Dokumen Setelah Login, maka admin dapat memasukkan data koleksi dokumen yang berisi tanggal, sumber majalah, judul majalah, dan input data majalah. Kemudian tekan tombol "Simpan" untuk menyimpan ke dalam sistem dan menampilkan pada halaman utama. Desain Halaman Memasukkan Data Koleksi Dokumen seperti pada Gambar 3.18. MAJALAH BAHASA JAWA Home Tanggal : Sumber Majalah : Judul Majalah : Input Data Majalah :

Summarization

Logout

c. Halaman Pengguna Gambar 3.14 Halaman Pengguna

SIMPAN

Gambar 3.13 Halaman Ad

Gambar 3.18 Halaman Memasukkan Data Koleksi Dokumen

58

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.4.3. Halaman Melihat Data Koleksi Dokumen Pada halaman utama pengguna dapat melihat data koleksi dokumen yang sudah dimasukkan oleh admin. Ketika pengguna menekan tombol "Continue Reading" maka sistem akan menampilkan data koleksi dokumen. Pada halaman ini pengguna juga dapat melihat ringkasan dari data koleksi dokumen tersebut dengan cara menekan link “Ringkasan Dokumen”. Desain Halaman Melihat Data Koleksi Dokumen seperti pada Gambar 3.19.

Home

Peringkas Otomatis

Data Dokumen Majalah :

Indonesia lagi ribet. Propinsi Aceh lagi panas. Perang TNI lumawan kelompok mbalela separatis GAM. Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa. Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM kuwi mau dudu barang sing gampang. Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih NKRI tetep wutuh. Pokoke ribet, tur ya ora gampang. bengok-bengok protes tekan luwar negeri. Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing bengok-bengok protes tekan luwar negeri. Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah. LSM mau, klebu Ringkasan Dokumen

Gambar 3.19 Halaman Melihat Data Koleksi Dokumen

59

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Ketika pengguna menekan link “Ringkasan Dokumen” maka akan terdapat halaman yang menampilkan ringkasan berdasarkan data koleksi dokumen tersebut. Seperti pada Gambar 3.20.

Home

Peringkas Otomatis

Data Ringkasan Majalah :

- Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa. - Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM kuwi mau dudu barang sing gampang. - Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih NKRI tetep wutuh. - Ing tengah kahanan ngono mau, akeh\ LSM (Lembaga Swadaya Masarakat) sing bengok-bengok protes tekan luwar negeri.

Gambar 3.20 Halaman Melihat Ringakasan Data Koleksi Dokumen

60

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.4.4. Halaman Peringkasan Teks Otomatis (Summarization) Pada halaman peringkasan teks otomatis (summarization) pengguna dapat melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen berbahasa Jawa. Kemudian menekan tombol "OK" maka sistem akan memproses menjadi sebuah ringkasan. Desain Peringkasan Teks Otomatis (Summarization) seperti Gambar 3.21.

Home

Peringkas Otomatis

Input Data Dokumen :

OK

Gambar 3.21 Halaman Peringkasan Teks Otomatis (Summarization)

61

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.4.5. Halaman Melihat Hasil Ringkasan Setelah pengguna memasukkan data dokumen berbahasa Jawa, maka sistem akan memproses sehingga menghasilkan sebuah ringkasan. Desain Halaman Melihat Hasil Ringkasan seperti pada Gambar 3.22.

Home

Peringkas Otomatis

Hasil Ringkasan :

- Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa. - Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM kuwi mau dudu barang sing gampang. - Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih NKRI tetep wutuh. - Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing bengok-bengok protes tekan luwar negeri. - Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah. - Terus terange, sing akeh malah masarakat, rakyat dha dinggo kudhung kanggo golek dana saka negara asing. - Lan saka kehe kedadeyan kaya sing tau dumadi ing Maluku, Manado, Papua (Irian Jaya), lan uga ing dhaerah-dhaerah ing Jawa LSM kaya ngono mau malah mung manas-manasi. - Kejaba kuwi sing paling gawe rugi nalikane ana anggota LSM asing tiwas merga kerusuhan, beritane sumebar cepet tekan ngendi-endi lan Indonesia banjur diuman\

Gambar 3.22 Halaman Melihat Hasil Ringkasan

62

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.5.

Skenario Pengujian Sistem Pada pengujian sistem akan dilakukan dengan cara mengoreksi secara

manual ringkasan yang dihasilkan oleh sistem. Yang dimaksud mengoreksi secara manual adalah penguji menilai apakah ringkasan dari sistem termasuk relevan atau tidak relevan. Pengujian ini akan dilakukan kepada 3 responden bahasa Jawa, dengan dokumen berjumlah 50. Dokumen yang digunakan dalam sistem ini bersumber dari Djakalodang tahun 1978, 2002 dan 2003. Berikut adalah contoh pengujian sistem yang dilakukan secara manual kepada responden. Jika dokumen 1 relevan makan nilai yang dihasilkan adalah 1 dan jika tidak relevan bernilai 0 begitu seterusnya. Dapat dilihat pada Tabel 3.10.

Tabel 3.10 Contoh Pengujian Sistem Dokumen

Relevan

Tidak Relevan

1

1

0

2

1

0

3

1

0

4

0

1

5

1

0

6

0

1

7

1

0

8

0

1

9

1

0

10

1

0

Jumlah

7

3

63

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Setelah mengisikan kuesioner untuk pengujian sistem, maka akan dilakukan perhitungan jumlah dokumen yang relevan. Dari jumlah dokumen yang relevan akan lakukan perhitungan nilai rata-rata untuk mendapatkan nilai akurasi yang dihasilkan oleh sistem. Berikut adalah cara menghitung nilai rata-rata terdapat pada rumus (1), Gambar 3.23.

Jumlah dokumen yang relevan Rata-rata

=

x 100%

(1)

Jumlah keseluruhan dokumen

Gambar 3.23 Rumus Perhitungan Rata-rata Dari contoh pengujian sistem diatas terdapat 10 dokumen yang relevan. Berikut adalah contoh menghitung nilai rata-rata, Gambar 3.24.

7 Rata-rata

=

x 100% 10

=

70 %

Gambar 3.24 Contoh Perhitungan Rata-rata Maka dari contoh pengujian sistem dengan dokumen berjumlah 10 terdapat nilai rata-rata akurasi yang dihasilkan oleh sistem sebesar 70%. Dengan demikian akan diketahui nilai rata-rata akurasi sistem ini dalam membantu pengguna untuk memperoleh intisari dari dokumen berbahasa Jawa sehingga dapat membuat keputusan melanjutkan membaca keseluruhan dokumen atau cukup dengan membaca ringkasan.

64

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

3.6

Data Ketika admin memasukkan data koleksi dokumen ke dalam sistem, data

tersebut akan disimpan ke dalam database. Hal ini dikarenakan banyaknya inputan yang dimasukkan admin, seperti tanggal, judul majalah, sumber majalah, serta data majalah. Dengan menggunakan database penyimpanan data menjadi lebih mudah serta data mudah untuk diolah.

65

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

BAB IV IMPLEMENTASI

4.1.

Spesifikasi Software dan Hardware yang Digunakan

4.1.1. Spesifikasi Software Spesifikasi software yang digunakan untuk implementasi Sistem Peringkasan Teks Otomatis Pada Dokumen Berbahasa Jawa Menggunakan Meotde TF-IDF adalah sebagai berikut : 1. Sistem operasi : Windows 7 Ultimate 64 bit 2. Netbeans IDE 6.9.1 3. SQLyog 4. Browser : Mozilla Firefox

4.1.2. Spesifikasi Hardware Spesifikasi hardware yang digunakan untuk implementasi Sistem Peringkasan Teks Otomatis Pada Dokumen Berbahasa Jawa Menggunakan Meotde TF-IDF adalah sebagai berikut : 1. Prosesor : AMD A8-5550M APU with Radeon(tm) HD Graphics (4CPUs), 2,1GHz 2. Memori RAM : 4096MB DDR3 3. Harddisk : 500 GB

66

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.

Implementasi Program

4.2.1

Implementasi Text Preprocessing Text Preprocessing memiliki 3 tahap yaitu pemisahan kata (tokenizing

atau split), penghapusan kata umum (stopword), dan pengembalian kata dasar (stemming). Setiap dokumen yang dimasukkan pengguna akan melalui proses ini untuk mendapatkan full text yang dimiliki. Hasil full text tersebut akan disimpan dalam bentuk ArrayList. Pada Gambar 4.1 adalah rangkaian bagaimana proses text preprocessing dilakukan oleh sistem. Berikut Implementasi Text Preprocessing, Listing Program 4.1.

Tokenizing/Split

Stopword

Stemming

ArrayList

Gambar 4.1 Rangkaian Proses Text Preprocessing

public String summarization(String teksAsli) { String[] kalimatAsli = teksAsli.split("\\."); String[] tempKalimat = teksAsli.split("\\.");

ArrayList teks_lengkap = new ArrayList();

StopWord stopword = new StopWord(); StemWord stemming = new StemWord();

for (int i = 0; i < tempKalimat.length; i++) { if (tempKalimat[i].startsWith(" ")) { tempKalimat[i] = tempKalimat[i].substring(1); }

67

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

String[] tempKata = tempKalimat[i].split(" "); for (int j = 0; j < tempKata.length; j++) { tempKata[j] = tempKata[j].replaceAll("[[email protected]#$%&*,_'?\"()\n/;:-=]", "");

if (stopword.isStopword(tempKata[j].toLowerCase())) { continue; } stemming.setWord(tempKata[j].toLowerCase()); tempKata[j] = stemming.getWord(); if (!teks_lengkap.contains(tempKata[j])) { teks_lengkap.add(tempKata[j]); } } } }

Listing Program 4.1 Implementasi Text Preprocessing

68

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.2 Implementasi Penghapusan Kata Umum (Stopword) Setelah proses pemisahan kata (tokenizing atau split), akan dilakukan proses penghapusan kata umum (stopword). Kata umum adalah kata yang tidak memiliki maka berarti dalam sebuah kalimat. Dalam sistem ini daftar kata umum disimpan dalam bentuk file .txt, kemudian akan dipanggil dalam sistem. Hasil dari penghapusan kata akan disimpan sementara dalam bentuk List. Berikut adalah Implementasi Penghapusan Kata Umum, Listing Program 4.2.

public class StopWord { List stopword; public StopWord() { try { Scanner file = new Scanner(new File("e:/stopword.txt")); stopword = new LinkedList(); while (file.hasNext()) { stopword.add(file.nextLine()); } } catch (FileNotFoundException ex) { Logger.getLogger(StopWord.class.getName()).log(Level.SEVERE, null, ex); } }

public boolean isStopword(String word) { return stopword.contains(word); } }

Listing Program 4.2 Implementasi Penghapusan Kata Umum (Stopword)

69

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.3 Implementasi Pengembalian Kata Dasar (Stemming) Kemudian akan dilakukan proses pengembalian kata dasar (stemming) dengan cara mencari kata yang sesuai daftar kata dasar (dictionary). Dalam sistem ini daftar kata dasar disimpan dalam bentuk file .txt, kemudian akan dipanggil dalam sistem. Hasil dari pengembalian kata akan disimpan sementara dalam bentuk List. Berikut adalah Implementasi Pengembalian Kata Dasar, Listing Program 4.3.

public class StemWord { String word; List directory;

public StemWord() { try { Scanner file = new Scanner(new File("e:/dictionary.txt")); directory = new LinkedList();

while (file.hasNext()) { String kata = file.nextLine(); directory.add(kata); } } catch (FileNotFoundException ex) { Logger.getLogger(StemWord.class.getName()).log(Level.SEVERE, null, ex); } } }

Listing Program 4.3 Implementasi Pengembalian Kata Dasar (Stemming)

70

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Method delSuffix() ini mengimplementasikan aturan untuk menghapus akhiran, "-e", "-n", "-a", "-i", "-ing" dll. Berikut adalah Implementasi Method delSuffix(), Listing Program 4.4.

public String delSuffix() { if (directory.contains(word)) { return word; } String kataAwal = word;

if (word.endsWith("e")) { word = word.substring(0, word.length() - 1); if (directory.contains(word)) { return word; } else { word = kataAwal; } } if (word.endsWith("n")) { word = word.substring(0, word.length() - 1); if (directory.contains(word)) { return word; } else { word = kataAwal; } } if (word.endsWith("a")) { word = word.substring(0, word.length() - 1); if (directory.contains(word)) { return word; } else {

71

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

word = kataAwal; } } if (word.endsWith("i")) { word = word.substring(0, word.length() - 1); if (directory.contains(word)) { return word; } else { word = kataAwal; } } if (word.endsWith("ing")) { word = word.substring(0, word.length() - 3); if (directory.contains(word)) { return word; } else { word = kataAwal; } }

return word; }

Listing Program 4.4 Implementasi Method delSuffix()

72

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Method delPrefix() ini mengimplementasikan aturan untuk menghapus awalan, "dipun-", "peng-", "peny-", "pem-", dll. Berikut adalah Implementasi Method delPrefix(), Listing Program 4.5.

private String delPrefix() { if (directory.contains(word)) { return word; }

String kataAwal = word;

if (word.startsWith("dipun")) { word = word.substring(5); if (directory.contains(word)) { return word; } else { word = kataAwal; } } if (word.startsWith("peng")) { word = word.substring(4); if (directory.contains(word)) { return word; } else { word = kataAwal; } } if (word.startsWith("peny")) { word = word.substring(4); if (directory.contains(word)) {

73

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

return word; } else { word = kataAwal; } } if (word.startsWith("pem")) { word = word.substring(3); if (directory.contains(word)) { return word; } else { word = kataAwal; } } if (word.startsWith("pam")) { word = word.substring(3); if (directory.contains(word)) { return word; } else { word = kataAwal; } }

return word; }

Listing Program 4.5 Implementasi Method delPrefix()

74

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Method delDuplikasi() ini mengimplementasikan aturan untuk menghapus kata yang sama. Berikut adalah Implementasi Method delDuplikasi(), Listing Program 4.6.

private String delDuplikasi() { String kataPertama = null; String kataKedua = null;

if (word.contains("-")) { kataPertama = word.substring(0, word.indexOf("-")); kataKedua = word.substring(word.indexOf("-") + 1); if (directory.contains(kataKedua)) { word = kataKedua; } else if (directory.contains(kataPertama)) { word = kataPertama; } else { word = kataKedua; } } return word; }

Listing Program 4.6 Implementasi Method delDuplikasi()

75

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.4 Implementasi Term Frequency (TF) Setelah text preprocessing selesai, akan dilakukan perhitungan jumlah frekuensui kemunculan kata (t) pada kalimat (D). Pada tahap ini akan dibuat tabelTF dalam array 2 dimensi dengan baris merupakan list kata (teks_lengkap) dan kolom merupakan list kalimat (tempKalimat). Jika kata (t) yang terkandung dalam kalimat (D) maka bernilai 1, sedangkan kata (t) yang tidak terkandung dalam kalimat (D) maka bernilai 0. Berikut adalah Implementasi Term Frequency (TF), Listing Program 4.7.

int[ ][ ] tabelTF = new int[tempKalimat.length][teks_lengkap.size()]; for (int i = 0; i < tempKalimat.length; i++) { if (tempKalimat[i].startsWith(" ")) { tempKalimat[i] = tempKalimat[i].substring(1); } String[] tempKata = tempKalimat[i].split(" "); for (int j = 0; j < tempKata.length; j++) { tempKata[j] = tempKata[j].replaceAll("[[email protected]#$%&,_'?\"()\n/;:-=]", ""); if (stopword.isStopword(tempKata[j].toLowerCase())) { continue; } stemming.setWord(tempKata[j].toLowerCase()); tempKata[j] = stemming.getWord(); int index = teks_lengkap.indexOf(tempKata[j]); tabelTF[i][index] = 1; } }

Listing Program 4.7 Implementasi Term Frequency (TF)

76

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.5 Implementasi Document Frequency (df) Pada tahap ini akan dilakukan perhitungan jumlah frekuensi kalimat (D) yang mengandung kata (t) dengan cara membuat tabelDF dalam array. Berikut adalah Implementasi Document Frequency, Listing Program 4.8.

int[ ] tabelDF = new int[teks_lengkap.size()]; for (int i = 0; i < teks_lengkap.size(); i++) { for (int j = 0; j < tempKalimat.length; j++) { tabelDF[i] += tabelTF[j][i]; } }

Listing Program 4.8 Implementasi Document Frequency (df)

4.2.6 Implementasi Inverse Document Frequency (IDF) Pada tahap ini akan dilakukan perhitungan (IDF) dengan membuat tabelIDF dalam array. Dengan cara Log dari jumlah total kalimat (D) dibagi hasil perhitungan (df) yang sudah dilakukan sebelumnya . Berikut adalah Implementasi Inverse Document Frequency, Listing Program 4.9.

float[ ] tabelIDF = new float[teks_lengkap.size()]; for (int i = 0; i < teks_lengkap.size(); i++) { tabelIDF[i] = (float) tempKalimat.length / tabelDF[i]; tabelIDF[i] = (float) Math.log10(tabelIDF[i]); }

Listing Program 4.9 Implementasi Inverse Document Frequency (IDF)

77

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.7 Implementasi Bobot Kata (W) Pada tahap ini akan dilakukan perhitungan bobot kata dengan cara mengalikan hasil perhitungan TF dan perhitungan IDF. Akan dibuat tabelTFIDF dalam array 2 dimensi dengan baris merupakan list kata (teks_lengkap) dan kolom merupakan list kalimat (tempKalimat). Berikut adalah Implementasi Bobot Kata, Listing Program 4.10.

float[ ][ ] tabelTFIDF = new float[tempKalimat.length][teks_lengkap.size()];

for (int i = 0; i < tempKalimat.length; i++) { for (int j = 0; j < teks_lengkap.size(); j++) { tabelTFIDF[i][j] = tabelTF[i][j] * tabelIDF[j]; } }

Listing Program 4.10 Implementasi Bobot Kata (W)

78

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.8 Implementasi Bobot Total Kalimat (D) Pada tahap ini akan dilakukan perhitungan bobot total kalimat (D) dengan cara menjumlahkan bobot kata (W) dengan cara membuat jumlah dalam array. Berikut adalah Implementasi Bobot Total Kalimat, Listing Program 4.11.

float jumlah[ ] = new float[tempKalimat.length]; for (int i = 0; i < tempKalimat.length; i++) { for (int j = 0; j < teks_lengkap.size(); j++) { jumlah[i] += tabelTFIDF[i][j]; } }

Listing Program 4.11 Implementasi Bobot Total Kalimat (D)

4.2.9 Implementasi Pengambilan Kalimat (D) Pada tahap ini akan dilakukan pengambilan kalimat (D) dengan jumlah bobot total kalimat (D) yang memiliki score paling tinggi. Pada sistem ini akan diambil 40% (Hovy, Mitkov, 2005) dari keseluruhan kalimat, untuk dijadikan ringkasan. Hasil dari pengambilan kalimat akan disimpan sementara dalam bentuk LinkedList. Berikut adalah Implemenasi Pengambilan Kalimat, Listing Program 4.12.

LinkedList list1 = new LinkedList(); LinkedList list2 = new LinkedList(); for (int i = 0; i < 40 * jumlah.length / 100; i++) { list1.add(jumlah[i]); list2.add(i); 79

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

} for (int i = 40 * jumlah.length / 100; i < jumlah.length; i++) { float min = list1.get(0); int index = 0; for (int j = 1; j < list2.size(); j++) { if (min > list1.get(j)) { min = list1.get(j); index = j; } } if (jumlah[i] > min) { list1.remove(index); list2.remove(index); list1.add(jumlah[i]); list2.add(i); } }

Listing Program 4.12 Implementasi Pengambilan Kalimat (D)

80

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.2.10 Implementasi Menampilkan Hasil Ringkasan Pada tahap ini sistem akan menampilkan hasil ringkasan berdasarkan perhitungan sebelumnya. Berikut adalah Implementasi Menampilkan Hasil Ringkasan, Listing Program 4.13.

String hasil = ""; for (int i = 0; i < list1.size(); i++) { int indexAwal = list2.get(i); hasil = hasil + "-" + kalimatAsli[indexAwal] + ".\n"; } return hasil; }

Listing Program 4.13 Implementasi Menampilkan Hasil Ringkasan

81

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.3 Implementasi Antar Muka (User Interface) Implementasi antar muka ini digunakan untuk mempermudah pengguna dalam berinteraksi dengan sistem, maka GUI (Graphical User Interface) dibuat berdasarkan perancangan sistem yang sudah dibuat sebelumnya.

4.3.1 Halaman Utama Pada halaman utama terdapat 2 aktor yang menggunakan yaitu admin dan pengguna. Admin dapat melakukan "Login" dengan cara memasukkan username dan password terlebih dahulu. Setelah Login admin dapat memasukkan data koleksi dokumen, kemudian akan disimpan oleh sistem dan akan ditampilkan pada halaman utama. Sedangkan pengguna dapat melihat data koleksi dokumen yang sudah dimasukkan admin sebelumnya. Seperti pada Gambar 4.2.

Gambar 4.2 Halaman Utam

82

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.3.2 Halaman Memasukkan Data Koleksi Dokumen Setelah Login berhasil, maka admin dapat memasukkan data koleksi dokumen yang berisi tanggal, sumber majalah, judul majalah, dan input data majalah. Kemudian tekan tombol "Simpan" untuk menyimpan ke dalam sistem dan menampilkan pada halaman utama. Seperti pada Gambar 4.3.

Gambar 4.3 Halaman Memasukkan Data Koleksi Dokumen

83

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.3.3 Halaman Melihat Data Koleksi Dokumen Pada halaman utama pengguna dapat melihat data koleksi dokumen yang sudah dimasukkan oleh admin. Pengguna juga dapat melihat ringkasan dari data koleksi dokumen tersebut dengan cara menekan link “Ringkasan Dokumen”. Seperti pada Gambar 4.4.

Gambar 4.4 Halaman Melihat Data Koleksi Dokumen

84

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Ketika pengguna menekan link “Ringkasan Dokumen” maka akan terdapat halaman yang menampilkan ringkasan berdasarkan data koleksi dokumen tersebut. Seperti pada Gambar 4.5.

Gambar 4.5 Halaman Melihat Ringkasan Data Koleksi Dokumen

85

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.3.4 Halaman Peringkasan Teks Otomatis (Summarization) Pada halaman peringkasan otomatis (summarization) Pengguna dapat melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen berbahasa Jawa. Kemudian menekan tombol "OK" maka sistem akan memproses menjadi sebuah ringkasan. Seperti pada Gambar 4.6.

Gambar 4.6 Halaman Peringkasan Teks Otomatis (Summarization)

86

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

4.3.5 Halaman Melihat Hasil Ringkasan Setelah pengguna memasukkan data dokumen berbahasa Jawa, maka sistem akan memproses sehingga menghasilkan sebuah ringkasan. Seperti pada Gambar 4.7.

Gambar 4.7 Halaman Melihat Hasil Ringkasan

87

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

BAB V ANALISIS HASIL DAN PEMBAHASAN

5.1

Analisis Pengujian Sistem Pengujian sistem akan dilakukan dengan cara memasukkan data dokumen

berbahasa jawa. Dokumen yang dimasukkan berjumlah 50 yang bersumber dari Djakalodhang. Sedangkan pengujian secara manual akan dilakukan kepada 3 responden yang sudah memiliki pengetahuan atau mengerti tentang Bahasa Jawa. Responden menguji secara manual dengan cara membaca dokumen berbahasa Jawa dan membandingkan ringkasan yang dihasilkan sistem. Responden akan mengisikan kuesioner untuk menentukan apakah dokumen yang diuji secara manual menghasilkan ringkasan yang relevan atau tidak relevan. Tujuan dari pengujian ini adalah mencoba fungsi sistem, menghitung nilai rata-rata untuk mengetahui nilai akurasi yang dihasilkan sistem. Diharapkan hasil keluaran dari penelitian ini dapat membantu pengguna dalam memperoleh intisari dari dokumen berbahasa Jawa sehingga dapat membantu membuat keputusan melanjutkan membaca keseluruhan dokumen atau cukup dengan membaca ringkasan.

5.1.1

Pengujian Kepada Responden Berikut adalah hasil pengisian kuisoner yang dilakukan kepada responden

secara manual terdapat pada Tabel 5.1, berikut :

88

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

- Responden 1 Nama

: Viktor Bayu Wisnu Brata

Dokumen yang relevan

: 30

Dokumen yang tidak relevan

: 20

- Responden 2 Nama

: Hanang Candra

Dokumen yang relevan

: 34

Dokumen yang tidak relevan

: 16

- Responden 3 Nama

: Bimantara Putra

Dokumen yang relevan

: 32

Dokumen yang tidak relevan

: 18

Tabel 5.1 Hasil Pengujian Kepada Responden DOKUMEN

RESPONDEN 1

RESPONDEN 2

RESPONDEN 3

1

1

1

1

2

0

1

1

3

0

1

0

4

0

0

1

5

1

1

0

6

1

0

1

7

1

1

0

8

1

0

1

9

1

1

1

10

1

1

1

11

0

1

0

89

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

12

0

0

1

13

0

1

0

14

0

1

1

15

0

0

1

16

0

0

0

17

0

0

0

18

1

1

1

19

1

1

1

20

1

1

1

21

1

1

0

22

1

0

1

23

0

1

1

24

1

1

1

25

1

0

1

26

1

1

1

27

0

0

0

28

1

1

1

29

1

1

1

30

1

0

1

31

1

0

1

32

1

1

0

33

1

0

1

34

0

1

1

35

1

1

1

36

1

0

0

37

1

1

0

38

0

1

1

39

0

1

0

40

1

1

1

41

1

1

1

90

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

42

1

0

0

43

1

1

1

44

0

1

0

45

0

1

1

46

0

1

0

47

0

0

1

48

1

1

1

49

0

1

0

50

1

1

0

JUMLAH

30

34

32

5.1.2

Hasil Pengujian Sistem Berdasarkan hasil pengujian sistem secara manual kepada 3 responden

dengan dokumen berjumlah 50, maka akan terdapat hasil sebagai berikut : Responden 1

: 30 dokumen yang relevan

Responden 2

: 34 dokumen yang relevan

Responden 3

: 32 dokumen yang relevan

Kemudian akan dilakukan perhitungan nilai rata-rata untuk mendapatkan nilai akurasi yang dihasilkan oleh sistem. Berikut adalah hasil perhitungan nilai rata-rata, Gambar 5.1.

30 + 34 + 32 Rata-rata

=

x 100% 150

=

64%

Gambar 5.1 Hasil Perhitungan Rata-rata

91

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Dari pengujian sistem yang telah dilakukan kepada 3 responden secara manual dengan dokumen berjumlah 50. Maka terdapat nilai rata-rata yang dihasilkan oleh sistem sebesar 64%. Pada penelitian ini nilai perhitungan rata-rata tersebut akan menjadi acuan nilai akurasi yang dihasilkan sistem peringkasan teks otomatis pada dokumen berbahasa Jawa menggunakan metode TF-IDF.

5.2

Pembahasan Pengujian Sistem Berdasarkan pengujian sistem yang telah dilakukan kepada 3 responden

secara manual, terdapat beberapa penilaian dokumen yang berbeda. Berikut pembahasannya : DOKUMEN

RESPONDEN 1

RESPONDEN 2

RESPONDEN 3

1

1

1

1

2

0

1

1

3

0

1

0

Pada dokumen 1, ketiga responden menilai bahwa dokumen tersebut adalah relevan. Yang dimaksud relevan adalah ringkasan yang dihasilkan oleh sistem sudah sesuai dengan kebutuhan pengguna. Pada dokumen 2 dan dokumen 3, terdapat responden dengan penilaian berbeda. Yang dimaksud tidak relevan meliputi banyak hal bisa dokumennya yang tidak baik atau memang ringkasan yang dihasilkan sistem tidak sesuai dengan kebutuhan pengguna. Hal ini tidak dapat diteliti lebih lanjut dikarenakan tidak ada konsisten atau kesesuaian antar responden.

92

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

DOKUMEN

RESPONDEN 1

RESPONDEN 2

RESPONDEN 3

16

0

0

0

17

0

0

0

Pada dokumen 16 dan 17, ketiga responden menilai bahwa dokumen tersebut tidak relevan. Karena adanya kesamaan dalam penilaian tersebut maka ringkasan yang dihasilkan sistem tidak sesuai dengan kebutuhan pengguna. Berikut pembahasannya :

Dokumen 16 :



MODHEL SINAU MANDHIRI Bocah ora Bosen, Prestasine Bisa Luwih Apik

Modhel sinau Mandhiri wektu saiki lagi dadi trend ing laladan Kabupaten Banyumas. Modhel sinau Mandhiri nggugah semangate siswa SD supaya bisa nyecep ngelmu kanthi cara sing nyenengake, ora mboseni kaya modhel sinau cara lawas. Modhel sinau cara lawas guru ana kelas mulang nerangake bahan wulangan muride supaya nggatekake. Angger ana sing ribut bakal disentak. Guru terus ngethuprus kaya lagi pidhato. Bab iki njalari murid SD akeh sing bosen. Nalika guru mulang malah nggambar nyoreti buku paket utawa nulis sakarepe

93

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

dhewe supaya bisa mbuwang rasa sing mboseni. Cara mulang modhel lawas pancen wis ora trep menawa terus-terusan digunakake. Cara iki nyebabake murid aras-arasen sinau. Luwih-luwih angger gurune sering aweh tugas nulis terusterusan. Bocah-bocah tambah bosen nampa wulangan.

Menawa tes asile kurang apik, akeh guru malah mojokake muride. "Bocah saiki diwulangake wingi bae wis lali. Apamaneh wulangan sing wis lawas, pokoke wes.... ewes..... bablas ora ana sing nyanthel. Wis diprentah sinau padha kesed, dikon nyathet wegah, mbuh arep padha dadi apa muridku. Ana ngomah ndeleng TV bae, ora mikir sinaune," ngono grenenge Guru-guru saiki sing ndelok tes muride bijine elek.

Apa ya bener mangkono? Bisa uga bener. Sebab bocah kakehan nonton TV, sinaune arang aja digadhang-gadhang bijine bagus. Bisa bae marga cara mulange kleru. Bocah kurang diwenehi kalodhangan kanggo nyuntak kreasine. Bocah dianggep ora perlu takon, sing penting lungguh anteng, ngrungokake, wis bakal dadi cah pinter temenan. Iki sing dadi sebab akeh cah ngerti apalan nanging prakteke bingung. Upamane teori nyangkok wit buah-buahan, ora nate digambarake nganggo praktek nek dikon njelasake mesthi bingung. apamaneh supaya praktek tambah olehe bingung.

Kanthi modhel sinau mandhiri bocah bakal seneng nampa wulangan. Pengalamane Mohammad Durori (36) Guru SDN 2 Kecila Kec. Kemranjen Kab.

94

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Banyumas kena kanggo kaca benggala. Moh. Durori kasil mraktekake modhel belajar mandhiri. Modhel iki kasil menang nalika presentasi lomba keberhasilan Guru ing Jakarta taun 2001. Malah pihak Unicef (PBB) sing lagi mbantu ningkatake mutu pendhidhikan ing Jawa Tengah nambah dana bantuwan sing cukup kanggo ningkatake programe Moh. Durori. Mulane Moh. Durori tambah semangate. Menu pagi tansah disiyapake supaya bocah-bocah padha mangkat gasik. Nyatane tekan saiki bocah-bocah SDN 2 Kecila padha balapan mangkat gasik-gasikan perlune arep njupuk tiket (karcis) mlebu kelas. Bubar njupuk tiket nuli nggarap lembar kerja (menu pagi). Bocah sing mangkate dhisik dhewe bakal aweh pitakon marang kancane nomer loro sadurunge mlebu kelas. Angger bisa njaga ngganti nakoni nomer telu. Sing mangkat gasik nuli lungguh sebab diganteni tugase dening nomer loro. Nek nomer loro gagal, ora bisa njawab diprentah mundur mburine nomer sing keri. Mangkono sateruse saben esuk. Wayahe mulih sing mangkat gasik mulihe paling dhisik. Kapan, jam pira muride mangkat, guru kelase ngerti. Sebab saben bocah duwe jam pribadi sing dipajang ana kelas. Saben njupuk tiket bocah mau ngatur wektu sarana muter jam cocog karo wektu mlebu kelas. Akeh bocah sadurunge jam nem padha teka sekolahan saperlu njupuk tiket lan tugas paling dhisik.

Kelas modhel sinau mandhiri kena diarani ora temata. Karyane siswa wujud gambar, puisi, garapan, pating trempel ing ruwangan kelas. Olehe lungguh uga bisa pindhah-pindhah sasenenge bocah nalika dhiskusi utawa nggarap tugas. Tugas saka guru kelase modhele werna-werna. Ana gambar komik, ana TTS,

95

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Piramida, lan dolanan ular tangga. Khusus etungan matematika murid sing cerdas dadi dhokter. Pasiene cah sing ora mudheng nalika nampa wulangan. Kanthi dhokter matematika cah sing kethether bisa ngimbangi kapinterane kancakancane. Bukti wis dilakoni Moh. Durori. Sadurunge nemokake modhel iki nalika Ebtanas bocahe bijine ambruk. Sing bijine rata-rata nem ora ana 10 persene. Bareng nganggo modhel anyar bijine rata-rata apik tenan. 99 persen kasil ngranggeh biji rata-rata pitu ing Ebtanas. Mulane SDN 2 Kecila sing lokasine ing desa dadi kembang lambe. Prestasi mau lawase rong taun tetep ngetop. Mulane Moh. Durori dianggep kasil nemokake modhel sinau sing bisa nyenengake siswa SD. PBB sing duwe proyek MBS (Manajemen Berbasis Sekolah) mbantu dana kanggo ningkatake mutu pendhidhikan ing SDN 2 Kecila. "Angger guru kreatif, ora wedi kesel, senajan ibarate gaji ora cukup, babagan prestasi ora angel olehe ngranggeh," kandhane Moh. Durori. Ngendikane Moh. Durori, wis wektune guru-guru saiki padha nggolek rekadaya, nyipta modhel anyar piye bisane muride pinter, seneng ana sekolahan, lan tamatane mumpuni trep karo mutu lulusane. Ndelok kelas Moh. Durori pancen nyleneh. Ana pohon ilmu. Pohon ilmu gawe saka pang wit sing dicet nuli diwenehi canthelan. Gunane angger bocah sing garapane entuk biji paling dhuwur kertase dipasang ing pang pucuk. Sing bijine paling elek dicanthelake paling ngisor. Ana kothak ajaib. Isine cara mecahake soal, ana jawabane. Bocah sing ora bisa njawab soal supaya nggolek jawaban sing bener ing kothak ajaib sawise garapane dibiji. Bocah-bocah sing diwulang ing kelas jan semangat temenan. Nanging guru kudu tansah nyiapake menu garapan

96

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

sing bisa gawe swasana sinaune bocah tansah grengseng, ora mboseni. Modhel Sinau Mandhiri iki nyebabake Moh. Durori dihadhiyahi bebungah Rp 14 juta saka Dinas Pendhidhikan. Ditambah hadhiyah liyane saka Unicef. Guru-guru kang pengin mbuktekake bisa teka dhewe menyang SDN 2 Kecila Kec. Kemranjen, Banyuumas. Arahe saka Yogyakarta nuju Purwokerto, mudhun Kantor Dinas Pendhidhikan Kec. Kemranjen. Kabeh sopir bus umum wis apal. Sumangga.* (Siswandi Dh/DL)

Hasil ringkasan dari sistem :



MODHEL SINAU MANDHIRI Bocah ora Bosen, Prestasine Bisa Luwih Apik

- Modhel sinau Mandhiri nggugah semangate siswa SD supaya bisa nyecep ngelmu kanthi cara sing nyenengake, ora mboseni kaya modhel sinau cara lawas. - Modhel sinau cara lawas guru ana kelas mulang nerangake bahan wulangan muride supaya nggatekake. - Nalika guru mulang malah nggambar nyoreti buku paket utawa nulis sakarepe dhewe supaya bisa mbuwang rasa sing mboseni. - Luwih-luwih angger gurune sering aweh tugas nulis terus-terusan.

97

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

- Menawa tes asile kurang apik, akeh guru malah mojokake muride. - Wis diprentah sinau padha kesed, dikon nyathet wegah, mbuh arep padha dadi apa muridku. - Ana ngomah ndeleng TV bae, ora mikir sinaune," ngono grenenge Guru-guru saiki sing ndelok tes muride bijine elek. - Sebab bocah kakehan nonton TV, sinaune arang aja digadhang-gadhang bijine bagus. - Bocah dianggep ora perlu takon, sing penting lungguh anteng, ngrungokake, wis bakal dadi cah pinter temenan. - Upamane teori nyangkok wit buah-buahan, ora nate digambarake nganggo praktek nek dikon njelasake mesthi bingung. - Pengalamane Mohammad Durori (36) Guru SDN 2 Kecila Kec. - Modhel iki kasil menang nalika presentasi lomba keberhasilan Guru ing Jakarta taun 2001. - Malah pihak Unicef (PBB) sing lagi mbantu ningkatake mutu pendhidhikan ing Jawa Tengah nambah dana bantuwan sing cukup kanggo ningkatake programe Moh. - Nyatane tekan saiki bocah-bocah SDN 2 Kecila padha balapan mangkat gasikgasikan perlune arep njupuk tiket (karcis) mlebu kelas. - Bubar njupuk tiket nuli nggarap lembar kerja (menu pagi). - Bocah sing mangkate dhisik dhewe bakal aweh pitakon marang kancane nomer loro sadurunge mlebu kelas. - Angger bisa njaga ngganti nakoni nomer telu.

98

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

- Sing mangkat gasik nuli lungguh sebab diganteni tugase dening nomer loro. - Nek nomer loro gagal, ora bisa njawab diprentah mundur mburine nomer sing keri. - Kapan, jam pira muride mangkat, guru kelase ngerti. - Saben njupuk tiket bocah mau ngatur wektu sarana muter jam cocog karo wektu mlebu kelas. - Akeh bocah sadurunge jam nem padha teka sekolahan saperlu njupuk tiket lan tugas paling dhisik. - Kelas modhel sinau mandhiri kena diarani ora temata. - Karyane siswa wujud gambar, puisi, garapan, pating trempel ing ruwangan kelas. - Olehe lungguh uga bisa pindhah-pindhah sasenenge bocah nalika dhiskusi utawa nggarap tugas. - Ana gambar komik, ana TTS, Piramida, lan dolanan ular tangga. - Kanthi dhokter matematika cah sing kethether bisa ngimbangi kapinterane kanca-kancane. - Bareng nganggo modhel anyar bijine rata-rata apik tenan. - 99 persen kasil ngranggeh biji rata-rata pitu ing Ebtanas. - Mulane SDN 2 Kecila sing lokasine ing desa dadi kembang lambe. - Durori dianggep kasil nemokake modhel sinau sing bisa nyenengake siswa SD. - PBB sing duwe proyek MBS (Manajemen Berbasis Sekolah) mbantu dana kanggo ningkatake mutu pendhidhikan ing SDN 2 Kecila.

99

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

- "Angger guru kreatif, ora wedi kesel, senajan ibarate gaji ora cukup, babagan prestasi ora angel olehe ngranggeh," kandhane Moh. - Durori, wis wektune guru-guru saiki padha nggolek rekadaya, nyipta modhel anyar piye bisane muride pinter, seneng ana sekolahan, lan tamatane mumpuni trep karo mutu lulusane. - Pohon ilmu gawe saka pang wit sing dicet nuli diwenehi canthelan. - Gunane angger bocah sing garapane entuk biji paling dhuwur kertase dipasang ing pang pucuk. - Bocah sing ora bisa njawab soal supaya nggolek jawaban sing bener ing kothak ajaib sawise garapane dibiji. - Nanging guru kudu tansah nyiapake menu garapan sing bisa gawe swasana sinaune bocah tansah grengseng, ora mboseni. - Durori dihadhiyahi bebungah Rp 14 juta saka Dinas Pendhidhikan. - Arahe saka Yogyakarta nuju Purwokerto, mudhun Kantor Dinas Pendhidhikan Kec.

100

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Berdasarkan ringkasan yang dihasilkan sistem, ada beberapa kalimat yang tidak sesuai dengan isi dokumen. Misalnya dalam kalimat pertama sedang membahas 1 topik kemudian pada kalimat kedua membahas topik lain, jadi kalimat-kalimat tersebut tidak ada kesesuaian. Kemudian untuk ringkasan yang bercetak tebal, ada beberapa kata yang berisi singkatan. Misalnya kata “Kecamatan” disingkat “Kec” dan kata “Mohamad” disingkat “Moh”. Karena perhitungan bobot kalimat dalam penelitian ini menggunakan karakter titik “.” untuk

memisah

antar

kalimat.

Singkatan-singkatan

menyebabkan ringkasan menjadi tidak relevan.

101

kata

tersebut

juga

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

BAB VI KESIMPULAN DAN SARAN

6.1

Kesimpulan Berdasarkan penelitian yang telah dilakukan dapat disimpulkan bahwa : 1. Penerapan metode TF-IDF pada peringkasan teks otomatis dengan dokumen berbahasa Jawa terdapat nilai rata-rata akurasi yang dihasilkan oleh sistem sebesar 64%. 2. Karena perhitungan bobot kalimat dalam penelitian ini menggunakan karakter titik “.” untuk memisah antar kalimat. Maka penulisan kata dalam dokumen yang berisi singkatan-singkatan, seperti alamat dan nama gelar sebaiknya dituliskan lengkap. Hal ini menjadi penting karena penulisan kata yang baik akan mempengaruhi relevan atau tidaknya ringkasan yang dihasilkan oleh sistem.

6.2

Saran Berdasarkan hasil pengujian yang sudah dilakukan dapat dilihat bahwa

sistem masih belum sempurna. Saran dari penulis untuk penelitian selanjutnya : 1. Sistem perlu penambahan daftar kata umum (stopword) berbahasa Jawa yang lengkap. 2. Sistem mampu menangani dokumen yang berisi singkatan-singkatan alamat dan nama gelar.

102

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

DAFTAR PUSTAKA

Grossman D, Ophir F. Information Retrieval : Algorithm and Heuristics. Kuwer Academic Publisher. (1998). Hovy, E. H. 2005. Automated Text Summarization. In.R. Mitkov (ed), The Oxford Handbook of Computational Linguistics, chapter 32, page 583-598. Oxford University Press. Jazek K, Steinberger J. 2008. Automatic text summarization (The state of the art 2007 and new challenges). Znalosti 2008, page 1-12. Kruse, Robert L, Data Stucture and Program Design Third Edition. Prentice Hall International, Inc, London (1994). Mani, I., House, D., Klein, G., et al. 1999.

The TIPSTER SUMMAC Text

Summarization Evaluation. Proceedings of EACL. Manning, Christopher D., Hinrich Schutze, 1999. Foundations of statistical natural language processing. The MIT Press. Manning, Christopher, D., Raghavan, Prabhakar., Schutze, Hinrich. (2009). An Introduction to Information Retrieval. England : Cambridge University Press. Mulyana I, Ramadona S, Herfina. 2012. Penerapan Terms Frequency-Inverse Document Frequency Pada Sistem Peringkasan Teks Otomatis Dokumen Tunggal Berbahasa Indonesia. Jurnal.

103

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

Mustaqhfitri M, Abidin Z, Kusumawati R. 2009. Peringkasan Teks Otomatis Berita Berbahasa Indonesia Menggunakan Metode Maximum Marginal Relevance. Jurnal MATICS (Vol. 4 No. 4; 09-2011) Orasan, C., Pekar, V. and Hasler, L. 2004. A comparison of summarisation methods

based

on

term

specificity

estimation.

University

of

WolverHampton. Rose, T. G., M. Stevenson, and M. Whitehead. 2002. The Reuters corpus volume 1 – from yesterday’s news to tommorow’s language resources. In Proceedings of LREC2004. Las Palmas de Gran Canaria, Spain. Savoy J. “A Learning Scheme for Information Retrieval in Hypertext”. Information Processing & Management. (1993) Sommerville, Ian. Software Engineering, 9th Edition. Pearson Education. United States of America. (2011). Wijono, Sri Hartati, et al. 2011. Studi Pengaruh Stemming untuk Pemerolehan Informasi dalam Bahasa Jawa. Laporan Penelitian. Hibah Pekerti DIKTI.

104

PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI

LAMPIRAN

KUESIONER

105

Life Enjoy

" Life is a reality to be experienced! "

Get in touch

Social

© Copyright 2016 - 2018 FEXDOC.COM - All rights reserved.