Pengembangan aplikasi pengelompokan dokumen berbahasa Indonesia
D Dalam berjalannya waktu, pengolahan data memainkan peran paling penting dalam sudut pandang seseorang. Sulitnya mencari data yang dapat menambah informasi yang berharga merupakan salah satu masalah dalam pengolahan data. Penggelompokan data merupakan salah satu solusi untuk memisahkan bagian data tertentu. Pengelompokan data adalah pembagian data menjadi beberapa beberapa kelompok berdasarkan kedekatan yang ada dari data lain yang dapat dijadikan pembeda.Tugas akhir ini mengangkat bahwa dengan banyaknya dokumen yang ada, kemungkinan adanya kesamaan isi semakin besar, sehingga perlu adanya aplikasi yang dapat memperlihatkan pengelompokan dokumen text berdasarkan kedekatan isi dari dokumen tersebut. Untuk mendapatkan pengelompokan dokumen seperti yang diharapkan, dibutuhkan suatu metode yang membantu proses pengelompokan dokumen-dokumen, metode yang digunakan dalam tugas akhir ini adalah k-means. Dengan kedekatan yang ada antara dokumen satu dengan dokumen yang lain, langkah-langkah yang terjadi dalam pengelompokan ini adalah dengan menentukan jumlah pengelompokan yang akan dibentuk, serta menghilangkan delimiter (tanda baca) sehingga menghasilkan dokumen yang berisi kata-kata yang dapat diproses dengan metode k-means.Dari hasil uji coba implementasi ini, metode pengelompokan dengan k-means dapat menunjukan dokumen-dokumen yang memiliki kesamaan dijadikan satu kelompok yang sama, dan dokumen-dokumen yang memiliki kesamaan lain berada dikelompok yang lain.
I In the passage of time, most data processing plays an important role in one's viewpoint. Difficulty of finding data that can add valuable information is one of the problems in data processing. Grouping of data is one solution to separate the specific data. Grouping the data is the data division into several groups, based on existing proximity of other data that can be used as a differentiator.This final project raised that with the number of documents, the possibility of a greater common content, so the need for applications that can display text documents based on proximity grouping the contents of the document. To obtain the document grouping as expected, needed a method that helps the process of grouping the documents, the method used in this thesis is the k - means clustering. With the closeness that exists between one document with another document, the steps that occur in this grouping is to determine the number of groupings to be formed, as well as eliminating the delimiter ( punctuation ) to produce a document containing words that can be processed by the method of k—means.From the test results of this implementation, the method with k-means clustering can show the documents which have in common the same into one group, and the documents that have other similarities to be on the other.