minggu 2

Latar belakang pemrosesan teks:
– Teks tidak hanya sekumpulan kata
– Analisa data dan pengetesan hipotesa
a. teks adalah ungkapan bahasa yang menurut isi, sintaksis dan pragmantis merupakan satu kesatuan.
b. korpus (dokumen) adalah kumpulan dari beberapa teks sebagai sumber penelitian bahasa dan sastra.
c. Pemrosesan teks banyak dilakukan dalam perangkat lunak pengolahan kata (word processor). contoh: Ms. Word dan Word perfect.
d. Tokenisasi adalah proses pemotongan kumpulan karakter menjadi sebuah kata tungga.

Pengolahan Teks mencakup :
– Information extractation : suatu dokumen teks yang di ekstrak
– Teks sumarization : meringkas teks pada dokumen komputer
– Data Mining : proses menggali nilai tambah dari suatu kumpulan data yang tidak diketahui secara manual
– Text mining : menambang data yang berupa teks dimana sumber data dan mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antardokumen.
– Information retrieval : sistem indeks, pencarian & mengingat khususnya pada teks
– Document Clustering : pengelompokan dokumen.

Contoh dokumen teks:
Teks dimedia sosial, teks dihalaman web, status pada sosial media, teks pada jurnal.
Karakteristik dokumen:
– Fisik : mencangkup tinggi, berat, tata letak proses pembuatan frek waktu, segi bentuk tekstual dan non-tekstual.
– Intelektual : tujuan dokumen, isi, subyek, jenis kepengarangan sumber metode penyebaran dan keaslian karya.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s