Skip to content

Latest commit

 

History

History
16 lines (11 loc) · 770 Bytes

ReadMe.md

File metadata and controls

16 lines (11 loc) · 770 Bytes

Text Preprocessing with Python

Dengan beberapa fitur didalamnya seperti tokenizing, stop word, dan stemming. Dalam project ini menggunakan library dari 'nltk', 'Sastrawi', dan 'xlsxwriter'

NLTK

Natural Language Toolkit, atau lebih umum NLTK, adalah serangkaian perpustakaan dan program untuk pemrosesan bahasa alami simbolik dan statistik untuk bahasa Inggris yang ditulis dalam bahasa pemrograman Python.

SASTRAWI

Sastrawi Python adalah library python sederhana yang memungkinkan Anda untuk mengurangi kata-kata infleksi dalam Bahasa Indonesia (Bahasa Indonesia) menjadi bentuk dasarnya (batang)

Tambahan: https://arraythis.com/

image