Skip to main content

Posts

Showing posts from 2016

Installing MALLET on Windows

MALLET  (Machine Learning Language Toolkit) is a useful Java-based tool for natural language processing developed by the University of Massachusetts, Amherst. By using MALLET, we can do document classification, sequence tagging, or topic modeling. This tutorial shows how to install MALLET on Windows. 1. Download zip file of Mallet from  http://mallet.cs.umass.edu/download.php . In this tutorial, I download  mallet-2.0.8RC3.zip  version.  2. Extract files to any directory as you wish. This time, I extract files to drive E:\ and rename the directory as "mallet". 3. Open Control Panel. Edit system environment variables. 4. Click "Environment Variables". 5. Create new user variable "MALLET_HOME" and set path to mallet directory. 6. Test whether MALLET is working by opening Command Prompt. Go to path where you have put MALLET files. In this example, it is"E:\mallet\". Type bin\mallet on command prompt. If you see the ...

How to Use Stanford POS Tagger in Python

NLTK is a platform for programming in Python to process natural language. NLTK provides a lot of text processing libraries, mostly for English. Formerly, I have built a model of Indonesian tagger using Stanford POS Tagger. That Indonesian model is used for this tutorial. To install NLTK, you can run the following command in your command line. I assume that you are using Windows and you have read and followed my first tutorial  (in Indonesian) of having two versions of Python in your laptop :   python3 -m pip install -U nltk  In this example, I use a previously trained tagger which I name myTagger.model . It is a model customized for Indonesian. Place the model under the nltk folder so that it will be nltk\myTagger.model . Download the stanford-postagger.jar from  http://nlp.stanford.edu/software/tagger.shtml . To run this tagger, write the following codes in command prompt: import nltk from nltk import * myTagger = StanfordPOSTagger(myTagger.model...

Java: Membuat Jar yang Memuat External Jar Lainnya Menggunakan Netbeans

Bagaimana jika suatu saat kita ingin membuat sebuah file jar dari program Java yang memanfaatkan (bergantung) dari external jar (biasanya di folder dist\lib)? Berikut adalah langkah-langkah untuk membuat file jar tersebut dengan Netbeans.  Pertama-tama lakukan clean and build pada program yang ingin dibuat file jar-nya.  Pada contoh ini, program SentenceSegmentation ingin dibuat file jar. Selanjutnya buka build.xml pada folder SentenceSegmentation .  Hapus isi build.xml dan masukkan kode berikut pada build.xml . SentSeg.jar adalah file jar hasilnya.     <?xml version="1.0" encoding="UTF-8"?>     <project name = "SentenceSegmentation" default = "default" basedir = "." >         <description> Builds, tests, and runs the project SentenceSegmentation. </description>         <import file = "nbproject/build-impl.xml" />             ...

Membuka File Zip Menggunakan Python (Windows 8)

Current working directory:  E:\python scripts Pada folder tersebut, terdapat sebuah file zip Random.zip  berisi sejumlah file .txt. Program untuk unzip file tersebut adalah unzip.py : import zipfile, os print(os.path.dirname(os.path.abspath(__file__))) #tempatnya unzip.py dir = os.path.dirname(os.path.abspath(__file__)) myfile = 'Random' with zipfile.ZipFile(myfile+'.zip', 'r') as z: print(dir+ '\\' +myfile) z.extractall(dir+ '\\' +myfile) Maka isi file pada Random.zip sekarang sudah ada di E:\python scripts\Random

Tutorial Django 1: Cara Instalasi Django pada Windows 8

Django adalah framework website berbasis bahasa pemrograman Python. Versi Python: 3.5 Versi Django 1.9.3 Download Python versi 3.x melalui link    https://python.org/download/  dan lakukan sesuai petunjuk instalasi pada situs tersebut. Pada contoh ini, Python 3.5 terdapat di folder E:\python35 Untuk memeriksa versi Python pada komputer, ketik python --version pada command prompt Jika terdapat lebih dari 2 versi Python (misalkan Python 2.x dan Python 3.x), ubah file python.exe pada masing-masing direktori yang memuat versi python tersebut menjadi python2.exe dan python3.exe. Untuk menjalankan program Python pada command prompt sesuai versi Python yang diinginkan - misal Python 3.x, cukup ketik python3 [file yang ingin dijalankan] . PIP adalah package manager untuk menginstal package-package Python. Jika versi Python yang digunakan adalah Python 3.5, pip sudah otomatis terinstal. Untuk download Django, ketik perintah python3 -m pip install django pada dire...