Langsung ke konten utama

Instalasi Dataiku DSS (Data Science Studio) Di CENTOS 6.6

Dataiku DSS (Data Science Studio) adalah software untuk mengolah dan menggabungkan Big Data dari data mentah (raw) menjadi data yang bisa digunakan. Aplikasi hanya dapat berjalan di server sebagai berikut:

  • Server dengan tipe 64 bit (x86-64)
  • Ubuntu Server, versions 12.04 LTS and 14.04 LTS
  • Debian, version 7
  • CentOS versions 6.4 and later (tested up to version 7.0)
  • Red Hat Entreprise Linux Server, versions 6.4 and later (tested up to version 7.0)
  • Amazon Linux, version 2013.09 and later (tested up to version 2014.09


  • Saya menggunakan VMware untuk mencoba aplikasi DSS dengan sistem operasi Centos 6.6 x86-64. Langkah-langkah-nya adalah sebagai berikut:

    1. Download aplikasi-nya disini, untuk Centos download disini. Pilih Centos yang versi minimal saja.
    2. Copy file compress DSS ke server Centos yang sudah di-install dan extract. Command-nya sebagai berikut:
    tar xzf dataiku-dss-VERSION.tar.gz
    cd dataiku-dss-VERSION
    3. Install JRE 7 atau 8, serta definisikan Variabel JAVA_HOME di user
    rpm -ivh jre7.x.x.rpm
    export JAVA_HOME=/usr/java/jre7.x.x
    4. DSS hanya dapat berjalan di user selain root. Jadi buat user lain, kemudian folder DSS yang sudah diekstrak diubah owner-nya. Contoh membuat user baru dan ubah owner folder ekstrakan-nya:
    useradd dataiku -g root
    passwd dataiku
    chown -R dataiku /opt/dataiku
    5. Instalasi library yang dibutuhkan :
    sudo -i "/opt/dataiku/dataiku-dss-VERSION/scripts/install/install-deps.sh"
    6. Eksekusi installer.sh di folder hasil extract-nya. Dan arahkan parameter '-d' ke folder yang kosong. Contoh command-nya
    ./installer.sh -d /opt/dataiku/dss -p 10000
    7. Matikan firewall di server tersebut agar web bisa diakses dari luar. Eksekusi command-command di bawah ini:
    service iptables save
    service iptables stop
    chkconfig iptables off
    8. Jalankan aplikasi DSS. Contoh command-nya
    /opt/dataiku/dss/bin/dss start

    Referensi:
    http://doc.dataiku.com/dss/latest/installation/new_instance.html






    Komentar

    1. permisi pak, saya baru saja menulis tentang fungsi autocorrelation untuk penentuan pola data time series apakah musiman, tren, atau stationer, di artikel berikut: http://datacomlink.blogspot.com/2015/12/data-mining-identifikasi-pola-data-time.html yang ingin saya tanyakan, apakah ada teknik lain untuk mencari pola data time series selain fungsi autocorrelation ya pak? terima kasih

      BalasHapus

    Posting Komentar

    Postingan populer dari blog ini

    Pengenalan Design Pattern di Java

    Java merupakan pemrograman yang berorientasi objek dengan interface, abstract, dan class sebagai bentuk dasar dari kode. Seorang programmer java yang ingin mencapai level expert apakah cukup dengan mengetahui prinsip OOP ( Object Oriented Programming ) ? Jawabannya tidak. Karena ilmu yang harus dipahami selanjutnya adalah Design Pattern dalam membuat kode Java. Design Pattern adalah solusi umum (konteks) terhadap masalah yang sering muncul dalam aplikasi software . Berdasarkan pengertian tersebut, design pattern terdiri dari tiga elemen dasar, yaitu: Konteks : situasi dimana pattern diterapkan (dan biasanya hal ini berulang) Masalah : tujuan atau batasan yang akan dicapai oleh konteks Solusi : desain umum dari masalah yang akan diselesaikan dan ditentukan batasannya

    Import File CSV to PostgreSQL

    Database postgresql adalah software database yang open source (gratis), sehingga pencinta database tidak memerlukan uang untuk membayar lisensi (seperti oracle dll.), kecuali uang ke warnet buat download softwarenya ( klik disini ). Postgresql memang mirip dengan database yang lain seperti mysql, oracle, h2, myDB, dan lain-lain. Sehingga user tidak perlu repot untuk menghafalkan banyak query (perintah pemograman dalam database). Pada artikel ini penulis akan menyajikan salah satu fitur dalam database untuk meng- import isi file CSV ke database. File CSV merupakan kumpulan data dalam tabel (excel dll) dengan delimiter (pembatas) berupa karakter. Contoh : Halaman;kebun;kita;bagus;sekali Pada contoh di atas, data csv dibatasi oleh karakter semicolon (;). Sehingga dalam tabel di excel, tiap kolom tabel akan dibatasi oleh delimiter yang kita inginkan. Sekarang kita masuk ke bagian query dalam postgresql. Dalam meng- import isi file CSV ke database di postgresql, hal yang haru