Ads block

Banner 728x90px

Aproksimasi Monte Carlo


Aproksimasi Monte Carlo
Apakah metode Monte Carlo itu? Bagaimana cara kerjanya? Pada situasi seperti apa saya memerlukan metode Monte Carlo? Untuk menjawab pertanyaan - pertanyaan te…
Baca selengkapnya »

Asumsi Statistik: Antara Benci & Butuh (Studi Kasus Regresi)


Asumsi Statistik: Antara Benci & Butuh (Studi Kasus Regresi)
Ketika kita membaca teorema Pytagoras: " Jika diberikan segitiga siku-siku maka kuadrat panjang sisi miringnya adalah penjumlahan kuadrat dua sisi lainny…
Baca selengkapnya »

Fast Cosine Dissimilarity for Sparse (CSR) Vectors in High-Dimensional Data


Fast Cosine Dissimilarity for Sparse (CSR) Vectors in High-Dimensional Data
Big-Data Scientist  bukanlah seorang programmer, ia mungkin tidak memiliki kemampuan untuk membuat software sehandal para programer sejati. Namun tuntutan pr…
Baca selengkapnya »

SMA on Instagram: Image Hashing - Mendeteksi Gambar Serupa


SMA on Instagram: Image Hashing - Mendeteksi Gambar Serupa
Social Media Analytics tidak selalu terkait data dalam bentuk teks. Idealnya teks dan gambar (bahkan video) secara simultan/bersamaan di olah untuk mendapatkan…
Baca selengkapnya »

Loci VS Centroid/Hubs: Pendekatan Baru dalam Menganalisa Data yang Besar (Big Data)


Loci VS Centroid/Hubs: Pendekatan Baru dalam Menganalisa Data yang Besar (Big Data)
Artikel ini adalah pembahasan non-teknis dan penjelasan lebih lanjut dari artikel saya di  Springer Lecture Notes in Computer Science Series tentang Clusters’ …
Baca selengkapnya »

Evaluasi Eksternal Clustering “Pairwise” F-ß-Score & NMI: Teori & Aplikasi


Evaluasi Eksternal Clustering “Pairwise” F-ß-Score & NMI: Teori & Aplikasi
Tidak seperti model klasifikasi ( supervised learning ), evaluasi pada model clustering ( unsupervised learning ) jauh lebih menantang. Mengapa? Hal ini berawa…
Baca selengkapnya »

Teori Graph di Python lewat NetworkX: Studi Kasus Greedy Algorithm


Teori Graph di Python lewat NetworkX: Studi Kasus Greedy Algorithm
Di post sebelumnya kita sudah mengaplikasikan Teori Graph di data media sosial. Post ini justru mundur ke belakang dan fokus ke memperkenalkan NetworkX untuk …
Baca selengkapnya »

Text PreProcessing & Terms Distribution


Artikel ini merupakan lanjutan dari artikel sebelumnya tentang  Crawling Data Twitter dengan Python . Akan tetapi apa yang dijelaskan di artikel ini dapat dite…
Baca selengkapnya »

Cython: semudah Python & secepat Java, bahkan lebih


Cython: semudah Python & secepat Java, bahkan lebih
Beberapa waktu yang lalu saya menulis sebuah  artikel   yang membandingkan performa 7 bahasa pemrograman ketika memproses 3 operasi dasar: “if”,”for”, & “w…
Baca selengkapnya »

Pereda Sakit Kepala: Urgensi Memahami String (di Python)


Pereda Sakit Kepala: Urgensi Memahami String (di Python)
Tipe variabel string gampang² susah untuk dipahami, sebenarnya tidak hanya di Python, tapi juga di hampir semua bahasa pemrograman. Kadang ia baik, kadang pema…
Baca selengkapnya »

Menyiapkan Modul Python untuk Suatu Pelatihan?


Menyiapkan Modul Python untuk Suatu Pelatihan?
Semenjak Data Science  (DS) &  Big Data (BD) ngetrend di dunia akademis & jagad digital ( kalau disebut "dunia Maya" takutnya ada yang kesele…
Baca selengkapnya »

Sphinx Search Engine in PyThon, PHP, and Matlab


Sphinx Search Engine in PyThon, PHP, and Matlab
Saat data besar, database relasional saja tidak cukup untuk memenuhi kebutuhan informasi (storage, retrieval dan-atau analitik). Setidaknya untuk kebutuhan pen…
Baca selengkapnya »

Pendahuluan MongoDB – The NoSQL Document Database


Pendahuluan MongoDB – The NoSQL Document Database
Baca selengkapnya »

NoSQL VS Relational (SQL) database … ??? …


NoSQL VS Relational (SQL) database … ??? …
Akhir-akhir ini istilah NoSQL (e.g. MongoDB) semakin jamak ditelinga, terutama pada pembahasan mengenai data yang besar (Big Data). Pertanyaan/diskusi yang pal…
Baca selengkapnya »

Matlab – MySQL


Matlab – MySQL
Saat mengolah data yang besar (e.g. Big Data) meletakkan seluruh data di memory menjadi tidak praktis atau bahkan tidak memungkinkan. Ada kalanya koneksi ant…
Baca selengkapnya »

Community Detection & Centrality: Teori & Aplikasi


Community Detection & Centrality: Teori & Aplikasi
Pada sebuah data graph (network) seperti data dari media sosial bagaimana kita mengetahui user yang paling berpengaruh? Jika diterapkan pada riset pemasaran at…
Baca selengkapnya »

Twitter Crawl: Scrapping


Twitter Crawl: Scrapping
Peraturan terbaru Twitter API membatasi pengambilan data Tweet hanya satu minggu (7 hari) kebelakang. Jika seseorang ingin meneliti atau menganalisa topik tert…
Baca selengkapnya »

Analisis Twitter: Crawling (searching)


Analisis Twitter: Crawling (searching)
Artikel ini membahas cara crawl (mengumpulkan) data dari media sosial twitter . Crawling data bisa dilakukan dengan setidaknya dua cara: search dan realtime …
Baca selengkapnya »

Apakah PyThon Lambat ? : Showdown 7 Bahasa Pemrograman


Apakah PyThon Lambat ? : Showdown 7 Bahasa Pemrograman
Semenjak SMU, saya pernah menggunakan/mempelajari beberapa bahasa pemrograman:  Basic, Pascal, Visual Basic, C++, Fortran, ActionScript, Java, R, Matlab, PHP ,…
Baca selengkapnya »

Salah Paham Industri 4.0 dan Pendidikan 4.0


Salah Paham Industri 4.0 dan Pendidikan 4.0
" Industri 4.0 tidak mensyaratkan Pendidikan 4.0 " Karena sudah terlalu sering saya menemukan kesalahan ini di berbagai forum/media, maka saya m…
Baca selengkapnya »

High Performance Computing (HPC) for Big Data – Bagian 1: Teori/Konsep


High Performance Computing (HPC) for Big Data – Bagian 1: Teori/Konsep
Komputasi dengan performa tinggi ( High Performance Computing -HPC) biasa dilakukan ketika permasalahan (model) yang dihadapi kompleks atau ketika data (domain…
Baca selengkapnya »

Budaya Digital Indonesia: Peluang, Tantangan, dan Trend Masa Depan


Budaya Digital Indonesia: Peluang, Tantangan, dan Trend Masa Depan
Belum lama ini, kita dikejutkan sebuah berita tentang seorang siswi sekolah yang mengaku sebagai anak pejabat saat diberhentikan oleh seorang polisi lalu lint…
Baca selengkapnya »

Big Data, Privasi, dan Terorisme


Big Data, Privasi, dan Terorisme
Belum lama ini isu tentang adanya sistem  Big Data Cyber Security  (polisi internet) sempat menyebar dengan cepat melalui media sosial dan menghebohkan masyara…
Baca selengkapnya »

Sentiment in Ranking Functions


Hampir tak bisa dipungkiri konflik yang semakin memanas di tengah masyarakat akhir-akhir ini turut dipengaruhi oleh penggunaan teknologi internet. Debat kusir…
Baca selengkapnya »

Tokenization dalam Bahasa Inggris, Indonesia, & Alay


Tokenization dalam Bahasa Inggris, Indonesia, & Alay
Kali ini kita akan membahas salah satu bagian penting dari Text Mining/Natural Language Processing:  Tokenization . Tokenization adalah salah satu bagian penti…
Baca selengkapnya »

Simulasi Dalil Limit Pusat dengan R


Simulasi Dalil Limit Pusat dengan R
Dalil limit pusat menyatakan: Misalkan  X 1 , X 2 , . . .  adalah barisan variabel random yang iid, masing - masing dengan mean  µ  dan variansi  s 2 . Maka …
Baca selengkapnya »

Simulasi Strong Law of Large Numbers dengan RSimulasi Strong Law of Large Numbers dengan R


Simulasi Strong Law of Large Numbers dengan RSimulasi Strong Law of Large Numbers dengan R
Teorema Strong Law of Large Numbers menyatakan Misalkan X 1 , X 2 , . . .  menyatakan sampel acak, dan misalkan  E ( X i ) = µ Maka, dengan probability 1,  …
Baca selengkapnya »

Pendahuluan Analisis Regresi


Pendahuluan Analisis Regresi
Beberapa hal yang akan dibahas: Apakah model regresi linier itu? Data seperti apa yang dapat digunakan pada regresi linier? Contoh-contoh regresi …
Baca selengkapnya »

Model linier dan NON-linier


Model linier dan NON-linier
Sebelumnya telah dibahas bentuk umum dari model regresi linier adalah sebagai berikut: Y = ß 0 + ß 1 X 1 + . . . + ß p X p + ? Atau, y i = ß 0 + ß 1 x 1 i +…
Baca selengkapnya »