Ads block

Banner 728x90px

Aproksimasi Monte Carlo


Aproksimasi Monte Carlo
Apakah metode Monte Carlo itu? Bagaimana cara kerjanya? Pada situasi seperti apa saya memerlukan metode Monte Carlo? Untuk menjawab pertanyaan - pertanyaan te…
Read more »

Asumsi Statistik: Antara Benci & Butuh (Studi Kasus Regresi)


Asumsi Statistik: Antara Benci & Butuh (Studi Kasus Regresi)
Ketika kita membaca teorema Pytagoras: " Jika diberikan segitiga siku-siku maka kuadrat panjang sisi miringnya adalah penjumlahan kuadrat dua sisi lainny…
Read more »

Fast Cosine Dissimilarity for Sparse (CSR) Vectors in High-Dimensional Data


Fast Cosine Dissimilarity for Sparse (CSR) Vectors in High-Dimensional Data
Big-Data Scientist  bukanlah seorang programmer, ia mungkin tidak memiliki kemampuan untuk membuat software sehandal para programer sejati. Namun tuntutan pr…
Read more »

SMA on Instagram: Image Hashing - Mendeteksi Gambar Serupa


SMA on Instagram: Image Hashing - Mendeteksi Gambar Serupa
Social Media Analytics tidak selalu terkait data dalam bentuk teks. Idealnya teks dan gambar (bahkan video) secara simultan/bersamaan di olah untuk mendapatkan…
Read more »

Loci VS Centroid/Hubs: Pendekatan Baru dalam Menganalisa Data yang Besar (Big Data)


Loci VS Centroid/Hubs: Pendekatan Baru dalam Menganalisa Data yang Besar (Big Data)
Artikel ini adalah pembahasan non-teknis dan penjelasan lebih lanjut dari artikel saya di  Springer Lecture Notes in Computer Science Series tentang Clusters’ …
Read more »

Evaluasi Eksternal Clustering “Pairwise” F-ß-Score & NMI: Teori & Aplikasi


Evaluasi Eksternal Clustering “Pairwise” F-ß-Score & NMI: Teori & Aplikasi
Tidak seperti model klasifikasi ( supervised learning ), evaluasi pada model clustering ( unsupervised learning ) jauh lebih menantang. Mengapa? Hal ini berawa…
Read more »

Teori Graph di Python lewat NetworkX: Studi Kasus Greedy Algorithm


Teori Graph di Python lewat NetworkX: Studi Kasus Greedy Algorithm
Di post sebelumnya kita sudah mengaplikasikan Teori Graph di data media sosial. Post ini justru mundur ke belakang dan fokus ke memperkenalkan NetworkX untuk …
Read more »

Text PreProcessing & Terms Distribution


Artikel ini merupakan lanjutan dari artikel sebelumnya tentang  Crawling Data Twitter dengan Python . Akan tetapi apa yang dijelaskan di artikel ini dapat dite…
Read more »

Cython: semudah Python & secepat Java, bahkan lebih


Cython: semudah Python & secepat Java, bahkan lebih
Beberapa waktu yang lalu saya menulis sebuah  artikel   yang membandingkan performa 7 bahasa pemrograman ketika memproses 3 operasi dasar: “if”,”for”, & “w…
Read more »

Pereda Sakit Kepala: Urgensi Memahami String (di Python)


Pereda Sakit Kepala: Urgensi Memahami String (di Python)
Tipe variabel string gampang² susah untuk dipahami, sebenarnya tidak hanya di Python, tapi juga di hampir semua bahasa pemrograman. Kadang ia baik, kadang pema…
Read more »

Menyiapkan Modul Python untuk Suatu Pelatihan?


Menyiapkan Modul Python untuk Suatu Pelatihan?
Semenjak Data Science  (DS) &  Big Data (BD) ngetrend di dunia akademis & jagad digital ( kalau disebut "dunia Maya" takutnya ada yang kesele…
Read more »

Sphinx Search Engine in PyThon, PHP, and Matlab


Sphinx Search Engine in PyThon, PHP, and Matlab
Saat data besar, database relasional saja tidak cukup untuk memenuhi kebutuhan informasi (storage, retrieval dan-atau analitik). Setidaknya untuk kebutuhan pen…
Read more »

Pendahuluan MongoDB – The NoSQL Document Database


Pendahuluan MongoDB – The NoSQL Document Database
Read more »

NoSQL VS Relational (SQL) database … ??? …


NoSQL VS Relational (SQL) database … ??? …
Akhir-akhir ini istilah NoSQL (e.g. MongoDB) semakin jamak ditelinga, terutama pada pembahasan mengenai data yang besar (Big Data). Pertanyaan/diskusi yang pal…
Read more »

Matlab – MySQL


Matlab – MySQL
Saat mengolah data yang besar (e.g. Big Data) meletakkan seluruh data di memory menjadi tidak praktis atau bahkan tidak memungkinkan. Ada kalanya koneksi ant…
Read more »

Community Detection & Centrality: Teori & Aplikasi


Community Detection & Centrality: Teori & Aplikasi
Pada sebuah data graph (network) seperti data dari media sosial bagaimana kita mengetahui user yang paling berpengaruh? Jika diterapkan pada riset pemasaran at…
Read more »

Twitter Crawl: Scrapping


Twitter Crawl: Scrapping
Peraturan terbaru Twitter API membatasi pengambilan data Tweet hanya satu minggu (7 hari) kebelakang. Jika seseorang ingin meneliti atau menganalisa topik tert…
Read more »

Analisis Twitter: Crawling (searching)


Analisis Twitter: Crawling (searching)
Artikel ini membahas cara crawl (mengumpulkan) data dari media sosial twitter . Crawling data bisa dilakukan dengan setidaknya dua cara: search dan realtime …
Read more »

Apakah PyThon Lambat ? : Showdown 7 Bahasa Pemrograman


Apakah PyThon Lambat ? : Showdown 7 Bahasa Pemrograman
Semenjak SMU, saya pernah menggunakan/mempelajari beberapa bahasa pemrograman:  Basic, Pascal, Visual Basic, C++, Fortran, ActionScript, Java, R, Matlab, PHP ,…
Read more »

Salah Paham Industri 4.0 dan Pendidikan 4.0


Salah Paham Industri 4.0 dan Pendidikan 4.0
" Industri 4.0 tidak mensyaratkan Pendidikan 4.0 " Karena sudah terlalu sering saya menemukan kesalahan ini di berbagai forum/media, maka saya m…
Read more »

High Performance Computing (HPC) for Big Data – Bagian 1: Teori/Konsep


High Performance Computing (HPC) for Big Data – Bagian 1: Teori/Konsep
Komputasi dengan performa tinggi ( High Performance Computing -HPC) biasa dilakukan ketika permasalahan (model) yang dihadapi kompleks atau ketika data (domain…
Read more »

Budaya Digital Indonesia: Peluang, Tantangan, dan Trend Masa Depan


Budaya Digital Indonesia: Peluang, Tantangan, dan Trend Masa Depan
Belum lama ini, kita dikejutkan sebuah berita tentang seorang siswi sekolah yang mengaku sebagai anak pejabat saat diberhentikan oleh seorang polisi lalu lint…
Read more »

Big Data, Privasi, dan Terorisme


Big Data, Privasi, dan Terorisme
Belum lama ini isu tentang adanya sistem  Big Data Cyber Security  (polisi internet) sempat menyebar dengan cepat melalui media sosial dan menghebohkan masyara…
Read more »

Sentiment in Ranking Functions


Hampir tak bisa dipungkiri konflik yang semakin memanas di tengah masyarakat akhir-akhir ini turut dipengaruhi oleh penggunaan teknologi internet. Debat kusir…
Read more »

Tokenization dalam Bahasa Inggris, Indonesia, & Alay


Tokenization dalam Bahasa Inggris, Indonesia, & Alay
Kali ini kita akan membahas salah satu bagian penting dari Text Mining/Natural Language Processing:  Tokenization . Tokenization adalah salah satu bagian penti…
Read more »

Simulasi Dalil Limit Pusat dengan R


Simulasi Dalil Limit Pusat dengan R
Dalil limit pusat menyatakan: Misalkan  X 1 , X 2 , . . . "> X 1 , X 2 , . . .  adalah barisan variabel random yang iid, masing - masing dengan mean …
Read more »

Simulasi Strong Law of Large Numbers dengan RSimulasi Strong Law of Large Numbers dengan R


Simulasi Strong Law of Large Numbers dengan RSimulasi Strong Law of Large Numbers dengan R
Teorema Strong Law of Large Numbers menyatakan Misalkan X 1 , X 2 , . . .  menyatakan sampel acak, dan misalkan  E ( X i ) = µ Maka, dengan probability 1,  …
Read more »

Pendahuluan Analisis Regresi


Pendahuluan Analisis Regresi
Beberapa hal yang akan dibahas: Apakah model regresi linier itu? Data seperti apa yang dapat digunakan pada regresi linier? Contoh-contoh regresi …
Read more »

Model linier dan NON-linier


Model linier dan NON-linier
Sebelumnya telah dibahas bentuk umum dari model regresi linier adalah sebagai berikut: Y = β 0 + β 1 X 1 + . . . + β p X p + …
Read more »