DFDS memperkenalkan dasar konsep, teori, dan aplikasi ilmu basis data untuk para profesional di bidang ilmu data. Berbeda dengan silabus ilmu basis data konvensional DFDS yang lebih memprioritaskan kompetensi ke arah Database Administrator (DBA) dengan memperkenalkan keamanan basis data, normalisasi, dsb, DFDS fokus ke penggunaan basis data untuk menunjang pengolahan data seperti berbagai macam query (optimal) dan pemanfaatan indexing pada basis data SQL dan NoSQL.
Interface yang akan digunakan dalam DFDS kebanyakan menggunakan bahasa pemrograman Python, pada beberapa kasus tertentu tools seperti PHPMyAdmin, MongoDB Compas, atau ElasticSearch Head juga akan digunakan.
Prasyarat : Sebagian MFDS, ADSP, dan SFDS
Tujuan :
- Memperkenalkan berbagai teknologi basis data, penggunaan, serta kelebihan dan kekurangannya.
- Kemampuan untuk melakukan query ke basis data secara optimal
- Mampu merubah bentuk struktur data dari basis data ke dalam bentuk yang dibutuhkan dalam pengolahan data.
- Memperkenalkan berbagai indexing dan kegunaannya dalam mendukung pengolahan data.
- Validasi data (quality checks)
- Optimizing sistem basis data untuk pengolahan data: mapping, nodes, etc.
Referensi:
- SQL Notes for Professionals, 2019, GoalKickers
- Silberschatz, A., Korth, H. F., & Sudarshan, S. (1997). Database system concepts(Vol. 4). New York: McGraw-Hill.
- DeBarros, A. (2018). Practical SQL: A Beginner's Guide to Storytelling with Data. No Starch Press.
Topic ID | Topic Title | Lessons |
DFDS1 | Getting Started, Selecting & Retrieving Data from database | - Introduction to database engines - Data modelling, ERD, cardinality, normalization - Relational model - API connect, data structures, - SQL &/ NoSQL basic queries for data retrieval - Key concepts: index, foreign key, null, etc. - Parsing data structures/format. (e.g. parsing json/objects in relational database) |
DFDS2 | Filtering, Sorting, and Calculating Data with SQL | - Clauses and operators (IF, Where, and, or, order, group by, etc.) - Basic math operators, as well as aggregate functions like Average, Count, Max, Min. - Wildcards best practice - Data deduplication techniques |
DFDS3 | Subqueries and Joins in SQL | - Subqueries best practice - Joins - aliases - Optimizing queries based on database type (columnar/row-based) - Query cost analysis |
DFDS4 | Modifying and Analyzing Data with SQL | * Requirement: Basic topics in EDA - Query results verification - modify strings by concatenating, trimming, changing the case, and using the substring function. - date and time strings - window functions, Array & UNNEST functions - SQL for EDA** (need some lessons in EDA module) |
...
DFDS6 | Advance topic on relational database | - Data normalization or not normalize - Partitioning/sharding & replicas - Cluster database (master, slave, data nodes) - Indexing strategy (various indexing, including termvectors) - Stored Procedures, etc |
DFDS7 | Introduction to NoSQL/NewSQL Databases | * Each database technology is one introductory topic - MongoDB - ElasticSearch - Neo4j, - Postgress - HBase, etc. |
No comments:
Post a Comment
Relevant & Respectful Comments Only.