DSBD 02: Data Scientist – Profesi dan Kompetensi


 https://twitter.com/ai_memes/status/1118247476845260801
Jokes-nya: Data Scientist adalah seseorang yang paling ahli statistik diantara para programer dan paling ahli pemrograman diantara para statistikawan [Josh Wills] [Image Source]
Kita sebelumnya sudah membahas di module DSBD-01 apa itu Big Data (BD), Data Science (DS), dan kaitannya dengan berbagai bidang ilmu lain. Sayangnya menjelaskan tentang Data Scientist (profesi DS) tidak semudah mendefinisikan apa itu DS. Mengapa? Karena walaupun mungkin terdapat pendapat yang berbeda-beda tentang definisi DS, tapi kita bisa runut siapa yang pertama kali mengemukakan istilah DS dan kita juga bisa urutkan "kekuatan" referensi sehingga bisa dengan mudah menyimpulkan definisi yang cukup baik. Misal Pak Cleveland yang pertama kali "coined"/memperkenalkan istilah DS secara resmi dalam publikasi ilmiah [1] (2001), lalu kita bisa juga meng-urutkan kekuatan referensi (misal Jurnal lebih kuat dari Proceeding, dst). Sayangnya Data Scientist di definisikan begitu beragam oleh banyak institusi (perusahaan/industri/Kementrian-Lembaga) tanpa kita dapat menyimpulkan dengan tegas mana yang benar atau terbaik dalam menjelaskan profesi Data Scientist. Namun tenang saja, ... kita masih bisa mempelajari beberapa contoh yang ada untuk kemudian berusaha menarik "benang merah" (silver lining)-nya.

Variasi Deskripsi Data Scientist di Industri

I Need a job meme Kebanyakan kebutuhan para pembaca terkait definisi (dan peran) Data Scientist ini biasanya adalah dalam rangka mempersiapkan diri menjadi Data Scientist di suatu institusi/perusahaan tertentu. Iya kan?...hayo ngaku :) Untuk keperluan ini sebenarnya kita dapat dengan mudah mempelajari dari bagaimana institusi  tersebut mengumumkan lowongan posisi data scientist. Kita bisa amati kebutuhan dan pengertian suatu institusi akan suatu profesi data dari prasyarat (requirement) dan deskripsi tugas yang diberikan. Sebagai contoh misal kita bisa melihat di Gambar 1  lowongan Data Scientist di Gojek atau silahkan lihat contoh lain dari tautan berikut [Link1, Link2]. kalau diperhatikan sekilas di konten kedua tautan sebelum ini, kita dengan mudah melihat keberagaman pengertian apa itu Data Scientist menurut beberapa perusahaan.

Lowongan Data Scientist Gambar 1. Contoh lowongan Data Scientist di Gojek [Sumber Gambar].

It's not black/white or written in stone

Secara umum perusahaan yang lebih besar dan sudah lama dalam memanfaatkan (big) data biasanya memiliki pengertian/persepsi yang lebih seragam terhadap profesi terkait data dan memiliki prasyarat, tugas serta tanggung jawab yang lebih jelas (dan "manusiawi"). Ini biasanya terjadi karena perusahaan besar memiliki team data yang relatif besar juga dan telah memiliki pengalaman lebih dari cukup untuk mengetahui cara mengolah data di institusinya secara optimal. Perusahaan yang lebih muda atau perusahaan lama, namun baru saja memanfaatkan data di tingkat lanjut (advance) biasanya memberikan tanggung jawab dan prasyarat yang lebih banyak atau lebih berat kepada applicant (job hunters), terkadang ndak masuk akal.

Contoh lowongan yang ndak masuk akal. 

 Tidak ada benar-salah dalam hal ini, perusahaan ("biasanya") lebih tau kebutuhan mereka akan human resources-nya. Bagi sebagian orang beberapa posisi mungkin dipandang kurang tepat namanya (berdasarkan job-desk yang diberikan), namun itulah kebutuhan perusahaan saat itu. Kecuali yang mungkin agak membuat repot adalah jika ada institusi yang sebenarnya tidak tau apa sebenarnya keinginan/kebutuhannya terkait pemanfaatan data yang optimal ... emang ada? sssttt... lumayan banyak!!! ... :D ... 

  dashboards_kpi_mayhem

Penghasilan Data Scientist: The Sexiest Job (katanya)

Salah satu hal yang membuat posisi Data Scientist begitu populer/viral adalah karena konon kabarnya memiliki gaji yang fantastis. Sebagian "milenials" juga tertarik bagaimana DS bisa memberikan dampak (impact) yang besar ke masyarakat/negara dan bahkan umat manusia secara luas. Tentu saja hal ini beralasan. Di era industri 4.0, data dapat menghasilkan solusi bagi orang banyak, sebut saja marketplace seperti Tokopedia/Bukalapak, Transportasi online seperti Gojek/Grab, atau perusahaan seperti Traveloka yang menghubungkan airlines, penginapan, dan hiburan ke masyarakat yang membutuhkan. Belum lagi banyaknya lapangan pekerjaan yang tercipta atau ekonomi masyarakat pengguna aplikasi yang terbantu.  Namun sebagai (calon) Data Scientist kita harus mengacu pada data untuk melihat kebenaran gosip Gaji yang fantastis tadi. Gambar 2 adalah rata-rata gaji data scientist di beberapa negara pada tahun 2017 menurut Business Broadway. Datanya diambil dari sebuah survey di Kaggle (silahkan baca lebih lanjut disini [Link]). Average Data Scientist Salary in several countries in 2017 according to Business Broadway [Link. Gambar 2. Average Data Scientist Salary in several countries in 2017 according to Business Broadway [Link]. 

 Namun hati-hati, karena sebagian netijen masih suka mengkonversi langsung gaji DS di luar negeri ke Rupiah tanpa kemudian mempertimbangkan biaya hidup atau membandingkan dengan posisi lain di negara/tempat tersebut. Sebagai contoh Gambar 2 memperlihatkan rata-rata gaji DS di beberapa negara, sepertinya di US DS enak sekali gajinya miliaran per-tahun. Ya tapi ndak begitu juga Malih! kalau kita bandingkan dengan biaya hidup disana dan-atau membandingkan dengan penghasilan profesi lain (misal profesor) seperti di Gambar 3, maka akan menjadi lebih jelas sebenarnya seberapa "fantastis" penghasilan DS di negara tersebut. Ternyata "menurut data tersebut" secara rata-rata penghasilan DS masih standar. Tentu saja ada beberapa pengecualian untuk DS di beberapa perusahaan tertentu, terutama perusahaan yang core bisnisnya sangat bergantung dengan data. Bagaimana dengan penghasilan DS di Indonesia? ... Teman-teman DS yang membaca ini semoga mau sharing sedikit info tersebut di kolom komentar. Tenang aja, kita ndak minta traktir kok ... tapi diajak ndak nolak sih :) #kidding.

Perbandingan biaya hidup dan penghasilan profesi profesor di US (sumber gambar tertera di gambar). Gambar 3. Perbandingan biaya hidup dan penghasilan profesi profesor di US (sumber gambar tertera di gambar).
Terlepas apakah penghasilan DS Fantastis/tidak, satu hal yang jelas adalah permintaan akan Data Scientist beberapa tahun terakhir terus meningkat baik di dalam maupun luar negeri. 
Hello ... is it me you're recruiting for? 
Tantangan: Coba baca text di gambar ini dalam hati tanpa nyanyi ... :) ...

Tugas/Tanggung Jawab Seorang Data Scientist

Selain hal trivial seperti "menggunakan data untuk menghasilkan insights", berikut ini adalah contoh lain tugas seorang Data Scientist (DS) :
  • Menerjemahkan keinginan/kebutuhan user ke model/algoritma yang ada di DS. Setelah itu menjelaskan model serta metrik evaluasi apa yang dipilih dan mengapa. Misal, tidak selamanya model di optimalkan berdasarkan akurasi, terkadang recall lebih penting, dsb.
  • Memberikan masukan ke client potensi pemanfaatan data yang belum disadari oleh institusi/perusahaan.
  • Terkadang (seringnya) tidak semua keinginan client bisa dibuat model yang baik dengan data yang ada. Hal ini perlu disampaikan ke client/user dan berikan penjelasannya. Bisa juga menyarankan untuk cara yang efektif dan efisien untuk melengkapi data yang diperlukan.
  • Memberi masukan terkait legal dan ethics penggunaan data dan model data science yang digunakan.
  • Bantu client untuk memahami informasi/insight dan bagaimana menggunakannya dalam dunia nyata. Namun hormati client, karena biasanya mereka jauh lebih ahli di domain/business knowledge-nya.
  • Mirip seperti software engineer (developer), setelah membuat model/analytic engine akan ada revisi beberapa kali sesuai masukan client/user/stakeholder.
  • Mirip seperti QC, melakukan monitoring dan update model.
  • dsb

Data Professionals

Lalu apa saja profesi terkait data? Yang utama (dan populer) biasanya adalah Data Engineer, Data Analyst, dan Data Scientist (Gambar 4). 

Data Engineer, Data Analyst, Data Scientist 
Gambar 4. Tiga profesi utama Data Professionals.

Secara singkat Data Engineer (DE) bertugas untuk mendesain arsitektur (big) database termasuk framework/platform big data. DE juga bertugas untuk meyakinkan Data Analyst (DA) dan DS mendapatkan data yang mereka butuhkan. DE juga memiliki peran untuk data governance (manajemen), termasuk masalah security, performance, dan tentu saja maintenance. Untuk posisi DE biasanya di beberapa perusahaan memiliki pengertian yang cukup seragam. Menjadi DE di perusahaan rintisan (startup) biasanya lebih challenging karena juga bertugas mendesain arsitektur perusahaan sejak awal. Bagi DE yang bekerja di perusahaan yang sudah well-established biasanya kebanyakan perannya terkait query di database yang konon kabarnya (menurut beberapa DE) agak membosankan. Di beberapa perusahaan (negara) penghasilan DE lebih besar dari DS. DE secara umum memiliki tanggung jawab yang lebih besar dari DS, karena seluruh (big) data ekosistem dalam tanggung jawabnya. 

  Data Analyst (DA) sebagaimana DS, didefinisikan berbeda-beda di beberapa perusahaan. Kebanyakan DA dianggap sebagai DS junior (tidak selalu). Biasanya DA dituntut lebih ke arah "business understanding". Kesehariannya biasanya terkait EDA (Eksploratory Data Analysis) yang meliputi data preprocessing, visualisasi, dan statistik sederhana. Most of the times, DA melakukan analisa pada data terstruktur. Data tersebut bisa stasioner atau tidak stasioner (bergantung waktu/lokasi). Salah satu hal yang penting dari DA adalah kemampuan "Story-Telling", yaitu mempresentasikan temuan/finding dari data ke pimpinan/stakeholders. Walau tidak selalu, biasanya DA menangani "known questions" or dealing with known metrics. Sedangkan DS nanti biasanya lebih ke generating novel insights atau automatic decisions. Hal lain yang sangat penting bagi DA adalah critical thinking. Being critical dalam melakukan interpretasi dari statistics dan hasil visualisasi untuk menghasilkan rekomendasi yang "tajam" ke atasan. Menurut tau-data posisi DA ini cocok untuk menjadi profile lulusan dari berbagai jurusan formal level diploma dan strata satu. 

 Di banyak kasus yang tau-data ketahui, biasanya DS memiliki tantangan/harapan kompetensi dan skills yang lebih tinggi ketimbang DA. DS dituntut untuk mampu menangani data terstruktur dan tidak terstruktur. Termasuk menangani masalah scalability dan performance model dalam production level (analytic engine-nya diaplikasikan dalam proses produksi). Di beberapa kasus DS dituntut menangani permasalahan yang tidak memiliki "ready solution". Artinya DS harus mengajukan (propose) data solution terhadap tantangan pengolahan data di perusahaan. Misal pengolahan data dari berbagai tipe, masalah real-time analytics pada streaming data, dan masih banyak lagi. Karena tuntutan ini, tau-data menemukan banyak DS di dalam dan luar negeri biasanya adalah lulusan pasca sarjana. Mengapa demikian? Karena "novelty" adalah hal yang sangat ditekankan dalam pembelajaran di level pascasarjana. Namun demikian tentu saja tingkat pendidikan formal bukanlah syarat mutlak. Apalagi faktor ijazah sebagai syarat profesi sudah semakin ditinggalkan di beberapa institusi (simak video untuk keterangan lebih lanjut). Pembahasan tentang DE, DA, dan DS akan saya tutup dengan reminder bahwa penjelasan diatas tidak bersifat mutlak. Institusi biasanya bervariasi dalam menentukan ke-3 profesi diatas.

Kompetensi dan Skills Data Professionals

Pertama-tama tau-data ingin menekankan bahwa DS tidak harus berasal dari mereka yang lulusan ilmu statistika, matematika, atau ilmu komputer. Karena DS adalah tentang menyelesaikan permasalahan lewat data, maka jurusan biologi, fisika, kimia, psikologi, bahkan sastra, dsb bisa menjadi seorang data scientist. Loh kok? emaing iya ya? iya!. Misal sesorang seseorang dari bidang kedokteran, biologi, atau farmasi membuat model personalized medicine, maka ia bisa menjadi DS yang super handal. Seorang ahli bahasa yang menciptakan language model atau speech recognition yang baik juga bisa menjadi DS yang keren. Seorang ahli psikologi yang mengembangkan AI untuk humanoid interaction dengan user adalah seorang DS yang luar biasa. Listnya ndak berhenti sampai disini, tidak perduli apapun bidang ilmu/jurusannya seseorang dapat menjadi seorang Data Scientist.  Tapi pengetahuan atau skills apa yang harus dipelajari/siapkan? tau-data melakukan studi kecil-kecilan di beberapa institusi dan mendapatkan secara umum kebutuhan pengetahuan yang diharapkan dari masing-masing posisi adalah seperti yang nampak pada Gambar 5. Di Gambar 5 tau-data juga sengaja menempatkan profesi programmer, karena banyak yang menanyakan tentang hal ini dan juga cukup banyak rekan programmer yang banting setir menjadi seorang DS. Gambar 5 tidak terlalu mengejutkan dan lebih sekedar penegasan visual dari penjelasan sebelumnya tentang tiga profesi utama terkait data. 

Perbandingan harapan pengetahuan antara Data Engineer, Analyst, dan Scientist, serta programmer. Gambar 5. Perbandingan harapan pengetahuan antara Data Engineer, Analyst, dan Scientist, serta programmer.

 T-Shape people

Perusahaan secara umum menginginkan T-shape people sebagai data professional (Gambar 6). Apa itu T-Shape people? Seseorang yang mengetahui banyak hal (just overview- garis horizontal) tapi ahli di suatu bidang (garis vertikal), hence T-Shaped. Mengapa T-shape? Karena T-shape people akan mudah untuk bekerjasama dan berkomunikasi dengan orang lain (kalau ngobrol "nyambung") karena pengetahuannya yang luas (garis horizontal). Akan tetapi T-shape people juga bisa berkontribusi dengan baik dalam komunitas karena memiliki keahlian yang khusus (garis vertikal). Dalam membentuk T-shape people ini lembaga pendidikan formal dapat mengenalkan berbagai pengetahuan ke (maha)siswa dalam kurikulumnya dan memberikan keahlian khusus bergantung pada pengajar senior di institusinya dan-atau sarana-prasarana yang tersedia. Seseorang dengan profile T-Shaped 
Gambar 6. Seseorang dengan profile T-Shaped.

Team Data: Data Scientist dan Unicorn

Data Science Unicorn 

 Kalau dibaca dari penjelasan sebelumnya DS kok sepertinya menyeramkan ya? Tenang saja, dalam dunia nyata hampir selalu sebuah perusahaan  tidak mengandalkan kepada "superman". Perusahaan memiliki team (bagian khusus) yang menangani berbagai keperluan terkait data.  Eits, tapi jangan salah lo ya, pengalaman saya pribadi (setelah "main" ke beberapa negara di Eropa dan Asia) saya sempat bertemu orang-orang luar biasa (minimal nyaris jenius) yang memiliki talenta super di bidang data science. Tapi industri tidak bisa berharap banyak hanya kepada orang-orang seperti ini. Karena kebutuhannya sangat banyak, namun unicorn-unicorn seperti ini sangat jarang. Sehingga perusahaan lebih mengharapkan team yang solid, mangkanya T-shaped people di penjelasan sebelumnya menjadi penting. Secara umum biasanya di dalam team data ada Data Engineer, analyst, dan Scientist. Namun pada kegiatan yang dilakukan biasanya juga bekerja-sama dengan programmer, devOps, dan juga UI/UX designer/engineer. Intinya no one-man-army kok, jadi kita ndak perlu takut/minder dengan kemampuan kita. Yang terpenting adalah mampu bekerja sama dalam team dengan baik.

Long-Life Learner dan Kreatif

Walau bekerja dalam sebuah team, namun teknologi dan metode berkembang (amat sangat) cepat dan semakin cepat. Kita tidak dituntut untuk mengetahui semua hal terkait metode dan teknologi di (big) data science. Namun demikian perusahaan di era industri 4.0 membutuhkan pekerja yang siap menerima tantangan dan mampu untuk berinovasi dan berkreasi untuk menghasilkan solusi yang tepat. Kreativitas dan Inovasi adalah "Core Value" bagi banyak perusahaan di era industri 4.0. Sehingga T-Shaped data scientist yang kreatif dan inovatif adalah dambaan banyak perusahaan. Di jamin deh, kalau kamu seperti ini, maka ndak perlu melamar pekerjaan, tapi justru perusahaan yang akan mencari dan mendatangi (karena mereka yang butuh kamu ... banget!).
Hayo ... kamu yang suka malas belajar di sekolah/kuliah, kalau mau jadi Data Scientist harus hilangkan kebiasaan ini. Di era data kita biasakan tidak hanya lapar kuliner dan traveling, tapi juga lapar ilmu ;) 
inovasi dan kreativitas di era informasi 

 Karena nature dari pokok bahasan di modul ini,  ndak ada referensi resmi ya. Akan tetapi kamu tetap bisa ke latihan soal singkat yang tau-data siapkan. O iya, tau-data juga mau mengingatkan bahwa konten video dan apa yang tertulis di web ini saling melengkapi ya. Jadi untuk mendapatkan pembahasan yang utuh sangat disarankan untuk mengakses kedua sumber tersebut. Sampai bertemu di Modul selanjutnya.


Tidak ada komentar:

Posting Komentar

Relevant & Respectful Comments Only.