PSD-01-B: Data Scientist – Profesi dan Kompetensi


https://twitter.com/ai_memes/status/1118247476845260801Jokes-nya: Data Scientist adalah seseorang yang paling ahli statistik diantara para programer dan paling ahli pemrograman diantara para statistikawan [Josh Wills] [Image Source]
Kita sebelumnya sudah membahas apa itu Big Data (BD), Data Science (DS), dan kaitannya dengan berbagai bidang ilmu lain. Sayangnya menjelaskan tentang Data Scientist (profesi DS) tidak semudah mendefinisikan apa itu DS. Mengapa? Karena walaupun mungkin terdapat pendapat yang berbeda-beda tentang definisi DS, tapi kita bisa runut siapa yang pertama kali mengemukakan istilah DS dan kita juga bisa urutkan "kekuatan" referensi sehingga bisa dengan mudah menyimpulkan definisi yang cukup baik. Misal Pak Cleveland yang pertama kali "coined"/memperkenalkan istilah DS secara resmi dalam publikasi ilmiah [1] (2001), lalu kita bisa juga meng-urutkan kekuatan referensi (misal Jurnal lebih kuat dari Proceeding, dst). Sayangnya Data Scientist di definisikan begitu beragam oleh banyak institusi (perusahaan/industri/Kementrian-Lembaga) tanpa kita dapat menyimpulkan dengan tegas mana yang benar atau terbaik dalam menjelaskan profesi Data Scientist. Namun tenang saja, ... kita masih bisa mempelajari beberapa contoh yang ada untuk kemudian berusaha menarik "benang merah" (silver lining)-nya.

Variasi Deskripsi Data Scientist di Industri

Kebanyakan kebutuhan para pembaca terkait definisi (dan peran) Data Scientist ini biasanya adalah dalam rangka mempersiapkan diri menjadi Data Scientist di suatu institusi/perusahaan tertentu. Untuk keperluan ini sebenarnya kita dapat dengan mudah mempelajari dari bagaimana institusi  tersebut mengumumkan lowongan posisi data scientist. Kita bisa amati kebutuhan dan pengertian suatu institusi akan suatu profesi data dari prasyarat (requirement) dan deskripsi tugas yang diberikan. Sebagai contoh misal kita bisa melihat di Gambar 1  lowongan Data Scientist di Gojek atau silahkan lihat contoh lain dari tautan berikut [Link1, Link2]. kalau diperhatikan sekilas di konten kedua tautan sebelum ini, kita dengan mudah melihat keberagaman pengertian apa itu Data Scientist menurut beberapa perusahaan. 

Lowongan Data Scientist
Gambar 1. Contoh lowongan Data Scientist di Gojek [Sumber Gambar].

It's not black/white or written in stone

Secara umum perusahaan yang lebih besar dan sudah lama dalam memanfaatkan (big) data biasanya memiliki pengertian/persepsi yang lebih seragam terhadap profesi terkait data dan memiliki prasyarat, tugas serta tanggung jawab yang lebih jelas (dan "manusiawi"). Ini biasanya terjadi karena perusahaan besar memiliki team data yang relatif besar juga dan telah memiliki pengalaman lebih dari cukup untuk mengetahui cara mengolah data di institusinya secara optimal. Perusahaan yang lebih muda atau perusahaan lama, namun baru saja memanfaatkan data di tingkat lanjut (advance) biasanya memberikan tanggung jawab dan prasyarat yang lebih banyak atau lebih berat kepada applicant (job hunters). Tidak ada benar-salah dalam hal ini, perusahaan ("biasanya") lebih tau kebutuhan mereka akan human resources-nya. Bagi sebagian orang beberapa posisi mungkin dipandang kurang tepat namanya (berdasarkan job-desc yang diberikan), namun itulah kebutuhan perusahaan saat itu. dashboards_kpi_mayhem

Penghasilan Data Scientist: The Sexiest Job (?)

Salah satu hal yang membuat posisi Data Scientist begitu populer/viral adalah karena kabarnya memiliki gaji yang fantastis. Sebagian "milenials" juga tertarik bagaimana DS bisa memberikan dampak (impact) yang besar ke masyarakat/negara dan bahkan umat manusia secara luas. Tentu saja hal ini beralasan. Di era industri 4.0, data dapat menghasilkan solusi bagi orang banyak, sebut saja marketplace seperti Tokopedia/Bukalapak, Transportasi online seperti Gojek/Grab, atau perusahaan seperti Traveloka yang menghubungkan airlines, penginapan, dan hiburan ke masyarakat yang membutuhkan. Belum lagi banyaknya lapangan pekerjaan yang tercipta atau ekonomi masyarakat pengguna aplikasi yang terbantu.  Namun sebagai (calon) Data Scientist kita harus mengacu pada data untuk melihat kebenaran gosip Gaji yang fantastis tadi. Gambar 2 adalah rata-rata gaji data scientist di beberapa negara pada tahun 2017 menurut Business Broadway. Datanya diambil dari sebuah survey di Kaggle (silahkan baca lebih lanjut disini [Link]). Average Data Scientist Salary in several countries in 2017 according to Business Broadway [Link. Gambar 2. Average Data Scientist Salary in several countries in 2017 according to Business Broadway [Link]. Namun hati-hati, karena sebagian masyarakat masih suka mengkonversi langsung gaji DS di luar negeri ke Rupiah tanpa kemudian mempertimbangkan biaya hidup atau membandingkan dengan posisi lain di negara/tempat tersebut. Sebagai contoh Gambar 2 memperlihatkan rata-rata gaji DS di beberapa negara, sepertinya di US DS enak sekali gajinya miliaran per-tahun. Namun, kalau kita bandingkan dengan biaya hidup dan-atau membandingkan dengan penghasilan profesi lain (misal profesor) seperti di Gambar 3, maka akan menjadi lebih jelas sebenarnya seberapa "fantastis" penghasilan DS di negara tersebut. Ternyata "menurut data tersebut" secara rata-rata penghasilan DS masih standar. Tentu saja ada beberapa pengecualian untuk DS di beberapa perusahaan tertentu, terutama perusahaan yang core bisnisnya sangat bergantung dengan data. [caption id="attachment_6099" align="aligncenter" width="669"]Perbandingan biaya hidup dan penghasilan profesi profesor di US (sumber gambar tertera di gambar). Gambar 3. Perbandingan biaya hidup dan penghasilan profesi profesor di US (sumber gambar tertera di gambar).[/caption]
Terlepas apakah penghasilan DS Fantastis/tidak, satu hal yang jelas adalah permintaan akan Data Scientist beberapa tahun terakhir terus meningkat baik di dalam maupun luar negeri. 

Data Professionals

Lalu apa saja profesi terkait data? Yang utama (dan populer) biasanya adalah Data Engineer, Data Analyst, dan Data Scientist (Gambar 4).

  Data Engineer, Data Analyst, Data Scientist 
Gambar 4. Tiga profesi utama Data Professionals. 

Secara singkat Data Engineer (DE) bertugas untuk mendesain arsitektur (big) database termasuk framework/platform big data. DE juga bertugas untuk meyakinkan Data Analyst (DA) dan DS mendapatkan data yang mereka butuhkan. DE juga memiliki peran untuk data governance (manajemen), termasuk masalah security, performance, dan tentu saja maintenance. Untuk posisi DE biasanya di beberapa perusahaan memiliki pengertian yang cukup seragam. Menjadi DE di perusahaan rintisan (startup) biasanya lebih challenging karena juga bertugas mendesain arsitektur perusahaan sejak awal. Bagi DE yang bekerja di perusahaan yang sudah well-established biasanya kebanyakan perannya terkait query di database yang konon kabarnya (menurut beberapa DE) agak membosankan. Di beberapa perusahaan (negara) penghasilan DE lebih besar dari DS. DE secara umum memiliki tanggung jawab yang lebih besar dari DS, karena seluruh (big) data ekosistem dalam tanggung jawabnya. 

  Data Analyst (DA) sebagaimana DS, didefinisikan berbeda-beda di beberapa perusahaan. Kebanyakan DA dianggap sebagai DS junior (tidak selalu). Biasanya DA dituntut lebih ke arah "business understanding". Kesehariannya biasanya terkait EDA (Eksploratory Data Analysis) yang meliputi data preprocessing, visualisasi, dan statistik sederhana. Most of the times, DA melakukan analisa pada data terstruktur. Data tersebut bisa stasioner atau tidak stasioner (bergantung waktu/lokasi). Salah satu hal yang penting dari DA adalah kemampuan "Story-Telling", yaitu mempresentasikan temuan/finding dari data ke pimpinan/stakeholders. Walau tidak selalu, biasanya DA menangani "known questions" or dealing with known metrics. Sedangkan DS nanti biasanya lebih ke generating novel insights atau automatic decisions. Hal lain yang sangat penting bagi DA adalah critical thinking. Being critical dalam melakukan interpretasi dari statistics dan hasil visualisasi untuk menghasilkan rekomendasi yang "tajam" ke atasan. Menurut taudata posisi DA ini cocok untuk menjadi profile lulusan dari berbagai jurusan formal level diploma dan strata satu. 

 Di banyak kasus yang taudata ketahui, biasanya DS memiliki tantangan/harapan kompetensi dan skills yang lebih tinggi ketimbang DA. DS dituntut untuk mampu menangani data terstruktur dan tidak terstruktur. Termasuk menangani masalah scalability dan performance model dalam production level (analytic engine-nya diaplikasikan dalam proses produksi). Di beberapa kasus DS dituntut menangani permasalahan yang tidak memiliki "ready solution". Artinya DS harus mengajukan (propose) data solution terhadap tantangan pengolahan data di perusahaan. Misal pengolahan data dari berbagai tipe, masalah real-time analytics pada streaming data, dan masih banyak lagi. Karena tuntutan ini, tau-data menemukan banyak DS di dalam dan luar negeri biasanya adalah lulusan pasca sarjana. Mengapa demikian? Karena "novelty" adalah hal yang sangat ditekankan dalam pembelajaran di level pascasarjana. Namun demikian tentu saja tingkat pendidikan formal bukanlah syarat mutlak. Pembahasan tentang DE, DA, dan DS akan saya tutup dengan reminder bahwa penjelasan diatas tidak bersifat mutlak. Institusi biasanya bervariasi dalam menentukan ke-3 profesi diatas.

Kompetensi dan Skills Data Professionals

DS tidak harus berasal dari mereka yang lulusan ilmu statistika, matematika, atau ilmu komputer. Karena DS adalah tentang menyelesaikan permasalahan lewat data, maka jurusan Biologi, Fisika, Kimia, Geografi, Psikologi, bahkan Sastra bisa menjadi seorang data scientist. Misal sesorang seseorang dari bidang kedokteran, biologi, atau farmasi membuat model personalized medicine, maka ia bisa menjadi DS yang super handal. Seorang ahli bahasa yang menciptakan language model atau speech recognition yang baik juga bisa menjadi DS yang keren. Seorang ahli psikologi yang mengembangkan AI untuk humanoid interaction dengan user adalah seorang DS yang luar biasa. Listnya tidak berhenti sampai disini, tidak perduli apapun bidang ilmu/jurusannya seseorang dapat menjadi seorang Data Scientist.  Lalu pengetahuan atau skills apa yang harus dipelajari/siapkan?  Gambar 5 tidak terlalu mengejutkan dan lebih sekedar penegasan visual dari penjelasan sebelumnya tentang tiga profesi utama terkait data.  

Perbandingan harapan pengetahuan antara Data Engineer, Analyst, dan Scientist, serta programmer. Gambar 5. Perbandingan harapan pengetahuan antara Data Engineer, Analyst, dan Scientist, serta programmer.

 T-Shape people

Perusahaan secara umum menginginkan T-shape people sebagai data professional (Gambar 6). Apa itu T-Shape people? Seseorang yang mengetahui banyak hal (just overview- garis horizontal) tapi ahli di suatu bidang (garis vertikal), hence T-Shaped. Mengapa T-shape? Karena T-shape people akan mudah untuk bekerjasama dan berkomunikasi dengan orang lain (kalau ngobrol "nyambung") karena pengetahuannya yang luas (garis horizontal). Akan tetapi T-shape people juga bisa berkontribusi dengan baik dalam komunitas karena memiliki keahlian yang khusus (garis vertikal). Dalam membentuk T-shape people ini lembaga pendidikan formal dapat mengenalkan berbagai pengetahuan ke (maha)siswa dalam kurikulumnya dan memberikan keahlian khusus bergantung pada pengajar senior di institusinya dan-atau sarana-prasarana yang tersedia. Seseorang dengan profile T-Shaped Gambar 6. Seseorang dengan profile T-Shaped.

Team Data: Data Scientist dan Unicorn

Data Science Unicorn 

 Kalau dibaca dari penjelasan sebelumnya DS sepertinya menyeramkan. Dalam dunia nyata hampir selalu sebuah perusahaan  tidak mengandalkan kepada "superman". Perusahaan memiliki team (bagian khusus) yang menangani berbagai keperluan terkait data.  Industri tidak bisa berharap banyak hanya kepada orang-orang seperti ini. Karena kebutuhannya sangat banyak, namun unicorn-unicorn (superman) seperti ini sangat jarang. Sehingga perusahaan lebih mengharapkan team yang solid, sehingga T-shaped people di penjelasan sebelumnya menjadi penting. Secara umum biasanya di dalam team data ada Data Engineer, analyst, dan Scientist. Namun pada kegiatan yang dilakukan biasanya juga bekerja-sama dengan programmer, devOps, dan juga UI/UX designer/engineer. Mampu bekerja sama dalam team dengan baik adalah syarat utama.

Long-Life Learner dan Kreatif

Walau bekerja dalam sebuah team, namun teknologi dan metode berkembang (amat sangat) cepat dan semakin cepat. Kita tidak dituntut untuk mengetahui semua hal terkait metode dan teknologi di (big) data science. Namun demikian perusahaan di era industri 4.0 membutuhkan pekerja yang siap menerima tantangan dan mampu untuk berinovasi dan berkreasi untuk menghasilkan solusi yang tepat. Kreativitas dan Inovasi adalah "Core Value" bagi banyak perusahaan di era industri 4.0. Sehingga T-Shaped data scientist yang kreatif dan inovatif adalah dambaan banyak perusahaan.
Hayo ... kamu yang suka malas belajar di sekolah/kuliah, kalau mau jadi Data Scientist harus hilangkan kebiasaan ini. Di era data kita biasakan tidak hanya lapar kuliner dan traveling, tapi juga lapar ilmu ;) 
inovasi dan kreativitas di era informasi

https://www.youtube.com/watch?v=0U1vgN-h41g

Tidak ada komentar:

Posting Komentar

Relevant & Respectful Comments Only.