Alhamdulillah ini tulisan pertama di tahun 2021. Secara gak sengaja nemu tweet menarik dari seseorang (sepertinya seorang data scientist). Tweetnya bercerita bagaimana prosed data science seperti halnya memasak makanan. Dia bercerita ketika dulu pas kerja dengan banyak mitra dan klien dan gak terlalu ngeh dengan apa itu data science, beliau punya analogi sendiri, yaitu proses masak.

Data Scientis itu sebenranya seperti koki di dapur, mengubah bahan-bahan (data) menjadi makanan (produk analisis data) dan kaya dengan nutrisi (punya nilai informasi). Sebelum masak, alangkah lebih baik kalo dari awal udah tahu apa yang mau dimasak atau mau masak apa. Apakah itu rendang?soto?atau nasi goreng? Dan data science sama halnya, lebih baik jika sudah tahu masalah yang akan dikerjakan.

Karena berhubungan dengan bahan (data), jika masak misal masak rendang, berarti perlu beli daging, rempah, cabe, santan, gula, garam dll sehingga gak overbudget. Sama dengan ngumpulin data, kalau sudah tahu masalahnya apa, jadi tahu data apa yang perlu dikumpulkan.

Di dunia data, ada bidang yang cukup spesifik untuk mengumpulkan bahan-bahan ini, ibarat jika masak, ada yang ngurusin penyimpanan bahan, suhu tempat penyimpanan macam kulkas dll. Ngumpulin data, nyimpan dan manage data tersebut dinamakan Data Engineer.

Kalo sudah ada bahan, perlu itu untuk membersihkan bahan-bahan tadi (cleansing), percobaan pakai bahan-bahan baru, misal cocok gak rendang pake daging ayam?ayamnya perlu direbus dulu gak itu? Disini ada proses data yaitu cleaning + wrangling exploration. Diproses bersihkan data ini bisa dicari dasar-dasar statistiknya misal mean, median, modus (bukan modal dusta lho ya…) dan divisualisasikan. Cari yang bisa diidentifikasi dari data.

Hasi itu barulah proses masak yang sebenar-benarnya masak. Dipakein bumbu apa dan perlu pake alat apa. Nah ini sepadan dengan penerapan metode pada data science, mau pakai supervised atau unsupervised? Butuh deep learning? Dan sama kayak memasak, harus diicip-icip kurang apa, kurang asin kah atau kurang manis?perlu tambah apa? Di data science juga seperti itu, jika habis melakukan training data misal kurang akurat, bisa diteliti kurangnya apa? butuh apa lagi? (misal labeled datanya kurang, hyperparameter) dan di-training ulang.

Jikalau dah kelar memasaknya, perlu disajikan kannn….Penyajiannya kalau indah bisa bikin selera makan meningkat. Tapi kalo gak juga gak papa, salah masih masuk akal dan familiar. Di dunia data ini dinamakan Data Visualisasi. Data visualisasi ini bagaimana caranya menyajikan hasil analisis tadi ke orang lain. Bagus itu bonus, tapi yang penting dapat memberikan informasi sehingga yang lihat bisa paham apa maksudnya.

Selanjutnya jika ini proses masak di sebuah restoran, ada orang yang tugasnya menimpan keseluruhan proses tadi menjadi resep yang dapat diduplikasi. Di dunia data ini dinamakan Machne Learning Engineering, sering ditemui di perusahaan besar, biar produk datanya bisa di-scale.

Inilah analogi data science pada proses masak. Cukup mudah dicerna dan dimengerti, sehingga nantinya gak perlu lagi bingung tentang istilah-istilah di data, ada Data Scientist, Data Engineer, Data Visualization dan ML Engineerng.

Sekian.