Mungkin kamu pernah mendengar tentang profesi seorang Data Science Data, Analyst dan Data Engineer, lalu apa bedanya? Mari kita bahas.
Data Analyst
Profesi Data analyst mengharuskan berhadapan dengan banyak data untuk dibersihkan, dianalisis, dan dibuatkan visualisasinya. Tugas seorang data analyst adalah mencari insight untuk memajukan bisnis dari berbagai aspek, lalu kemudian diberikan pada data engineer. Data analyst juga bertanggung jawab untuk mengolah bahan yang diberikan untuk membuat eksperimen dan menentukan strategi bisnis lanjutan. Setiap hari melakukan visualisasi data yang menjadi penghubung tim pemasaran, tim penjualan, tim teknis, dan strategi bisnis.
Data analyst juga bertanggung jawab menyelesaikan pertanyaan seperti “bagaimana cara kami menjelaskan kepada manajemen bahwa kenaikan biaya memengaruhi jumlah konsumen?” dan “apa yang mendorong pertumbuhan bisnis?”
Dikarenakan Data Analyst harus berhubungan langsung dengan bisnis maka ia harus memahami dengan benar bagaimana naik turunnya permainan dalam pasar penjualan. Dengan begitu Data Analyst juga dapat mengolah bahan secara langsung untuk membuat eksperimen inovasi terbaru yang sekiranya akan disukai oleh traffic pasar saat ini. Hasil dari eksperimen tersebut nanti akan diberikan kepada Data Scientist dan Data Engineer sebagai insights.
Untuk menyelesaikan pekerjaan sehari-hari, data analyst akan bekerja dengan program Excel, Tableau, dan SQL. Mereka harus menguasai istilah bisnis dan tools yang digunakan untuk membuat grafik/infografik.
Data Scientist
Mengolah lebih lanjut data yang telah dikumpulkan oleh data engineer. Mulai dari data extraction, lalu data preparation (cleansing), data processing, dan analysis. Data scientist perlu memastikan kondisi data baik dan sesuai untuk dianalisis dan diambil insightsnya. Data scientist biasanya melakukan eksperimentasi dengan menggunakan teknik machine learning dan metode statistik untuk digunakan dalam pemodelan prediktif dan preskriptif.
Ketika Anda memiliki setumpuk data yang terlalu besar bagi seorang manusia untuk mengurai dan terlalu berharga untuk diabaikan, Anda perlu beberapa cara menarik wawasan yang dapat dicerna darinya. Itulah pekerjaan dasar dari seorang ilmuwan data: mengkombinasikan beberapa pasang data untuk mengungkap suatu pola. Contohnya, kebiasaan dan preferensi konsumen. Pola yang dicari ini nantinya dapat digunakan sebagai acuan untuk memprediksi pergerakan bisnis suatu produk.
Seorang data scientist bertanggung jawab membersihkan, memproses, dan mengolah data besar yang sudah dikumpulkan oleh data engineer di suatu perusahaan. Data scientist juga tak jarang harus melakukan eksperimen untuk membuktikan dan memberikan saran yang paling tepat untuk perkembangan sebuah organisasi, perusahaan, dan badan usaha.
Dalam pekerjaan sehari-hari, data scientist akan sering berhadapan dengan pertanyaan seperti “berapa banyak jenis pengguna yang dimiliki oleh perusahaan?” dan “bisakah menciptakan model yang bisa memprediksi suatu produk yang akan laris jika dijual untuk target pasar tertentu?”
Pada intinya, pekerjaan sebagai data scientist adalah bagaimana bisa menghasilkan suatu kesimpulan yang dapat dicerna dan diterima oleh semuanya, berdasar dari kumpulan data besar yang sudah ada.
Setiap hari, data scientist berhadapan dengan program olah data seperti SQL dan Python. Persyaratan: Teknologi yang akan Anda gunakan termasuk Python, scikit-learn, Pandas, SQL, dan mungkin Flask, Spark dan/atau TensorFlow/PyTorch. Setidaknya, mereka harus menguasai bidang pemrograman data, komunikasi, matematika, statistik, dan ekonomi.
Pada uraian pekerjaan di atas tidak berdiri sendiri dalam semua kasus. Pada startup tahap awal, misalnya, seorang ilmuwan data mungkin harus menjadi insinyur data dan atau analis data. Tetapi sebagian besar pekerjaan akan jauh lebih rapi ke dalam salah satu kategori ini daripada yang lain. Dan semakin besar perusahaan tersebut, maka semakin banyak kategori ini dibutuhkan.
Orang-orang bekerja dalam mengolah data tidak boleh kehilangan fokus karena akan berakibat fatal dan tentu hal ini merupakan pekerjaan sulit. Sebagai contoh, beberapa perusahaan menerapkan model sederhana untuk dataset yang besar, beberapa menerapkan model yang kompleks untuk dataset kecil, beberapa melatih model mereka dengan cepat, dan beberapa tidak menggunakan model (konvensional) sama sekali.
Data Engineer
Data engineer bertugas untuk mengembangkan dan membuat desain arsitektur manajemen data dan memonitor infrastrukturnya di dalam sebuah perusahaan. Data Engineer akan mengelola jalur data untuk perusahaan yang menangani data dalam jumlah besar, juga harus memastikan bahwa data bisa dikumpulkan
dan diambil secara efisien dari sumber ketika dibutuhkan, dibersihkan dan diproses. Tujuannya adalah untuk membangun dan mengoptimalkan sistem perusahaan yang memungkinkan bagi data analyst dan data scientist menyelesaikan pekerjaan mereka. Data Engineer harus memiliki keahlian di bidang programming, big data, dan matematika.
Sebagai contoh pada sebuah restoran ternama, Data Engineer merupakan orang yang menyiapkan, memilih serta mengolah bahan terbaiknya untuk kemudian diberikan kepada chef yang paling hebat pada restoran tersebut. Disamping menyiapkan bahan-bahan yang terbaik, data engineer juga harus memastikan bahan tersebut tetap fresh dan bisa diambil kapanpun ketika chef tersebut membutuhkan.
Dalam hal ini untuk bisa mendapatkan bahan-bahan yang terbaik tersebut, makanya data engineer harus memiliki koneksi penjual agar bisa memperoleh bahan-bahan yang fresh dan terbaik. Dengan begitu data engineer harus memahami bagaimana mengatur arus atau proses pengantaran dari bahan tersebut agar sampai dalam keadaaan yang paling fresh.
Jika dilihat dari analogi tersebut dapat ditarik kesimpulan bahwa setiap individu data engineer merupakan sebagai penyedia data yang nanti akan diberikan pada Data Scientist (DS) dan Data Analyst (DA). Semua data yang nantinya diberikan kepada DS dan DA harus sesuai dengan apa yang dibutuhkannya, dan data-data tersebut harus 100% bersih dan benar.
Umumnya ketahui bahwa Data Engineer memiliki keterkaitan dengan istilah Pipeline dan juga Big Data. Bisa dikatakan bahwa Data Engineer merupakan sebagai pembuat infrastruktur dari proses bagaimana data yang didapatkan dan diolah itu sesuai dengan apa yang dibutuhkan oleh DS dan DA.
Tak hanya itu, Data Engineer juga harus memperhatikan dimana data tersebut harus disimpan dan juga bagaimana bentuk dari data tersebut. Seperti analogi di restoran tadi, Data Engineer harus memastikan dan memperhatikan dengan baik bagaimana data yang diambil tersebut baik dan kembali dengan bersih dan fresh. Bahkan jika data yang dikirimkan tersebut gagal hingga sampai tujuan juga merupakan tugas dari Data Engineer.
Data Engineer harus bisa menguasai Databases (NoSQL,RDBMS, Data Lake, Data Warehouse, etc), SQL, Pipeline (Kafka, Azkaban, Airflow, Luigi, etc), ETL Tools (Ab Initio, Pentaho, etc), dan pastinya pemrograman dasar serta shell script.
If you believe it,
You can Achieve it
Marketing Software House :
Metta B. Putra
Marketing Rep. Software House Jakarta :
Jalan Kelapa Sawit II Blok CC No. 8, Kelapa Gading, DKI Jakarta 14240
Workshop Software House Yogyakarta :
Jalan Wiratama TR III No. 392, Tegalrejo, Yogyakarta
Workshop Software House Indramayu :
Jalan Wiralodra No. 64, Lemahabang, Indramayu, Jawa Barat 45212