Engineer Tokopedia Berbagi Cerita Menangani dan Mengelola Insiden

Image title
Oleh Tim Publikasi Katadata - Tim Publikasi Katadata
30 Desember 2020, 11:07
Tokopedia
Katadata

Dalam fase Alerting, poin yang juga tak kalah penting adalah Basic Knowledge Alarm, dimana setiap anggota tim perlu memiliki pengetahuan dasar untuk dapat mendefinisikan suatu alarm serta menentukan langkah apa yang harus segera dilakukan.

Setelah Basic Knowledge Alarm, Incident Management Platform juga dijelaskan sebagai poin yang perlu diperhatikan. Ketika terjadi insiden, kita perlu membuat jalur komunikasi yang baik untuk dapat langsung menghubungi pihak-pihak yang berkaitan dengan insiden tersebut.

Tahapan ketiga setelah Alerting adalah Triage & Notify yang dijelaskan oleh Danish Jatmiko, Engineering Manager – Order & Campaign Tokopedia.. Tahapan ini menjelaskan tentang apa yang perlu dilakukan saat insiden datang.

Danish menjelaskan bahwa hal pertama yang perlu dilakukan adalah menjaga agar tidak panik. Terlebih, seorang pemipin perlu mengendalikan dan mengatur situasi yang terjadi.  Sebagai contoh, ketika traffic sedang mengalami down, kita perlu tahu apa penyebabnya, apakah karena koneksi, PPN, atau servis lainnya.

Langkah yang tidak kalah pentingnya adalah bagaimana cara kita meredam atau menghentikan insiden yang terjadi sesegera mungkin. Setelah insiden dapat diatasi dan kembali normal, kita dapat mengetahui apa yang sebenarnya terjadi dan mencari tahu solusi jangka panjangnya.

Tahapan terakhir pada manajemen insiden adalah Post-Mortem Investigation and Resolution yang dijelaskan oleh Viriya Saddha Pannindriya, Software Engineer Lead – Order Tokopedia. Pada tahap ini, Viriya menjelaskan bahwa ketika mengalami insiden, kita menjadi panik dan mencari solusi dengan cara yang cepat.

Namun, solusi tersebut bisa jadi bukanlah solusi yang tepat dan benar-benar merupakan akar dari permasalahan tersebut. Kita harus terus menggali lebih dalam tentang root cause sehingga dapat menentukan solusi jangka panjang.

Oleh karena itu, penting untuk melihat masalah sampai ke akar agar dapat mengetahui seberapa luas isu yang dihadapi.  Viriya menjelaskan langkah terakhir yang ada pada tahapan Post-Mortem Investigation and Resolution yakni Documentation.

Pada fase ini, penting untuk menjaga bagaimana suatu insiden yang pernah terjadi tidak terjadi kembali di kemudian hari. Oleh karena itu, kita perlu membuat sebuah dokumentasi dari pengalaman atau insiden tersebut sebagai track record.

Sebagai penutup, Viriya membagikan kutipan yaitu “Organizational culture is a living creature and employees are the ones who faced it”. Kutipan ini memiliki makna bahwa setiap hal yang dilakukan oleh setiap tim yang ada di suatu perusahaan merupakan nilai yang mencerminkan perusahaan tersebut.

START Summit Extension Desember menutup akhir tahun dengan lebih dari 30 ribu penonton yang menyaksikan acara ini melalui Tokopedia Play. Di tahun 2021 mendatang, Tokopedia melalui Tokopedia Academy akan kembali menghadirkan rangkaian acara teknologi yang membagikan dan membawakan tema serta praktik terbaik untuk mendorong perkembangan talenta digital masa depan di Indonesia.

Halaman:
Editor: Doddy Rosadi
Berita Katadata.co.id di WhatsApp Anda

Dapatkan akses cepat ke berita terkini dan data berharga dari WhatsApp Channel Katadata.co.id

Ikuti kami

Artikel Terkait

Video Pilihan
Loading...