Engineer Tokopedia Berbagi Cerita Menangani dan Mengelola Insiden

Image title
Oleh Tim Publikasi Katadata - Tim Publikasi Katadata
30 Desember 2020, 11:07
Tokopedia
Katadata

Sebagai sebuah platform dengan total pengguna aktif sebanyak lebih dari 100 juta setiap bulan serta ekosistem yang membantu lebih dari 9,9 juta penjual untuk mewujudkan mimpi mereka, Tokopedia perlu menanamkan budaya yang dapat diimplementasikan pada setiap divisi dan tim di dalamnya agar selalu memberikan pengalaman dan pelayanan yang terbaik.

Melalui acara START Summit Extension yang diadakan pada 17 Desember 2020 lalu, para tim Engineer Tokopedia kembali hadir untuk membagikan praktik terbaik mereka dalam membangun dan meningkatkan budaya kewaspadaan terhadap sistem platform Tokopedia.

Advertisement

Dengan tema “High Severity! Behind Tokopedia’s Reliable Incident Management”, START Summit Extension Desember terbagi ke dalam beberapa sesi. Sebagai pembuka, Software Engineer Lead – Purchase Platform Tokopedia Timothy Agustian memberikan penjelasan tentang bagaimana budaya kerja yang diterapkan oleh setiap karyawan dapat membentuk keseharian tim Engineer.

Menurut Timothy, sebagai perusahaan yang dipercaya oleh jutaan penjual dan pembeli, seluruh tim teknologi Tokopedia memiliki tanggung jawab yang besar untuk mengelola setiap insiden yang terjadi.

Oleh karena itu, Tokopedia memiliki beberapa tahapan dalam mengelola insiden. Tahapan yang pertama adalah Preparation & Monitoring, di mana tahap ini merupakan fase pertama untuk mempersiapkan sistem ketika insiden belum terjadi. Fase ini adalah fase awal yang akan mempengaruhi fase-fase berikutnya. Timothy menjelaskan bahwa fase ini terbagi ke dalam beberapa poin penting, yakni:

Trained Team Member

Hal utama yang perlu disiapkan adalah melatih anggota tim. Bagi setiap developer, mereka harus memiliki pengetahuan dasar tentang use case yang perlu ditangani, serta infrastruktur dan bagaimana alur dari setiap bisnis secara umum untuk membantu mereka dalam mengidentifikasi masalah apa yang nantinya dapat terjadi, dan bagaimana mereka dapat menangani masalah tersebut.

One-Stop for All Team Documentation

Sebagai seorang developer yang sudah berpengalaman dan terbiasa menangani insiden, mengumpulkan dan membuat dokumentasi merupakan hal yang sangat penting sehingga segala informasi yang berkaitan dengan insiden manajemen dapat dengan mudah diakses oleh tim-tim member lainnya untuk dapat dijadikan acuan.

Good Monitoring Platform

Poin ini juga tak kalah penting, di mana tahap ini berguna untuk membantu kita mengetahui keadaan server atau bisnis secara real time, sehingga kita dapat memantau secara berkala dan mempersiapkan berbagai kemungkinan yang dapat terjadi.

Timothy melanjutkan tentang tahap kedua dalam proses mengelola insiden Tokopedia, yakni Alerting. Saat alarm sudah berbunyi, maka ini merupakan tanda bahwa terdapat suatu insiden. Insiden yang baik adalah jika alertingnya juga baik, sehingga kita dapat langsung mengetahui saat insiden terjadi dan tidak mengetahuinya dari pihak eksternal atau pengguna, melainkan dapat mengetahuinya terlebih dulu.

Halaman:
Editor: Doddy Rosadi
Berita Katadata.co.id di WhatsApp Anda

Dapatkan akses cepat ke berita terkini dan data berharga dari WhatsApp Channel Katadata.co.id

Ikuti kami

Artikel Terkait

Video Pilihan
Loading...
Advertisement