Monyet Huru-hara Dan Rantaian Bekalan Netflix

Saya baru-baru ini mengadakan perbualan dengan Carlos Crespo, Ketua Pegawai Operasi syarikat induk Zara Inditex, di mana beliau menyebut alat perisian yang dicipta oleh Netflix lebih sedekad yang lalu untuk menginstitusikan daya tahan sistem. Nama itu menarik, dan bagi pemimpin rantaian bekalan yang cuba mencipta semula rangkaian bekalan mereka untuk masa yang bergelora, ia tidak dapat dinafikan. Namun, GoogleGOOG
carian untuk "rantai bekalan huru-hara monyet" menghasilkan tepat satu petikan, mulai 2012.

Mengapa kita tidak menggunakan idea ini untuk daya tahan rantaian bekalan?

Apa itu Chaos Monkey?

Ia adalah satu alat perisian, dan secara lebih luas, prinsip kejuruteraan yang menutup secara rawak bahagian sistem kompleks yang memaksa pengendali pulih secara langsung. Semacam latihan kebakaran mengejut, tetapi setiap hari, dan dalam cara dan tempat rawak. Ideanya ialah menjadi mahir dalam menyelesaikan masalah sistem dengan pantas adalah satu proses pembelajaran yang seharusnya mendapat manfaat daripada keluk pembelajaran yang semakin meningkat.

Cerita belakang adalah tentang bagaimana Netflix meningkatkan perniagaan penstrimannya di Amazon Web Services sambil beralih daripada penghantaran DVD ke depan pintu pelanggan. Pada mulanya, ia adalah pendekatan logik kepada perancangan redundansi sistem, seperti apa yang anda harapkan daripada NASA, tetapi dalam praktiknya ia mengeksploitasi norma budaya Netflix yang membenarkan penyumbang individu menyelesaikan masalah mereka sendiri. Seperti yang diceritakan dalam "Kejuruteraan Kekacauan” sebuah buku 2020 oleh Casey Rosenthal dan Nora Jones yang mempelopori amalan di Netflix, ia berpunca kepada lima prinsip:

  • Bina hipotesis sekitar tingkah laku keadaan mantap
  • Pelbagaikan peristiwa dunia sebenar
  • Jalankan eksperimen dalam pengeluaran
  • Automatikkan percubaan untuk berjalan secara berterusan
  • Minimumkan jejari letupan

Gabungan budaya dan proses di Netflix adalah penting kerana ia memupuk dan memanfaatkan pendekatan penyelesaian masalah sumber terbuka, sambil memutarkan roda penutupan rawak secara sistematik mempercepatkan pembelajaran merentas pasukan lanjutan.

Ketahanan Rantaian Bekalan dan Kejuruteraan Kekacauan

Transformasi digital dalam rantaian bekalan menjadi hangat tahun ini kerana ia membantu rantaian bekalan menyokong model perniagaan baharu dan memacu ke arah operasi yang mampan (lihat kajian BCG X), tetapi juga kerana ia menjanjikan "ketahanan". Malangnya, aplikasi praktikal transformasi digital untuk daya tahan rantaian bekalan secara amnya masih bergantung kepada platform untuk "keterlihatan" yang lebih baik, disokong oleh sekumpulan taktik tradisional seperti penimbalan inventori dan dwi sumber. Menyokong pendekatan ini adalah satu lagi lapisan kerja analisis masa untuk pulih oleh David Simchi-Levi di MIT, dan gelombang simulasi menggunakan kembar digital. Itu semua kedengaran hebat, tetapi apa yang hilang ialah sebarang cara sistematik untuk bereksperimen dengan kegagalan rantaian bekalan sebenar untuk mempelajari cara terbaik untuk pulih dalam amalan.

Menggunakan Chaos Monkey pada Rantaian Bekalan

Doktor mengambil Sumpah Hippocratic sebelum memotong kami, termasuk yang terkenal "pertama-tama jangan membahayakan." Bukan idea yang buruk bagi sesiapa yang menggunakan prinsip Chaos Monkey pada rantaian bekalan, yang memerlukan secara rawak mematikan mesin sebenar di suatu tempat. Ini bukan perkara remeh, dan setahu saya, belum lagi berlaku di mana-mana.

  • Prinsip pertama yang disebut di atas mengatakan untuk menumpukan pada output sistem dan bukannya atribut dalaman. Sahkan bahawa sistem berfungsi dan bukannya cuba memahami sebab ia berfungsi.
  • Prinsip kedua mengatakan untuk memecahkan pelbagai perkara dengan cara yang realistik. Tidak perlu mensimulasikan perang termonuklear global, hanya matikan suis atau hilang pesanan dan pelajari penyelesaian yang paling berkesan.
  • Prinsip ketiga mengatakan tempat terbaik untuk belajar adalah dalam pengeluaran. Belajar dengan melakukan adalah lebih baik daripada belajar melalui simulasi - iaitu, kembar digital adalah hebat, tetapi mereka mungkin tidak mencukupi untuk membina budaya daya tahan.
  • Prinsip keempat menginstitusikan prinsip monyet huru-hara kerana ia membolehkan penskalaan proses percubaan, yang membawa anda ke keluk pembelajaran yang lebih curam. Gunakan sains data untuk memadam kebakaran.
  • Akhir sekali, kurangkan jejari letupan. Ini bermaksud "jangan membahayakan" dan diterjemahkan kepada sejenis penimbalan (inventori, masa utama, penghantaran dipercepatkan) untuk melindungi pelanggan daripada merasai percubaan anda. Belajar menguruskan letupan terkawal.

Seseorang boleh berhujah bahawa tiga tahun yang lalu Covid, perang, pergolakan buruh, dan kegawatan ekonomi telah menjadi satu kekacauan besar monyet jangka kering untuk semua orang. Pengajaran Netflix ialah bahawa krisis seperti ini bukan hanya sesuatu untuk dirancang, tetapi sesuatu untuk dikuasai sebagai fakta kehidupan yang kekal.

Badai yang sempurna mungkin tidak pernah berakhir, jadi mungkin kita harus belajar untuk mengharunginya.

Sumber: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/