ABSTRAK
Optimasi Bayesian adalah algoritma optimasi kotak hitam global yang stokastik. Dengan menggabungkan Pembelajaran Mesin dengan pengambilan keputusan, algoritma tersebut dapat secara optimal memanfaatkan informasi yang diperoleh selama eksperimen untuk merencanakan eksperimen lebih lanjut—sambil menyeimbangkan eksplorasi dan eksploitasi. Meskipun Desain Eksperimen secara tradisional telah menjadi metode yang disukai untuk mengoptimalkan bioproses, alat yang digerakkan oleh AI baru-baru ini semakin menarik perhatian pada optimasi Bayesian dalam rekayasa bioproses. Tinjauan ini menyajikan prinsip dan metodologi optimasi Bayesian dan berfokus pada penerapannya pada berbagai tahap rekayasa bioproses dalam pemrosesan hulu dan hilir.
1 Pendahuluan
Dalam sains dan teknik, kemajuan dan penemuan pengetahuan baru bergantung pada penyelidikan eksperimental sistematis terhadap sistem yang kompleks. Terutama dalam sistem biologis, di mana akurasi prediksi hasil eksperimen sangat bergantung pada data, pendekatan terhadap eksperimen telah berkembang secara signifikan dari waktu ke waktu. Desain eksperimen sistematis yang paling mudah adalah pendekatan One-Factor-At-a-Time (OFAT), yang melibatkan perubahan satu variabel dalam suatu sistem sambil menjaga variabel lain tetap konstan dan mengamati respons sistem terhadap setiap perubahan (Daniel 1973). Namun, meskipun mudah dan intuitif, berdasarkan desain, efek hanya satu variabel pada sistem diamati (Razavi dan Gupta 2015). Lebih jauh lagi, keterbatasan eksperimen yang dapat dieksekusi secara manual dengan cepat tercapai dalam sistem multifaktorial, karena jumlah total eksperimen meningkat secara eksponensial dengan jumlah parameter yang akan disaring. Hal ini mengarah pada metode Desain Eksperimen (DoE) statistik, yang merupakan peningkatan signifikan yang diperkenalkan oleh Ronald Fisher pada tahun 1935 (Fisher 1935) dan disempurnakan lebih lanjut oleh George Box pada tahun 1951 (Box dan Wilson 1951). Dengan memperkenalkan model permukaan respons, DoE menjadi desain eksperimental dan standar pengoptimalan baru.
Secara umum, model permukaan respons adalah representasi empiris dari efek beberapa variabel input pada kecocokan respons target menggunakan teknik regresi berdasarkan data eksperimen. Pilihan antara bentuk model linier, polinomial, atau model lainnya bergantung pada kompleksitas proses yang dipelajari. Pilihan ini secara langsung memengaruhi strategi pengambilan sampel, mulai dari desain faktorial penuh untuk sistem sederhana hingga desain faktorial fraksional atau komposit sentral untuk interaksi yang lebih kompleks. Desain faktorial penuh mencakup semua kombinasi faktor tetapi sering kali tidak praktis untuk studi dengan banyak variabel, yang mengarah pada penggunaan desain fraksional yang mengambil sampel dari sebagian kombinasi untuk mengidentifikasi efek dan interaksi utama secara efisien. Desain komposit sentral semakin menyempurnakan pendekatan untuk model kuadrat, mengoptimalkan eksplorasi hubungan nonlinier (Szpisják-Gulyá 2023).
Namun, keterbatasan DoE adalah memerlukan model matematika yang telah ditentukan sebelumnya, seperti linier atau polinomial, sejak awal. Hal ini menciptakan bias yang mungkin tidak secara akurat mencerminkan dinamika sistem yang mendasarinya (Razavi dan Gupta 2015). Lebih jauh lagi, metode DoE tradisional mengintegrasikan pengambilan sampel dan analisis hasil secara ketat, sehingga membatasi fleksibilitas untuk beradaptasi dengan temuan baru selama proses eksperimen. Pendekatan ini dapat membatasi respons terhadap temuan baru, sehingga menghambat penyesuaian langsung berdasarkan hasil eksperimen (Greenhill et al. 2020). Ekstensi iteratif dari metode DoE klasik, seperti desain optimal berurutan mengatasi masalah ini dengan menggabungkan data baru ke dalam proses desain (Goos 2006; Wynn 1970). Pendekatan ini meningkatkan akurasi dan efisiensi model dalam mengidentifikasi solusi optimal. Namun, melengkapi metode DoE tradisional dan iteratif, metodologi eksperimen adaptif menyediakan kerangka kerja yang lebih luas yang berkembang berdasarkan data dan wawasan waktu nyata. Metodologi adaptif sering kali melampaui penyempurnaan model untuk secara eksplisit memandu eksplorasi dan eksploitasi dalam desain eksperimental. Pendekatan adaptif ini memungkinkan para ilmuwan untuk menyesuaikan diri dengan temuan baru selama eksperimen. Sampel berikut dapat diambil dari area yang sebelumnya belum dieksplorasi yang kemungkinan akan menghasilkan nilai maksimum atau minimum atau mewakili kompromi. Metode pengambilan sampel adaptif dapat mengarah pada penemuan solusi optimal lebih cepat sambil mengurangi jumlah eksperimen (Jin dan Kumar 2023).
Dalam beberapa tahun terakhir, optimasi Bayesian (BO) telah muncul sebagai perkembangan logis ke metode DoE tradisional. Awalnya didalilkan oleh Jonas Mockus pada tahun 1975 (Močkus 1975) dan mendapatkan keunggulan pada tahun 2010-an untuk mengoptimalkan hiperparameter jaringan saraf (Snoek et al. 2012), BO mengintegrasikan Pembelajaran Mesin dengan pengambilan sampel adaptif ke dalam algoritma optimasi global berbasis model yang fleksibel. BO, seperti DoE, bergantung pada model matematika yang mendasarinya. Sering kali, model ini berbentuk proses Gaussian (GP), yang merupakan model nonparametrik yang sangat fleksibel yang mampu merepresentasikan hubungan nonlinier yang kompleks tanpa memerlukan bentuk fungsional yang telah ditentukan sebelumnya. Model ini sangat efektif dengan kumpulan data kecil dan gangguan stokastik, sementara kemampuannya untuk mengukur ketidakpastian memungkinkan BO untuk menyeimbangkan eksplorasi dan eksploitasi secara dinamis selama pengoptimalan. Hal ini membuat BO efisien dalam mengidentifikasi solusi optimal dengan upaya eksperimental yang minimal (Frazier 2018).
Fleksibilitas dan kemanjuran BO dalam mengatasi tantangan pengoptimalan yang kompleks telah ditunjukkan di berbagai bidang, termasuk ilmu material (Jin dan Kumar 2023; Zhang 2021; Rohr et al. 2020; Chepiga 2023; Frazier dan Wang 2015), reaksi kimia (Pickles 2024; Zhang 2024), rekayasa protein (Hu et al. 2023), ilmu saraf (Choinière 2 )
2 Optimalisasi Bayesian: Pendekatan Berbasis Model Sekuensial
BO adalah kerangka kerja optimalisasi global tingkat lanjut yang menggabungkan fungsi pengganti probabilistik dan fungsi akuisisi. Fungsi pengganti memperkirakan perilaku fungsi objektif menggunakan data yang ada, mengubah fungsi objektif menjadi pengganti yang lebih mudah dievaluasi. Sebaliknya, fungsi akuisisi secara strategis menentukan titik pengambilan sampel baru, menyeimbangkan eksplorasi area baru dengan eksploitasi wilayah bernilai tinggi yang diketahui yang dipandu oleh model pengganti.
Ide utama BO terletak pada teorema Bayes (Bayes 1763)
2.1 Fungsi Pengganti
BO menggunakan model pengganti untuk memperkirakan fungsi kotak hitam yang tidak diketahui f, dengan model GP menjadi yang paling populer karena elemen alami kuantifikasi ketidakpastian dan fleksibilitasnya (Rasmussen dan Williams 2006). Model pengganti GP didefinisikan oleh fungsi rata-rata m(x) dan fungsi kovarians, atau kernel, k(x,x′), yang diartikulasikan sebagai
Fungsi rata-rata m(x) merepresentasikan output rata-rata fungsi f(x) di seluruh ruang desain, yang sering diasumsikan sebagai nol demi kesederhanaan dalam banyak aplikasi.
Fungsi kernel k(x,x′) mendefinisikan kovariansi antara dua titik x dan x′ di ruang input, yang menangkap ukuran kesamaan di antara keduanya. Kesamaan ini menentukan bagaimana hubungan dalam data dimodelkan, yang memengaruhi kemampuan GP untuk merepresentasikan kelancaran dan variabilitas dalam f(x) (Garnett 2023). Kernel sangat kuat karena secara implisit memetakan input ke dalam ruang fitur berdimensi tinggi (atau bahkan berdimensi tak terhingga) tanpa secara eksplisit melakukan transformasi. Hal ini dicapai melalui trik kernel, di mana fungsi kernel secara langsung menghitung produk dalam di ruang fitur. Dengan cara ini, pola nonlinier yang kompleks dalam ruang input dapat direpresentasikan sebagai hubungan linier yang lebih sederhana dalam ruang fitur implisit, yang memungkinkan GP untuk memodelkan berbagai perilaku fungsional tanpa memerlukan parameterisasi eksplisit f(x) (Rasmussen dan Williams 2006).
Pilihan kernel mengatur fleksibilitas dan kemampuan beradaptasi GP, dengan kernel yang berbeda mengkodekan asumsi tentang kelancaran, variabilitas, atau periodisitas (Rasmussen dan Williams 2006). Misalnya, kernel yang umum digunakan adalah fungsi eksponensial kuadrat (SE), yang juga dikenal sebagai fungsi basis radial (RBF), yang didefinisikan sebagai
di mana θ adalah parameter skala panjang yang mengendalikan kelancaran fungsi. Kelas kernel penting lainnya adalah kernel Matérn, generalisasi dari kernel RBF, yang menyediakan fleksibilitas tambahan melalui parameter kelancaran ν (Rasmussen dan Williams 2006). Parameter ini mengendalikan diferensiabilitas fungsi yang dimodelkan dan varian kernel Matérn yang sangat berguna terjadi ketika ν = 5/2. Kasus khusus ini menawarkan keseimbangan yang baik antara kelancaran dan ketertelusuran komputasional dan juga umum digunakan selain RBF (Snoek et al. 2012).
Sementara GP sangat fleksibel dan efektif, skala biaya komputasionalnya secara kubik (O(n3)) dengan jumlah titik data n. Ini karena GP melibatkan inversi matriks kovariansi n × n selama pelatihan, membuatnya kurang cocok untuk kumpulan data yang sangat besar. Perkiraan seperti sparse GP atau metode titik induksi dapat mengurangi masalah ini, tetapi trade-off dalam akurasi dapat terjadi (Csató dan Opper 2002; Wang dan Chen 2023).
Karena BO bergantung pada kemampuan model untuk mengukur ketidakpastian guna mencari solusi optimal secara efisien, setiap model yang menawarkan kemampuan ini dapat digunakan sebagai pengganti. Meskipun GP sering kali menjadi pilihan yang lebih disukai karena sifat probabilistiknya yang inheren, model lain seperti Random forest (Qi et al. 2024) dan jaringan saraf Bayesian (Snoek 2015) dapat diadaptasi untuk BO. Selain itu, metode deep ensemble dapat memberikan perkiraan ketidakpastian dengan menganalisis varians dalam prediksi dari beberapa model. Bahkan model non-probabilistik dapat diintegrasikan ke dalam BO menggunakan metode pengganti atau kesalahan prediksi untuk memperkirakan ketidakpastian (Westermann dan Evins 2020).
Perlu dicatat bahwa keandalan kuantifikasi ketidakpastian sangat bergantung pada pilihan hiperparameter, prior, dan struktur model. Sementara rutinitas pengoptimalan seperti pemaksimalan kemungkinan marjinal mengurangi subjektivitas, pilihan ini masih bergantung pada pengetahuan dan asumsi domain, yang dapat memengaruhi hasil (Snoek et al. 2012).
2.2 Fungsi Akuisisi
Sebagai strategi pengambilan keputusan, fungsi akuisisi dalam BO menentukan titik berikutnya untuk ditanyakan dalam proses pengoptimalan. Fungsi ini menggunakan prediksi mean µ(x) dan ketidakpastian σ(x) dari model GP sebagai dasar untuk pengoptimalan. Keseimbangan biasanya dicari antara mengeksploitasi area dengan mean objektif tinggi yang diketahui dan menjelajahi wilayah dengan ketidakpastian yang signifikan (Greenhill et al. 2020). Prinsipnya diilustrasikan dalam Gambar 2. Berdasarkan trade-off ini, fungsi akuisisi diklasifikasikan ke dalam tiga kategori utama: berbasis perbaikan, optimis, dan berbasis informasi (Jin dan Kumar 2023).
2.3 Metode Lanjutan dalam Optimasi Bayesian
Proses iteratif inti BO telah diadaptasi dan diperluas untuk memenuhi tantangan yang dihadirkan oleh berbagai masalah dunia nyata. Prinsip-prinsip terpenting disajikan dalam bagian ini. Namun, penjelasan mendalam dapat ditemukan dalam tinjauan berikut (Greenhill et al. 2020; Jin dan Kumar 2023; Shahriari 2016; Wang 2023).
Menggabungkan Pengetahuan Sebelumnya. Memanfaatkan pengetahuan sebelumnya dalam kerangka kerja BO dapat secara signifikan meningkatkan efisiensi optimasi dengan mengurangi kompleksitas pencarian. Karena teorema Bayes pada dasarnya adalah tentang memperbarui pengetahuan, misalnya, data serupa dari eksperimen sebelumnya dapat digunakan sebagai prior dan dimanfaatkan dengan cara yang berbeda (Joy 2019). Lebih jauh, model proses Gaussian seperti itu menawarkan mekanisme untuk memasukkan pengetahuan ahli, misalnya, dengan mengedit kernel atau fungsi mean itu sendiri (Nguyen et al. 2023).
Ruang Tipe Campuran. Banyak masalah optimasi yang melibatkan berbagai jenis variabel input (kontinu, diskrit, kategoris, dan biner). BO telah diadaptasi untuk menangani berbagai jenis input tersebut melalui berbagai metode, seperti pengodean one-hot, modifikasi kernel untuk mengakomodasi berbagai jenis variabel, atau menggunakan model pengganti seperti Random forest yang secara alami menangani berbagai input (Shields et al. 2021).
Dimensi Tinggi. Secara umum, kinerja BO menurun di atas 20 dimensi (Greenhill et al. 2020). Strategi untuk mengurangi hal ini meliputi pengurangan ruang desain, penyaringan variabel untuk mengidentifikasi variabel yang paling berpengaruh, penguraian masalah menjadi sub-masalah yang lebih sederhana, atau penggunaan teknik pengurangan dimensionalitas. Kernel khusus dan metode aproksimasi telah dikembangkan untuk memungkinkan BO dalam ruang berdimensi lebih tinggi.
Optimasi Multi-Objektif. Masalah desain sering kali mencakup beberapa tujuan yang saling bertentangan. BO telah diadaptasi untuk menangani skenario tersebut melalui konsep optimasi Pareto, di mana serangkaian titik optimal diidentifikasi sehingga tidak ada satu pun tujuan yang dapat ditingkatkan tanpa merugikan yang lain. Pendekatan ini memerlukan penyeimbangan antara tujuan dan sering kali melibatkan konstruksi front Pareto untuk memandu proses pengoptimalan (Bradford et al. 2018).
Kendala. Masalah pengoptimalan di dunia nyata sering kali disertai berbagai kendala, termasuk kendala ketidaksetaraan dan kesetaraan, serta kendala “kotak hitam” yang bentuknya tidak diketahui. Metode BO telah berkembang untuk memasukkan kendala tersebut ke dalam proses pengoptimalan, baik dengan memodifikasi fungsi akuisisi atau menggunakan strategi seperti metode Lagrangian Tertambah untuk mengubah masalah pengoptimalan yang dibatasi menjadi yang tidak dibatasi (Picheny 2016; Letham et al. 2019).
Optimalisasi Paralel (Batch). Dalam skenario di mana beberapa eksperimen dapat dilakukan secara bersamaan, BO telah diperluas untuk merekomendasikan batch pengaturan eksperimen. Pendekatan ini melibatkan pemilihan beberapa titik untuk dievaluasi secara paralel, menggunakan teknik seperti penekanan atau penalti lokal dalam fungsi akuisisi untuk memperhitungkan eksplorasi simultan dari beberapa titik (Gonzalez 2015).
Optimasi Multi-Fidelitas (Multi-informasi). Jika evaluasi fidelitas tinggi mahal, BO dapat memanfaatkan model multi-fidelitas yang menggabungkan hasil eksperimen fidelitas tinggi dengan informasi fidelitas rendah. Itu bisa berupa simulasi, prediksi, atau pengukuran yang lebih murah tetapi lebih bising. Pendekatan ini memungkinkan pencarian yang efisien dengan memanfaatkan evaluasi fidelitas rendah yang mudah digunakan untuk memandu eksplorasi dan memanfaatkan evaluasi fidelitas tinggi yang lebih mahal (Cosenza et al. 2022).
3 Contoh Aplikasi BO dalam Rekayasa Bioproses
Gambaran umum beberapa studi tentang aplikasi BO dalam rekayasa bioproses yang diterbitkan dalam 7 tahun terakhir diberikan di bagian ini. Studi yang dipilih disusun berdasarkan unit operasinya masing-masing.
3.1 Pemrosesan Hulu
3.1.1 Optimasi Media
Yoshida dkk. mengoptimalkan media sintetis untuk ekspresi protein berbasis plasmid dalam Escherichia coli menggunakan 31 komponen media yang berbeda (Yoshida dkk. 2023). Dengan desain eksperimen Latin Hypercube, 81 kultivasi dilakukan dalam skala sumur dalam, dan fluoresensi GFP diukur sebagai respons terhadap tingkat ekspresi protein. Set data yang dihasilkan, yang terdiri dari konsentrasi komponen media dan intensitas fluoresensi, digunakan untuk melatih jaringan saraf dalam (DNN) dan menunjukkan hasil yang menjanjikan setelah pelatihan ulang kedua. DNN ini digunakan sebagai dasar untuk dioptimalkan oleh BO, dengan algoritme yang menyarankan 20 komposisi media baru. Dengan pendekatan ini, penulis mengubah masalah menjadi representasi digital, dengan fokus pada pengoptimalan simulasi masalah alih-alih terlibat dalam siklus eksperimen dan penilaian ulang laboratorium yang berkelanjutan. Fluoresensi GFP akhir menunjukkan intensitas 1,4 kali lebih tinggi daripada yang terbaik dari set data awal dan divalidasi dalam skala yang lebih besar.
Dalam pendekatan mereka untuk mengoptimalkan media kultur sel untuk pertanian seluler, Consenza dkk. menemukan keterbatasan dalam penelitian sebelumnya yang menentukan pertumbuhan multi-passage (Cosenza dkk. 2021). Oleh karena itu, para peneliti menggunakan algoritma BO multi-sumber informasi dalam pendekatan baru. Metode ini menggabungkan pengujian fidelitas rendah, seperti pewarnaan AlamarBlue dan LIVE/DEAD, yang menawarkan estimasi biomassa yang hemat biaya, dengan pengukuran fidelitas tinggi seperti penghitungan sel pengecualian trypan blue (Cosenza dkk. 2022). Algoritma ini bertujuan untuk memaksimalkan pertumbuhan sel sambil meminimalkan biaya media. Pengoptimalan 14 komponen media untuk sel C2C12 tikus menghasilkan formulasi media yang secara signifikan mengungguli media komersial umum dalam mendukung proliferasi sel, mencapai peningkatan jumlah sel sebesar 181% dengan 38% lebih sedikit eksperimen dibandingkan dengan metode DoE tradisional. Media ini juga menunjukkan kinerja yang kuat dalam pertumbuhan jangka panjang di beberapa lintasan sel.
Serupa dengan itu, sebagai perluasan dari BO multiinformasi mereka, Cosenza dkk. juga menggunakan BO multiinformasi multiobjektif untuk mengembangkan media bebas serum yang diuji dengan sel C2C12 tikus untuk aplikasi pertanian seluler (Cosenza 2023). Tujuannya adalah memaksimalkan pertumbuhan sel sambil mencapai minimalisasi biaya, penulis menemukan media dengan pertumbuhan dua kali lipat daripada kontrol.
3.1.2 Kultur Sel
Claes dkk. mengeksplorasi kemanjuran BO untuk pengoptimalan bioproses, dengan fokus khusus pada aplikasinya dalam pembuatan terapi sel dalam kondisi gangguan eksperimen yang sengaja divariasikan dan kebutuhan untuk eksperimen paralel (Claes dkk. 2024). Penelitian ini menilai kinerja BO melalui evaluasi pada dua model bioproses in silico dan selanjutnya menunjukkan penerapannya dalam pemurnian monosit in vitro. Analisis in silico pertama mengungkapkan bahwa BO mengungguli standar industri DoE saat ini, yang membutuhkan sekitar 50% lebih sedikit eksperimen untuk mencapai tujuan pengoptimalan yang serupa. Secara khusus, metodologi BO terbukti mengurangi beban eksperimen sekitar 69% untuk pengoptimalan proses antibodi monoklonal (mAb), yang mencapai hasil produk yang sebanding hanya dengan 14 eksperimen, dibandingkan dengan 45 eksperimen yang diperlukan oleh metodologi permukaan respons tradisional. Untuk aplikasi in vitro, pengoptimalan proses pemurnian monosit melalui sentrifugasi sel aliran berlawanan dioptimalkan menggunakan BO. Aplikasi praktis ini meningkatkan pemulihan monosit dari 46% menjadi 82% sambil mempertahankan tingkat kemurnian 78%, semuanya dalam kerangka 10 kali percobaan. Aplikasi ini memamerkan kemampuan BO untuk menavigasi lanskap pengoptimalan bioproses yang kompleks secara efisien dan menunjukkan potensinya untuk secara signifikan mengurangi konsumsi sumber daya dan mempercepat jadwal pengembangan dalam pembuatan terapi sel.
Bader dkk. BO terapan untuk mengoptimalkan produksi vesikel ekstraseluler dari kultur 3D sel punca mesenkimal (Bader 2023). Empat parameter dipertimbangkan dalam pengoptimalan proses, yaitu konsentrasi pembawa mikro, kepadatan penyemaian, waktu sentrifugasi, dan kecepatan impeller, untuk mengoptimalkan tiga tujuan: memaksimalkan aktivitas enzimatik protein MSG-EV CD73, memaksimalkan rasio vesikel terhadap protein, dan meminimalkan jumlah pengotor kalregulin. Hal ini dicapai dengan menggunakan algoritma BO batch multi-objektif dalam 32 (4 × 8) percobaan. Rangkaian pertama dari delapan percobaan direncanakan menggunakan desain Latin Hypercube dan digunakan untuk pemodelan proses Gaussian awal. Desain DoE yang sebanding terletak dalam 27–81 percobaan untuk desain percobaan yang berbeda. Para penulis juga mencatat bahwa
3.1.3 Fermentation
Eskanderi et al. demonstrated the application of multi-fidelity BO to optimize the gas conversion rate in an industrial-scale bioreactor for syngas fermentation using a high-fidelity computational fluid dynamics model leveraged with a simpler, ideal-mixing-based model (Eskandari et al. 2023). Furthermore, Thompson et al. developed a physically constrained neural network and combined it with an expected information gain acquisition function to optimize the operating conditions of a bioreactor for microbial communities (Thompson et al. 2023).
3.1.4 Pengoptimalan Reaksi
Rosa dkk. mengoptimalkan satu set yang terdiri dari 12 parameter reaksi untuk memaksimalkan konsentrasi mRNA melalui reaksi transkripsi in vitro (Rosa 2022). Penulis dapat mengoptimalkan reaksi dengan menerapkan teknik pengoptimalan batch dari tiga hingga lima titik pengambilan sampel, yang menghasilkan konsentrasi mRNA akhir sebesar 12 g/L, yang merupakan peningkatan dua kali lipat dalam setengah waktu yang berbeda dengan standar industri yang dipublikasikan. Sebanyak 60 eksperimen dilakukan, dengan 16 eksperimen awal dalam desain Latin Hypercube. Lebih jauh, penulis membahas keterbatasan mendasar GP yang relatif terhadap DoE: interpretabilitasnya. Hal ini dicapai dengan menggunakan model penjelasan berdasarkan nilai Shapley, yang memberi penulis wawasan yang lebih dalam dan penjelasan yang lebih transparan.
Dalam studi mereka tentang pengoptimalan delignifikasi kayu alkali, Rummukainen dkk. secara langsung membandingkan DoE dan BO. Mereka menemukan bahwa pilihan eksperimen awal dapat secara signifikan memengaruhi algoritme BO dalam mengidentifikasi kondisi optimal dengan cepat. Lebih jauh, peningkatan noise pengukuran juga memperlambat kemajuannya. Optimasi Bayesian masih memberikan model yang lebih tepat mendekati optimum jika dibandingkan dengan model permukaan respons, namun, dalam studi mereka, jumlah keseluruhan eksperimen yang diperlukan tidak dapat dikurangi dibandingkan dengan DoE. Penulis menyarankan untuk menggabungkan DoE dan BO: menggunakan desain pengisian ruang dan desain optimal dapat membantu memilih eksperimen awal yang disempurnakan lebih lanjut oleh BO (Rummukainen 2024).
3.2 Pemrosesan Hilir
3.2.1 Formulasi
Narayanan dkk. mengoptimalkan tiga varian berbeda dari fragmen variabel rantai tunggal tandem (scFv) yang berasal dari antibodi Humira, dengan mempertimbangkan delapan senyawa sistem penyangga sebagai variabel independen untuk memaksimalkan stabilitas termal, atau tepatnya, suhu leleh Tm (Narayanan 2021). 20 eksperimen awal dalam desain eksperimen Latin Hypercube digunakan untuk membangun model. Dua siklus lainnya dilakukan dalam mode batch hingga total 25 eksperimen dilakukan untuk menemukan optimum. Dibandingkan dengan desain DoE yang berbeda, 64–128 eksperimen diperlukan untuk menemukan optimum ini. Setelah awalnya memilih rentang parameter yang agak konservatif, penulis juga menyelidiki ruang desain dalam rentang parameter yang diperluas. Untuk memfasilitasi hal ini, eksperimen yang telah dilakukan dimanfaatkan sebagai “keyakinan awal” untuk diintegrasikan ke dalam siklus BO, suatu pendekatan yang tidak layak dengan DoE tradisional. Selain itu, pendekatan multi-objektif dilakukan untuk memaksimalkan suhu leleh dan stabilitas antarmuka dari satu varian scFv. Dengan 15 eksperimen awal, total 33 eksperimen dilakukan untuk mengidentifikasi front Pareto.
Sano dkk. menerapkan BO pada pengembangan produk farmasi untuk menyempurnakan formulasi dan metode pembuatan tablet yang hancur secara oral (Sano dkk. 2020). Dengan memanfaatkan set data yang telah dipublikasikan yang disempurnakan dengan penambahan data dari DoE melalui simulasi jaringan saraf tiruan, penelitian ini berupaya meminimalkan eksperimen yang tidak perlu dan mempercepat pengembangan metode. Alih-alih memperkirakan front Pareto, beberapa tujuan dioptimalkan dengan memperkenalkan skor yang ditentukan secara matematis sebagai trade-off dari dua target, kekuatan tarik, dan waktu hancur. Temuan studi menunjukkan bahwa BO dapat mengurangi beban kerja eksperimen secara signifikan, memangkas jumlah eksperimen yang diperlukan dari sekitar 25, seperti yang dipersyaratkan oleh desain DoE komposit pusat, menjadi hanya 10. Peningkatan efisiensi ini juga dikaitkan dengan penyetelan hiperparameter berulang dalam proses BO, yang membantu menstabilkan variasi kinerja di berbagai skenario pengoptimalan dan meningkatkan kinerja rata-rata secara keseluruhan. Penelitian mereka menggarisbawahi potensi BO untuk mengurangi ketergantungan pada keahlian individu dalam pengembangan farmasi, meningkatkan efisiensi dan efektivitas tugas pengoptimalan.
4 BO Hari Ini dan Masa Depan: Alat, Teknik, dan Lintasan
4.1 Kekuatan dan Keterbatasan BO Dibandingkan dengan DoE
Melakukan pencarian literatur dalam basis data Scopus dengan istilah “Bioproses” dan “Desain Eksperimen” menunjukkan peningkatan publikasi yang stabil dari 5 pada tahun 2009 hingga 61 pada tahun 2024 (Kasemiire 2021). Untuk pencarian analog yang hanya menggunakan kata kunci “Optimasi Bayesian” dan “Bioproses,” jumlah total yang dapat ditemukan adalah 22. Mempertimbangkan hanya artikel-artikel yang benar-benar menerapkan BO untuk memandu eksperimen dalam konteks optimasi bioproses menyisakan lebih sedikit lagi. Hal ini tampaknya agak mengejutkan, karena sebagian besar penelitian yang membandingkannya dengan standar industri DoE melaporkan perlunya lebih sedikit eksperimen dan hasil yang lebih baik.
Namun, beberapa faktor dapat menjelaskan adopsi BO yang lebih lambat dibandingkan dengan DoE. Tidak seperti DoE, yang mengandalkan metodologi statistik yang mapan dan diterapkan secara luas dalam industri dan akademis, BO menuntut pemahaman yang lebih mendalam tentang model probabilistik, konsep pembelajaran mesin, dan penyetelan hiperparameter. Kompleksitas ini mungkin menjadi penghalang bagi para eksperimentalis tanpa pengalaman sebelumnya di bidang ini. Selain itu, DoE menawarkan kesederhanaan dan interpretabilitas, yang membuatnya sangat berharga dalam pengaturan regulasi. Sifat deterministik dan desain eksperimental yang tetap mudah dikomunikasikan dan divalidasi, terutama dalam industri di mana persetujuan regulasi memerlukan transparansi. BO, meskipun menawarkan fleksibilitas dan adaptabilitas yang lebih besar, biasanya bergantung pada model kotak hitam yang lebih sulit untuk ditafsirkan dan divalidasi untuk tujuan tersebut. Perbedaan penting lainnya adalah kesesuaiannya untuk sistem eksperimental yang berbeda. BO cocok untuk masalah dan skenario nonlinier dengan ruang desain yang bising atau kompleks. Untuk sistem berskala lebih kecil dan berkarakterisasi dengan baik dengan tujuan yang relatif lebih sederhana, DoE dapat memberikan hasil yang sebanding sekaligus lebih mudah diimplementasikan. Namun, BO memiliki keuntungan dalam memanfaatkan pengetahuan sebelumnya dengan menggabungkan data yang ada secara langsung ke dalam model probabilistiknya. Meskipun DoE juga dapat mencakup desain berurutan, biasanya DoE bergantung pada asumsi dan bentuk model yang telah ditetapkan sebelumnya, sehingga membatasi kemampuannya untuk beradaptasi secara dinamis terhadap wawasan baru. Terakhir, pertimbangan praktis, seperti ketersediaan perangkat lunak, juga dapat memengaruhi pilihan.
4.2 Perangkat Lunak
DoE diimplementasikan dengan sangat baik dalam berbagai rangkaian perangkat lunak komersial, menyediakan dokumentasi yang baik dan antarmuka pengguna generik yang mudah digunakan. Ini belum berlaku untuk BO. Di sini, implementasi terutama ditemukan di pustaka perangkat lunak sumber terbuka untuk berbagai bahasa pemrograman seperti Python, Matlab, R, atau Julia, yang terutama ditujukan untuk tujuan penelitian. Tabel 1 mengilustrasikan berbagai paket BO yang digunakan dalam contoh yang kami rujuk. Menjadi area penelitian yang sangat aktif menimbulkan tantangan lain bagi para eksperimentalis: tidak ada satu platform pun yang saat ini memuat semua kemajuan terkini di bidang tersebut. Akibatnya, Wang dan Dowling merekomendasikan agar para eksperimentalis tidak berkomitmen pada satu solusi perangkat lunak BO tanpa terlebih dahulu membandingkan fitur, dokumentasi, dan tutorial dari beberapa platform (Wang dan Dowling 2022). Tinjauan umum berbagai paket perangkat lunak dan contoh kode telah diberikan dalam literatur beberapa kali dan dapat ditemukan dalam tinjauan berikut (Jin dan Kumar 2023; Zhang 2021; Wang dan Dowling 2022). Namun, perlu disebutkan beberapa paket yang baru-baru ini diterbitkan yang ditargetkan untuk kampanye eksperimental dunia nyata, menurunkan hambatan bagi para eksperimentalis secara signifikan dan mendukung banyak fungsi di luar kotak. Beberapa di antaranya dikembangkan oleh produsen industri seperti BayBE, yang dikembangkan oleh Merck KGaA (Fitzner 2024), Obsidian yang dikembangkan oleh Merck & Co. Inc. (Stone dan Xu 2024), atau ProcessOptimizer yang dikembangkan oleh Novo Nordisk (Obdrup 2024). Kadang-kadang, penyedia perangkat lunak industri juga tampaknya menambahkan BO ke portofolio produk mereka (Eksperimen AI di Benchling 2024; Analisis Data Bioproses Bayesian dalam R&D dan manufaktur GMP 2024; Desice 2024). Munculnya alat-alat ini menyoroti meningkatnya minat untuk membuat BO dapat diakses oleh khalayak yang lebih luas. Para penulis memperkirakan akan melihat lebih banyak solusi perangkat lunak di masa mendatang dan karena itu menduga penerapan BO akan meningkat.
4.3 Menuju Eksperimen Otonom dengan Bayesian
4.3.1 Optimasi
BO juga telah mendapatkan banyak perhatian dalam konteks eksperimen otonom. Karena karakter siklusnya dan kecerdasan pengambilan keputusan yang terintegrasi, robot dapat dilengkapi dengan algoritma yang memungkinkan mereka untuk memandu eksperimen secara independen, setelah eksperimen direncanakan. Contoh penting dari kimia menunjukkan optimasi fotokatalis untuk produksi hidrogen oleh robot yang beroperasi selama 8 hari secara otonom melakukan hampir 700 eksperimen untuk mengeksplorasi ruang desain sepuluh dimensi (Burger 2020). Dalam rekayasa bioproses, beberapa contoh penyaringan throughput tinggi yang dikombinasikan dengan pengambilan keputusan yang dibantu model telah ditunjukkan: Kanda dkk. mengembangkan sistem AI robot otonom yang dilengkapi dengan algoritma optimasi Bayesian batch (Genki dan Kanda 2022). Sistem ini bertugas mengoptimalkan induksi diferensiasi dari sel punca pluripoten terinduksi (iPSC) ke sel epitel pigmen retina (RPE). Bahasa Indonesia: Ia menguji 143 kondisi berbeda selama 111 hari, menavigasi melalui 200 juta pengaturan eksperimen potensial. Hasilnya menunjukkan peningkatan 88% dalam produksi sel iPSCRPE dalam hal skor pigmentasi dibandingkan dengan kultur manual terbaik yang ditetapkan sebelumnya. Helleckes dkk. berfokus pada peningkatan sekresi enzim PETase oleh Corynebacterium glutamicum untuk biodegradasi plastik polietilen tereftalat (PET) (Helleckes dkk. 2023). Mereka memperkenalkan strategi penyaringan berbasis probabilitas yang menggabungkan otomatisasi laboratorium dengan BO. Pendekatan ini memungkinkan identifikasi peptida sinyal optimal yang cepat dan efisien untuk sekresi enzim melalui penyaringan throughput tinggi. Dengan mengintegrasikan proses otomatis dengan pemodelan statistik, penelitian ini secara signifikan meningkatkan efisiensi penyaringan, mengidentifikasi peptida sinyal yang paling menjanjikan untuk sekresi PETase hanya dalam dua putaran penyaringan. Demikian pula, Helleckes dkk. baru-baru ini mengembangkan proses semi-otomatis untuk membuat 63 varian badan inklusi aktif katalitik yang berbeda, ditambah dengan alur kerja penyaringan otomatis yang dioptimalkan menggunakan pengoptimalan Bayesian dan pengambilan sampel Thompson (Helleckes et al. 2024).
Dalam kombinasi dengan metode penyaringan, pengoptimalan Bayesian menawarkan cara yang menjanjikan untuk memandu secara efisien melalui ruang desain yang luas yang juga tidak dapat diakses oleh penyaringan kaku saja.
4.4 Pengoptimalan Bayesian Berbasis Fisika
Awalnya dikembangkan sebagai metode untuk pengoptimalan kotak hitam, pengoptimalan Bayesian secara tradisional bergantung pada model pengganti berbasis data untuk memperkirakan fungsi objektif. Dalam beberapa tahun terakhir, persimpangan pembelajaran mesin dengan model prinsip pertama telah menarik minat yang signifikan di berbagai disiplin ilmu dan teknik (Rackauckas 2021). Pendekatan ini menggunakan kekuatan prediktif metode berbasis data yang dikombinasikan dengan wawasan mendasar yang ditawarkan oleh pengetahuan fisik, yang bertujuan untuk meningkatkan akurasi prediktif guna mengurangi biaya komputasi dan meningkatkan interpretabilitas model. Dikenal sebagai pemodelan hibrida, praktik ini memiliki sejarah panjang dalam bidang rekayasa bioproses yang dimulai sejak tahun 1990-an (Psichogios dan Ungar 1992). Oleh karena itu, penggabungan model pengganti hibrida dengan fungsi akuisisi yang memanfaatkan kuantifikasi ketidakpastian menghadirkan pendekatan menarik yang dapat menarik minat. Meskipun tidak banyak dieksplorasi dalam literatur, beberapa studi dalam ilmu material dan fisika melaporkan bahwa pendekatan ini menghasilkan akurasi yang lebih baik dan identifikasi optimum global yang lebih cepat dibandingkan dengan metode kotak hitam tradisional (Hanuka et al. 2021; Oikonomou 2023).
Fleksibilitas BO menawarkan berbagai kemungkinan untuk mengintegrasikan pengetahuan fisika ke dalam proses pengoptimalan. Misalnya, Di Fiore et al. mengusulkan kerangka kerja BO multifidelitas yang sadar fisika yang awalnya menggunakan model fidelitas rendah berdasarkan prinsip-prinsip awal untuk eksplorasi yang luas. Proses ini mengidentifikasi area utama tempat data eksperimen atau simulasi fidelitas tinggi kemudian diterapkan untuk menyempurnakan model (Di Fiore dan Mainini 2024). Namun, sebagian besar pendekatan menargetkan struktur model itu sendiri. Contoh yang ditunjukkan oleh Ziatdinov dkk. yang mengembangkan metode BO berbasis proses Gaussian yang disempurnakan yang meningkatkan pengoptimalan dengan menggabungkan model fisik sebagai prior probabilistik terstruktur. Integrasi ini meningkatkan efisiensi dan akurasi proses pembelajaran (Ziatdinov dkk. 2022). Demikian pula, Khatamsaz dkk. menunjukkan BO berbasis Fisika yang meningkatkan efisiensi pengoptimalan dengan menggabungkan kernel yang diinfus fisika ke dalam model proses Gaussian, yang secara efektif memanfaatkan informasi statistik dan fisik untuk pengoptimalan desain material (Khatamsaz 2023).
5 Kesimpulan
BO telah memposisikan dirinya sebagai alat pengembangan proses yang sangat menjanjikan di bidang rekayasa bioproses, menawarkan alat pengoptimalan adaptif dan hemat sampel yang menggabungkan pembelajaran mesin dan pengambilan keputusan eksperimental. Artikel tinjauan ini menyoroti prinsip-prinsip utamanya dan memamerkan berbagai aplikasi yang saat ini diterbitkan di berbagai unit operasi dalam rekayasa bioproses. Lanskap perangkat lunak serta aplikasi dalam eksperimen otonom dibahas. Selain itu, eksplorasi penggabungan BO dengan model berbasis fisika disajikan, yang menunjukkan arah yang menjanjikan untuk mengintegrasikan wawasan berbasis data dengan prinsip-prinsip ilmiah yang mapan.
Leave a Reply