Pada tanggal 6 Oktober 2025, OpenAI merilis AgentKit, sebuah rangkaian alat terpadu yang dirancang untuk memudahkan pengembang dan organisasi dalam membuat, menyebarkan, dan mengoptimalkan agen---entitas berbasis AI yang dapat menjalankan alur kerja, memanggil alat eksternal, serta berinteraksi secara cerdas dengan pengguna atau sistem lain. Sebelum kehadiran AgentKit, pembangunan agen umumnya melibatkan beragam alat yang terpisah, mulai dari orkestrasi manual, penyesuaian prompt secara ad hoc, hingga pembuatan sistem evaluasi buatan sendiri.Â
OpenAI kini menghadirkan platform yang menyatukan seluruh kebutuhan tersebut dalam satu ekosistem yang terintegrasi, sehingga pengembang tidak perlu lagi membangun dari nol.
Mengutip dari openAi.com, AgentKit terdiri atas beberapa komponen utama. Pertama, Agent Builder, sebuah kanvas visual yang memungkinkan pengembang merancang alur kerja multi-agen menggunakan antarmuka drag-and-drop. Fitur ini memungkinkan pembuatan node seperti agen, guardrails, modul logika, dan percabangan kondisi secara intuitif.Â
Pengembang dapat meninjau alur kerja sebelum diluncurkan serta memanfaatkan sistem versioning untuk melacak setiap perubahan. Dalam contoh penerapan, tim Ramp berhasil membangun agen pembelian hanya dalam beberapa jam menggunakan Agent Builder---sebuah pencapaian yang sebelumnya membutuhkan waktu berbulan-bulan.
Komponen kedua adalah Connector Registry, pusat pengelolaan konektor yang memungkinkan agen terhubung dengan berbagai sumber data atau alat eksternal, seperti Dropbox, Google Drive, SharePoint, Microsoft Teams, atau sistem internal melalui API. Melalui registry ini, administrator dapat mengatur dan memantau koneksi antar-ruang kerja tanpa perlu melakukan integrasi berulang untuk setiap agen. Pendekatan ini menghadirkan efisiensi tinggi dalam mengelola konektivitas lintas sistem.
Kedua, ChatKit hadir untuk memudahkan integrasi antarmuka percakapan antara agen dan pengguna. Pengembang tidak perlu lagi membangun UI chat dari awal karena ChatKit sudah menyediakan dukungan terhadap streaming respons, percabangan thread, dan tampilan status model. ChatKit juga dapat disesuaikan agar selaras dengan tema dan identitas produk. OpenAI mencontohkan penggunaan ChatKit oleh tim Canva yang mengintegrasikan fitur ini dalam waktu kurang dari satu jam untuk membuat agen dukungan pelanggan yang efisien dan responsif.
Agar agen dapat berfungsi dengan andal, OpenAI memperluas platform Evals yang telah ada. Melalui fitur baru seperti datasets, trace grading, dan automated prompt optimization, pengembang dapat membangun dan memperluas kumpulan evaluasi dengan kombinasi penilaian otomatis dan anotasi manusia. Platform ini juga mendukung model dari penyedia pihak ketiga. Beberapa organisasi melaporkan bahwa evaluasi berbasis AgentKit mampu memangkas waktu pengembangan alur kerja lebih dari 50 persen serta meningkatkan akurasi hingga 30 persen.
Selain itu, OpenAI memperkenalkan Reinforcement Fine-Tuning (RFT) yang dikhususkan bagi agen. Dengan fitur ini, pengembang dapat melatih model agar mampu memanggil alat yang tepat pada waktu yang sesuai serta menilai performanya berdasarkan kriteria yang relevan dengan kebutuhan kasus penggunaan tertentu. RFT saat ini sudah tersedia untuk model o4-mini dan masih dalam tahap beta untuk GPT-5. Pendekatan ini menjadikan agen lebih adaptif dan kontekstual dalam menangani tugas yang kompleks.
AgentKit menawarkan sejumlah keunggulan signifikan. Integrasi yang mulus membuat berbagai komponen seperti orchestrator, prompt, konektor, dan UI kini dapat diatur dari satu tempat. Produktivitas meningkat karena proses iterasi bisa dilakukan lebih cepat, bahkan dalam hitungan jam. Sistem evaluasi dan guardrails juga memberikan jaminan keamanan dan reliabilitas yang lebih tinggi. Dengan dukungan fine-tuning dan grading kustom, performa agen dapat disesuaikan dengan kebutuhan organisasi.
Meski demikian, beberapa tantangan masih perlu diperhatikan. Sebagian fitur utama seperti Agent Builder dan Connector Registry masih dalam tahap beta dan belum terbuka untuk semua pengguna. Kasus penggunaan yang sangat kompleks, seperti di bidang medis atau hukum, mungkin tetap memerlukan penyesuaian mendalam. Aspek keamanan dan etika juga harus menjadi prioritas karena agen yang dapat mengakses data dan menjalankan tindakan otomatis berpotensi menimbulkan risiko kebocoran atau penyalahgunaan. Selain itu, adopsi organisasi terhadap platform baru seperti AgentKit memerlukan masa penyesuaian, terutama bagi tim yang telah memiliki infrastruktur AI mapan.