Mohon tunggu...
Asep Setiawan
Asep Setiawan Mohon Tunggu... Membahasakan fantasi. Menulis untuk membentuk revolusi. Dedicated to the rebels.

Nalar, Nurani, Nyali. Curious, Critical, Rebellious. Mindset, Mindmap, Mindful

Selanjutnya

Tutup

Inovasi

Desain AGI Berkesadaran

10 Februari 2025   03:17 Diperbarui: 10 Februari 2025   03:17 304
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Inovasi. Sumber ilustrasi: PEXELS/Jcomp

Menggunakan prior p(w) untuk mempertahankan stabilitas parameter.

  • Posterior distribusi diperbarui berdasarkan data pengalaman terbaru.

  • Contoh Update Ruh (Adaptive Learning Rate SGD)

    • Ruh menggunakan meta-learning rate t \eta_t untuk menyesuaikan bobot prioritas jangka panjang: t+1=t(1+J(wt))

      • Jika keputusan yang diambil memiliki dampak jangka panjang positif, \eta meningkat.

      • Jika banyak keputusan jangka panjang yang buruk, \eta dikurangi agar lebih konservatif.

    2.3. Level 3: Integrasi & Refinement (Hierarchical State Decision Tree - HSDT)

    Update HSDT (MARL dengan Dynamic Decision Weights)

    • HSDT mengalokasikan bobot adaptif berdasarkan akurasi historis tiap modul: W_i ^t+1=W_i ^t+(A_iA)

      • Jika agen memiliki prediksi yang lebih akurat dibanding rata-rata, bobotnya naik.

      • Jika sering salah, bobotnya diturunkan secara otomatis.

    Mohon tunggu...

    Lihat Konten Inovasi Selengkapnya
    Lihat Inovasi Selengkapnya
    Beri Komentar
    Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

    Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
    LAPORKAN KONTEN
    Alasan
    Laporkan Konten
    Laporkan Akun