Mohon tunggu...
Asep Setiawan
Asep Setiawan Mohon Tunggu... Membahasakan fantasi. Menulis untuk membentuk revolusi. Dedicated to the rebels.

Nalar, Nurani, Nyali. Curious, Critical, Rebellious. Mindset, Mindmap, Mindful

Selanjutnya

Tutup

Inovasi

Desain AGI Berkesadaran

10 Februari 2025   03:17 Diperbarui: 10 Februari 2025   03:17 304
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Inovasi. Sumber ilustrasi: PEXELS/Jcomp

Reward Function: R(s,a)=R_instant+R_delayed

  • Instant Reward (R_instant): Reward langsung dari aksi yang dilakukan.

  • Delayed Reward (R_delayed): Reward berdasarkan feedback dari Ego & Superego.

  • Bobot dan diperbarui secara dinamis berdasarkan pengalaman.

Contoh Update Superego (Graph Learning dengan Hebbian Update)

  • Graph Morality diperbarui dengan mekanisme Hebbian Learning: w_ij ^t+1=w_ij ^t+(x_ix_jw_ij ^t)

    • Jika suatu tindakan menghasilkan efek etis positif, edge weight diperkuat.

    • Jika bertentangan dengan prinsip etis, edge weight dikoreksi dengan penalization.

2.2. Level 2: Adaptasi Meta-Kognitif (Bayesian Inference & Continual Learning)

Contoh Update Bashirah (Variational Inference dalam BNNs)

  • Bayesian Weight Update: p(wD)p(Dw)p(w)

    • Mohon tunggu...

      Lihat Konten Inovasi Selengkapnya
      Lihat Inovasi Selengkapnya
      Beri Komentar
      Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

      Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun