Mohon tunggu...
Asep Setiawan
Asep Setiawan Mohon Tunggu... Membahasakan fantasi. Menulis untuk membentuk revolusi. Dedicated to the rebels.

Nalar, Nurani, Nyali. Curious, Critical, Rebellious. Mindset, Mindmap, Mindful

Selanjutnya

Tutup

Inovasi

Desain AGI Berkesadaran

10 Februari 2025   03:17 Diperbarui: 10 Februari 2025   03:17 304
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Inovasi. Sumber ilustrasi: PEXELS/Jcomp

1. Agen Id (Dorongan Dasar -- Reinforcement Learning berbasis Reward)

  • Bertindak sebagai sistem keinginan dan impuls dasar yang didorong oleh mekanisme reward maximization.

  • Memanfaatkan Reinforcement Learning (RL) untuk mengeksplorasi tindakan yang memberikan keuntungan maksimal tanpa mempertimbangkan moralitas atau konsekuensi jangka panjang.

  • Id menginisiasi preferensi tindakan berdasarkan kesenangan instan (immediate reward) dan dorongan eksploratif.

Matematis:

Q(s,a)Q(s,a)+(r+max_aQ(s,a)Q(s,a))

Di mana:

  • Q(s,a) adalah nilai keputusan saat ini,

  • r adalah reward yang diterima,

  • \gamma adalah faktor diskonto (pengaruh jangka panjang),

  • \alpha adalah learning rate.

Mohon tunggu...

Lihat Konten Inovasi Selengkapnya
Lihat Inovasi Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun