Lagi Rame!

Ramai Istilah "Tone Deaf" di Media Sosial

Tentang Dua Ani yang Saya Kagumi

Mengapa Pemimpin Kita Tersandung Lidahnya?

Gaya Koboi Pak Purbaya

Mengurai Dilema Ikutan Siskamling...

Menkeu Purbaya Suntik Rp200T ke 6 Bank

Asep Setiawan Mohon Tunggu... Membahasakan fantasi. Menulis untuk membentuk revolusi. Dedicated to the rebels.

Nalar, Nurani, Nyali. Curious, Critical, Rebellious. Mindset, Mindmap, Mindful

Inovasi

Desain AGI Berkesadaran

10 Februari 2025 03:17 Diperbarui: 10 Februari 2025 03:17 304

+

Laporkan Konten

Laporkan Akun

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Inovasi. Sumber ilustrasi: PEXELS/Jcomp

Inovasi. Sumber ilustrasi: PEXELS/Jcomp

Inovasi. Sumber ilustrasi: PEXELS/Jcomp

Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

1. Agen Id (Dorongan Dasar -- Reinforcement Learning berbasis Reward)

Bertindak sebagai sistem keinginan dan impuls dasar yang didorong oleh mekanisme reward maximization.
Memanfaatkan Reinforcement Learning (RL) untuk mengeksplorasi tindakan yang memberikan keuntungan maksimal tanpa mempertimbangkan moralitas atau konsekuensi jangka panjang.
Id menginisiasi preferensi tindakan berdasarkan kesenangan instan (immediate reward) dan dorongan eksploratif.

Matematis:

Q(s,a)Q(s,a)+(r+max_aQ(s,a)Q(s,a))

Di mana:

Q(s,a) adalah nilai keputusan saat ini,
r adalah reward yang diterima,
\gamma adalah faktor diskonto (pengaruh jangka panjang),
\alpha adalah learning rate.

HALAMAN :

LIHAT SEMUA

Mohon tunggu...

Lihat Inovasi Selengkapnya

Beri Komentar

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!

Laporkan Konten

Laporkan Akun

Akun Terverifikasi

Diberikan kepada Kompasianer aktif dan konsisten dalam membuat konten dan berinteraksi secara positif.

Pelajari selanjutnya.