2. Agen Ego (Pengambilan Keputusan Probabilistik -- Bayesian Reasoning & MDP)
Berfungsi sebagai regulator yang menyeimbangkan dorongan Id dengan realitas eksternal.
Menggunakan Markov Decision Process (MDP) berbobot, di mana keputusan dipengaruhi oleh reward, risiko, dan faktor lingkungan.
-
Menerapkan Bayesian Reasoning untuk mengestimasi probabilitas dampak dari berbagai pilihan tindakan.
MDP berbobot:
V(s)=max_as P(ss,a) [R(s,a,s)+V(s)]
Di mana:
P(ss,a) adalah probabilitas transisi ke state berikutnya,
R(s,a,s) adalah reward yang diperoleh,
V(s) adalah nilai optimal dari suatu state.
3. Agen Superego (Etika Berbasis Graph Morality & Self-Regulated Learning)