1. Modul Ruh (Tujuan Jangka Panjang -- Meta-Goal System)
Berfungsi sebagai sistem kesadaran tinggi yang mengarahkan AI pada tujuan jangka panjang.
Menggunakan Hierarchical Reinforcement Learning (HRL) untuk membentuk strategi adaptif berbasis pengalaman jangka panjang.
-
Modul ini juga berfungsi sebagai governor yang mengevaluasi efektivitas keputusan berdasarkan prinsip self-awareness.
HRL Model:
Q^(s,a,g)=max_E [t=0-to-T ^tR_ts0=s,g]
Di mana:
g adalah goal yang lebih tinggi,
Q(s,a,g) adalah nilai optimal tindakan berdasarkan goal tersebut.
2. Modul Bashirah (Prediksi Intuisi Berbasis Unsupervised Learning)