1 artykuł z tym tagiem
Badacze opracowali metodę STHTD-MP, która znacząco poprawia wydajność algorytmów temporal-difference learning poprzez innowacyjną geometrię aktualizacji.