Bootstrapping simulation-based algorithms with a suboptimal policy
Finding optimal policies for Markov Decision Processes with large state spaces is in general intractable. Nonetheless, simulation-based algorithms inspired by Sparse Sampling (SS) such as Upper Confidence Bound applied in Trees (UCT) and Forward Search Sparse Sampling (FSSS) have been shown to perfo...
محفوظ في:
المؤلفون الرئيسيون: | Nguyen T., Silander T., Lee W., Tze-Yun LEONG |
---|---|
التنسيق: | text |
اللغة: | English |
منشور في: |
Institutional Knowledge at Singapore Management University
2014
|
الموضوعات: | |
الوصول للمادة أونلاين: | https://ink.library.smu.edu.sg/sis_research/3000 https://ink.library.smu.edu.sg/context/sis_research/article/4000/viewcontent/7934_37003_2_PB.pdf |
الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
مواد مشابهة
-
A sparse sampling model for 3D face recognition
بواسطة: Yuan, J., وآخرون
منشور في: (2014) -
A Fast Bandwidth Minimization Algorithm
بواسطة: LIM, Andrew, وآخرون
منشور في: (2007) -
Respondent-driven sampling and sparse graph convergence
بواسطة: Athreya, S., وآخرون
منشور في: (2022) -
Achieving higher resolution ISAR imaging with limited pulses via compressed sampling
بواسطة: Zhang, L., وآخرون
منشور في: (2014) -
Sparse Sequential Generalization of K-means for dictionary training on noisy signals
بواسطة: Sahoo, Sujit Kumar, وآخرون
منشور في: (2017)