A smoothed Q-learning algorithm for estimating optimal dynamic treatment regime
In this paper we propose a smoothed Q-learning algorithm for estimating optimal dynamic treatment regimes. In contrast to the Q-learning algorithm in which non-regular inference is involved, we show that under assumptions adopted in this paper, the proposed smoothed Q-learning estimator is asymptoti...
محفوظ في:
المؤلفون الرئيسيون: | FAN, Yanqin, HE, Ming, SU, Liangjun, ZHOU, Xiao-Hua |
---|---|
التنسيق: | text |
اللغة: | English |
منشور في: |
Institutional Knowledge at Singapore Management University
2019
|
الموضوعات: | |
الوصول للمادة أونلاين: | https://ink.library.smu.edu.sg/soe_research/2044 https://ink.library.smu.edu.sg/context/soe_research/article/3043/viewcontent/Smoothed_Q_learning_algorithm_for_estimating_optimal_2016_pp.pdf |
الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
مواد مشابهة
-
Optimal Estimation under Nonstandard Conditions
بواسطة: PLOBERGER, Werner, وآخرون
منشور في: (2012) -
On the Asymptotic Effect of Substituting Estimators for Nuisance Parameters in Inferential Statistics
بواسطة: YANG, Zhenlin, وآخرون
منشور في: (2003) -
A new statistic for regression transformation
بواسطة: YANG, Zhenlin
منشور في: (2000) -
Power Maximization and Size Control in Heteroskedasticity and Autocorrelation Robust Tests with Exponentiated Kernels
بواسطة: SUN, Yixiao, وآخرون
منشور في: (2009) -
SEQUENTIAL MONTE CARLO ALGORITHMS FOR HIGH-DIMENSIONAL FILTERING AND SMOOTHING
بواسطة: XU YAXIAN
منشور في: (2018)