Pricing problems with Thompson sampling
In 1933, William R. Thompson proposed an algorithm known as Thompson sampling in order to maximise culmulative payo in a multi-armed bandit (MAB) problem. MAB problems have been fre- quently used to model real-life decision making scenarios. This pa- per explores the extension of Thompson sampl...
محفوظ في:
المؤلف الرئيسي: | Lee, Samuel Wai Leong |
---|---|
مؤلفون آخرون: | Yan Zhenzhen |
التنسيق: | Final Year Project |
اللغة: | English |
منشور في: |
2019
|
الموضوعات: | |
الوصول للمادة أونلاين: | http://hdl.handle.net/10356/77144 |
الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
مواد مشابهة
-
Universality for the largest eigenvalue of sample covariance matrices with general population
بواسطة: Bao, Zhigang, وآخرون
منشور في: (2015) -
Central limit theorem for the spiked eigenvalues of separable sample covariance matrices
بواسطة: Zhang, Bo
منشور في: (2017) -
Geometry of sample spaces
بواسطة: Harms, Philipp, وآخرون
منشور في: (2023) -
Sample size estimation with missing values on clinical trials
بواسطة: Zhang, Mengyang
منشور في: (2019) -
State-Aware Variational Thompson Sampling for Deep Q-Networks
بواسطة: WEE SUN LEE, وآخرون
منشور في: (2021)