Compositional prompt tuning with motion cues for open-vocabulary video relation detection

Prompt tuning with large-scale pretrained vision-language models empowers open-vocabulary prediction trained on limited base categories, e.g., object classification and detection. In this paper, we propose compositional prompt tuning with motion cues: an extended prompt tuning paradigm for compositi...

وصف كامل

محفوظ في:
التفاصيل البيبلوغرافية
المؤلفون الرئيسيون: GAO, Kaifeng, CHEN, Long, ZHANG, Hanwang, XIAO, Jun, SUN, Qianru
التنسيق: text
اللغة:English
منشور في: Institutional Knowledge at Singapore Management University 2023
الموضوعات:
الوصول للمادة أونلاين:https://ink.library.smu.edu.sg/sis_research/8102
https://ink.library.smu.edu.sg/context/sis_research/article/9105/viewcontent/4266_compositional_prompt_tuning_wi.pdf
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!