Learning generalized video memory for automatic video captioning
Recent video captioning methods have made great progress by deep learning approaches with convolutional neural networks (CNN) and recurrent neural networks (RNN). While there are techniques that use memory networks for sentence decoding, few work has leveraged on the memory component to learn and ge...
محفوظ في:
المؤلفون الرئيسيون: | CHANG, Poo-Hee, TAN, Ah-hwee |
---|---|
التنسيق: | text |
اللغة: | English |
منشور في: |
Institutional Knowledge at Singapore Management University
2018
|
الموضوعات: | |
الوصول للمادة أونلاين: | https://ink.library.smu.edu.sg/sis_research/6076 https://ink.library.smu.edu.sg/context/sis_research/article/7079/viewcontent/Multi_disciplinary_Trends_in_Artificial_Intelligence.pdf |
الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
مواد مشابهة
مواد مشابهة
-
Image captioning via semantic element embedding
بواسطة: ZHANG, Xiaodan, وآخرون
منشور في: (2020) -
PERSONALIZED VISUAL INFORMATION CAPTIONING
بواسطة: WU SHUANG
منشور في: (2023) -
Semantic-filtered Soft-Split-Aware video captioning with audio-augmented feature
بواسطة: Xu, Yuecong, وآخرون
منشور في: (2021) -
Interactive video search with multi-modal LLM video captioning
بواسطة: CHENG, Yu-Tong, وآخرون
منشور في: (2025) -
Cross-modal graph with meta concepts for video captioning
بواسطة: Wang, Hao, وآخرون
منشور في: (2022)