Structure-aware multimodal feature fusion for RGB-D scene classification and beyond

Structure-aware multimodal feature fusion for RGB-D scene classification and beyond

While convolutional neural networks (CNNs) have been excellent for object recognition, the greater spatial variability in scene images typically means that the standard full-image CNN features are suboptimal for scene classification. In this article, we investigate a framework allowing greater spati...

Full description

Saved in:

Bibliographic Details
Main Authors:	Wang, Anran, Cai, Jianfei, Lu, Jiwen, Cham, Tat-Jen
Other Authors:	School of Computer Science and Engineering
Format:	Article
Language:	English
Published:	2020
Subjects:	Engineering::Computer science and engineering::Computing methodologies::Image processing and computer vision Feature Fusion Multimodal Analytics
Online Access:	https://hdl.handle.net/10356/138263
Tags:	Add Tag No Tags, Be the first to tag this record!
Institution:	Nanyang Technological University
Language:	English

Similar Items

Towards robust and efficient multimodal representation learning and fusion
by: Guo, Xiaobao
Published: (2025)

Feature learning for RGB-D scene understanding
by: Wang, Anran
Published: (2016)

Multimodal sentiment analysis using hierarchical fusion with context modeling
by: Majumder, Navonil, et al.
Published: (2020)

Fusing pairwise modalities for emotion recognition in conversations
by: Fan, Chunxiao, et al.
Published: (2024)

Exploring a multimodal fusion-based deep learning network for detecting facial palsy
by: OO, Heng Yim Nicole, et al.
Published: (2024)

Multimodal fusion for multimedia analysis: A survey
by: Atrey, P.K., et al.
Published: (2013)

Sentic maxine: Multimodal affective fusion and emotional paths
by: Hupont, I., et al.
Published: (2014)

Fusion of multimodal embeddings for ad-hoc video search
by: FRANCIS, Danny, et al.
Published: (2019)

Document dependent fusion in multimodal music retrieval
by: Li, Z., et al.
Published: (2013)

Query-document-dependent fusion: A case study of multimodal music retrieval
by: Li, Z., et al.
Published: (2014)

Adaptive multimodal fusion based similarity measures in music information retrieval
by: ZHANG BINGJUN
Published: (2011)

MultiFusion: A boosting approach for multimedia fusion
by: Wang, X., et al.
Published: (2013)

Comprehensive query-dependent fusion using regression-on-folksonomies: A case study of multimodal music search
by: Zhang, B., et al.
Published: (2013)

M3SA: Multimodal Sentiment Analysis based on multi-scale feature extraction and multi-task learning
by: LIN, Changkai, et al.
Published: (2024)

Visiting the Invisible: layer-by-layer completed scene decomposition
by: Zheng, Chuanxia, et al.
Published: (2023)

Multimodal Music Information Retrieval: From Content Analysis to Multimodal Fusion
by: LI ZHONGHUA
Published: (2013)

Comprehensive Query-Dependent Fusion Using Regression-on-Folksonomies: A Case Study of Multimodal Music Search
by: ZHANG, Bingjun, et al.
Published: (2009)

Feature fusion with covariance matrix regularization in face recognition
by: Lu, Ze, et al.
Published: (2018)

Boundary-aware feature propagation for scene segmentation
by: Ding, Henghui, et al.
Published: (2020)

KnowleNet: knowledge fusion network for multimodal sarcasm detection
by: Yue, Tan, et al.
Published: (2023)

Multi-modal sensor fusion-based deep neural network for end-to-end autonomous driving with scene understanding
by: Huang, Zhiyu, et al.
Published: (2022)

Query-document-dependent fusion: A case study of multimodal music retrieval
by: LI, Zhonghua, et al.
Published: (2013)

Pluralistic image completion
by: Zheng, Chuanxia, et al.
Published: (2020)

CONTEXT-AWARE FUSION FOR MULTI-MODAL BIOMETRICS: WHOM DO I LISTEN TO AND WHEN?
by: SIVASANKARAN DIVYA
Published: (2018)

Sentic blending: Scalable multimodal fusion for the continuous interpretation of semantics and sentics
by: Cambria, E., et al.
Published: (2014)

Weakly-supervised 3D hand pose estimation from monocular RGB images
by: Cai, Yujun, et al.
Published: (2020)

Multimodal data fusion for object detection under rainy conditions
by: Liu, Ting Tao
Published: (2022)

Revisiting disentanglement and fusion on modality and context in conversational multimodal emotion recognition
by: LI, Bobo, et al.
Published: (2023)

Knowledge-based multimodal information fusion for role recognition and situation assessment by using mobile robot
by: Yang, Chule, et al.
Published: (2020)

Vision-based guidance system for breast awareness application using RGB-D sensor
by: Aguilar, Ariane A., et al.
Published: (2016)

Pluralistic free-form image completion
by: Zheng, Chuanxia, et al.
Published: (2023)

Knowledge-aware Multimodal Dialog Systems
by: Lizi Liao, et al.
Published: (2020)

Jointly optimizing sensing pipelines for multimodal mixed reality interaction
by: RATHNAYAKE, Darshana, et al.
Published: (2020)

Blind late fusion in multimedia event retrieval
by: DE BOER, Maaike H. T., et al.
Published: (2016)

Structure-aware fusion network for 3D scene understanding
by: Yan, Haibin, et al.
Published: (2022)

Interactive state-transition diagrams for visualization of multimodal annotation
by: Podlasov, A., et al.
Published: (2014)

FASFLNet: feature adaptive selection and fusion lightweight network for RGB-D indoor scene parsing
by: Qian, Xiaohong, et al.
Published: (2023)

A novel context-aware multimodal framework for persian sentiment analysis
by: Dashtipour, Kia, et al.
Published: (2022)

A generative model for depth-based robust 3D facial pose tracking
by: Sheng, Lu, et al.
Published: (2020)

Visual relationship detection with visual-linguistic knowledge from multimodal representations
by: Chiou, Meng-Jiun, et al.
Published: (2022)