Text backdoor detection using an interpretable RNN abstract model

Text backdoor detection using an interpretable RNN abstract model

Deep neural networks (DNNs) are known to be inherently vulnerable to malicious attacks such as the adversarial attack and the backdoor attack. The former is crafted by adding small perturbations to benign inputs so as to fool a DNN. The latter generally embeds a hidden pattern in a DNN by poisoning...

وصف كامل

محفوظ في:

التفاصيل البيبلوغرافية
المؤلفون الرئيسيون:	FAN, Ming, SI, Ziliang, XIE, Xiaofei, LIU, Yang, LIU, Ting
التنسيق:	text
اللغة:	English
منشور في:	Institutional Knowledge at Singapore Management University 2021
الموضوعات:	Training Recurrent neural networks Task analysis Motion pictures Data models Analytical models Sentiment analysis Text backdoor detection RNN model abstraction interpretation OS and Networks Software Engineering
الوصول للمادة أونلاين:	https://ink.library.smu.edu.sg/sis_research/7118
الوسوم:	إضافة وسم لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
المؤسسة:	Singapore Management University
اللغة:	English

مواد مشابهة

Towards interpreting recurrent neural networks through probabilistic abstraction
بواسطة: DONG, Guoliang, وآخرون
منشور في: (2020)

Stealthy backdoor attack for code models
بواسطة: YANG, Zhou, وآخرون
منشور في: (2024)

DeepStellar: Model-based quantitative analysis of stateful deep learning systems
بواسطة: DU, Xiaoning, وآخرون
منشور في: (2019)

Evaluation of backdoor attacks and defenses to deep neural networks
بواسطة: Ooi, Ying Xuan
منشور في: (2024)

Deepcause: Verifying neural networks with abstraction refinement
بواسطة: NGUYEN HUA GIA PHUC,
منشور في: (2022)

BADFL: Backdoor attack defense in federated learning from local model perspective
بواسطة: ZHANG, Haiyan, وآخرون
منشور في: (2024)

Scalable and precise refinement of cache timing analysis via path-sensitive verification
بواسطة: Chattopadhyay, S., وآخرون
منشور في: (2014)

Clean-label backdoor attack and defense: an examination of language model vulnerability
بواسطة: Zhao, Shuai, وآخرون
منشور في: (2025)

Which neural network makes more explainable decisions? An approach towards measuring explainability
بواسطة: ZHANG, Mengdi, وآخرون
منشور في: (2022)

SampDetox : Black-box backdoor defense via perturbation-based sample detoxification
بواسطة: YANG, Yanxin, وآخرون
منشور في: (2024)

Privacy-enhancing and robust backdoor defense for federated learning on heterogeneous data
بواسطة: CHEN, Zekai, وآخرون
منشور في: (2024)

On-device deep multi-task inference via multi-task zipping
بواسطة: HE, Xiaoxi, وآخرون
منشور في: (2023)

Neuron sensitivity guided test case selection
بواسطة: HUANG, Dong, وآخرون
منشور في: (2024)

Multi-Abstraction Concern Localization
بواسطة: DUY, Tien-Duy B., وآخرون
منشور في: (2013)

Fusing multi-abstraction vector space models for concern localization
بواسطة: ZHANG, Yun, وآخرون
منشور في: (2018)

NPC: Neuron path coverage via characterizing decision logic of deep neural networks
بواسطة: XIE, Xiaofei, وآخرون
منشور في: (2022)

EXTENDING TOPIC MODELS FOR TEXT ANALYSIS OF CORPORATE RISK DISCLOSURES
بواسطة: BAO YANG
منشور في: (2014)

Efficient and secure federated learning against backdoor attacks
بواسطة: MIAO, Yinbin, وآخرون
منشور في: (2024)

Neural network semantic backdoor detection and mitigation: A causality-based approach
بواسطة: SUN, Bing, وآخرون
منشور في: (2024)

Causality analysis for neural network security
بواسطة: SUN, Bing
منشور في: (2024)

Inferring links between concerns and methods with multi-abstraction vector space model
بواسطة: ZHANG, Yun, وآخرون
منشور في: (2016)

Adversarial learning for coordinate regression through k-layer penetrating representation
بواسطة: JIANG, Mengxi, وآخرون
منشور في: (2024)

Design and analysis of a general recurrent neural network model for time-varying matrix inversion
بواسطة: Zhang, Y., وآخرون
منشور في: (2014)

Hyperbolic graph topic modeling network with continuously updated topic tree
بواسطة: ZHANG, Ce, وآخرون
منشور في: (2023)

Linkbreaker: Breaking the backdoor-trigger link in DNNs via neurons consistency check
بواسطة: CHEN, Zhenzhu, وآخرون
منشور في: (2022)

Evaluation of backdoor attacks on deep neural networks
بواسطة: Mohamed Nur Hazim Bin Mohamed Ghazali
منشور في: (2025)

Towards an effective and interpretable refinement approach for DNN verification
بواسطة: LI, Jiaying, وآخرون
منشور في: (2023)

Mitigating backdoor attacks in large language model-based recommendation systems: a defense and unlearning approach
بواسطة: Salimin, Joanne Christina
منشور في: (2025)

A core task abstraction approach to hierarchical reinforcement learning [Extended abstract]
بواسطة: LI, Zhuoru, وآخرون
منشور في: (2016)

Mental Visual Indexing: Towards Fast Video Browsing
بواسطة: Richang Hong, وآخرون
منشور في: (2020)

An Intention-Aware Interactive System for Mobile Video Browsing
بواسطة: Jun He, وآخرون
منشور في: (2020)

User-database interaction at the knowledge level of abstraction
بواسطة: Chan, H.C., وآخرون
منشور في: (2014)

TLV: Abstraction through testing, learning, and validation
بواسطة: SUN, Jun, وآخرون
منشور في: (2015)

Neighbor-anchoring adversarial graph neural networks (extended abstract)
بواسطة: LIU, Zemin, وآخرون
منشور في: (2022)

CARF-net : CNN attention and RNN fusion network for video-based person reidentification
بواسطة: Prasad, Dilip Kumar, وآخرون
منشور في: (2019)

Scope-aware data cache analysis for WCET estimation
بواسطة: HUYNH BACH KHOA
منشور في: (2011)

BadSFL: backdoor attack in scaffold federated learning
بواسطة: Zhang, Xuanye
منشور في: (2024)

Dynamic decision analysis in medicine: A data-driven approach
بواسطة: Cao, C., وآخرون
منشور في: (2014)

A network-based approach to interpreting pore blockage and cake filtration during membrane fouling
بواسطة: Han, Qi, وآخرون
منشور في: (2017)

Holistic combination of structural and textual code information for context based API recommendation
بواسطة: CHEN, Chi, وآخرون
منشور في: (2022)