A Mutation-Based Method for Backdoored Sample Detection Without Clean Data

Luoyu Chen; Feng Wu; Tao Zhang; Abdullah Mohamed Asiri; Weiqi Wang; Shui Yu

doi:10.1109/globecom52923.2024.10901693

Abstract

1 min read

Backdoor attacks significantly threaten machine learning-based vision systems. Existing detection methods typically require clean data from a similar distribution as the dataset under inspection, limiting practical deployment. This work proposes a Mutation-Based Method (MBM) for detecting and filtering backdoored samples in image training dataset, without referencing any external clean data. MBM aims at distinguishing backdoored and benign samples distribution via their distinct stability in feature space under certain data augmentations. Firstly, MBM applies multiple data augmentation techniques, generating mutated versions of each sample to ‘deactivate’ potential triggers while maintaining natural semantics not heavily distorted. Secondly, MBM measures how sample features diverge after mutating from its origin as poison score, which we call ‘Feature Stability’. Thirdly, by analyzing extreme scores within each class, MBM effectively identifies the backdoored class, and isolates samples not from backdoored class as clean data. Finally, a benign distribution is fit to benchmark against backdoored samples from backdoored class. We validated MBM on the CIFAR-10 dataset, achieving a true positive rate above 95% and a false positive rate below 0.2% for all defense settings. Our results confirm MBM’s efficacy without reliance on external clean data.

A Mutation-Based Method for Backdoored Sample Detection Without Clean Data

Abstract

Discussion(0)

Related publications

Silent Killer: Optimizing Backdoor Trigger Yields a Stealthy and Powerful Data Poisoning Attack

A New Oversampling Method Based on Triangulation of Sample Space

Toward intelligent training of supervised image classifications: directing training data acquisition for SVM classification

Oversampling method based on GAN for tabular binary classification problems

Pseudo Oversampling Based on Feature Transformation and Fuzzy Membership Functions for Imbalanced and Overlapping Data

Related publications

Preprint2023
Silent Killer: Optimizing Backdoor Trigger Yields a Stealthy and Powerful Data Poisoning Attack
Preprint2023

Article2023
A New Oversampling Method Based on Triangulation of Sample Space
Article2023

Article2004
Toward intelligent training of supervised image classifications: directing training data acquisition for SVM classification
Article2004

Article2023
Oversampling method based on GAN for tabular binary classification problems
Article2023

Article2024
Pseudo Oversampling Based on Feature Transformation and Fuzzy Membership Functions for Imbalanced and Overlapping Data
Article2024