arXiv:2405.09591 Abstract | arXiv Analytics

arXiv:2405.09591 [cs.LG]Abstract References Reviews Resources

A Comprehensive Survey on Data Augmentation

Zaitian Wang, Pengfei Wang, Kunpeng Liu, Pengyang Wang, Yanjie Fu, Chang-Tien Lu, Charu C. Aggarwal, Jian Pei, Yuanchun Zhou

Published 2024-05-15Version 1

Data augmentation is a series of techniques that generate high-quality artificial data by manipulating existing data samples. By leveraging data augmentation techniques, AI models can achieve significantly improved applicability in tasks involving scarce or imbalanced datasets, thereby substantially enhancing AI models' generalization capabilities. Existing literature surveys only focus on a certain type of specific modality data, and categorize these methods from modality-specific and operation-centric perspectives, which lacks a consistent summary of data augmentation methods across multiple modalities and limits the comprehension of how existing data samples serve the data augmentation process. To bridge this gap, we propose a more enlightening taxonomy that encompasses data augmentation techniques for different common data modalities. Specifically, from a data-centric perspective, this survey proposes a modality-independent taxonomy by investigating how to take advantage of the intrinsic relationship between data samples, including single-wise, pair-wise, and population-wise sample data augmentation methods. Additionally, we categorize data augmentation methods across five data modalities through a unified inductive approach.

Categories: cs.LG, cs.AI

Keywords: comprehensive survey, existing data samples, ai models, encompasses data augmentation techniques, population-wise sample data augmentation methods

Related articles: Most relevant | Search more

arXiv:2304.05055 [cs.LG] (Published 2023-04-11)

A Comprehensive Survey on Deep Graph Representation Learning

Wei Ju et al.

arXiv:2302.00487 [cs.LG] (Published 2023-01-31)

A Comprehensive Survey of Continual Learning: Theory, Method and Application

Liyuan Wang, Xingxing Zhang, Hang Su, Jun Zhu

arXiv:2404.18947 [cs.LG] (Published 2024-04-27)

Multimodal Fusion on Low-quality Data: A Comprehensive Survey

Qingyang Zhang et al.

arXiv Analytics

arXiv:2405.09591 [cs.LG]Abstract References Reviews Resources

A Comprehensive Survey on Data Augmentation

Links

Toolbox

arXiv:2405.09591 [cs.LG]AbstractReferencesReviewsResources

A Comprehensive Survey on Data Augmentation

Links

Toolbox

arXiv:2405.09591 [cs.LG]Abstract References Reviews Resources