aigc文本的对抗检测算法，绕过aigc文本检测的方法

合并后的分组全面覆盖了 AIGC 文本对抗检测的技术闭环：从基础检测算法的迭代与基准评估，到攻击方如何通过语义绕过技术挑战防御，再到防御方利用机器遗忘和鲁棒训练进行反制。同时，报告延伸至底层系统优化（边缘计算、量子智能）与宏观治理维度（伦理偏见、行业应用），为研究者提供了从微观特征到宏观政策的完整视角。

共 71 篇文献，5 个研究方向

AIGC 文本检测算法构建与多维基准测试

该组文献关注检测模型的核心研发与性能度量。涵盖了基于预训练模型（BERT、LLM）、特征工程、多语言（阿拉伯语、印地语）及特定领域（医疗、学术）的检测系统，并建立了针对公平性、偏见和细粒度作者身份识别的评估框架。相关文献: Prof Sayali Shivarkar et. al, 2025 等 21 篇文献

针对检测系统的对抗性攻击与绕过方法

此类文献研究如何利用对抗性扰动、改写攻击（Paraphrasing）、语义诱导（隐喻攻击）及动态输出等手段绕过 AIGC 检测器。研究不仅限于文本，还扩展到了文本到运动、视觉语言模型等跨模态领域的安全漏洞。相关文献: Nandish Chattopadhyay et. al, 2024 等 13 篇文献

提升防御鲁棒性、机器遗忘与新型检测范式

探讨如何增强检测器的反绕过能力，包括利用大模型重写特征（Raidar）、强化学习、统计学防御以及机器遗忘（Machine Unlearning）技术，以实现对有害生成内容或特定版权信息的消除与纠正。相关文献: Chengzhi Mao et. al, 2024 等 10 篇文献

AIGC 治理、伦理政策与特定行业应用挑战

从宏观层面分析 AI 政策、合规框架（隐私六等级）、行业偏见及公平性。同时探讨了合成数据在医疗、电池开发、人才市场等垂直领域的生成质量评估与社会影响。相关文献: Kevin Wei et. al, 2024 等 15 篇文献

算法底层优化、边缘计算与量子智能支撑

侧重于 AIGC 任务的系统级优化，包括在边缘计算环境下的任务卸载、超参数自动化调优、高基数特征编码，以及利用量子机器学习提升模型泛化界限的研究。相关文献: Luca Franceschi et. al, 2024 等 12 篇文献

总计126篇相关文献

Sarang at DEFACTIFY 4.0: Detecting AI-Generated Text Using Noised Data and an Ensemble of DeBERTa Models

Sarang在DEFACTIFY 4.0中的应用：利用噪声数据和DeBERTa模型集成检测AI生成文本

arxiv.org-Avinash Trivedi, Sangeetha Sivanesan, 2025-ArXiv Preprint

This paper presents an effective approach to detect AI-generated text, developed for the Defactify 4.0 shared task at the fourth workshop on multimodal fact checking and hate speech detection. The task consists of two subtasks: Task-A, classifying whether a text is AI generated or human written, and Task-B, classifying the specific large language model that generated the text. Our team (Sarang) achieved the 1st place in both tasks with F1 scores of 1.0 and 0.9531, respectively. The methodology involves adding noise to the dataset to improve model robustness and generalization. We used an ensemble of DeBERTa models to effectively capture complex patterns in the text. The result indicates the effectiveness of our noise-driven and ensemble-based approach, setting a new standard in AI-generated text detection and providing guidance for future developments.