风控领域下的表格学习

最终分组结果揭示了风控领域下表格学习的演进路线：从传统的基于集成学习和特征工程（WoE/分箱）的信贷模型，正快速迈向深度表征学习（Transformer/GNN）与自监督预训练阶段。大语言模型（LLM）的介入为风控注入了语义理解与逻辑解释的新能力。研究重点已从单纯的“预测准确率”转向包括公平性、可解释性和隐私安全在内的“可信风控”体系。同时，强化学习在动态风险博弈中的应用，以及表格学习在医疗、工安、网安等垂直领域的跨界实践，共同构成了当前全方位、智能化的风险控制技术版图。

共 117 篇文献，8 个研究方向

金融信贷风险评估与集成学习优化

该组文献聚焦于风控的核心场景——信用评分与违约预测。主要利用集成学习（XGBoost, LightGBM, CatBoost）、元启发式优化算法（遗传算法、屎壳郎优化）及逻辑回归增强模型，解决类别不平衡和高维信贷特征提取问题。相关文献: J. Guan et. al, 2025 等 29 篇文献

深度表格表征、自监督学习与架构创新

探讨针对表格数据设计的专用神经网络架构。涉及TabNet、Transformer变体、图神经网络（GNN）以及自监督预训练（掩码建模、对比学习），旨在通过深度学习捕获表格特征间的非线性交互和稀疏表征。相关文献: Yuvraj Sharma et. al, 2026 等 14 篇文献

大语言模型（LLM）与智能体风控驱动

研究如何利用LLM的语义理解、逻辑推理及Agentic协作能力增强风控模型。包括利用LLM进行隐空间知识迁移、代码风险解释、提示工程辅助信用分类以及自动化决策框架。相关文献: Chitro Majumdar et. al, 2025 等 8 篇文献

表格数据工程：特征挖掘、数据增强与清洗

侧重于风控前端的数据治理。涵盖WoE（权重证据化）、IV值分析、分箱技术、基于CTGAN或SMOTE的数据合成与增强，以及处理表格数据缺失值和异构性的自动化特征工程。相关文献: Santhosh Kumar Sagar Nagaraj et. al, 2025 等 17 篇文献

可信风控：公平性、可解释性与模型合规

关注模型的“黑盒”问题及伦理风险。包含利用SHAP/LIME、量子神经网络提升透明度，研究算法偏见缓解、模型校准、不确定性量化以及隐私保护下的联邦学习风控。相关文献: Agus Sudjianto et. al, 2025 等 14 篇文献

多模态融合、欺诈识别与知识工程

研究表格数据与非结构化数据（文本、图像、图谱）的交互应用。主要任务包括反欺诈、异常检测、企业关联风控及基于本体（Ontology）和证据理论（D-S）的知识驱动风险建模。相关文献: Hongyi Ge et. al, 2026 等 12 篇文献

动态决策、强化学习与实时风险监控

探讨在动态变化环境下的风险博弈。研究强化学习在资产配置、自动驾驶安全控制、在线学习中的风险边界约束，以及金融市场中的时间序列风险预警与在线学习应用。相关文献: Yunhe Li et. al, 2023 等 10 篇文献

跨行业垂直领域风险评估实践

展示表格学习在非金融领域的泛化应用，包括医疗健康（疾病预测、住院风险）、工业工程安全、网络安全评估以及环境与食品安全等多元风控场景。相关文献: SeshaSai Nath et. al, 2024 等 13 篇文献

总计197篇相关文献

Achieving Risk Control in Online Learning Settings

在线学习环境中实现风险控制

Shai Feldman, Liran Ringel, Stephen Bates 等, 2022-Trans. Mach. Learn. Res.

To provide rigorous uncertainty quantification for online learning models, we develop a framework for constructing uncertainty sets that provably control risk -- such as coverage of confidence intervals, false negative rate, or F1 score -- in the online setting. This extends conformal prediction to apply to a larger class of online learning problems. Our method guarantees risk control at any user-specified level even when the underlying data distribution shifts drastically, even adversarially, over time in an unknown fashion. The technique we propose is highly flexible as it can be applied with any base online learning algorithm (e.g., a deep neural network trained online), requiring minimal implementation effort and essentially zero additional computational cost. We further extend our approach to control multiple risks simultaneously, so the prediction sets we generate are valid for all given risks. To demonstrate the utility of our method, we conduct experiments on real-world tabular time-series data sets showing that the proposed method rigorously controls various natural risks. Furthermore, we show how to construct valid intervals for an online image-depth estimation problem that previous sequential calibration schemes cannot handle.