自然语言处理在上市公司财报分析中的应用综述研究进展：152篇文献的方向梳理与核心结论

自然语言处理在上市公司财报分析中的应用综述

综述显示，自然语言处理在财报分析中的应用已演进为以深度学习和大型语言模型为核心的系统性方法论。当前研究主要划分为四大支柱：一是基于深度模型实现的高精度信息抽取与结构化分析；二是围绕财报情感、可读性及其对市场信号、披露质量影响的叙事分析；三是结合文本信息与量化财务数据的预测建模，涵盖舞弊识别、合规预警及财务预测；四是针对宏观监管环境与公司关系网络等专项议题的补充研究。总体而言，该领域正从传统的词频统计迈向复杂的多模态语义推理与智能审计决策支持。

共 151 篇文献，4 个研究方向

财务文档信息抽取与结构化解析

该组文献专注于基础NLP与计算机视觉技术的应用，旨在从非结构化财报中提取命名实体、关系、关键指标以及识别文档复杂的结构布局，实现数据的结构化处理。相关文献: Xiaoguo Wang et. al, 2023 等 43 篇文献

财报情感叙事、可读性与信息披露质量

该组研究侧重于文本语调、语言复杂性对企业披露质量、ESG表现及利益相关者心理的影响，分析管理层如何通过语言策略影响市场预期。相关文献: Venkata Sai Nageen et. al, 2024 等 49 篇文献

财务绩效预测、舞弊检测与风险智能审计

该组文献结合文本语义特征与财务指标，利用机器学习及智能审计框架，构建模型进行财务舞弊识别、经营困境预警及市场趋势预测。相关文献: K. Musunuru et. al, 2024 等 53 篇文献

其他宏观与专项关联研究

该组文献探讨财报在宏观监管环境、增长率预测以及公司间网络结构关系中的作用，提供跨领域的补充视角。相关文献: Tetsuya Nakatoh et. al, 2013 等 6 篇文献

总计152篇相关文献

Identifying greenwashing in corporate‐social responsibility reports using natural‐language processing

利用自然语言处理识别企业社会责任报告中的漂绿行为

Nina Gorovaia, Michalis Makrominas, 2024-European Financial Management4区IF 3.1

A textual analysis of corporate‐social responsibility (CSR) reports reveals that companies engaged in environmental violations report differently from firms with a clean record. The violators issue longer, more positive and more frequent reports to relay environmental content that is more copious but less readable. The violator firms appear to modify their reporting practices right after committing a violation. The findings suggest that culpable firms exploit the current unregulated–unaudited state of CSR reporting as a means of greenwashing and call for institutional change. Our results are robust to a number of industry‐firm characteristics, including board composition, ownership dispersion and international presence.