A Critical Discourse Analysis of News Reports within Fairclough's Three-Dimensional Model

新闻话语证据：发布后标题改写与媒体框架/偏见标注资源

聚焦可复用的数据资源与标注方案：研究新闻在发布后标题被编辑/改写的现象，并围绕该资源进行偏见类型标注、分类与下游框架/参与度分析，从而为CDA中“话语如何组织经验、建构立场”的文本证据提供可量化起点。

The MediaSpin Dataset: Post-Publication News Headline Edits Annotated for Media Bias（Preetika Verma, Kokil Jaidka, 2024, ArXiv Preprint）

新闻语篇计算识别：行动者/主体指称（代词→规范名）

围绕新闻报道中的“话语网络”关键环节：从代词指称到规范主体名的行动者识别，解决称谓/指代链构建难题，并对传统流水线与LLM/混合模型进行评估，为CDA可操作的“谁在说/谁被塑造为行动主体”的文本层证据提供方法。

Actor Identification in Discourse: A Challenge for LLMs?（Ana Barić, Sean Papay, Sebastian Padó, 2024, ArXiv Preprint）

话语结构与修辞组织的计算表征：话语树/RS T用于下游评测（以MT为例）

将话语结构（如Rhetorical Structure Theory）编码为可计算的树结构表征，并用于自动评测任务（例如机器翻译一致性评测），强调“语篇组织/修辞关系”作为核心特征进行建模，以支撑CDA文本维度对衔接、层次关系与隐含立场机制的可证据化分析。

DiscoTK: Using Discourse Structure for Machine Translation Evaluation（Shafiq Joty, Francisco Guzman, Lluis Marquez, Preslav Nakov, 2019, ArXiv Preprint）

话语标记与话语关系信号的计算建模：连接/隐式关系/主题分段/锚定

共同点是以“话语标记—话语关系—话语组织信号”为抓手：既考察话语连接词对计算理解的影响，也进行话语标记识别与对话行为预测；同时通过神经模型学习隐式话语关系、利用上句语境/依存信息改进主题分段，并扩展到多体裁/锚定方案（不仅限WSJ新闻）。这些成果共同服务于CDA“文本如何通过衔接/关系类型实现意识形态运作与立场组织”的可计算证据链。

When Do Discourse Markers Affect Computational Sentence Understanding?（Ruiqi Li, Liesbeth Allein, Damien Sileo, Marie-Francine Moens, 2023, ArXiv Preprint）
Identifying Discourse Markers in Spoken Dialog（Peter A. Heeman, Donna Byron, James F. Allen, 1998, ArXiv Preprint）
A Recurrent Neural Model with Attention for the Recognition of Chinese Implicit Discourse Relations（Samuel Rönnqvist, Niko Schenk, Christian Chiarcos, 2017, ArXiv Preprint）
Improving Topic Segmentation by Injecting Discourse Dependencies（Linzi Xing, Patrick Huber, Giuseppe Carenini, 2022, ArXiv Preprint）
Beyond The Wall Street Journal: Anchoring and Comparing Discourse Signals across Genres（Yang Liu, 2019, ArXiv Preprint）
On the Role of Context for Discourse Relation Classification in Scientific Writing（Stephen Wan, Wei Liu, Michael Strube, 2025, ArXiv Preprint）
Discourse Structure in Machine Translation Evaluation（Shafiq Joty, Francisco Guzmán, Lluís Màrquez, Preslav Nakov, 2017, ArXiv Preprint）
The distribution of discourse relations within and across turns in spontaneous conversation（S. Magalí López Cortez, Cassandra L. Jacobs, 2023, ArXiv Preprint）
A Neural Approach to Discourse Relation Signal Detection（Amir Zeldes, Yang Liu, 2020, ArXiv Preprint）
ChatGPT Evaluation on Sentence Level Relations: A Focus on Temporal, Causal, and Discourse Relations（Chunkit Chan, Jiayang Cheng, Weiqi Wang, Yuxin Jiang, Tianqing Fang, Xin Liu, Yangqiu Song, 2023, ArXiv Preprint）
GumDrop at the DISRPT2019 Shared Task: A Model Stacking Approach to Discourse Unit Segmentation and Connective Detection（Yue Yu, Yilun Zhu, Yang Liu, Yan Liu, Siyao Peng, Mackenzie Gong, Amir Zeldes, 2019, ArXiv Preprint）
Embedding Mental Health Discourse for Community Recommendation（Hy Dang, Bang Nguyen, Noah Ziems, Meng Jiang, 2023, ArXiv Preprint）
A Joint Model of Conversational Discourse and Latent Topics on Microblogs（Jing Li, Yan Song, Zhongyu Wei, Kam-Fai Wong, 2018, ArXiv Preprint）
Anchoring a Lexicalized Tree-Adjoining Grammar for Discourse（Bonnie Lynn Webber, Aravind K. Joshi, 1998, ArXiv Preprint）
Anchoring a Lexicalized Tree-Adjoining Grammar for Discourse（Bonnie Lynn Webber, Aravind K. Joshi, 1998, ArXiv Preprint）

语言形式化与语法/解析框架的理论与工具基础（符号层表征能力）

该组提供CDA所需的“可计算文本结构描述能力”的基础：涵盖约束语法/范畴语法等形式语言理论、构式语法与AI关联、语法开发工程经验，以及语言识别的鲁棒评测；并补充解析环境与形式系统，使得把话语线索形式化为结构/接口表征成为可能。

The Power of Constraint Grammars Revisited（Anssi Yli-Jyrä, 2017, ArXiv Preprint）
Construction Grammar and Artificial Intelligence（Katrien Beuls, Paul Van Eecke, 2023, ArXiv Preprint）
Experiences with the GTU grammar development environment（Martin Volk, Dirk Richarz, 1997, ArXiv Preprint）
Robust Language Identification for Romansh Varieties（Charlotte Model, Sina Ahmadi, Jannis Vamvas, 2026, ArXiv Preprint）
Construction Grammar and Language Models（Harish Tayyar Madabushi, Laurence Romain, Petar Milin, Dagmar Divjak, 2023, ArXiv Preprint）
Minimalist Grammars and Minimalist Categorial Grammars, definitions toward inclusion of generated languages（Maxime Amblard, 2011, ArXiv Preprint）
TuLiPA: Towards a Multi-Formalism Parsing Environment for Grammar Engineering（Laura Kallmeyer, Timm Lichte, Wolfgang Maier, Yannick Parmentier, Johannes Dellert, Kilian Evang, 2008, ArXiv Preprint）
Classical linear logic, cobordisms and categorical semantics of categorial grammars（Sergey Slavnov, 2018, ArXiv Preprint）
Evaluation of a Grammar of French Determiners（Eric Laporte, 2007, ArXiv Preprint）
Order preserving and order reversing operators on the class of convex functions in Banach spaces（Alfredo N. Iusem, Daniel Reem, Benar F. Svaiter, 2012, ArXiv Preprint）
Functions on Symmetric Spaces and Oscillator Representations（Hongyu He, 2006, ArXiv Preprint）

社交媒体政治化/操纵/群体话语动态：协调检测、主题转移、道德框架与图探索

面向社交媒体的政治/意识形态/操纵与情绪相关现象：通过协调行为检测、主题转移度量政治化过程、结合BERTopic与道德基础理论追踪政治话题演化与道德框架关联，并用图探索发现未知网络中的隐藏节点/影响者；同时以多任务学习从早期文本识别压力/抑郁等状态。核心在于把话语内容与群体互动/网络结构过程耦合并量化。

Coordinated Behavior on Social Media in 2019 UK General Election（Leonardo Nizzoli, Serena Tardelli, Marco Avvenuti, Stefano Cresci, Maurizio Tesconi, 2020, ArXiv Preprint）
Topic Shifts as a Proxy for Assessing Politicization in Social Media（Marcelo Sartori Locatelli, Pedro Calais, Matheus Prado Miranda, João Pedro Junho, Tomas Lacerda Muniz, Wagner Meira, Virgilio Almeida, 2023, ArXiv Preprint）
Modeling Political Discourse with Sentence-BERT and BERTopic（Margarida Mendonca, Alvaro Figueira, 2025, ArXiv Preprint）
Exploring Unknown Social Networks for Discovering Hidden Nodes（Sho Tsugawa, Hiroyuki Ohsaki, 2025, ArXiv Preprint）
Multitask learning for recognizing stress and depression in social media（Loukas Ilias, Dimitris Askounis, 2023, ArXiv Preprint）
Label-dependent Feature Extraction in Social Networks for Node Classification（Tomasz Kajdanowicz, Przemyslaw Kazienko, Piotr Doskocz, 2013, ArXiv Preprint）

新闻/信息推荐与影响图：社交网络多层关系建模与个性化传播推断

以社交网络的多层关系为核心实现信息传播/关系生成：一方面显式建模扩散与影响图用于微博新闻推荐与时变偏好刻画，另一方面在多维网络框架中区分社会联系与语义（对象）联系，通过层权重适配生成推荐/建议。为CDA提供“媒体内容如何在网络实践中被选择与扩散”的计算外部语境。

IGNiteR: News Recommendation in Microblogging Applications (Extended Version)（Yuting Feng, Bogdan Cautis, 2022, ArXiv Preprint）
Multidimensional Social Network in the Social Recommender System（Przemyslaw Kazienko, Katarzyna Musial, Tomasz Kajdanowicz, 2013, ArXiv Preprint）

社交媒体失真信息/宣传：检测、表征与扩散动力学建模

关注社交媒体中的虚假信息/宣传/操纵：通过传播网络建模、检测/聚类流程与动力学评估刻画行动者—内容—扩散的可计算证据链，并提供机制层面的外部约束，帮助CDA将“话语再生产的权力/制度作用方式”接到可追踪的传播过程上。

Proppy: A System to Unmask Propaganda in Online News（Alberto Barrón-Cedeño, Giovanni Da San Martino, Israa Jaradat, Preslav Nakov, 2019, ArXiv Preprint）
Keeping it Authentic: The Social Footprint of the Trolls Network（Ori Swed, Sachith Dassanayaka, Dimitri Volchenkov, 2024, ArXiv Preprint）
Measuring social spam and the effect of bots on information diffusion in social media（Emilio Ferrara, 2017, ArXiv Preprint）
Clustering Memes in Social Media（Emilio Ferrara, Mohsen JafariAsbagh, Onur Varol, Vahed Qazvinian, Filippo Menczer, Alessandro Flammini, 2013, ArXiv Preprint）
Quantifying Social Network Dynamics（Radosław Michalski, Piotr Bródka, Przemysław Kazienko, Krzysztof Juszczyszyn, 2013, ArXiv Preprint）
Assessing Individual and Community Vulnerability to Fake News in Social Networks（Bhavtosh Rath, Wei Gao, Jaideep Srivastava, 2021, ArXiv Preprint）
Empirical Evaluation of Link Deletion Methods for Limiting Information Diffusion on Social Media（Shiori Furukawa, Sho Tsugawa, 2026, ArXiv Preprint）

新闻媒体事实性与偏差的预测：跨模态/跨语言联合建模与多来源证据整合

把“事实性（factuality）—偏差/意识形态（bias）”作为可预测对象，在媒体/机构层面构建评估框架：涵盖特征工程与机器学习建模、事实性与偏差联合预测、多来源信号整合（文章/维基/社媒/流量等），以及专门化LLM提升跨语言新闻理解与分析能力，从而为CDA的文本—意识形态解读提供可量化参照。

Predicting Factuality of Reporting and Bias of News Media Sources（Ramy Baly, Georgi Karadzhov, Dimitar Alexandrov, James Glass, Preslav Nakov, 2018, ArXiv Preprint）
What Was Written vs. Who Read It: News Media Profiling Using Text Analysis and Social Media Context（Ramy Baly, Georgi Karadzhov, Jisun An, Haewoon Kwak, Yoan Dinkov, Ahmed Ali, James Glass, Preslav Nakov, 2020, ArXiv Preprint）
A Survey on Predicting the Factuality and the Bias of News Media（Preslav Nakov, Husrev Taha Sencar, Jisun An, Haewoon Kwak, 2021, ArXiv Preprint）
Multi-Task Ordinal Regression for Jointly Predicting the Trustworthiness and the Leading Political Ideology of News Media（Ramy Baly, Georgi Karadzhov, Abdelrhman Saleh, James Glass, Preslav Nakov, 2019, ArXiv Preprint）
LlamaLens: Specialized Multilingual LLM for Analyzing News and Social Media Content（Mohamed Bayan Kmainasi, Ali Ezzat Shahroor, Maram Hasanain, Sahinur Rahman Laskar, Naeemul Hassan, Firoj Alam, 2024, ArXiv Preprint）

社媒研究的可复现实验与工程基础设施：实时干预测量与可持续软件实践

以研究过程的可执行性、复现性与工程可持续为重点：包含面向社媒信息流的实时干预与测量（可用于减少研究偏差、检验因果效应），以及支持新架构适配与长期维护的软件实践。该组为CDA研究中的“证据采集、干预验证与复现质量控制”提供方法论支撑。

Reranking Social Media Feeds: A Practical Guide for Field Experiments（Tiziano Piccardi, Martin Saveski, Chenyan Jia, Jeffrey Hancock, Jeanne L. Tsai, Michael S. Bernstein, 2024, ArXiv Preprint）
Experiments in Sustainable Software Practices for Future Architectures（Charles R. Ferenbaugh, 2013, ArXiv Preprint）

可解释结构/贡献估计的对话树与因果归因（结构—作用—解释框架）

强调结构化的因果或贡献归因：一方面使用因果发现与结构因果模型估计影响渠道贡献（方向性、可解释）；另一方面以对话树联合学习话语角色与主题。该组为CDA提供“话语/渠道如何产生影响”的可解释结构—作用建模补充。

Causal-driven attribution (CDA): Estimating channel influence without user-level data（Georgios Filippou, Boi Mai Quach, Diana Lenghel, Arthur White, Ashish Kumar Jha, 2025, ArXiv Preprint）
A Joint Model of Conversational Discourse and Latent Topics on Microblogs（Jing Li, Yan Song, Zhongyu Wei, Kam-Fai Wong, 2018, ArXiv Preprint）

非直接相关：跨学科数学/物理/天文/离散算法/3D工程等背景材料（不纳入新闻CDA主分析）

这些条目主要属于数学/物理/天文数值/3D工程/离散或算法理论等领域，未在所给初始化分组中形成对新闻话语分析的直接文本证据或计算话语机制主线。为避免与“新闻/话语/社媒话语”主干分组交叉，本组作为非直接相关背景并列收束（保留但不用于CDA核心证据合成）。

Stochastic integration in Riemannian manifolds from a functional-analytic point of view（Alexandru Mustăţea, 2022, ArXiv Preprint）
Infinite Dimensional Ito Algebras of Quantum White Noise（V. P. Belavkin, 2005, ArXiv Preprint）
IVOA Recommendation: Data Model for Astronomical DataSet Characterisation（Mireille Louys, Anita Richards, Francois Bonnarel, Alberto Micol, Igor Chilingarian, Jonathan McDowell, the IVOA Data Model Working Group, 2011, ArXiv Preprint）
Thetis coastal ocean model: discontinuous Galerkin discretization for the three-dimensional hydrostatic equations（Tuomas Kärnä, Stephan C. Kramer, Lawrence Mitchell, David A. Ham, Matthew D. Piggott, António M. Baptista, 2017, ArXiv Preprint）
Maximum Lebesgue Extension of Monotone Convex Functions（Keita Owari, 2013, ArXiv Preprint）
Point transitivity, $Δ$-transitivity and multi-minimality（Zhijing Chen, Jian Li, Jie Lü, 2013, ArXiv Preprint）
Higher-Order Functions and Brouwer's Thesis（Jonathan Sterling, 2016, ArXiv Preprint）
On three-dimensional Alexandrov spaces（Fernando Galaz-Garcia, Luis Guijarro, 2013, ArXiv Preprint）
A lattice model with a theta term in three dimensions（Srinath Cheluvaraja, 1999, ArXiv Preprint）
Description of three-dimensional evolution algebras（Yolanda Cabrera Casado, Mercedes Siles Molina, M. Victoria Velasco, 2017, ArXiv Preprint）
A new tool in nuclear physics: Nuclear lattice simulations（Ulf-G. Meißner, 2015, ArXiv Preprint）
Practical Reasoning in DatalogMTL（Dingmin Wang, Przemysław A. Wałęga, Pan Hu, Bernardo Cuenca Grau, 2024, ArXiv Preprint）
Practical Trade-Offs for the Prefix-Sum Problem（Giulio Ermanno Pibiri, Rossano Venturini, 2020, ArXiv Preprint）
A Three-Dimensional GUI for Windows Explorer（David Carter, Luiz Fernando Capretz, 2015, ArXiv Preprint）
GraMMaR: Ground-aware Motion Model for 3D Human Motion Reconstruction（Sihan Ma, Qiong Cao, Hongwei Yi, Jing Zhang, Dacheng Tao, 2023, ArXiv Preprint）
A Novel Corpus of Discourse Structure in Humans and Computers（Babak Hemmatian, Sheridan Feucht, Rachel Avram, Alexander Wey, Muskaan Garg, Kate Spitalnic, Carsten Eickhoff, Ellie Pavlick, Bjorn Sandstede, Steven Sloman, 2021, ArXiv Preprint）
Embedding Mental Health Discourse for Community Recommendation（Hy Dang, Bang Nguyen, Noah Ziems, Meng Jiang, 2023, ArXiv Preprint）

A Critical Discourse Analysis of News Reports within Fairclough's Three-Dimensional Model

合并后，这批文献可形成一套支持“Fairclough三维模型下新闻话语批评”的多层计算证据框架：在**社会实践层**，利用社交媒体网络与扩散动力学识别失真信息/宣传及其行动者机制，同时用政治化与操纵相关方法刻画群体话语动态；在**媒体/话语再生产层**，通过事实性与偏差预测（含跨语言/多来源信号）把“文本—立场”转化为可量化参照，并用可复现的社媒实验/工程基础设施保障证据质量；在**文本/语篇层**，引入行动者指称识别、话语结构树表征、以及话语标记与话语关系信号的自动识别与建模，为衔接、关系类型与隐含立场运作提供可操作的语言学证据。另有部分形式语言/语法与解析理论作为符号化文本结构表征的工具箱，以及少量跨学科非直接相关背景被并列剔除以避免分组交叉。

共 70 篇文献，12 个研究方向

新闻话语证据：发布后标题改写与媒体框架/偏见标注资源

聚焦可复用的数据资源与标注方案：研究新闻在发布后标题被编辑/改写的现象，并围绕该资源进行偏见类型标注、分类与下游框架/参与度分析，从而为CDA中“话语如何组织经验、建构立场”的文本证据提供可量化起点。相关文献: Preetika Verma et. al, 2024

新闻语篇计算识别：行动者/主体指称（代词→规范名）

围绕新闻报道中的“话语网络”关键环节：从代词指称到规范主体名的行动者识别，解决称谓/指代链构建难题，并对传统流水线与LLM/混合模型进行评估，为CDA可操作的“谁在说/谁被塑造为行动主体”的文本层证据提供方法。相关文献: Ana Barić et. al, 2024

话语结构与修辞组织的计算表征：话语树/RS T用于下游评测（以MT为例）

将话语结构（如Rhetorical Structure Theory）编码为可计算的树结构表征，并用于自动评测任务（例如机器翻译一致性评测），强调“语篇组织/修辞关系”作为核心特征进行建模，以支撑CDA文本维度对衔接、层次关系与隐含立场机制的可证据化分析。相关文献: Shafiq Joty et. al, 2019

话语标记与话语关系信号的计算建模：连接/隐式关系/主题分段/锚定

语言形式化与语法/解析框架的理论与工具基础（符号层表征能力）

该组提供CDA所需的“可计算文本结构描述能力”的基础：涵盖约束语法/范畴语法等形式语言理论、构式语法与AI关联、语法开发工程经验，以及语言识别的鲁棒评测；并补充解析环境与形式系统，使得把话语线索形式化为结构/接口表征成为可能。相关文献: Anssi Yli-Jyrä et. al, 2017 等 11 篇文献

社交媒体政治化/操纵/群体话语动态：协调检测、主题转移、道德框架与图探索

新闻/信息推荐与影响图：社交网络多层关系建模与个性化传播推断

以社交网络的多层关系为核心实现信息传播/关系生成：一方面显式建模扩散与影响图用于微博新闻推荐与时变偏好刻画，另一方面在多维网络框架中区分社会联系与语义（对象）联系，通过层权重适配生成推荐/建议。为CDA提供“媒体内容如何在网络实践中被选择与扩散”的计算外部语境。相关文献: Yuting Feng et. al, 2022 等 2 篇文献

社交媒体失真信息/宣传：检测、表征与扩散动力学建模

关注社交媒体中的虚假信息/宣传/操纵：通过传播网络建模、检测/聚类流程与动力学评估刻画行动者—内容—扩散的可计算证据链，并提供机制层面的外部约束，帮助CDA将“话语再生产的权力/制度作用方式”接到可追踪的传播过程上。相关文献: Alberto Barrón-Cedeño et. al, 2019 等 7 篇文献

新闻媒体事实性与偏差的预测：跨模态/跨语言联合建模与多来源证据整合

把“事实性（factuality）—偏差/意识形态（bias）”作为可预测对象，在媒体/机构层面构建评估框架：涵盖特征工程与机器学习建模、事实性与偏差联合预测、多来源信号整合（文章/维基/社媒/流量等），以及专门化LLM提升跨语言新闻理解与分析能力，从而为CDA的文本—意识形态解读提供可量化参照。相关文献: Ramy Baly et. al, 2018 等 5 篇文献

社媒研究的可复现实验与工程基础设施：实时干预测量与可持续软件实践

以研究过程的可执行性、复现性与工程可持续为重点：包含面向社媒信息流的实时干预与测量（可用于减少研究偏差、检验因果效应），以及支持新架构适配与长期维护的软件实践。该组为CDA研究中的“证据采集、干预验证与复现质量控制”提供方法论支撑。相关文献: Tiziano Piccardi et. al, 2024 等 2 篇文献

可解释结构/贡献估计的对话树与因果归因（结构—作用—解释框架）

强调结构化的因果或贡献归因：一方面使用因果发现与结构因果模型估计影响渠道贡献（方向性、可解释）；另一方面以对话树联合学习话语角色与主题。该组为CDA提供“话语/渠道如何产生影响”的可解释结构—作用建模补充。相关文献: Georgios Filippou et. al, 2025 等 2 篇文献

非直接相关：跨学科数学/物理/天文/离散算法/3D工程等背景材料（不纳入新闻CDA主分析）

这些条目主要属于数学/物理/天文数值/3D工程/离散或算法理论等领域，未在所给初始化分组中形成对新闻话语分析的直接文本证据或计算话语机制主线。为避免与“新闻/话语/社媒话语”主干分组交叉，本组作为非直接相关背景并列收束（保留但不用于CDA核心证据合成）。相关文献: Alexandru Mustăţea et. al, 2022 等 17 篇文献

总计79篇相关文献

Beyond The Wall Street Journal: Anchoring and Comparing Discourse Signals across Genres

超越《华尔街日报》：跨体裁的语篇信号锚定与比较

arxiv.org-Yang Liu, 2019-ArXiv Preprint

Recent research on discourse relations has found that they are cued not only by discourse markers (DMs) but also by other textual signals and that signaling information is indicative of genres. While several corpora exist with discourse relation signaling information such as the Penn Discourse Treebank (PDTB, Prasad et al. 2008) and the Rhetorical Structure Theory Signalling Corpus (RST-SC, Das and Taboada 2018), they both annotate the Wall Street Journal (WSJ) section of the Penn Treebank (PTB, Marcus et al. 1993), which is limited to the news domain. Thus, this paper adapts the signal identification and anchoring scheme (Liu and Zeldes, 2019) to three more genres, examines the distribution of signaling devices across relations and genres, and provides a taxonomy of indicative signals found in this dataset.