A Critical Discourse Analysis of News Reports within Fairclough's Three-Dimensional Model

新闻话语证据:发布后标题改写与媒体框架/偏见标注资源

聚焦可复用的数据资源与标注方案:研究新闻在发布后标题被编辑/改写的现象,并围绕该资源进行偏见类型标注、分类与下游框架/参与度分析,从而为CDA中“话语如何组织经验、建构立场”的文本证据提供可量化起点。

新闻语篇计算识别:行动者/主体指称(代词→规范名)

围绕新闻报道中的“话语网络”关键环节:从代词指称到规范主体名的行动者识别,解决称谓/指代链构建难题,并对传统流水线与LLM/混合模型进行评估,为CDA可操作的“谁在说/谁被塑造为行动主体”的文本层证据提供方法。

话语结构与修辞组织的计算表征:话语树/RS T用于下游评测(以MT为例)

将话语结构(如Rhetorical Structure Theory)编码为可计算的树结构表征,并用于自动评测任务(例如机器翻译一致性评测),强调“语篇组织/修辞关系”作为核心特征进行建模,以支撑CDA文本维度对衔接、层次关系与隐含立场机制的可证据化分析。

话语标记与话语关系信号的计算建模:连接/隐式关系/主题分段/锚定

共同点是以“话语标记—话语关系—话语组织信号”为抓手:既考察话语连接词对计算理解的影响,也进行话语标记识别与对话行为预测;同时通过神经模型学习隐式话语关系、利用上句语境/依存信息改进主题分段,并扩展到多体裁/锚定方案(不仅限WSJ新闻)。这些成果共同服务于CDA“文本如何通过衔接/关系类型实现意识形态运作与立场组织”的可计算证据链。

语言形式化与语法/解析框架的理论与工具基础(符号层表征能力)

该组提供CDA所需的“可计算文本结构描述能力”的基础:涵盖约束语法/范畴语法等形式语言理论、构式语法与AI关联、语法开发工程经验,以及语言识别的鲁棒评测;并补充解析环境与形式系统,使得把话语线索形式化为结构/接口表征成为可能。

社交媒体政治化/操纵/群体话语动态:协调检测、主题转移、道德框架与图探索

面向社交媒体的政治/意识形态/操纵与情绪相关现象:通过协调行为检测、主题转移度量政治化过程、结合BERTopic与道德基础理论追踪政治话题演化与道德框架关联,并用图探索发现未知网络中的隐藏节点/影响者;同时以多任务学习从早期文本识别压力/抑郁等状态。核心在于把话语内容与群体互动/网络结构过程耦合并量化。

新闻/信息推荐与影响图:社交网络多层关系建模与个性化传播推断

以社交网络的多层关系为核心实现信息传播/关系生成:一方面显式建模扩散与影响图用于微博新闻推荐与时变偏好刻画,另一方面在多维网络框架中区分社会联系与语义(对象)联系,通过层权重适配生成推荐/建议。为CDA提供“媒体内容如何在网络实践中被选择与扩散”的计算外部语境。

社交媒体失真信息/宣传:检测、表征与扩散动力学建模

关注社交媒体中的虚假信息/宣传/操纵:通过传播网络建模、检测/聚类流程与动力学评估刻画行动者—内容—扩散的可计算证据链,并提供机制层面的外部约束,帮助CDA将“话语再生产的权力/制度作用方式”接到可追踪的传播过程上。

新闻媒体事实性与偏差的预测:跨模态/跨语言联合建模与多来源证据整合

把“事实性(factuality)—偏差/意识形态(bias)”作为可预测对象,在媒体/机构层面构建评估框架:涵盖特征工程与机器学习建模、事实性与偏差联合预测、多来源信号整合(文章/维基/社媒/流量等),以及专门化LLM提升跨语言新闻理解与分析能力,从而为CDA的文本—意识形态解读提供可量化参照。

社媒研究的可复现实验与工程基础设施:实时干预测量与可持续软件实践

以研究过程的可执行性、复现性与工程可持续为重点:包含面向社媒信息流的实时干预与测量(可用于减少研究偏差、检验因果效应),以及支持新架构适配与长期维护的软件实践。该组为CDA研究中的“证据采集、干预验证与复现质量控制”提供方法论支撑。

可解释结构/贡献估计的对话树与因果归因(结构—作用—解释框架)

强调结构化的因果或贡献归因:一方面使用因果发现与结构因果模型估计影响渠道贡献(方向性、可解释);另一方面以对话树联合学习话语角色与主题。该组为CDA提供“话语/渠道如何产生影响”的可解释结构—作用建模补充。

非直接相关:跨学科数学/物理/天文/离散算法/3D工程等背景材料(不纳入新闻CDA主分析)

这些条目主要属于数学/物理/天文数值/3D工程/离散或算法理论等领域,未在所给初始化分组中形成对新闻话语分析的直接文本证据或计算话语机制主线。为避免与“新闻/话语/社媒话语”主干分组交叉,本组作为非直接相关背景并列收束(保留但不用于CDA核心证据合成)。

A Critical Discourse Analysis of News Reports within Fairclough's Three-Dimensional Model

合并后,这批文献可形成一套支持“Fairclough三维模型下新闻话语批评”的多层计算证据框架:在**社会实践层**,利用社交媒体网络与扩散动力学识别失真信息/宣传及其行动者机制,同时用政治化与操纵相关方法刻画群体话语动态;在**媒体/话语再生产层**,通过事实性与偏差预测(含跨语言/多来源信号)把“文本—立场”转化为可量化参照,并用可复现的社媒实验/工程基础设施保障证据质量;在**文本/语篇层**,引入行动者指称识别、话语结构树表征、以及话语标记与话语关系信号的自动识别与建模,为衔接、关系类型与隐含立场运作提供可操作的语言学证据。另有部分形式语言/语法与解析理论作为符号化文本结构表征的工具箱,以及少量跨学科非直接相关背景被并列剔除以避免分组交叉。

70 篇文献,12 个研究方向
新闻话语证据:发布后标题改写与媒体框架/偏见标注资源
聚焦可复用的数据资源与标注方案:研究新闻在发布后标题被编辑/改写的现象,并围绕该资源进行偏见类型标注、分类与下游框架/参与度分析,从而为CDA中“话语如何组织经验、建构立场”的文本证据提供可量化起点。相关文献: Preetika Verma et. al, 2024
新闻语篇计算识别:行动者/主体指称(代词→规范名)
围绕新闻报道中的“话语网络”关键环节:从代词指称到规范主体名的行动者识别,解决称谓/指代链构建难题,并对传统流水线与LLM/混合模型进行评估,为CDA可操作的“谁在说/谁被塑造为行动主体”的文本层证据提供方法。相关文献: Ana Barić et. al, 2024
话语结构与修辞组织的计算表征:话语树/RS T用于下游评测(以MT为例)
将话语结构(如Rhetorical Structure Theory)编码为可计算的树结构表征,并用于自动评测任务(例如机器翻译一致性评测),强调“语篇组织/修辞关系”作为核心特征进行建模,以支撑CDA文本维度对衔接、层次关系与隐含立场机制的可证据化分析。相关文献: Shafiq Joty et. al, 2019
话语标记与话语关系信号的计算建模:连接/隐式关系/主题分段/锚定
共同点是以“话语标记—话语关系—话语组织信号”为抓手:既考察话语连接词对计算理解的影响,也进行话语标记识别与对话行为预测;同时通过神经模型学习隐式话语关系、利用上句语境/依存信息改进主题分段,并扩展到多体裁/锚定方案(不仅限WSJ新闻)。这些成果共同服务于CDA“文本如何通过衔接/关系类型实现意识形态运作与立场组织”的可计算证据链。相关文献: Ruiqi Li et. al, 2023 等 15 篇文献
语言形式化与语法/解析框架的理论与工具基础(符号层表征能力)
该组提供CDA所需的“可计算文本结构描述能力”的基础:涵盖约束语法/范畴语法等形式语言理论、构式语法与AI关联、语法开发工程经验,以及语言识别的鲁棒评测;并补充解析环境与形式系统,使得把话语线索形式化为结构/接口表征成为可能。相关文献: Anssi Yli-Jyrä et. al, 2017 等 11 篇文献
社交媒体政治化/操纵/群体话语动态:协调检测、主题转移、道德框架与图探索
面向社交媒体的政治/意识形态/操纵与情绪相关现象:通过协调行为检测、主题转移度量政治化过程、结合BERTopic与道德基础理论追踪政治话题演化与道德框架关联,并用图探索发现未知网络中的隐藏节点/影响者;同时以多任务学习从早期文本识别压力/抑郁等状态。核心在于把话语内容与群体互动/网络结构过程耦合并量化。相关文献: Leonardo Nizzoli et. al, 2020 等 6 篇文献
新闻/信息推荐与影响图:社交网络多层关系建模与个性化传播推断
以社交网络的多层关系为核心实现信息传播/关系生成:一方面显式建模扩散与影响图用于微博新闻推荐与时变偏好刻画,另一方面在多维网络框架中区分社会联系与语义(对象)联系,通过层权重适配生成推荐/建议。为CDA提供“媒体内容如何在网络实践中被选择与扩散”的计算外部语境。相关文献: Yuting Feng et. al, 2022 等 2 篇文献
社交媒体失真信息/宣传:检测、表征与扩散动力学建模
关注社交媒体中的虚假信息/宣传/操纵:通过传播网络建模、检测/聚类流程与动力学评估刻画行动者—内容—扩散的可计算证据链,并提供机制层面的外部约束,帮助CDA将“话语再生产的权力/制度作用方式”接到可追踪的传播过程上。相关文献: Alberto Barrón-Cedeño et. al, 2019 等 7 篇文献
新闻媒体事实性与偏差的预测:跨模态/跨语言联合建模与多来源证据整合
把“事实性(factuality)—偏差/意识形态(bias)”作为可预测对象,在媒体/机构层面构建评估框架:涵盖特征工程与机器学习建模、事实性与偏差联合预测、多来源信号整合(文章/维基/社媒/流量等),以及专门化LLM提升跨语言新闻理解与分析能力,从而为CDA的文本—意识形态解读提供可量化参照。相关文献: Ramy Baly et. al, 2018 等 5 篇文献
社媒研究的可复现实验与工程基础设施:实时干预测量与可持续软件实践
以研究过程的可执行性、复现性与工程可持续为重点:包含面向社媒信息流的实时干预与测量(可用于减少研究偏差、检验因果效应),以及支持新架构适配与长期维护的软件实践。该组为CDA研究中的“证据采集、干预验证与复现质量控制”提供方法论支撑。相关文献: Tiziano Piccardi et. al, 2024 等 2 篇文献
可解释结构/贡献估计的对话树与因果归因(结构—作用—解释框架)
强调结构化的因果或贡献归因:一方面使用因果发现与结构因果模型估计影响渠道贡献(方向性、可解释);另一方面以对话树联合学习话语角色与主题。该组为CDA提供“话语/渠道如何产生影响”的可解释结构—作用建模补充。相关文献: Georgios Filippou et. al, 2025 等 2 篇文献
非直接相关:跨学科数学/物理/天文/离散算法/3D工程等背景材料(不纳入新闻CDA主分析)
这些条目主要属于数学/物理/天文数值/3D工程/离散或算法理论等领域,未在所给初始化分组中形成对新闻话语分析的直接文本证据或计算话语机制主线。为避免与“新闻/话语/社媒话语”主干分组交叉,本组作为非直接相关背景并列收束(保留但不用于CDA核心证据合成)。相关文献: Alexandru Mustăţea et. al, 2022 等 17 篇文献