TextRank 的加权改进、BART 的轻量化优化

本报告综合了 TextRank 算法的加权改进与 BART 模型的轻量化优化两大前沿方向。研究脉络清晰地展示了自然语言处理领域在“语义增强”与“计算效率”之间的平衡：一方面，通过融合深度学习嵌入（BERT/Word2Vec）与多维统计特征，使传统的无监督图算法 TextRank 具备了更强的语义感知能力，并广泛应用于垂直领域；另一方面，针对以 BART 为代表的预训练模型，通过知识蒸馏、结构化剪枝、量化及潜在空间压缩等技术手段，显著降低了大规模生成式模型的部署门槛，同时结合检索增强与忠实度优化策略，解决了生成内容的事实一致性挑战。这些研究共同推动了高效、精准的文本分析与生成技术在工业界的落地。

共 101 篇文献，6 个研究方向

融合语义嵌入与多维特征的 TextRank 算法改进

该组文献聚焦于通过引入外部语义信息（如 BERT、Word2Vec、FastText 词向量）和统计特征（如 TF-IDF、位置权重、词性、BM25）来优化传统 TextRank 算法。旨在解决传统图模型在捕捉长距离语义关联及句子重要性表征方面的局限性，提升关键词提取和摘要生成的准确性。相关文献: Wadeea R. Naji et. al, 2025 等 23 篇文献

TextRank 在垂直领域与多源数据中的应用实践

这部分文献探讨了改进后的 TextRank 及其变体在特定场景下的应用，包括社交媒体（Twitter/Bilibili）、电子商务评论、公共卫生、金融交易监控、股价预测及低资源语言处理。研究强调了结合领域特征（如用户参与度、首句权重、情感倾向）对关键信息浓缩的实用价值。相关文献: Anwar Alhenshiri et. al, 2025 等 12 篇文献

BART 模型的知识蒸馏与量化压缩技术

该组文献关注 BART 及其轻量化版本（如 DistilBART）的性能优化。通过知识蒸馏、模型量化、潜在空间压缩（引入自编码器）等手段，在保持生成质量的同时，显著降低模型参数量和推理延迟，使其适用于视频摘要、教育翻译等资源受限场景。相关文献: Gulden Murzabekova et. al, 2025 等 18 篇文献

Transformer 架构的结构化剪枝与高效部署策略

这部分文献研究了针对 BART 及大语言模型（LLMs）的通用压缩技术，包括层塌陷（Layer Collapse）、注意力头剪枝、结构化剪枝（Wanda/Wanda++）、提示词压缩（LLMLingua-2）以及模块化替换，旨在实现模型在边缘设备上的高效部署。相关文献: Yifei Yang et. al, 2024 等 23 篇文献

BART 摘要生成的忠实度提升与策略优化

该组文献致力于解决生成式模型在摘要任务中的幻觉与事实一致性问题。通过引入关键词引导（RAKE/KeyBERT）、实体忠实度奖励（EHI）、检索增强（Re2G）以及强化学习反馈，优化 BART 的生成策略，确保摘要的准确性与逻辑性。相关文献: Maria Linneke Adjie et. al, 2025 等 6 篇文献

加权图建模与知识蒸馏的基础理论研究

该组文献提供了图算法改进与模型压缩的底层数学支撑，涉及加权网络的边缘聚类、邻接矩阵分析、Logit 标准化以及跨学科的图排序应用（如生物医学基因排序、流行病防护策略），为 TextRank 和 BART 的优化提供了方法论参考。相关文献: Nikhil V. Chandran et. al, 2025 等 19 篇文献

总计101篇相关文献

A Multidimensional-Weighted TextRank and LSTM-Attention Model for Network Public Opinion Sentiment Analysis

基于多维加权TextRank和LSTM-Attention的网络公众舆论情感分析模型

Minjie He, Qi Huang, 2025-Informatica

No abstract available