人工智能能力

最终合并的分组全面覆盖了人工智能能力的研究版图：从底层的神经网络架构与特征表示技术，到中层的逻辑推理、自适应学习与具身智能机制，再到高层的通用人工智能（AGI）愿景。报告不仅深入探讨了AI在医疗、科研、供应链等关键行业的深度应用能力，还从组织行为学和管理学视角分析了AI能力对企业绩效的赋能作用，构建了一个从理论基础到技术实现，再到社会组织应用的完整能力评价体系。

共 114 篇文献，7 个研究方向

通用人工智能（AGI）的理论框架与认知启发架构

探讨AGI的数学定义（如AIXI）、演进路径、脑启发神经架构、常识知识表示以及受心理学启发的认知空间导航模型。相关文献: Sirajo Abdullahi Bakura et. al, 2025 等 23 篇文献

大语言模型（LLM）的逻辑推理、复杂决策与评估基准

聚焦于LLM在逻辑、数学、经济等领域的推理能力，涵盖思维链（CoT）技术、强化学习（如DeepSeek-R1）对推理的激励、认知偏见分析以及针对专家级问题的评估基准。相关文献: Melanie Mitchell et. al, 2025 等 19 篇文献

医疗健康领域的临床推理与智慧医疗应用

专门研究AI在临床医学环境下的表现，包括诊断准确性、临床决策过程、医学考试能力、护理系统化以及通用医疗人工智能（GMAI）框架的构建。相关文献: Christophe Gauld et. al, 2024 等 22 篇文献

机器学习的自适应、持续学习与领域迁移能力

研究AI系统在动态环境中的鲁棒性，涉及终身学习、领域自适应（Domain Adaptation）、主动学习、概念漂移检测及数据流环境下的自我调节机制。相关文献: Omid Gheibi et. al, 2022 等 10 篇文献

具身智能、物理推理与自主代理系统

涵盖具备物理形态或自主行动能力的AI，包括物理推理能力评估（Phy-Q）、机器人控制、具身智能体（FaGeL）以及代理智能（Agentic AI）在自动化实验中的应用。相关文献: Cheng Xue et. al, 2021 等 8 篇文献

组织AI能力构建、行业赋能与科学研究自动化

探讨AI能力如何转化为组织绩效与创造力，分析其在供应链、法律、交通等行业的落地，以及AI作为“科学家2.0”对科研范式的重塑。相关文献: Suheil Neiroukh et. al, 2024 等 10 篇文献

基础神经网络架构、特征表示与计算智能方法论

侧重于底层技术实现，包括卷积神经网络（CNN）、自编码器、特征提取技术、信息场论以及各类计算智能优化算法。相关文献: Weizu Wu et. al, 2017 等 22 篇文献

总计115篇相关文献

ChatGPT与DeepSeek-R1比较研究：架构、推理能力与应用场景分析A Comparative Study of ChatGPT and DeepSeek-R1: Analysis of Architecture, Reasoning Capabilities, and Application Scenarios

李昌奎, 2025-Theory and Practice of Social Science

人工智能技术的飞速发展推动了大语言模型（LLM）的不断进步。在众多LLM中，OpenAI推出的ChatGPT和DeepSeek-AI开发的DeepSeek-R1尤为引人注目。ChatGPT基于GPT-4架构，具备强大的自然语言理解能力和广泛的应用场景，而DeepSeek-R1则通过强化学习方法优化推理能力，在数学推理和编程任务中展现了强劲的竞争力。本文基于DeepSeek-R1的最新研究成果，全面对比ChatGPT与DeepSeek-R1在模型架构、训练方法、推理能力、应用场景及开放性等方面的差异。研究发现，ChatGPT依赖监督微调（SFT）和基于人类反馈的强化学习（RLHF），在自然语言处理任务上表现突出，而DeepSeek-R1更倾向于通过强化学习优化推理能力，尤其在数学推理、代码生成等任务上表现优异。此外，ChatGPT采用闭源策略，主要用于商业应用，而DeepSeek-R1则采取开源模式，为研究社区和开发者提供更大的灵活性。本文的研究结果为人工智能研究人员和开发者提供了重要参考，以期促进LLM技术的发展，并为未来的大模型优化提供新思路。 The rapid development of artificial intelligence has driven the continuous advancement of large language models (LLMs). Among them, OpenAI's ChatGPT and DeepSeek-AI's DeepSeek-R1 have garnered significant attention. ChatGPT, built upon the GPT-4 architecture, demonstrates strong natural language understanding and wide-ranging applications, whereas DeepSeek-R1 leverages reinforcement learning techniques to optimize reasoning capabilities, excelling in mathematical reasoning and programming tasks. This paper, based on the latest research on DeepSeek-R1, provides a comprehensive comparison between ChatGPT and DeepSeek-R1 in terms of model architecture, training methods, reasoning capabilities, application scenarios, and openness. The study reveals that ChatGPT relies on supervised fine-tuning (SFT) and reinforcement learning from human feedback (RLHF), making it highly effective in natural language processing tasks. In contrast, DeepSeek-R1 emphasizes reinforcement learning to enhance reasoning abilities, particularly excelling in mathematical reasoning and code generation tasks. Moreover, ChatGPT follows a closed-source approach, primarily for commercial use, while DeepSeek-R1 adopts an open-source model, offering greater flexibility for researchers and developers. This study provides valuable insights for AI researchers and developers, contributing to the advancement of LLM technology and future model optimization strategies.