试验设计及统计分析
试验设计与空间填充方法研究
这些文献主要关注试验设计(DOE)的理论构建、优化算法及空间填充性质,致力于通过数学结构提升模型效率与预测性能。
- 基于正交试验法的机器人最优路径问题研究(李海涛, 张鹏程, 张铁壁, 王文成, 2025, 河北水利电力学院学报)
- Triple设计的空间填充性质(康佐航, 欧祖军, 李洪毅, 刘旭, 2025, 应用概率统计)
复杂系统的不确定性量化与模型验证
这些文献聚焦于高维、复杂数据环境下的不确定性传播及模型评估,利用统计建模和代理模型解决维度灾难与预测置信度问题。
- 基于活跃子空间的爆压不确定度传递分析(梁霄, 范孟君, 王言金, 王瑞利, 2025, 高压物理学报)
- 密集追踪干预研究设计中的建模及其样本量规划——基于动态结构方程模型(刘玥, 何月翎, 刘红云, 2026, 心理学报)
- 部分函数型线性模型中高维回归系数的检验(李倩, 谭祥勇, 方月歆, 李红梅, 2026, 应用概率统计)
基于因果推断与机器学习的政策及价值评估
这些文献应用先进的因果推断方法(如双重机器学习、合成控制法)处理现实世界中的复杂经济、政策或数据价值评估问题。
- 国家创新型城市试点政策对城市经济韧性的影响研究(李健, 谢华育, 鞠明洋, 2026, 华东师范大学学报(哲学社会科学版))
- 基于因果推断思想的数据价值评估方法(张怡, 王志远, 2025, 系统管理学报)
统计学科建设与方法论视角
该文献从宏观学科发展角度审视统计学的学术生态、人才培养及在人工智能时代的未来研究重点。
- 四大的迷思及破解(吴建福, 2025, 应用概率统计)
本次梳理的文献涵盖了从试验设计的数学基础、复杂系统不确定性分析、因果推断应用到统计学科顶层设计的多个维度。研究呈现出由基础理论优化向数据驱动的复杂场景应用转型的趋势,强调统计方法在应对高维数据、不确定性传播以及社会经济策略评估中的核心价值。
总计8篇相关文献
为推动数据交易与数据市场的发展,解决传统数据评估方法在成本和计算复杂性方面的挑战,本文提出了一种新的基于因果推断的数据增量价值评估方法——数据合成控制法(data synthetic control method,DSCM)。DSCM从数据买方视角出发,将新增数据视为一项干预,创新性地构建反事实推断框架,以精准量化新增数据对监督学习模型性能的贡献。在仿真数据实验中,DSCM对不同模型的数据价值估计与实际数据价值高度吻合,平均误差仅为0.0032。在广告点击预测实际应用中,DSCM对用户中心数据价值的估计与实际价值的平均误差率仅为9%,显著优于传统评估方法。这表明DSCM能够提供准确、稳定的数据价值评估,有效支持企业的数据驱动决策。
为了探究机器人运动过程中的自主路径规划问题,以TSP问题为模型,在遗传算法的基础上,采用5因素4水平正交试验法,通过极差、方差分析不同初始化参数对于最终路径结果的影响。通过实例验证,结果表明:种群数量和迭代次数的取值对应的路径结果具有较大的偏差平方和,对应较大的均方,对结果的影响显著,而其他参数的影响较小。各参数对于优化结果的影响从大到小的顺序为:迭代次数、种群数量、选择因子、变异概率,交叉概率。利用正交试验法对遗传算法的参数进行优化,可以避免单一参数选优时不同参数之间耦合效应的影响,从而找到一组适应不同类型和规模问题的最优化参数组合,利用该参数初始化遗传算法求解此类问题,可以迅速获得最优解。
爆压间接标定中的不确定度无法消除,不确定度量化能提高模型的可信度和预测能力。然而,爆压间接标定函数具有复杂非线性结构耦合多输入变量等特征,使得爆压不确定度传播研究遇到“维数灾难”等问题。活跃子空间是处理爆压不确定度量化的有效工具。首先,导出系统响应量(system response quantity, SRQ)的梯度协方差矩阵;然后,基于Monte Carlo方法,寻找活跃变量,即SRQ变化最快的方向;接着,将高维输入不确定度转化成一维空间处理,避免了“维数灾难”;最后,建立基于一维活跃变量的四阶多项式响应面模型。结果表明,活跃子空间方法成功刻画了输入不确定度对SRQ的影响,且试验结果落在代理模型预测值的置信区间内,确认了爆压模型的预测能力。研究还发现,爆压的离散程度较大,与孙承纬的结论吻合。此外,建立了一种新的爆压模型。该模型是仿射变换与多项式函数的复合运算,具有形式简洁、光滑性好、鲁棒能力强、运算速度快的特点,且系统输入量是随机变量而非固定值,多项式拟合系数不因输入不确定度的变化而改变。该研究方法具备体系性,可以推广到其他类型的炸药爆压预测。
在实际应用中常常会遇到高维和函数型数据的混合数据. 部分函数型线性模型是处理这种混合型数据的有力工具. 本文基于部分函数型线性模型构造 U 检验统计量, 讨论模型中高维回归系数的全局检验问题. 应用鞅的中心极限定理, 证明了所提出检验统计量在原假设和局部备择下的渐近分布.通过蒙特卡洛数值模拟验证了该检验统计量在有限样本情形下具有良好水平和功效. 最后, 将该方法应用于环境污染数据, 展示了其有效性和实用性.
密集追踪干预研究具有生态效度高、能够提供实时和个性化干预等优势。然而, 目前常用的数据分析方法未能充分反映密集追踪数据的特点, 而先进的数据分析模型又缺乏与之匹配的样本量规划方法, 极大地限制了这种范式的推广应用。本文在两种典型的密集追踪干预实验设计——单臂设计和随机对照设计下, 基于动态结构方程模型, 结合检验力和效应量估计准确性, 采用模拟研究方法开展样本量规划, 并从第一类错误率等方面对两种设计进行综合比较, 最后提出了实验设计和样本量规划建议。
倍扩方法常用于构造性质优良的大型设计. 本文基于Triple设计的倍扩结构在最大最小L_2-距离准则下讨论了其空间填充性质, 获得了Triple设计的最大最小L_2-距离上界. 基于字长计数器得到了Triple设计广义字长型的快速计算方式, 并获得了Triple设计的字长计数器下界. 数值例子表明Triple设计具有良好的空间填充性, 且能够达到最大最小L_2-距离上界 and 字长计数器下界.
本文探讨了统计学界对“四大天王”期刊(Ann.of Stat., J.Am.Stat.Assoc., Biometrika, J.Roy.Stat.Soc.B.)的过度重视现象,指出虽然“四大天王”在学术评价中起到了一定的积极作用,但过度依赖会导致学术视野狭窄,忽视国家和社会的实际需求,并建议将“四大天王”扩展为“华丽十大”,鼓励学者关注更多领域的期刊和会议,以促进学科交叉融合.本文还探讨了人工智能对统计学的影响,认为统计学仍具有独特的价值,并提出了一些关于统计学未来发展的思考,例如加强实验设计和不确定性量化等领域的研究,以及改进统计学人才培养模式.
在全球经贸秩序动荡背景下,我国城市经济正经历深度调整期,提升城市经济韧性成为高质量发展的重要议题。近年来,中央强调以高质量发展的确定性应对外部不确定性,科技创新成为提升城市经济韧性的重要路径。本文基于2004—2023年中国274个地级及以上城市面板数据,运用双重机器学习模型,实证检验国家创新型城市试点政策对城市经济韧性的影响。研究表明:(1)试点政策使城市经济韧性显著提升,在实施第四年后政策效果显现并持续增强,对此展开的稳健性检验也证实了这一结论。(2)国家创新型城市试点政策通过集聚效应、技术创新和产业结构高级化,增强城市经济韧性。(3)该政策效果具有显著的异质性,在非资源型城市、发达城市以及东部地区城市该效果显著为正,而在资源型城市、欠发达城市、中西部地区城市该效果不显著,在东北地区城市该效果甚至为负。由此引申出的政策建议是:延长政策周期与强化中长期支持,以更好稀释政策滞后效应;推动制造业与服务业深度融合,完善产业结构“双重升级”的路径;以技术创新为政策核心,培育城市经济韧性撬动点;因地制宜扩展试点范围,提升政策的可及性与公平性。
本次梳理的文献涵盖了从试验设计的数学基础、复杂系统不确定性分析、因果推断应用到统计学科顶层设计的多个维度。研究呈现出由基础理论优化向数据驱动的复杂场景应用转型的趋势,强调统计方法在应对高维数据、不确定性传播以及社会经济策略评估中的核心价值。