光场视频插帧方法（时空超分/时域超分）

自监督光场视频重建：稀疏视角（双目/单目）到时空光场

共同点是针对“光场视频重建/插帧的稀疏视角输入”提出自监督学习框架，核心通过几何一致性（视差/极线/双目或单目几何）、光度一致性与时序约束来指导网络，同时引入低秩或分层光场先验来正则化并提升视角插值/外推能力；其中也强调遮挡（disocclusion）等现实困难的处理。

SeLFVi: Self-supervised Light-Field Video Reconstruction from Stereo Video（Prasan A. Shedligeri, Florian Schiffers, Sushobhan Ghosh, O. Cossairt, K. Mitra, 2021, 2021 IEEE/CVF International Conference on Computer Vision (ICCV)）
Synthesizing Light Field Video from Monocular Video（Shrisudhan Govindarajan, Prasan Shedligeri, Sarah, Kaushik Mitra, 2022, ArXiv Preprint）

光场视频时域插值/帧插帧：角向一致性与运动驱动合成

共同点是“时间插值（VFI/时域超分）”范式：从两个（或相邻）时间点的输入生成中间时刻光场/视频帧；方法普遍依赖运动/光流或场景流进行时间对齐，并通过网络合成中间视角，同时强调一致性（角向一致性、空间/时间一致性）与表示效率（如显式分离运动与外观特征、或注意力机制复用）。

Angularly Consistent Light Field Video Interpolation（Pierre David, Mikael Le Pendu, C. Guillemot, 2020, 2020 IEEE International Conference on Multimedia and Expo (ICME)）
Light field video frame interpolation using hierarchical spatial-angular-temporal information decoupling and fusion（Mingxing Fu, Yeyao Chen, Chongchong Jin, Haiyong Xu, Ting Luo, Zongju Peng, Gangyi Jiang, 2026, Displays）
VFIMamba: Video Frame Interpolation with State Space Models（Yutao Cui, Chunxu Liu, Kai Ma, Limin Wang, Guozhen Zhang, Xiaotong Zhao, 2024, Advances in Neural Information Processing Systems 37）
Extracting Motion and Appearance via Inter-Frame Attention for Efficient Video Frame Interpolation（Guozhen Zhang, Yuhan Zhu, Hongya Wang, Youxin Chen, Gangshan Wu, Limin Wang, 2023, 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)）

面向插帧的光场几何与光流估计：以运动/深度传播为核心

共同点是引入“时空光场相关的运动/几何（光流、深度、视角传播）”作为插帧或重建的关键中间表征：前者通过学习的时空流估计把LF角信息传播到2D视频并用外观估计合成高帧率光场视频；后者基于4D光场几何（超像素/斜平面）进行全视图光流与深度估计，为跨视角的时间/视角一致性提供物理约束。

Light field video capture using a learning-based hybrid imaging system（Tingxian Wang, Jun-Yan Zhu, N. Kalantari, Alexei A. Efros, R. Ramamoorthi, 2017, ACM Transactions on Graphics）
Full View Optical Flow Estimation Leveraged From Light Field Superpixel（Hao Zhu, Xiaoming Sun, Qi Zhang, Qing Wang, A. Robles-Kelly, Hongdong Li, Shaodi You, 2020, IEEE Transactions on Computational Imaging）

时空超分一阶段/端到端：联合空间-角度-时间提升

共同点是将任务表述为“空间-时间联合超分/慢动作时空超分”，从低分辨率且低帧率观测直接恢复高质量的时空序列；其中一个聚焦LF视频，通过SAI重组织与多尺度/角向辅助特征聚合来同时处理空间、角度与时间；另一个把空间超分与时间插值合成到一阶段框架，用特征时间插值避免显式补帧导致的两阶段开销。

Space-Time Super-Resolution for Light Field Videos（Zeyu Xiao, Zhen Cheng, Zhiwei Xiong, 2023, IEEE Transactions on Image Processing）
Zooming SlowMo: An Efficient One-Stage Framework for Space-Time Video Super-Resolution（Xiaoyu Xiang, Yapeng Tian, Yulun Zhang, Yun Fu, Jan P. Allebach, Chenliang Xu, 2021, ArXiv Preprint）

连续时间光场视频因子化：POV驱动的时序一致性重建

共同点是强调“连续时间感知（POV/刷新率）”而非仅离散帧约束：通过序列级低秩/因子分解，并把POV效应显式纳入全局目标以消除闪烁并提升时序一致性；同时提出实用的序列级高效优化/因子化实现（cuboid-wise、因果TF-C）以适配系统部署。

Temporal Fusion: Continuous-Time Light Field Video Factorization（Li-De Chen, Li-Qun Weng, Hao-Chien Cheng, An-Yu Cheng, Chao-Tsung Huang, 2025, IEEE Transactions on Image Processing）

通用视频时域建模：短/长时差分、融合策略与循环聚合

共同点是围绕“视频时序建模/时间特征聚合”的通用VSR/VFI思想展开，用短期/长期时序差分、不同融合方式（2D/3D CNN、RNN）或滑动窗口循环状态来提高时间一致性与细节恢复；虽然不专门以光场为唯一对象，但为光场时域插帧提供了可迁移的时序建模模块与思想。

Local-Global Temporal Difference Learning for Satellite Video Super-Resolution（Yi Xiao, Qiangqiang Yuan, Kui Jiang, Xianyu Jin, Jiang He, Liangpei Zhang, Chia-Wen Lin, 2023, ArXiv Preprint）
Revisiting Temporal Modeling for Video Super-resolution（Takashi Isobe, Fang Zhu, Xu Jia, Shengjin Wang, 2020, ArXiv Preprint）
Sliding Window Recurrent Network for Efficient Video Super-Resolution（Wenyi Lian, Wenjing Lian, 2022, ArXiv Preprint）

多视角光场数据/对应与场景流基础设施：对齐与评测支撑

共同点是提供“多视角对应/场景流估计与数据管线”支撑光场视频插帧研究：在线对应与场景流估计为跨视角几何对齐提供基础；数据集与采集/处理管线则面向稀疏与宽基线多视角视频LF，降低方法训练与评测的工程门槛。

Efficient Multi‐image Correspondences for On‐line Light Field Video Processing（Lukasz Dabala, M. Ziegler, P. Didyk, Frederik Zilly, J. Keinert, K. Myszkowski, H. Seidel, Przemyslaw Rokita, Tobias Ritschel, 2016, Computer Graphics Forum）
Multi-view Scene Flow Estimation: A View Centered Variational Approach（Tali Basha, Y. Moses, N. Kiryati, 2010, International Journal of Computer Vision）
Dataset and Pipeline for Multi-view Light-Field Video（Neus Sabater, Guillaume Boisson, B. Vandame, P. Kerbiriou, Frederic Babon, Matthieu Hog, R. Gendrot, T. Langlois, Olivier Bureller, Arno Schubert, V. Allié, 2017, 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW)）

面向时序质量的生成/鲁棒建模：运动先验、广义退化与时变核一致性

共同点是把“插帧/超分结果质量”与“时序运动或退化建模”直接耦合：扩散模型通过运动先验提升中间帧生成的物理/感知一致性；NegVSR通过更广泛的噪声退化建模增强真实场景泛化；盲视频SR则利用退化核的时间一致性避免因假设固定核带来的时序伪影。这类思想可用于提升光场时域超分的鲁棒性与时序稳定性。

Motion-aware Latent Diffusion Models for Video Frame Interpolation（Zhilin Huang, Yijie Yu, Ling Yang, C. Qin, Bing Zheng, Xiawu Zheng, Zikun Zhou, Yaowei Wang, Wenming Yang, 2024, Proceedings of the 32nd ACM International Conference on Multimedia）
NegVSR: Augmenting Negatives for Generalized Noise Modeling in Real-World Video Super-Resolution（Yexing Song, Meilin Wang, Zhijing Yang, Xiaoyu Xian, Yukai Shi, 2023, ArXiv Preprint）
Temporal Kernel Consistency for Blind Video Super-Resolution（Lichuan Xiang, Royson Lee, Mohamed S. Abdelfattah, Nicholas D. Lane, Hongkai Wen, 2021, ArXiv Preprint）

学习式光场成像方法综述：任务格局与趋势背景

共同点是综述性质：对学习式光场成像与相关框架、评测与数据集进行系统梳理，为理解光场视频插帧方法在更大范围（任务划分、学习框架趋势、挑战）中的位置提供总体背景支撑。

Learning-based light field imaging: an overview（Saeed Mahmoudpour, Carla Pagliari, P. Schelkens, 2024, EURASIP Journal on Image and Video Processing）

光场视频插帧方法（时空超分/时域超分）

该批文献可按“自监督稀疏视角到光场视频重建”“光场视频时域插值（VFI）”“利用光场几何/光流的运动驱动”“联合空间-角度-时间的时空超分（端到端/一阶段）”“连续时间POV驱动的因子化时序一致性”“通用视频时序建模模块”“多视角对齐/场景流与数据管线支撑”“生成与鲁棒建模（运动先验、退化泛化、时变核一致性）”“综述背景”九类逻辑分组，从而覆盖光场视频插帧研究链条的关键环节。

共 21 篇文献，9 个研究方向

自监督光场视频重建：稀疏视角（双目/单目）到时空光场

共同点是针对“光场视频重建/插帧的稀疏视角输入”提出自监督学习框架，核心通过几何一致性（视差/极线/双目或单目几何）、光度一致性与时序约束来指导网络，同时引入低秩或分层光场先验来正则化并提升视角插值/外推能力；其中也强调遮挡（disocclusion）等现实困难的处理。相关文献: Prasan A. Shedligeri et. al, 2021 等 2 篇文献

光场视频时域插值/帧插帧：角向一致性与运动驱动合成

共同点是“时间插值（VFI/时域超分）”范式：从两个（或相邻）时间点的输入生成中间时刻光场/视频帧；方法普遍依赖运动/光流或场景流进行时间对齐，并通过网络合成中间视角，同时强调一致性（角向一致性、空间/时间一致性）与表示效率（如显式分离运动与外观特征、或注意力机制复用）。相关文献: Pierre David et. al, 2020 等 4 篇文献

面向插帧的光场几何与光流估计：以运动/深度传播为核心

共同点是引入“时空光场相关的运动/几何（光流、深度、视角传播）”作为插帧或重建的关键中间表征：前者通过学习的时空流估计把LF角信息传播到2D视频并用外观估计合成高帧率光场视频；后者基于4D光场几何（超像素/斜平面）进行全视图光流与深度估计，为跨视角的时间/视角一致性提供物理约束。相关文献: Tingxian Wang et. al, 2017 等 2 篇文献

时空超分一阶段/端到端：联合空间-角度-时间提升

共同点是将任务表述为“空间-时间联合超分/慢动作时空超分”，从低分辨率且低帧率观测直接恢复高质量的时空序列；其中一个聚焦LF视频，通过SAI重组织与多尺度/角向辅助特征聚合来同时处理空间、角度与时间；另一个把空间超分与时间插值合成到一阶段框架，用特征时间插值避免显式补帧导致的两阶段开销。相关文献: Zeyu Xiao et. al, 2023 等 2 篇文献

连续时间光场视频因子化：POV驱动的时序一致性重建

共同点是强调“连续时间感知（POV/刷新率）”而非仅离散帧约束：通过序列级低秩/因子分解，并把POV效应显式纳入全局目标以消除闪烁并提升时序一致性；同时提出实用的序列级高效优化/因子化实现（cuboid-wise、因果TF-C）以适配系统部署。相关文献: Li-De Chen et. al, 2025

通用视频时域建模：短/长时差分、融合策略与循环聚合

共同点是围绕“视频时序建模/时间特征聚合”的通用VSR/VFI思想展开，用短期/长期时序差分、不同融合方式（2D/3D CNN、RNN）或滑动窗口循环状态来提高时间一致性与细节恢复；虽然不专门以光场为唯一对象，但为光场时域插帧提供了可迁移的时序建模模块与思想。相关文献: Yi Xiao et. al, 2023 等 3 篇文献

多视角光场数据/对应与场景流基础设施：对齐与评测支撑

共同点是提供“多视角对应/场景流估计与数据管线”支撑光场视频插帧研究：在线对应与场景流估计为跨视角几何对齐提供基础；数据集与采集/处理管线则面向稀疏与宽基线多视角视频LF，降低方法训练与评测的工程门槛。相关文献: Lukasz Dabala et. al, 2016 等 3 篇文献

面向时序质量的生成/鲁棒建模：运动先验、广义退化与时变核一致性

共同点是把“插帧/超分结果质量”与“时序运动或退化建模”直接耦合：扩散模型通过运动先验提升中间帧生成的物理/感知一致性；NegVSR通过更广泛的噪声退化建模增强真实场景泛化；盲视频SR则利用退化核的时间一致性避免因假设固定核带来的时序伪影。这类思想可用于提升光场时域超分的鲁棒性与时序稳定性。相关文献: Zhilin Huang et. al, 2024 等 3 篇文献

学习式光场成像方法综述：任务格局与趋势背景

共同点是综述性质：对学习式光场成像与相关框架、评测与数据集进行系统梳理，为理解光场视频插帧方法在更大范围（任务划分、学习框架趋势、挑战）中的位置提供总体背景支撑。相关文献: Saeed Mahmoudpour et. al, 2024

总计21篇相关文献

Light field video frame interpolation using hierarchical spatial-angular-temporal information decoupling and fusion

基于分层空间-角-时间信息解耦与融合的轻场视频帧插值

doi.org-Mingxing Fu, Yeyao Chen, Chongchong Jin 等, 2026-Displays2区IF 3.4

… suffering from low frame rates when providing high spatial-angular sampling. To address the above challenges, this paper proposes a new LFV frame interpolation method based on …