自动驾驶结合存算一体

自动驾驶系统约束与端到端加速架构（含瓶颈识别与异构算力加速）

这组论文聚焦自动驾驶（或ADAS）端到端系统架构设计：在实时性、安全性与可预测性等约束下识别关键计算瓶颈，并讨论GPU/FPGA/ASIC等加速器与异构计算平台的实现路径，同时强调能效指标（TOPS/s per power）与“Memory Wall/数据搬运”问题对车载部署的影响。

The Architectural Implications of Autonomous Driving: Constraints and Acceleration（Shi-Chieh Lin, Yunqi Zhang, Chang-Hong Hsu, Matt Skach, Md E. Haque, Lingjia Tang, Jason Mars, 2018, Proceedings of the Twenty-Third International Conference on Architectural Support for Programming Languages and Operating Systems）
Accelerating Automated Driving and ADAS Using HW/SW Codesign（Shubham Rai, Cecilia De la Parra, Martin Rapp, Jan Micha Borrmann, Nina Bretz, Stefan Metzlaff, T. Soliman, Christoph Schorn, 2024, 2024 IEEE 37th International System-on-Chip Conference (SOCC)）
Driving into the memory wall: the role of memory for advanced driver assistance systems and autonomous driving（Matthias Jung, S. Mckee, C. Sudarshan, Christoph Dropmann, C. Weis, N. Wehn, 2018, Proceedings of the International Symposium on Memory Systems）
ZuSE Ki-Avf: Application-Specific AI Processor for Intelligent Sensor Signal Processing in Autonomous Driving（Gia Bao Thieu, Sven Gesper, G. Payá-Vayá, C. Riggers, Oliver Renke, Till Fiedler, Jakob Marten, Tobias Stuckenberg, Holger Blume, C. Weis, Lukas Steiner, C. Sudarshan, N. Wehn, Lennart M. Reimann, R. Leupers, Michael Beyer, D. Köhler, Alisa Jauch, Jan Micha Borrmann, Setareh Jaberansari, T. Berthold, Meinolf Blawat, Markus Kock, Gregor Schewior, Jens Benndorf, Frederik Kautz, Hans-Martin Bluethgen, C. Sauer, 2023, 2023 Design, Automation & Test in Europe Conference & Exhibition (DATE)）

存算一体/算内存的总体方法与体系结构（PIM/AiM，软硬协同与功能安全）

共同点在于从宏观层面梳理存算一体（PIM/AiM）作为解决数据移动瓶颈与能效问题的体系结构：包括ReRAM算内计算/存储双功能的架构趋势、非理想/EDA工具链等关键挑战，以及软硬件协同与部署视角（如面向车载推理与可靠性/安全）。

Holistic approaches to memory solutions for the Autonomous Driving Era（Daeyong Shim, Chunseok Jeong, Euncheol Lee, Junmo Kang, S. Yoon, Yongkee Kwon, Il Park, Hyun Ahn, Seonyong Cha, Jinkook Kim, 2022, 2022 IEEE International Symposium on Circuits and Systems (ISCAS)）
Resistive-RAM-Based In-Memory Computing for Neural Network: A Review（Weijian Chen, Zhi Qi, Zahid Akhtar, Kamran Siddique, 2022, Electronics）
Three Challenges in ReRAM-Based Process-In-Memory for Neural Network（Ziyi Yang, Kehan Liu, Yiru Duan, Mingjia Fan, Qiyue Zhang, Zhou Jin, 2023, 2023 IEEE 5th International Conference on Artificial Intelligence Circuits and Systems (AICAS)）
A Survey of ReRAM-Based Architectures for Processing-In-Memory and Neural Networks（Sparsh Mittal, 2018, Machine Learning and Knowledge Extraction）
基于忆阻器的存算一体加速器综述（周恒, 刘锦鹏, 冯丹, 童薇）

面向车载DNN推理的存内计算实现：ReRAM交叉阵列与激活/权重稀疏优化

这组论文围绕“算内计算如何真正提升运算效率”展开：以ReRAM交叉阵列为核心讨论并行MAC/算术单元的实现细节，并通过位级/比特级稀疏利用、低精度或量化与专用电路设计来降低A/D开销、提升吞吐与能效；同时给出面向实际模型工作负载（含LLM相关加速架构）的存内加速思路。

ERA-BS: Boosting the Efficiency of ReRAM-Based PIM Accelerator With Fine-Grained Bit-Level Sparsity（Fangxin Liu, Wenbo Zhao, Zongwu Wang, Yongbiao Chen, Xiaoyao Liang, Li Jiang, 2024, IEEE Transactions on Computers）
FPCAS: In-Memory Floating Point Computations for Autonomous Systems（Sina Sayyah Ensan, Swaroop Ghosh, 2019, 2019 International Joint Conference on Neural Networks (IJCNN)）
RoboPIM: A ReRAM-based Accelerator for LLM-based Robotics Applications via Dynamic Task Slicing（Wenjing Xiao, Jianyu Wang, Dan Chen, Huize Li, Mohsen Guizani, Min Chen, T. Wu, 2026, IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems）

高带宽近像素/光学存内神经网络：减少冗余与降低能耗延迟

共同目标是减少车载视觉等感知链路中的数据搬运与冗余：前者在传感端引入近像素计算（含3D堆叠CIS与嵌入式DRAM缓冲）以做时间帧过滤并降低帧间冗余；后者提出自由空间光学存内神经网络，通过高并行光学权重/输入调制实现超高吞吐与超低能耗/低延迟。

Temporal Frame Filtering for Autonomous Driving Using 3D-Stacked Global Shutter CIS With IWO Buffer Memory and Near-Pixel Compute（Janak Sharda, Wantong Li, Qiucheng Wu, Shiyu Chang, Shimeng Yu, 2023, IEEE Transactions on Circuits and Systems I: Regular Papers）
High-clockrate free-space optical in-memory computing（Yuanhao Liang, James Wang, Kaiwen Xue, Xinyi Ren, Ran Yin, Shaoyuan Ou, Lian Zhou, Yuan Li, T. Heuser, N. Heermeier, Ian Christen, James A. Lott, S. Reitzenstein, Mengjie Yu, Zaijun Chen, 2025, Light: Science & Applications）

自动驾驶关键子任务的硬件化加速（路径规划QP求解、稀疏计算与数据流）

该组论文聚焦自动驾驶中的具体关键算法环节——路径规划的QP求解与线性系统求解，并针对FPGA实现：利用ADMM框架、PCG与稀疏矩阵的定制存储/稀疏MM/V等模块化硬件设计，同时进行算子级与系统级数据流流水化以提升端到端吞吐、降低资源与能耗。

A Sparsity-Aware Autonomous Path Planning Accelerator with HW/SW Co-Design and Multi-Level Dataflow Optimization（Yifan Zhang, Xiaoyu Niu, Hongzheng Tian, Yanjun Zhang, Bo Yu, Shaoshan Liu, Sitao Huang, 2025, ACM Transactions on Architecture and Code Optimization）

车载决策所需的忆阻/纳米电子关联存储与并行搜索

共同点在于将“存算一体”落到决策所需的并行匹配/模式搜索：以忆阻器/纳米器件与混合SRAM-忆阻架构实现关联存储（替代TCAM），面向实时决策任务强调功耗、搜索时延、面积与鲁棒性等评估维度。

Design and Implementation of Nanoelectronics-Based Advanced Associative Memory Architecture for Autonomous Vehicles（D. N. Nithilam, B. Paulchamy, 2025, Journal of Nanoelectronics and Optoelectronics）

存算一体友好的算术/量化与硬件协同（端侧DNN鲁棒量化、算内执行）

该组共同讨论“计算形式选择”与“存算一体落地”的关键：从DNN新型算术/激活函数与量化权衡、端侧鲁棒性到软硬协同（算法变换+面向硬件的量化与多核/分区存储/电压缩放），并强调将激进量化与存内执行结合可显著带来能耗与时延收益；同时与车载数据搬运瓶颈（Memory Wall）形成问题-方案闭环。

A Hardware/Software Co-Design Vision for Deep Learning at the Edge（Flavio Ponzina, Simone Machetti, M. Rios, B. Denkinger, A. Levisse, G. Ansaloni, Miguel Peón-Quirós, David Atienza Alonso, 2022, IEEE Micro）
Novel Arithmetics in Deep Neural Networks Signal Processing for Autonomous Driving: Challenges and Opportunities（M. Cococcioni, Federico Rossi, E. Ruffaldi, S. Saponara, Benoît Dupont de Dinechin, 2021, IEEE Signal Processing Magazine）
Driving into the memory wall: the role of memory for advanced driver assistance systems and autonomous driving（Matthias Jung, S. Mckee, C. Sudarshan, Christoph Dropmann, C. Weis, N. Wehn, 2018, Proceedings of the International Symposium on Memory Systems）

神经形态/感存算一体视觉传感与前处理（时序冗余与感知效率）

共同点在于把存算一体前移到视觉传感与前处理环节：通过神经形态视觉传感器实现感知、存储与信息预处理的电路集成，减少传统传感器-处理单元分离导致的传输延时与能耗，并提升信息处理效率。

具有感存算一体化的新型神经形态视觉传感器（廖付友, 柴扬, 2021, 物理）

自动驾驶结合存算一体

这些文献围绕“自动驾驶+存算一体”形成了从端到端系统约束（实时/安全/可预测、能效与Memory Wall）到器件/架构实现（ReRAM PIM、算内浮点/稀疏优化、近像素CIS与自由空间光学、关联存储并行搜索、神经形态前端计算），再到软硬协同（量化、算术选择、HW/SW codesign与部署挑战）的完整技术链条。整体研究方向是：用存算一体减少数据搬运与A/D代价，在满足车载实时与可靠性约束的前提下，提升推理/规划等关键任务的吞吐、能效与尾延迟。

共 20 篇文献，8 个研究方向

自动驾驶系统约束与端到端加速架构（含瓶颈识别与异构算力加速）

这组论文聚焦自动驾驶（或ADAS）端到端系统架构设计：在实时性、安全性与可预测性等约束下识别关键计算瓶颈，并讨论GPU/FPGA/ASIC等加速器与异构计算平台的实现路径，同时强调能效指标（TOPS/s per power）与“Memory Wall/数据搬运”问题对车载部署的影响。相关文献: Shi-Chieh Lin et. al, 2018 等 4 篇文献

存算一体/算内存的总体方法与体系结构（PIM/AiM，软硬协同与功能安全）

共同点在于从宏观层面梳理存算一体（PIM/AiM）作为解决数据移动瓶颈与能效问题的体系结构：包括ReRAM算内计算/存储双功能的架构趋势、非理想/EDA工具链等关键挑战，以及软硬件协同与部署视角（如面向车载推理与可靠性/安全）。相关文献: Daeyong Shim et. al, 2022 等 5 篇文献

面向车载DNN推理的存内计算实现：ReRAM交叉阵列与激活/权重稀疏优化

这组论文围绕“算内计算如何真正提升运算效率”展开：以ReRAM交叉阵列为核心讨论并行MAC/算术单元的实现细节，并通过位级/比特级稀疏利用、低精度或量化与专用电路设计来降低A/D开销、提升吞吐与能效；同时给出面向实际模型工作负载（含LLM相关加速架构）的存内加速思路。相关文献: Fangxin Liu et. al, 2024 等 3 篇文献

高带宽近像素/光学存内神经网络：减少冗余与降低能耗延迟

共同目标是减少车载视觉等感知链路中的数据搬运与冗余：前者在传感端引入近像素计算（含3D堆叠CIS与嵌入式DRAM缓冲）以做时间帧过滤并降低帧间冗余；后者提出自由空间光学存内神经网络，通过高并行光学权重/输入调制实现超高吞吐与超低能耗/低延迟。相关文献: Janak Sharda et. al, 2023 等 2 篇文献

自动驾驶关键子任务的硬件化加速（路径规划QP求解、稀疏计算与数据流）

该组论文聚焦自动驾驶中的具体关键算法环节——路径规划的QP求解与线性系统求解，并针对FPGA实现：利用ADMM框架、PCG与稀疏矩阵的定制存储/稀疏MM/V等模块化硬件设计，同时进行算子级与系统级数据流流水化以提升端到端吞吐、降低资源与能耗。相关文献: Yifan Zhang et. al, 2025

车载决策所需的忆阻/纳米电子关联存储与并行搜索

共同点在于将“存算一体”落到决策所需的并行匹配/模式搜索：以忆阻器/纳米器件与混合SRAM-忆阻架构实现关联存储（替代TCAM），面向实时决策任务强调功耗、搜索时延、面积与鲁棒性等评估维度。相关文献: D. N. Nithilam et. al, 2025

存算一体友好的算术/量化与硬件协同（端侧DNN鲁棒量化、算内执行）

该组共同讨论“计算形式选择”与“存算一体落地”的关键：从DNN新型算术/激活函数与量化权衡、端侧鲁棒性到软硬协同（算法变换+面向硬件的量化与多核/分区存储/电压缩放），并强调将激进量化与存内执行结合可显著带来能耗与时延收益；同时与车载数据搬运瓶颈（Memory Wall）形成问题-方案闭环。相关文献: Flavio Ponzina et. al, 2022 等 3 篇文献

神经形态/感存算一体视觉传感与前处理（时序冗余与感知效率）

共同点在于把存算一体前移到视觉传感与前处理环节：通过神经形态视觉传感器实现感知、存储与信息预处理的电路集成，减少传统传感器-处理单元分离导致的传输延时与能耗，并提升信息处理效率。相关文献: 廖付友 et. al, 2021

总计22篇相关文献

具有感存算一体化的新型神经形态视觉传感器

wuli.iphy.ac.cn-廖付友, 柴扬, 2021-物理北大核心

传统的数字图像处理系统包括图像传感器与图像处理单元，二者在物理空间上分离，图像信息在其间的传输造成了延时与能耗。此外，数字图像传感器基于“帧”的工作原理，可能丢失一些重要信息，或者造成数据冗余。人类视觉系统提供了一种高效并行的信息处理方式。神经形态视觉传感器能够模拟人类视网膜的功能，同时具备感知光信号、存储信号和进行信息预处理的功能。这类感存算一体化的神经形态视觉传感器简化了人工视觉系统的电路复杂性，提升了信息处理效率，节省了系统功耗。文章总结了传统的数字图像传感器存在的问题，介绍了几种重要的人工神经网络，讨论了新型神经形态视觉传感器的研究进展和存在的问题。