自动驾驶结合存算一体

自动驾驶系统约束与端到端加速架构(含瓶颈识别与异构算力加速)

这组论文聚焦自动驾驶(或ADAS)端到端系统架构设计:在实时性、安全性与可预测性等约束下识别关键计算瓶颈,并讨论GPU/FPGA/ASIC等加速器与异构计算平台的实现路径,同时强调能效指标(TOPS/s per power)与“Memory Wall/数据搬运”问题对车载部署的影响。

存算一体/算内存的总体方法与体系结构(PIM/AiM,软硬协同与功能安全)

共同点在于从宏观层面梳理存算一体(PIM/AiM)作为解决数据移动瓶颈与能效问题的体系结构:包括ReRAM算内计算/存储双功能的架构趋势、非理想/EDA工具链等关键挑战,以及软硬件协同与部署视角(如面向车载推理与可靠性/安全)。

面向车载DNN推理的存内计算实现:ReRAM交叉阵列与激活/权重稀疏优化

这组论文围绕“算内计算如何真正提升运算效率”展开:以ReRAM交叉阵列为核心讨论并行MAC/算术单元的实现细节,并通过位级/比特级稀疏利用、低精度或量化与专用电路设计来降低A/D开销、提升吞吐与能效;同时给出面向实际模型工作负载(含LLM相关加速架构)的存内加速思路。

高带宽近像素/光学存内神经网络:减少冗余与降低能耗延迟

共同目标是减少车载视觉等感知链路中的数据搬运与冗余:前者在传感端引入近像素计算(含3D堆叠CIS与嵌入式DRAM缓冲)以做时间帧过滤并降低帧间冗余;后者提出自由空间光学存内神经网络,通过高并行光学权重/输入调制实现超高吞吐与超低能耗/低延迟。

自动驾驶关键子任务的硬件化加速(路径规划QP求解、稀疏计算与数据流)

该组论文聚焦自动驾驶中的具体关键算法环节——路径规划的QP求解与线性系统求解,并针对FPGA实现:利用ADMM框架、PCG与稀疏矩阵的定制存储/稀疏MM/V等模块化硬件设计,同时进行算子级与系统级数据流流水化以提升端到端吞吐、降低资源与能耗。

车载决策所需的忆阻/纳米电子关联存储与并行搜索

共同点在于将“存算一体”落到决策所需的并行匹配/模式搜索:以忆阻器/纳米器件与混合SRAM-忆阻架构实现关联存储(替代TCAM),面向实时决策任务强调功耗、搜索时延、面积与鲁棒性等评估维度。

存算一体友好的算术/量化与硬件协同(端侧DNN鲁棒量化、算内执行)

该组共同讨论“计算形式选择”与“存算一体落地”的关键:从DNN新型算术/激活函数与量化权衡、端侧鲁棒性到软硬协同(算法变换+面向硬件的量化与多核/分区存储/电压缩放),并强调将激进量化与存内执行结合可显著带来能耗与时延收益;同时与车载数据搬运瓶颈(Memory Wall)形成问题-方案闭环。

神经形态/感存算一体视觉传感与前处理(时序冗余与感知效率)

共同点在于把存算一体前移到视觉传感与前处理环节:通过神经形态视觉传感器实现感知、存储与信息预处理的电路集成,减少传统传感器-处理单元分离导致的传输延时与能耗,并提升信息处理效率。

自动驾驶结合存算一体

这些文献围绕“自动驾驶+存算一体”形成了从端到端系统约束(实时/安全/可预测、能效与Memory Wall)到器件/架构实现(ReRAM PIM、算内浮点/稀疏优化、近像素CIS与自由空间光学、关联存储并行搜索、神经形态前端计算),再到软硬协同(量化、算术选择、HW/SW codesign与部署挑战)的完整技术链条。整体研究方向是:用存算一体减少数据搬运与A/D代价,在满足车载实时与可靠性约束的前提下,提升推理/规划等关键任务的吞吐、能效与尾延迟。

20 篇文献,8 个研究方向
自动驾驶系统约束与端到端加速架构(含瓶颈识别与异构算力加速)
这组论文聚焦自动驾驶(或ADAS)端到端系统架构设计:在实时性、安全性与可预测性等约束下识别关键计算瓶颈,并讨论GPU/FPGA/ASIC等加速器与异构计算平台的实现路径,同时强调能效指标(TOPS/s per power)与“Memory Wall/数据搬运”问题对车载部署的影响。相关文献: Shi-Chieh Lin et. al, 2018 等 4 篇文献
存算一体/算内存的总体方法与体系结构(PIM/AiM,软硬协同与功能安全)
共同点在于从宏观层面梳理存算一体(PIM/AiM)作为解决数据移动瓶颈与能效问题的体系结构:包括ReRAM算内计算/存储双功能的架构趋势、非理想/EDA工具链等关键挑战,以及软硬件协同与部署视角(如面向车载推理与可靠性/安全)。相关文献: Daeyong Shim et. al, 2022 等 5 篇文献
面向车载DNN推理的存内计算实现:ReRAM交叉阵列与激活/权重稀疏优化
这组论文围绕“算内计算如何真正提升运算效率”展开:以ReRAM交叉阵列为核心讨论并行MAC/算术单元的实现细节,并通过位级/比特级稀疏利用、低精度或量化与专用电路设计来降低A/D开销、提升吞吐与能效;同时给出面向实际模型工作负载(含LLM相关加速架构)的存内加速思路。相关文献: Fangxin Liu et. al, 2024 等 3 篇文献
高带宽近像素/光学存内神经网络:减少冗余与降低能耗延迟
共同目标是减少车载视觉等感知链路中的数据搬运与冗余:前者在传感端引入近像素计算(含3D堆叠CIS与嵌入式DRAM缓冲)以做时间帧过滤并降低帧间冗余;后者提出自由空间光学存内神经网络,通过高并行光学权重/输入调制实现超高吞吐与超低能耗/低延迟。相关文献: Janak Sharda et. al, 2023 等 2 篇文献
自动驾驶关键子任务的硬件化加速(路径规划QP求解、稀疏计算与数据流)
该组论文聚焦自动驾驶中的具体关键算法环节——路径规划的QP求解与线性系统求解,并针对FPGA实现:利用ADMM框架、PCG与稀疏矩阵的定制存储/稀疏MM/V等模块化硬件设计,同时进行算子级与系统级数据流流水化以提升端到端吞吐、降低资源与能耗。相关文献: Yifan Zhang et. al, 2025
车载决策所需的忆阻/纳米电子关联存储与并行搜索
共同点在于将“存算一体”落到决策所需的并行匹配/模式搜索:以忆阻器/纳米器件与混合SRAM-忆阻架构实现关联存储(替代TCAM),面向实时决策任务强调功耗、搜索时延、面积与鲁棒性等评估维度。相关文献: D. N. Nithilam et. al, 2025
存算一体友好的算术/量化与硬件协同(端侧DNN鲁棒量化、算内执行)
该组共同讨论“计算形式选择”与“存算一体落地”的关键:从DNN新型算术/激活函数与量化权衡、端侧鲁棒性到软硬协同(算法变换+面向硬件的量化与多核/分区存储/电压缩放),并强调将激进量化与存内执行结合可显著带来能耗与时延收益;同时与车载数据搬运瓶颈(Memory Wall)形成问题-方案闭环。相关文献: Flavio Ponzina et. al, 2022 等 3 篇文献
神经形态/感存算一体视觉传感与前处理(时序冗余与感知效率)
共同点在于把存算一体前移到视觉传感与前处理环节:通过神经形态视觉传感器实现感知、存储与信息预处理的电路集成,减少传统传感器-处理单元分离导致的传输延时与能耗,并提升信息处理效率。相关文献: 廖付友 et. al, 2021