TI C2000系列重大更新!首次加入NPU,内核升级到64位!

B站影视 2024-12-06 10:06 2

摘要:电子发烧友网报道(文/黄晶晶)从1994年推出第一颗TMS320C10处理器开始,C2000 DSP已走过了30年的辉煌历程。期间C2000系列不断迭代升级,陆续加入浮点运算单元、数学运算协处理器、三角函数运算器、向量运算加速单元等,以及不断优化的PWM和AD

电子发烧友网报道(文/黄晶晶)从1994年推出第一颗TMS320C10处理器开始,C2000 DSP已走过了30年的辉煌历程。期间C2000系列不断迭代升级,陆续加入浮点运算单元、数学运算协处理器、三角函数运算器、向量运算加速单元等,以及不断优化的PWM和ADC等外设。例如2023年推出的280015X将CPU内核做成Lock Step,用2颗CPU锁步运行,并支持器件本身的功能安全。今年,F28P55X正式加入NPU,并且下一代C2000的内核做到64位运算的位宽。德州仪器中国区技术支持总监师英在近日的媒体会上表示,TI C2000系列将继续凭借其卓越的性能和丰富的应用经验,在电源变换、太阳能、逆变系统、伺服驱动、交流电机驱动、直流无刷电机驱动,以及汽车变换与牵引逆变器等领域满足客户需求。

在当前工业及汽车领域的实时控制系统中,越来越多的任务倾向于采用更为智能、基于AI的方法来完成。于是F28P55X这款产品应运而生。

F28P55X芯片首次在C2000系列中引入NPU(即神经网络处理单元)。这一AI加速器能够独立完成AI领域常见的运算算子。在神经网络推论运算中,卷积运算占据了主导地位。普通CPU完成这一运算往往效率相对较低。而利用神经网络加速单元,其性能将比使用C2000的CPU提高5-10倍。

对于嵌入式系统或实时控制系统而言,边缘AI无疑是一个必然选择。边缘AI指的是所有神经网络推理算法均在设备端(即边缘侧)执行与运算。这一模式的优势主要体现在以下三个方面:

首先,实时性得到显著提升,无需将数据上传至云端,从而避免了传输延迟。

其次,通过算法优化及NPU的加入,系统整体功耗得以降低。NPU天生擅长处理卷积运算及神经网络运算,因此能够实现更高的效率与更低的功耗。

最后,从安全性与可靠性的角度来看,避免了数据采集与传输至云端的过程,有助于提升设备的安全性。

F28P55X系列产品的特性参数颇为亮眼,其内置的Flash memory最高可达1.1MB。对于实时系统而言,ADC与高精度PWM是两大核心外设。具体而言,F28P55X提供了24个高精度PWM通道以及最多39个ADC通道。F28P55X并非单一器件,而是一个涵盖多种配置的系列。德州仪器已经推出不同内存规格、汽车级认证以及功能安全等级的组合。预计该系列将陆续推出多达40余款型号,以满足市场的多样化需求。

F28P55X可进一步降低系统成本并缩小系统尺寸。师英解析,以传统的电弧故障检测为例,这是一个应用于太阳能逆变系统的场景。下图左侧白色框内为太阳能板,其发出的电能需经过DC/DC变换器或逆变器,以及MPPT等处理单元,这些功能通常由C2000系列的实时控制MCU完成。

然而,在传统方案中,还需额外增加一个MCU-2用于电源电弧检测。具体来说,在传统的非NPU方案中,通过对直流母线电压与电流进行采样,并设置一系列触发阈值或规则来判断电弧是否发生。这种方法存在诸多限制,检测准确率往往难以提升,一般仅能达到85%左右。检测不准确可能导致两种后果:一是漏报,即实际发生电弧但未被检测到,从而增加火灾或停机的风险;二是误报,即未发生电弧却发出警报,可能导致不必要的停机,进而影响生产效率。

采用F28P55X这一创新解决方案后,原有的DC/DC转换器、逆变器以及MPPT系统均继续沿用了C2000系列的核心技术,这意味着原始的实时控制拓扑结构与硬件配置基本保持不变,特别是软件算法层面无需做出调整。唯一的变化在于,我们利用F28P55X内置的NPU来专门执行电弧检测任务。

那么,它为何能实现99%的高检测准确性呢?这得益于TI先进的离线边缘AI工具——TI Edge AI Tools。该工具能够针对大量电弧发生时的电流与电压数据进行深度训练,从而构建一个精准的CNN模型。模型训练完成后,通过专用的软件开发工具,即可轻松部署至F28P55X的NPU上。由于这一过程基于庞大的数据集进行训练,而非依赖传统的软件设计规则与触发阈值来判断电弧情况,因此其检测准确率能够高达99%。

在工业与汽车领域,执行效率的提升速度日益加快,电机的转速也随之不断攀升。随着电机转速的提升,新一代功率半导体的应用使得开关调制频率同步增高。在这样的背景下,实时运算处理器MCU的运算效率亟需实现大幅度提升。

“28系列的版本已经在实时控制领域用了很多年,从C28迭代至C29版本是时隔二十三年后的一次迭代升级。F29H85x系列代表着C2000 内核的一次重大升级。”师英说道。F29H85x系列处理位宽从32位跃升至64位,并配备了超长指令级架构,使得单个指令周期最多能并行完成8条指令。并行运算是DSP架构的一大优势,这也是DSP与通用CPU之间的显著差异之一。这一改进使得F29H85x的基础运算性能相较于C28提高了2倍以上。

除了CPU性能的显著提升外,F29H85x系列还天然支持两大安全领域:功能安全与信息安全。具体而言,F29H85x在功能安全方面可达到汽车领域ISO26262标准的ASIL-D级别,即最高标准;同时,在工业领域也符合IEC61508的SIL-3级别,同样是工业安全的最高标准。在信息安全方面,引入了行业内广泛应用的HSM,使得该系列器件能够满足全球不同地区对于信息安全的各种严格要求。无论是国际还是其他区域的标准,均可通过HSM模块实现。功能安全与信息安全是F29H85x系列不可或缺的两大关键性能。

为了确保CPU内部的功能安全与信息安全,F29的架构中设计了多重隔离机制,类似于防火墙的功能。特别是加入了功能安全与信息安全单元(SSU),能够对应用程序代码、应用数据、保密内容以及普通内容进行有效的隔离,从而全面满足功能安全与信息安全的要求。

与C28相比,C29在信号链性能上可实现2至3倍的提升。对于马达驱动的数学运算与实时运算而言,其性能可提升2倍;而在电源变换方面,C29的性能则可提升约3倍。若仅就FFT运算而言,C29的运算速度相较于C28可快出5倍。C29的CPU版本在数学运算能力上实现了极为显著的提升。

此外,与C28相比,C29的中断响应速度也提升了4倍。在考量这一中断响应速度时,需要综合考虑整个实时运算的环路,即从传感器ADC的信号输入到PWM的输出。仅计算速度快并不够,数据的采集与控制指令的输出同样需要加速,才能实现实时控制系统性能的本质性提升。因此,中断响应速度同样至关重要。所谓通用代码性能,主要指的是memory copy、数据搬移以及通讯等方面的性能。C28的内核实质上是一颗DSP,从过去的架构设计来看,C28相较于C29在处理如数据搬移指令等housekeeping代码方面并不擅长。然而,这一问题在F29上得到了很好的改善。

得益于CPU性能的提升,F29H85x可广泛应用于众多实时控制领域。例如,在汽车的OBC(车载充电机)、DC/DC转换器以及主机MCU的集成式架构中,F29H85x都能发挥出色表现。它同样适用于多电机的牵引逆变器以及助力转向系统。此外,F29H85x不仅可用于光伏逆变器,还能支持最新的电源结构、在线UPS以及机器人领域。

F29系列MCU通过提升性能,特别是ADC和PWM等关键外设的性能,使其更加适用于第三代宽禁带半导体在电源管理中的应用。目前,众多服务器电源及太阳能逆变器等设备已采用这些新架构进行电源设计,充分展现了F29系列MCU在高性能电源管理领域的优势。F29系列MCU的设计旨在支持更高的开关频率,降低开关损耗,为用户带来更高的功率密度。同时减少磁性元器件的使用,进而使得整个系统的尺寸也相应减小。

师英分析,由于F29H85x的中断效率得到提升,能够更快地进行运算和中断响应。在一个PWM开关周期内,CPU需完成ADC对电流、电压及位置的采样,随后进行数据转换与运算,并最终输出控制波形。原本在F28系列的前代产品中,若采用传统MOSFET功率器件,由于其开关频率较低,CPU有足够的时间(如1微秒)来完成整个采样、运算与输出周期。然而,当开关频率提升至10倍时,该周期将缩短至0.1微秒。在如此短的时间内完成ADC采样、终端响应、数据转换与运算,以及PWM输出,对实时控制MCU构成了严峻挑战。

在电源变换领域中,诸多新兴电源拓扑结构涌现,其中最为常见的一种便是矩阵转换器,它能够通过一套拓扑结构完成AC到AC、DC到DC的复杂变换。一方面,这对于功率级、磁性元器件以及大型电容性元器件的需求与传统电源拓扑结构相比发生了诸多变化;另一方面,这同样对嵌入式处理器的实时性、PWM以及ADC通道提出了全新的需求。因此,F29H85x非常适合用于新型的矩阵转换器拓扑结构。同时,在所有这些系统中,F29H85x都天然地符合最高等级的功能安全与信息安全要求。

以下是高压一体化电动汽车OBC(车载充电机)+HVLV DCDC(高低压直流转换器)+主机应用的框图示例。在传统的框架中,完成OBC+HVLV DCDC+主机的功能通常需要三个MCU。然而,采用F29H85x,即仅需一颗MCU便能实现OBC+DC/DC+主机MCU的三合一功能。

由于其内部集成了一对锁步运行的CPU(CPU1和CPU2)以及一个独立的C29内核(CPU3),因此仅需一颗MCU即可完成整套系统的功能。CPU1和CPU2的锁步运行能够很好地支持ASIL-D级别的功能安全需求,同时两者均可运行AUTOSAR,这是几乎所有设备都需要的。而CPU3则可以独立承担OBC和DCDC的控制环路,实现单芯片系统的高效运行。

F28P55X作为TI首款集成NPU的C2000系列产品,已经迈出了重要一步。师英表示,未来我们可根据不同应用场景的需求灵活调整NPU算力。若某些应用需要更强大的算力支持,我们可以在现有架构基础上进行性能提升;若在某些特定场合算力需求较低,我们亦可进行相应优化。我们的核心原则是始终聚焦于客户需求与市场需求,致力于打造出更加可靠、安全、经济实用的电子产品。同时,F29H85x是C29系列的首款产品,其未来功能搭配将紧密围绕客户需求与应用场景进行定制化设计,未来存在无限可能。

来源:核芯产业观察

相关推荐