Forums

强化学习嵌入式平台

开始于 松山 4 months ago11浏览

我想在嵌入式平台上实现强化学习(RL)算法,针对需要连续控制的应用程序。目的是要能够以相对较快的采样率采集多个输入信号(4-6)(>10MHz)并产生一样快的4-6控制信号。

鉴于时序方面的严格限制,我面向基于FPGA的器件(Xilinx ZCU104,ZCU111,……)。这些设备的应用通常仅限于推理,并且有许多IP内核/库专用于推理加速。不幸的是,如果我们仅局限于推理,我们将失去将培训和预测无缝结合的在线RL模型的主要优势之一。也有基于GPU的设备(例如Nvidia Jetson Xavier),但它们似乎在获取和处理此类快速信号方面都受到限制。

考虑到时间限制和进行设备培训的必要性,您有什么建议吗?