苹果推出 DeepPCR 算法：加速神经网络训练和推理能力

12 月 16 日消息，苹果公司近日发布了 DeepPCR 机器学习算法，通过并行处理常规顺序操作，可以加速神经网络的推理和训练。

神经网络已能处理文本或图片合成、分割和分类等复杂任务。不过由于计算需求过大，神经网络训练和反馈结果的时间可能需要数天或者数周。

神经网络处理过程中，目前广泛采取并行化技术，可以加速训练和推理速度。

不过神经网络中的一些操作仍然是按顺序完成的，扩散模型通过一系列的去噪阶段生成输出，并且逐层进行向前和向后传递，随着步骤数的增加，这些进程的顺序执行在计算上变得昂贵，可能会导致计算瓶颈。

苹果公司科研团队为了解决这个问题，推出了 DeepPCR 算法，进一步加速了神经网络的训练和推理。

该团队采用了平行循环还原（PCR）算法来检索该解决方案，将顺序过程的计算成本从 O（L）降低到 O（log2 L），降低了复杂性，提高了运行速度。

团队表示多层感知器中部署 DeepPCR 算法之后，并行化前向和后向通过，实现了最高 30 倍的前向传递速度和最高 200 倍的向后传递速度。

附上 DeepPCR 算法主要结论如下：

DeepPCR 是一种用于在神经网络训练和推理中并行化顺序过程的创新方法。它的主要特点是能够将计算复杂度从 O（L）降低到 O（log2 L），其中 L 是序列长度。
DeepPCR 已用于并行化多层感知器（MLP）中的前向和后向传递，还对该技术的性能进行了广泛的分析，以确定该方法的高性能状态，同时考虑基本设计参数。
DeepPCR 已被用于加速 MNIST 上的深度 ResNet 训练，以及在 MNIST、CIFAR-10 和 CelebA 数据集上训练的扩散模型的生成。结果表明，虽然 DeepPCR 显示出显著的加速，将 ResNet 训练的数据恢复速度提高了 7×，扩散模型创建速度提高了 11×。

Published by