用喇叭识别手写数字?这其实是正经的论文啊

用扬声器识别手写数字?

听起来像是形而上学,但这实际上是一篇严肃的 Nature 论文。

下图,表面上看起来像是改装过的扬声器,但实际上是用来识别手写数字的,准确率接近90%。

这就是康奈尔大学的物理学家提出的。

他们使用扬声器、电子设备和激光来创建物理神经网络 (PNN) 的声学、电气和光学版本。

并且这些神经网络也可以使用反向传播算法进行训练。

物理学家提出 PNN 的原因是:摩尔定律已死,我们将用物理系统来拯救机器学习。

根据这篇文章,与软件实现的神经网络相比,PNN 有望将机器学习的能量效率和速度提高几个数量级。

如何用物理学进行反向传播

科学家之所以能用物理设备搭建神经网络音频信号主要物理参数有,是因为物理实验和机器学习的本质是一样的——参数调整和优化。

物理学中有许多非线性系统(声学、电学、光学)可用于逼近任意函数,例如人工神经网络。

声学神经网络就是这样。

做实验的两位博士后将扬声器上方的振膜拆下,将方形钛板连接到扬声器动圈上。

从计算机接收到的控制信号和金属板的振动产生输入信号,然后将信号输出到扬声器,从而形成反馈闭环。

至于如何进行反向传播,作者提出了一种将物理世界与计算机混合的算法,称为“物理意识训练”(PAT),这是一种可以反向传播直接训练任何物理系统以执行深度神经网络的通用框架。

在声学神经网络系统中音频信号主要物理参数有,振动板接收从 MNIST 图像转换而来的声音输入样本(红色),驱动振动板后,信号被麦克风(灰色)记录并及时转换为输出信号(蓝色)数模转换。

整个物理系统的流程如下:首先将数字信号转换成模拟信号,输入到物理系统中,然后将输出与真实结果进行比较,反向传播后调整物理系统的参数。

通过反复调整扬声器参数,他们在 MNIST 数据集上实现了 87% 的准确率。

您可能会问,在培训过程中使用计算机有什么好处?

诚然,PNN 在训练上可能没有优势,但 PNN 的运行依赖于物理定律。一旦网络训练完成,无需计算机干预,在推理延迟和功耗方面具有优势。

而且 PNN 在结构上比神经网络的软件版本要简单得多。

还有电气和光学版本

除了声学版本,研究人员还构建了神经网络的电学和光学版本。

电气版使用四个电子元件,电阻器、电容器、电感器和三极管。就像中学物理实验一样,电路极其简单。

这组模拟电路 PNN 能够以 93% 的测试准确率执行 MNIST 图像分类任务。

光学版本是最复杂的。近红外激光通过倍频晶体转化为蓝光。但是,这个系统的准确率最高,可以达到97%。

此外,光学系统可以进行简单的语音分类。

上面使用的物理系统训练算法 PAT 可用于任何系统,您甚至可以使用它来构建流体甚至机械朋克版本的神经网络。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论