如果您希望可以时常见面,欢迎标星收藏哦~
利用基于光子学的技术进行“光速计算”有明显的吸引力——不仅仅是极高的速度,尽管这当然很重要,而且与基于晶体管逻辑的计算实现相比,其功耗也极低。
过去几年,我接触过几家提供各种光学计算解决方案的公司。但到目前为止,这些解决方案主要涉及将不同频率和相位的多束光注入光纤,并利用干涉进行复杂的计算,如果用硅片进行这些计算,则需要大量晶体管。
好吧,我刚刚接触到光学计算领域的一些新鲜事物。我和Michael F?rtsch 博士聊天,他是一家名为Q.ANT的德国初创公司的首席执行官。当然,当我说“初创公司”时,我们需要记住 Q.ANT 成立于 2018 年,到撰写本文时已经过去了六年。我不知道你是怎么想的,但从技术角度来看,六年前对我来说似乎是一生之久。
简单介绍一下背景故事,迈克尔最初从事的是计算网站的工作,但后来觉得无聊,于是他开始学习数学和物理,最后获得了马克斯·普朗克学会的博士学位。随后,迈克尔在美国国家标准与技术研究所工作了几年,还做了一些其他工作,最后他决定重返工业界,创办了 Q.ANT。
在继续之前,值得注意的是,我们希望执行的计算量现在每三个月左右就会翻一番。这在多个层面上都是可怕的。
这里的一个问题是我们执行计算所消耗的能量。目前,大多数计算都是使用基于 CMOS 技术的硅芯片进行的。较小的晶体管比较大的晶体管消耗的功率更少。我们正在转向越来越小的工艺节点,其中晶体管的尺寸以纳米为单位,所以这很好 - 对吗?
问题是,我们希望执行的计算量呈指数级增长,这意味着我们需要在单个芯片上安装数百亿个晶体管。数百亿个晶体管会消耗大量能源,而当一台服务器中有多个这样的芯片、一个机架中有多个服务器、一个数据中心中有数万个机架时,能源消耗就会加剧。
归根结底,我们目前的计算解决方案 远没有达到我们所希望的速度,并且 (b) 消耗太多电力。例如,迈克尔指出,他最近参加了一次超级计算机会议和展览。他说每个机架都需要水冷。他还指出,在不久的将来,新的超标量数据中心将开始需要自己的专用发电站——可能是小型模块化反应堆 (SMR) 的形式。
Q.ANT 是一家有趣的公司。它拥有来自 21 个国家的 100 多名专家,拥有约 890 年的行业经验,平均年龄约为 36 岁。该公司的使命是开发光子计算解决方案,以应对当今人工智能 时代的两大挑战:1)管理人工智能推理和其他数据密集型应用所需的大量数据(包括复杂的数学运算)。2)显著减少当今全球人工智能数据中心所消耗的大量电力和能源。
现在,我们可以深入研究 Q.ANT 的技术,但我担心深入研究可能会掩盖更大的故事,所以让我们将事情保持在相对较高的水平。让我们从下面的图像开始,这是基于光子学的本机处理单元 ,它建立在公司的光赋能本机算法 (LENA) 架构上。
Q.ANT 的光子芯片是 LENA 的核心
与其他产品相比,这款光子芯片的第一个区别在于,它采用薄膜铌酸锂 制造而成。观察左侧的低损耗波导,它将引入光信号;观察右侧的低损耗耦合器,它将输出光信号。
中间的金色圆圈是电控光调制器。我们可以这样理解,每个圆圈都是一个电容器的极板。通过向该极板施加电压,我们可以调制通过调制器的光信号。多个调制器可以相互结合使用,以实现越来越复杂的计算。
这款 Q.ANT NPU 使用光而不是电子来执行复杂的非线性数学运算,有望实现比传统 CMOS 技术至少高 30 倍的能源效率和显著的计算速度提升。 想想看,傅里叶变换在传统计算中通常需要数百万个晶体管,而现在只需一个光学元件就能完成。这很令人兴奋,不是吗?
基于这一底层技术,Q.ANT 宣布推出其首款商业产品——基于光子学的 NPU,它配备了行业标准的 PCI-Express接口,与当今现有的计算生态系统完全兼容。
PCIe 卡上的 Q.ANT NPU
LENA 与标准 GPU
假设我们试图训练 AI 识别文森特·梵高的《星夜》。我们使用基于 LENA 的 NPU 而不是在传统图形处理单元 上实现的标准人工神经网络 (ANN) 进行训练
上行显示一个训练周期 后的结果。下行显示 150 个周期后的结果。很容易看出 Q.ANT 解决方案有多先进。同样值得注意的是,LENA 仅需要 0.1 百万个参数,仅执行 0.2 百万次操作,而 GPU 则需要 5.1 百万个参数和 10 百万次操作。
现在我已经引起了你们的注意,我会首先告诉你们目前的情况,然后告诉你们我认为未来事情可能会如何发展。
目前的情况是,上图第一张图中所示的 TFLN NPU 安装在一块原始的硅基板上——基本上就是一块没有任何晶体管的硅片。目前,这块基板的主要作用是为调制器提供电容器的另一侧(我将其视为可以偏置或至少接地的“大容量电容器板”)。此外,如今,光信号通过常规光纤传入和传出该设备。
那么未来会怎样呢?首先,我可以设想将铌酸锂层直接安装在功能齐全的硅芯片上。在这种情况下,我们可以在芯片顶部使用金属化圈作为各个调制器电容器的表面,并且可以在 NPU 顶面上涂一层导体作为“大容量电容器板”。
其次,与使用光纤将光信号“水平”地传送到铌酸锂层的边缘不同,我们可以使用硅芯片中制造的激光二极管将光信号垂直向上传输到 NPU 的低损耗光波导中。同样,与使用光纤访问从铌酸锂层的边缘“水平”传出的光信号不同,我们可以使用硅芯片中制造的光电二极管从 NPU 的低损耗光耦合器垂直接收这些光信号。
想象一下,将当今任何高端 CPU、GPU、FPGA 或 SoC与上述光学 NPU 相结合。所有东西都将放在同一个封装中(不比今天的封装大),在外界看来就像普通芯片一样。我应该指出,所有这些都只是我的猜测;这不是迈克尔说 Q.ANT 正在做的事情,但如果我在 Q.ANT 有话要说,我会调查这件事。
非线性网络的潜在应用可以通过 Q.ANT 技术得到增强,从而提供更高的性能,同时消耗更少的电量,这些应用多种多样。下面列出了一些示例。
非线性网络的示例应用
我认为,对于任何参与 AI 和高性能计算 的人来说,这种光子处理在效率和性能方面都非常有趣。当然,这不全是关于我的(应该是,但事实并非如此)。那么,你对这一切有什么看法?
如有硅光流片需求,
欢迎扫码,将有专人对接。
半导体精品公众号推荐
专注半导体领域更多原创内容
关注全球半导体产业动向与趋势
今天是《半导体行业观察》为您分享的第3976期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。