让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

初创公司开发了一款光学NPU

发布日期:2024-12-17 09:58    点击次数:153

(原标题:初创公司开发了一款光学NPU)

如若您但愿不错常常碰面,接待标星保藏哦~

开端:实质来自eejournal,谢谢。

哄骗基于光子学的技巧进行“光速推敲”有显豁的诱导力——不单是是极高的速率,尽管这虽然很病笃,而且与基于晶体管逻辑的推敲齐全比拟,其功耗也极低。

以前几年,我宣战过几家提供万般光学推敲科罚决议的公司。但到咫尺为止,这些科罚决议主要触及将不同频率和相位的多束光注入光纤,并哄骗干与进行复杂的推敲,如若用硅片进行这些推敲,则需要多半晶体管。

好吧,我刚刚宣战到光学推敲鸿沟的一些极新事物。我和Michael F?rtsch 博士聊天,他是一家名为Q.ANT的德国初创公司的首席扩充官。虽然,当我说“初创公司”时,咱们需要记取 Q.ANT 成立于 2018 年,到撰写本文时还是由去了六年。我不知谈你是如何思的,但从技巧角度来看,六年前对我来说似乎是一世之久。

浅薄先容一下布景故事,迈克尔率先从事的是推敲网站的行状,但自后认为败兴,于是他运转学习数学和物理,终末赢得了马克斯·普朗克学会的博士学位。随后,迈克尔在好意思国国度尺度与技巧计算所(NIST)行状了几年,还作念了一些其他行状,终末他决定重返工业界,创办了 Q.ANT。

在不时之前,值得小心的是,咱们(东谈主类)但愿扩充的磋议论现在每三个月傍边就会翻一番。这在多个层面上都是可怕的。

这里的一个问题是咱们扩充推敲所铺张的能量。咫尺,大多数推敲都是使用基于 CMOS 技巧的硅芯片进行的。较小的晶体管比较大的晶体管铺张的功率更少。咱们正在转向越来越小的工艺节点,其中晶体管的尺寸以纳米为单元,是以这很好 - 对吗?

问题是,咱们但愿扩充的磋议论呈指数级增长,这意味着咱们需要在单个芯片上装置数百亿个晶体管。数百亿个晶体管会铺张多半动力,而当一台服务器中有多个这么的芯片、一个机架中有多个服务器、一个数据中知彼心腹万个机架时,动力铺张就会加重。

归根结底,咱们咫尺的推敲科罚决议 (a) 远莫得达到咱们所但愿的速率,况且 (b) 铺张太多电力。举例,迈克尔指出,他最近投入了一次超等推敲契机议和展览。他说每个机架都需要水冷。他还指出,在不久的将来,新的超标量数据中心将运转需要我方的专用发电站——可能是微型模块化响应堆 (SMR) 的形态。

Q.ANT 是一家兴致兴致的公司。它领有来自 21 个国度的 100 多名行家,领有约 890 年的行业教授,平均年事约为 36 岁。该公司的责任是开发光子推敲科罚决议,以玩忽咫尺东谈主工智能 (AI) 时间的两大挑战:1)管制东谈主工智能推理和其他数据密集型应用所需的多半数据(包括复杂的数学运算)。2)显耀减少咫尺环球东谈主工智能数据中心所铺张的多半电力和动力。

现在,咱们不错深化计算 Q.ANT 的技巧,但我惦记深化计算可能会覆盖更大的故事,是以让咱们将事情保抓在相对较高的水平。让咱们从底下的图像运转,这是基于光子学的本机处理单元 (NPU),它建造在公司的光赋能本机算法 (LENA) 架构上。

Q.ANT 的光子芯片是 LENA 的中枢(开端:Q.ANT)

与其他家具比拟,这款光子芯片的第一个分散在于,它经受薄膜铌酸锂 (TFLN) 制造而成。不雅察左侧的低损耗波导,它将引入光信号;不雅察右侧的低损耗耦合器,万宝配资它将输出光信号。

中间的金色圆圈是电控光调制器。咱们不错这么研究,每个圆圈都是一个电容器的极板。通过向该极板施加电压,咱们不错调制通过调制器的光信号。多个调制器不错相互联结使用,以齐全越来越复杂的推敲。

这款 Q.ANT NPU 使用光而不是电子来扩充复杂的非线性数学运算,有望齐全比传统 CMOS 技巧至少高 30 倍的动力后果和显耀的推敲速率栽培。 思思看,傅里叶变换在传统推敲中常常需要数百万个晶体管,而现在只需一个光学元件就能完成。这很令东谈主同意,不是吗?

基于这一底层技巧,Q.ANT 通知推出其首款买卖家具——基于光子学的 NPU,它配备了行业尺度的 PCI-Express(PCIe)接口,与咫尺现存的推敲生态系统澈底兼容。

PCIe 卡上的 Q.ANT NPU(开端:Q.ANT)

嗯,这如实看起来很棒,但这项技巧到底有多好呢?我很倨傲你问这个问题,因为迈克尔共享了一张以衰退直不雅的花样“传达这个思法”的图片,如下所示。

LENA 与尺度 GPU(开端:Q.ANT)

假定咱们试图本质 AI 识别文森特·梵高的《星夜》。咱们使用基于 LENA 的 NPU 而不是在传统图形处理单元 (GPU) 上齐全的尺度东谈主工神经网络 (ANN) 进行本质

上行知道一个本质周期 (epoch) 后的扫尾。下行知道 150 个周期后的扫尾。很容易看出 Q.ANT 科罚决议有多先进。相同值得小心的是,LENA 仅需要 0.1 百万个参数,仅扩充 0.2 百万次操作,而 GPU 则需要 5.1 百万个参数和 10 百万次操作。

现在我还是引起了你们的小心,我会最先告诉你们咫尺的情况,然后告诉你们我认为畴昔事情可能会如何发展。

咫尺的情况是,上图第一张图中所示的 TFLN NPU 装置在一块原始的硅基板上——基本上等于一块莫得任何晶体管的硅片。咫尺,这块基板的主要作用(虽然,除了提供遗弃物以外)是为调制器提供电容器的另一侧(我将其视为不错偏置或至少接地的“大容量电容器板”)。此外,如今,光信号通过旧例光纤传入和传出该拓荒。

那么畴昔会如何呢?最先,我不错设思将铌酸锂层径直装置在功能皆全的硅芯片上。在这种情况下,咱们不错在芯片顶部(宣战 NPU 底面的一侧)使用金属化圈动作各个调制器电容器的名义,况且不错在 NPU 顶面上涂一层导体动作“大容量电容器板”。

其次,与使用光纤将光信号“水平”地传送到铌酸锂层的边际不同,咱们不错使用硅芯片中制造的激光二极管将光信号垂直朝上传输到 NPU 的低损耗光波导中。相同,与使用光纤捕快从铌酸锂层的边际“水平”传出的光信号不同,咱们不错使用硅芯片中制造的光电二极管从 NPU 的低损耗光耦合器垂径直纳这些光信号。

思象一下,将咫尺任何高端 CPU、GPU、FPGA 或 SoC(咫尺仅由硅制成)与上述光学 NPU 相联结。通盘东西都将放在并吞个封装中(不比今天的封装大),在外界看来就像普通芯片一样。我应该指出,通盘这些都只是我的臆度;这不是迈克尔说 Q.ANT 正在作念的事情,但如若我在 Q.ANT 有话要说,我会捕快这件事。

非线性网络的潜在应用不错通过 Q.ANT 技巧得到增强,从而提供更高的性能,同期铺张更少的电量,这些应用多种万般。底下列出了一些示例。

非线性网络的示例应用(开端:Q.ANT)

我认为,对于任何参与 AI 和高性能推敲 (HPC) 的东谈主来说,这种光子处理在后果和性能方面都衰退兴致兴致。虽然,这不全是对于我的(应该是,但事实并非如斯)。那么,你对这一切有什么成见?

如有硅光流片需求,

接待扫码,将有专东谈主对接。

https://www.eejournal.com/article/a-bold-new-twist-on-optical-computing/

半导体宏构公众号推选

专注半导体鸿沟更多原创实质

眷注环球半导体产业动向与趋势

*免责声明:本文由作家原创。著述实质系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或相沿,如若有任何异议,接待关连半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第3976期实质,接待眷注。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

可爱咱们的实质就点“在看”共享给小伙伴哦




Powered by 万宝配资 @2013-2022 RSS地图 HTML地图

建站@kebiseo; 2013-2024 万生优配app下载官网 版权所有