供需大厅

登录/注册

公众号

更多资讯,关注微信公众号

小秘书

更多资讯,关注荣格小秘书

邮箱

您可以联系我们 info@ringiertrade.com

电话

您可以拨打热线

+86-21 6289-5533 x 269

建议或意见

+86-20 2885 5256

顶部

荣格工业资源APP

了解工业圈,从荣格工业资源APP开始。

打开

特斯拉Dojo Training Tile投入量产

来源:荣格电子芯片 发布时间:2024-05-07 252
电子芯片设计/电子设计自动化(EDA)设计/电子设计自动化(IP类软件) 电子芯片设计
特斯拉 Dojo Training Tile量产,人工智能芯片迎来创新小高峰。

图片来源  /  台积电

 

 

Dojo超级计算机是特斯拉从头开始设计的新一代超级计算机,并且特斯拉还计划建造一个新的100 MW数据中心来训练其自动驾驶AI。

 

Dojo 超级计算机预计将能够处理海量传感器数据,帮助在真实世界的驾驶画面中训练人工智能。除了特斯拉的全自动驾驶(FSD)测试版系统外,Dojo 作为世界上最多产的计算集群之一,预计还将有多种潜在应用。

 

今年1月份,美国纽约州州长凯西-霍楚尔(Kathy Hochul)在州经济发展听证会上正式宣布,特斯拉计划在其位于布法罗的Gigafactory工厂建造下一个Dojo超级计算机集群。

 

这表明特斯拉对Dojo超级计算机的投资不仅限于硬件建设,还包括对Nvidia硬件等的大幅增加投资。

  

在4月底台积电北美技术研讨会上,台积电方面透露,特斯拉(Tesla)宣布用于人工智能训练的Dojo晶圆系统处理器现已投入量产,并有望在短期内部署。

 

特斯拉的Dojo晶圆系统处理器(或特斯拉称之为 Dojo Training Tile)依赖于一个5×5的处理器芯片阵列(标线尺寸,或接近该芯片尺寸),这些芯片放置在载体晶圆上,并使用台积电的集成扇出(InFO)技术互连,以实现晶圆级互连(InFO_SoW)。

 

 Tesla's Dojo Training Tile

 

据IEEE Spectrum报道,InFO_SoW 技术旨在实现高性能连接,使得 Tesla Dojo 的25个芯片可以像一个处理器一样工作。同时,为了使晶圆级处理器保持一致,台积电用虚拟芯片填充了芯片之间的空白点。

 

特斯拉的Dojo系统采用了从ExaPOD到Cabinet,再到Training Tile和D1芯片的层次结构,最终形成了一个包含1,062,000个训练节点的系统。每个Training Tile包含25个D1芯片,这些芯片通过台积电的集成技术放置在载体晶圆上。这种设计使得每个Training Tile能够提供高达9PFLOPS的计算能力。

 

由于Tesla Dojo Training Tile 基本上包含25个超高性能处理器,因此它非常耗电,并且需要复杂的冷却系统。为了给晶圆上的系统供电,特斯拉使用了一个高度复杂的电压调节模块,该模块可向计算平面提供 18,000 安培的功率。后者会散发多达 15,000W 的热量,因此需要液体冷却。

 

此外,特斯拉声称每个Training Tile是自包含且模块化的,可以层叠多个瓦片,总共120个瓦片共同工作,能够实现1.1 exaflop的能力。这种高密度的计算能力主要得益于其采用的先进封装技术和散热设计,例如使用液体冷却方法来维持高性能运行。

 

特斯拉的Dojo Training Tile是一个高度集成和模块化的计算单元,通过先进的封装技术和高效的散热设计,实现了极高的计算性能和能效比。这些Training Tile不仅支持特斯拉自动驾驶汽车的人工智能训练需求,还为未来更广泛的应用场景提供了可能。

 

但目前,特斯拉尚未透露其Dojo晶圆系统性能,但考虑到其开发的所有挑战,它似乎有望成为人工智能训练的一个非常强大的解决方案。

 

图片来源:台积电

 

晶圆级处理器,如特斯拉的Dojo和Cerebras的晶圆级引擎(WSE),比多处理器机器的性能效率要高得多。它们的主要优势包括内核之间的高带宽和低延迟通信、降低供电网络阻抗和卓越的能效。此外,这些处理器可以从冗余的“额外”内核中受益,或者,在特斯拉的情况下,受益于良好的处理器内核。

 

此类处理器尚存在一定挑战。晶圆上的系统目前必须专门使用片上存储器,这并不灵活,而且可能不足以满足所有类型的应用。这将通过名为CoW_SoW的下一代晶圆系统平台来解决,该平台将实现3D堆叠和在处理器瓦片上安装HBM4内存。

 

目前,只有Cerebras和Tesla拥有晶圆上系统设计。但台积电确信,随着时间的推移,更多的人工智能和高性能计算处理器开发商将构建晶圆级设计。

 

 资料来源:

1.Tesla's wafer-sized Dojo processor is in production — 25 chips combined into one

原文链接:https://www.tomshardware.com/tech-industry/teslas-dojo-system-on-wafer-is-in-production-a-serious-processor-for-serious-ai-workloads

 

2.Tesla wants to take machine learning silicon to the Dojo

原文链接:https://www.theregister.com/2022/08/24/tesla_supercomputer_dojo/


*声明:本文系荣格电子芯片综合整理,仅为传播信息所用,不构成任何投资依据;如对文章内容有异议,请联系后台。

 

关注微信公众号 - 荣格电子芯片
聚焦电子芯片制造领域的技术资讯、企业动态以及前沿创新,涵盖半导体、集成电路、贴片封装等多个行业领域的解决方案。
推荐新闻