微软超级计算机使用了上万颗英伟达GPU
北京时间3月14日消息,人工智能聊天机器人ChatGPT一经推出便火爆全球,但外界可能不知道,ChatGPT之所以能够如此智能,背后依托的是微软公司为它打造的一台昂贵的超级计算机。
2019年,当微软向ChatGPT开发商OpenAI投资10亿美元时,它同意为这家人工智能研究创业公司打造一台庞大的尖端超级计算机。唯一的问题是:微软没有OpenAI需要的那样的东西,也无法完全确定它能在Azure云服务中构建这么大的东西而不会破坏它。
当时,OpenAI正试图训练一套规模越来越大的人工智能程序,也就是“模型”,后者正在吸收越来越大的数据量,学习越来越多的参数。这些参数是人工智能系统通过训练和再训练得出的变量。这意味着,OpenAI需要在很长一段时间内使用强大的云计算服务。
上万颗芯片、数亿投资
为了克服这一挑战,微软不得不想办法将数万颗英伟达A100图形芯片(训练人工智能模型的主力)组合在一起,并改变服务器在机架上的位置以防止断电。微软负责云计算和人工智能的执行副总裁斯科特·格思里(Scott Guthrie)不愿透露该项目的具体成本,但表示“可能不止”几亿美元。
“我们构建了一个可以在超大规模范围内运行并且可靠的系统架构。 这就是ChatGPT成为可能的原因,”微软Azure人工智能基础设施总经理尼迪·查普尔(Nidhi Chappell)表示,“它是从中得出的一个模型,未来还会有很多很多其他的模型。”
英伟达A100造价1万美元
“SX-8”由512台计算机连接在一起,搭载有日本电气公司开发的、科学计算专用的中央处理器,市场价格预定为500亿至600亿日元。超级计算机在科研、商业、军事等领域有广泛用途。总体而言,美国在建造超级计算机方面处于世界领先地。
这项技术帮助OpenAI发布了ChatGPT,后者在去年11月发布几天后就吸引了100多万用户,现在正被纳入其他公司的商业模式,从亿万富翁对冲基金创始人肯·格里芬(Ken Griffin)运营的公司,到外卖公司Instacart。随着ChatGPT等生成式人工智能工具越来越受到企业和消费者的兴趣,微软、亚马逊公司和谷歌等云服务提供商将面临更大的压力,需要确保他们的数据中心能够提供所需的巨大计算能力。
“我们不想把它打造成定制产品,它一开始是一个定制产品,但我们总是想办法把它打造成通用型产品,这样任何想训练大型语言模型的人都可以利用同样的改进,”格思里在一次采访中表示,“这真的能够帮助我们成为使用更广泛的人工智能云。”
训练一个庞大的人工智能模型需要在一个地方拥有大量相互连接的图形处理单元,就像微软组装的人工智能超级计算机一样。一旦模型投入使用,回答用户提出的所有查询——称之为推理——需要稍微不同的设置。微软还部署了用于推理的图形芯片,超级计算机私人能买吗,但这些成千上万个处理器在地理上分散在公司的60多个数据中心区域。微软周一在一篇博客文章中表示,现在该公司正在为人工智能工作负载添加最新的英伟达图形芯片H100,以及最新版本的英伟达Infiniband网络技术,以更快地共享数据。
微软Azure云服务
目前,新必应搜索仍处于预览阶段。微软正在从等待名单中逐渐增加更多用户。格思里的团队每天与大约24员工举行会议,后者被称之为“后勤维修人员”,这一称呼原指一群在比赛中调整赛车的机械师。该小组的工作是弄明白如何让更强的计算能力快速上线,以及解决突然出现的问题。
企业回选择z型提升机需要考虑型号,种类,输送量,提升量,材质,功率,重量,输送能力,输送距离等多方面因素,比如材质有碳钢,不锈钢,45号钢,塑料等;种类有z型,c型提升机,zc混合型提升机等。z型提升机的价格大概在每台上万元,便宜的有几千元。
小错会酿成大祸
个人组装很贵的,它不像我们普通的微机,就是我日常用的电脑。不是买些配件回来就可以的,你有钱去组装还不如让IBM帮你装一台。现在的超级计算机基本都是按需定制的,也就相当于专业的组装,成本大概在几千万美元以上。我。
云服务依赖的是成千上万个不同的部件和物品,包括服务器的各个部件、管道、建筑物的混凝土、不同的金属和矿物,任何一个部件的推迟或供应不足,无论多么微小,都可能导致功亏一篑。最近,维修人员不得不处理电缆托盘的短缺问题。电缆托盘是一种篮子状的精巧装置,用来固定从机器上脱落的电缆。因此,他们设计了一种新的电缆托盘,使得微软可以自己制造,也可以找地方购买。格思里说,他们还在研究如何尽可能多地压缩世界各地现有数据中心的服务器,这样他们就不必等待新的大楼了。
这机子好啊,24500核cpu、5000+核GPU、98TB内存!不过这机子没法玩游戏啊,跑的Linux呢,要是重装windows应该就能玩了吧,更爽的是,一小时电费就2000多RMB呢!真是high到爆啊
新一代超级计算机
微软Azure全球基础设施总监阿利斯泰尔·斯皮尔斯(Alistair Speirs)表示,该公司还必须确保能够为所有这些机器和芯片降温,并在较冷的气候条件下使用蒸发、室外空气,在炎热的气候条件下使用高科技沼泽冷却器。
“现在让世界惊叹的模型是建立在我们几年前开始建造的超级计算机上的。新的模型将建立在我们正在训练的新型超级计算机上,这台计算机更大,也更精密。”
【来源:凤凰网科技】