百度智能云重磅晓谕:将点亮昆仑芯三代三万卡集群
三言科技音讯 近日,百度智能云生效点亮昆仑芯三代万卡集群,这亦然国内首个认真点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一要紧冲破记号着百度在东谈主工智能算力界限迈出了坚实的一步,不仅为百度自己的本领发展提供了苍劲能源,也为通盘这个词中国科技界、互联网行业和AI行业带来了新的发展机遇。
万卡集群上风突显,助力算力冲破与老本优化
万卡集群的建成不仅为百度带来了苍劲的算力支抓,还鼓舞了模子降本的趋势。在昔时一年中,通盘这个词行业王人在力图缩短大模子的使用老本,而算力垂死是导致老本居高不下的蹙迫身分之一。百度通过自研芯片和大范围集群的设立,不仅惩办了自己算力供应的问题,还为通盘这个词行业提供了新的念念路和成见。
从算力上看,超大范围并行野心智商可完了检修终端跃升,万卡集群可将千亿参数模子的检修周期大幅缩短,欢畅AI原生应用快速迭代的需求。同期也能支抓万亿参数模子、复杂任务和多模态数据,撑抓Sora类应用的开导。此外,万卡集群大致支抓多任务并发智商,通过动态资源切分,单集群可同期检修多个轻量化模子,通过通讯优化与容错机制减少算力豪侈,完了检修老本指数级着落。
跟着国产大模子的兴起,万卡集群缓慢从“单任务算力滥用”到“集群效用最大化”过渡,通过模子优化、并行计谋、灵验检修率普及、动态资源分拨等技能,智能调治任务,将检修、微调、推理任务羼杂部署,从而普及集群空洞期骗率,缩短单元算力老本。
百舸赋能,全地方普及集群性能与牢固性
昔时,多芯混训和激增的故障率等艰巨,成为万卡集群部署经由中的纷乱挑战。而24年9月升级的百度百舸AI异构野心平台4.0,在万卡集群的设立中进展了至关蹙迫的作用。
领先,冲破硬件延伸性瓶颈,如卡间互联的拓扑罢休,幸免通讯带宽成为瓶颈;同期,围绕芯片及集群功耗,基于万卡范围老例决策功耗可达十兆瓦或更高,采用改换性散热决策,从而惩办万卡集群的能效与散热问题;完善模子的散布式检修优化,采用高效并行化任务切分计谋,检修主流开源模子的集群MFU普及至58%;在普及牢固性方面,提供容错与牢固性机制,幸免由于单卡故障率随范围指数上涨而变成的万卡集群灵验性大幅着落,保险灵验检修率达到98%;终末,针对机间通讯带宽需求,设立超大范围HPN高性能收罗,优化拓扑结构,从而缩短通讯瓶颈,带宽灵验性达到90%以上。
日前,花旗银行发布研报暗示,DeepSeek、百度等中国模子展现出高效和低老本上风,将有助于加快环球AI应用开导,并在环球激发更多本领改换,鼓舞2025年东谈主工智能应用的拐点。中国工程院院士、清华大学野心理系教悔郑纬民也暗示,当下构开国产自主万卡系统充满挑战,但"至关蹙迫"。
