点击蓝字 关注我们
ENTERPRISE
6月20日,华为开发者大会2025(HDC 2025)在广东东莞举办。会上,华为常务董事、华为云计算CEO张平安正式发布盘古大模型5.5,宣告其自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型实现全面升级。
据介绍,盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,提升用户体验。例如,盘古提出了自适应快慢思考合一的技术,通过构建难度感知的快慢思考数据和两阶段渐进训练,实现模型根据问题难易程度自适应地切换快慢思考模式,整体模型推理效率提升8倍;此外,盘古深度研究DeepDiver通过长链难题合成、渐进式奖励等关键技术,可以在网页搜索、常识性问答等应用上获得很高的执行效率,可在5分钟内完成超过10跳的复杂问答、生成万字以上的专业调研报告等,大幅提升工作效率。
具体而言,在自然语言处理NLP大模型方面,推出全新718B参数的深度思考模型。该模型由256个专家组成,在知识推理、工具调用、数学等领域实现大幅增强;预测大模型方面,采用业界首创的triplet transformer统一预训练架构,可将不同行业的数据进行统一的三元组编码,并在同一框架内高效处理和预训练,极大地提升预测大模型精度的同时,大幅提升跨行业、跨场景的泛化性;计算机视觉CV大模型方面,发布全新MoE架构的300亿参数视觉大模型,这也是目前业界最大的视觉模型,全面支持图像、红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策,并构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库,实现业务场景可识别种类与精度的大幅提升;多模态大模型方面,发布基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练,构建所需要的数字物理空间,实现持续优化迭代;科学计算大模型方面,持续拓展该模型与更多科学应用领域的结合,当前已实现在气象、能源等领域的深度落地应用。
记者获悉,在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、500多个场景中落地,涉及政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象多个专业领域。
“盘古大模型是基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。”张平安表示。他宣布,基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供了算力支持。
据了解,华为云新一代昇腾AI云服务首次将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink进行全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s,与非超节点相比提升近4倍。其中,超节点结构发挥核心作用:一方面,。超节点架构能更好地支持混合多专家MoE大模型的推理,一个超节点可以支持384个专家并行推理,极大提升效率;同时,超节点还可以支持“一卡一算子任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上;此外,超节点还可以支持训推算力一体部署,训推算力可灵活分配,为客户提供最优资源调用方案。
当前,昇腾AI云服务已为科大讯飞、新浪、硅基流动、面壁智能、中科院、360等超过1300家客户提供AI算力支撑。
来源::中国电子报、电子信息产业网
往期回顾
|
C E E A
扫二维码|关注我们
中国电子企业协会
http://www.ceea.org.cn
欢迎投稿
本协会公众号目前开设会员资讯栏目,欢迎各会员单位积极投稿,稿件请以word文档和照片素材,宣传展示品牌特色、价值理念、服务内容、近期取得的科技创新成果、重大技术突破和行业荣誉、重大活动、公益项目、优秀案例、成功经验等展现会员特色和影响力的内容等;发送至协会邮箱,审核后将排期推送。期待您的来稿! 邮箱:zy@ceea.org.cn