首页 > 最新动态 > 行业动态信息
最新动态
行业动态信息
2024-10-1231

点击蓝字,关注我们






   2022年,面对世界变局加快演变、新冠疫情冲击等多重考验,在以习近平同志为核心的党中央坚强领导下,各地区各部门高效统筹疫情防控和经济社会发展,加大宏观调控力度应对超预期因素冲击,全年工业生产总体稳定,新动能继续成长,为保持经济社会大局稳定提供了坚实保障。

     

英伟达Blackwell GPU,未来1年订单已售罄

Nvidia 用于 AI 和 HPC 的 Blackwell GPU因封装问题导致产量下降而需要重新设计,因此略有延迟 ,但看起来这并没有影响对这些处理器的需求。据摩根士丹利分析师询问的该公司管理层称(通过Barron's ),未来12个月的 Nvidia Blackwell GPU供应已经售罄,这与几个季度前Hopper GPU 供应的情况相似。因此,预计Nvidia明年将获得市场份额(通过 Seeking Alpha)。
  摩根士丹利分析师分享了近与 Nvidia 领导层(包括执行官黄仁勋)会面后得出的结论。会议期间,分析师透露,未来 12 个月的 Blackwell GPU 订单已经售罄。这意味着今天下订单的新客户必须等到明年年底才能收到订单。
  Nvidia的传统客户(AWS、CoreWeave、谷歌、Meta、微软和甲骨文等)已经购买了 Nvidia 及其合作伙伴台积电在未来几个季度内生产的所有 Blackwell GPU。
  如此巨大的需求可能表明,尽管来自 AMD、英特尔、云服务提供商(提供专有产品)以及各种小公司的竞争愈演愈烈,但 Nvidia 明年仍可能获得市场份额。
  摩根士丹利分析师约瑟夫·摩尔 (Joseph Moore) 在给客户的报告中写道:“我们仍然认为,Nvidia 很可能在2025年真正获得 AI 处理器的份额,因为定制硅片的用户明年将看到 Nvidia 解决方案的迅猛增长。我们本周听到的一切都证实了这一点。”
  现在Nvidia的B100和B200 GPU的封装问题已经解决,Nvidia可以生产与台积电一样多的 Blackwell GPU。B100 和 B200 都采用台积电的 CoWoS-L 封装,而这家全球的芯片代工厂是否有足够的 CoWoS-L 产能还有待观察。
  此外,随着对AI GPU的需求猛增,内存制造商能否为Blackwell等 GPU 提供足够的 HBM3E 内存仍有待观察。尤其是Nvidia尚未让三星的 HBM3E 内存获得 Blackwell GPU 的,这也是影响供应的另一个因素。

越南:计划2050年前建造3个晶圆厂、20个封装测试厂

该国家计划到2050年成为半导体行业的主要全球参与者。越南总理范明政的战略列出了具体目标、详细时间表和可行步骤,以推动该行业的增长并确保长期可持续性。
  越南总理第1018/QD-TTg号决议采纳的战略相当全面,围绕五个主要目标制定:设计专用芯片、促进电子行业增长(将使用在越南和其他地方开发和制造的芯片)、培养熟练劳动力、吸引投资以及实施其他相关举措以促进行业发展。到2050年,总体目标包括建立3个半导体生产设施、20个封装和测试设施,并培养数百名本地芯片设计师。

消息称三星电子第二代3nm制程工艺良品率不稳定

据国外媒体报道,在7nm、5nm等制程工艺的量产上晚于台积电的三星电子,在3nm制程工艺上终于占得先机,他们的这一制程工艺在2022年的6月30日开始初步生产芯片,较台积电的同年12月29日开始商业化生产早了近半年。
而有外媒在报道中提到,在3nm制程工艺量产两年之后,三星电子的第二代3nm制程工艺,也在今年下半年开始量产。

马斯克的“机器人之梦”

特斯拉三款机器人新品亮相,进一步说明特斯拉创始人兼CEO马斯克对特斯拉“世界上的机器人/半智能机器人公司”的定位。
  北京时间10月11日上午,特斯拉在美国举办“We, Robot(我们,机器人)”活动,马斯克一口气推出三款“机器人”——自动驾驶汽车Cybercab、自动驾驶小巴Robovan以及升级版人形机器人Optimus。
  发布会上,马斯克乘坐两座自动驾驶汽车Cybercab登场。这辆标志着特斯拉已实现L5级自动驾驶的形态“超前”的未来汽车引来现场观众阵阵“尖叫”——没有方向盘、没有刹车、没有后视镜也没有充电插口(无线的方式感应充电),售价低于3万美元,预计在2027年之前量产。
  “Cybercab将是Uber和Airbnb的结合,让车主充当无人驾驶汽车的房东,在城市中漫游,接送乘客。”马斯克在发布会上慷慨激昂地陈词,Cybercab不仅可以随叫随到、负责安全抵达目的地,用户可以在Cybercab座舱里娱乐、工作和休息,做任何想做的事。
  发布会的第二款机器人新品“Robovan”是一台自动驾驶巴士,多可容纳20人,还可以同时用于货物运输。
  在发布会上,马斯克公布了两种无人驾驶汽车的运营成本,分别为每英里约0.2美元(含税价格可能为每英里0.3或0.4美元)和每英里5到10美分,远远低于当前人类运输汽车的成本。
  自2022年发布以来,Optimus一直只“活”在展示视频中,线下只做静态展示。此次发布会亮相,是Optimus首次“走”进三维世界——20余台Optimus列队在人群中穿过,5台Optimus人形机器人在舞台上集体舞蹈,灵活的动作和稳健的步伐引得现场掌声阵阵;一台精致着装的Optimus化身“服务员”在发布会后的参观活动中提供酒水服务——娴熟地拿起杯子接满鸡尾酒并递送给对面的客人。
  马斯克在发布会上对人形机器人极尽赞美:人形机器人Optimus用途丰富——不仅可以遛狗、修剪草坪、照看老人和孩子,还可以成为工厂的工人、人们的老师和朋友。
  马斯克预测,在大规模生产的情况下,一台特斯拉人形机器人Optimus的成本将控制在2万至3万美元之间,甚至低于一辆汽车。不过马斯克也坦言,人形机器人的商业化进程刚刚起步,要相当一段时间才能实现规模效应。
  一直以来,马斯克高度推崇发展人形机器人,他曾多次表示“未来特斯拉的长期价值,大部分体现在人形机器人——擎天柱(Optimus)上。”马斯克甚至还预言未来人类和机器人的数量比例为2:1,人形机器人的需求将达到100亿至200亿台,远超过电动汽车。
  就在今年4月,特斯拉官已经宣称有两台第二代人形机器人Optimus进入特斯拉工厂进行电池处理相关任务,预计2025年年底将有数千台人形机器人在特斯拉汽车工厂服务,或将于2026年交付给外部客户。
  对于特斯拉汽车,马斯克一直不愿意将其归为汽车产品。在去年出席英国AI安全峰会时,马斯克就表达了特斯拉汽车实质上是机器人的论调:“任何由计算机驱动的东西实际上都是机器人,你可以认为特斯拉汽车是轮子上的机器人,任何连接到互联网的东西实际上都是人工智能的端点执行器。”
  今天,无论是发布会“We,Robot”的名称,还是三款亮相的“机器人”新品都印证了特斯拉正在沿着创始人马斯克规划的“世界上的机器人/半智能机器人公司”的发展路径狂奔,意图从“全球市值的汽车公司”升级为“全球市值的机器人公司”。

AMD攻势凶猛

AMD董事长兼CEO苏姿丰在美国当地时间10月10日于旧金山举行的Advancing AI活动上带来了一整套AI“杀手锏”,给整个业界带来了全新的AI震撼。
  其中,的惊喜正是AMD发布的旗舰AI芯片-AMD Instinct MI325X GPU(以下简称:MI325X),苏妈也是再次信心满满地掏出了与老对手英伟达当下热销产品H200的对比图,她表示,MI325X的内存容量是H200的1.8倍,内存带宽、FP16和FP8峰值理论算力都达到了H200的1.3倍。
  此外,苏妈还发布了第五代EPYC服务器CPU,并称其为“面向云计算、企业级和AI的全球CPU”,与老对手英特尔的第五代至强铂金8592+处理器相比,这款CPU的HPC(高性能计算)性能提高多达3.9倍,基于CPU的AI加速提高多达3.8倍。苏妈此次可谓是将满满的压力给到了英伟达和英特尔。
  HBM3e内存容量是GPU提升的关键?
  当前,英伟达毫无疑问是数据中心GPU领域的霸主,TechInsights公布的数据显示,2023年全球数据中心GPU总出货量达到了385万颗,其中,英伟达以98%的市场份额稳居第一,AMD虽位居第二,却仍是相差十分悬殊。但熟悉苏妈的人都知道,她苏妈受命于AMD危难之际,不怕的就是打硬仗,此次带来的MI325X就是为了“硬刚”英伟达的H200而来。
  据了解,MI325X采用了与上一代MI300X相同的CDNA 3架构,的提升就是首次采用了业界目前的HBM3e,总容量达256GB,基于16-Hi堆栈制程,内存带宽高达6TB/s,单颗芯片总共拥有1530亿个晶体管。  告诉记者,HBM内存提高,对于GPU来说,能够带来数据传输速度的提升、数据处理能力的增强、能效比的提高、空间与延迟的节省、对更复杂应用场景的支持以及系统稳定性与可靠性的提升等多方面的好处。因此,MI325X的FP8性能达到了2.6PFLOP,FP16性能也达到了1.3PFLOP。
  横向对比,英伟达H200采用的HBM3e容量为141GB,带宽为4.8TB/sz,总晶体管数量约为800亿个,相比于MI325X肯定是不够看了,哪怕是英伟达推出的B200,采用的HBM3e内存容量也仅为192GB,与MI325X的256GB HBM3e内存容量仍存在差距。
  虽然,两家对于GPU的设计各有不同,HBM3e内存容量也并不是评判GPU性能的标准,但对产品性能的上限有明显提升,这也是AMD直面英伟达的底气。苏妈很自豪地在发布会上强调:“MI325服务器平台在运行Llama 3.1时,能提供比英伟达H200 HGX高出多达40%的性能。”
  根据AMD信息,MI325X加速器目前有望在2024年第四季度投入生产,预计从2025年第一季度开始发货。
  此外,根据当前“一年一迭代”的节奏,AMD此次更新了其AI芯片的路线图,预计下一代MI350系列将在明年上市,将采用3nm制程,并把HBM3E内存再提升至288GB,新一代CDNA 4架构也将安排上,使得其推理性能比基于CDNA 3架构的加速器提高了35倍,该系列AMD计划在2025年下半年上市。
  其中,MI350系列的代表产品MI355X是AMD专门用来应对英伟达在三月刚刚发布的Blackwell B200的。据了解,MI355X的FP8和FP16性能相比MI325X提升了80%,FP16峰值性能达到2.3PFLOPS,FP8峰值性能达到4.6PFLOPS,FP6和FP4峰值性能达到9.2PFLOPS。
  CPU性能已经赶超英特尔?
  CPU业务对于AMD来说是涅槃重生的开始,在2018年,其EPYC服务器的市占率仅为2%,经过四代的升级,终于在2024年第一季度达到了34%,从英特尔手里抢走了近30%的CPU服务器市场份额,也成了AMD的主要营收来源。
  苏妈在发布今年第二季度财报时就表示:“我们在第二季度实现了强劲的营业额与收入增长,这得益于数据中心事业部创纪录的营业额。我们的AI业务继续加速攀升,在Instinct系列、,EPYC和Ryzen处理器的市场需求带动下,AMD为下半年营业额的强劲增长已做好了充分准备。”
  所以,AMD此次的另一大杀手锏就是其第五代EPYC服务器CPU,代号“Turin”。
  据介绍,Turin拥有1500亿颗晶体管,采用台积电3/4nm制程、全新“Zen 5”及“Zen 5c”核心兼容广泛部署的SP5平台,多支持192核、384个线程。当前,英特尔能效核版至强6虽然能在未来通过双芯封装做到288核心,但无法支持超线程技术,只有288个线程。因此,在核心数和线程数上,AMD已经赶超了英特尔。
  在技术全面升级的情况下,Turin的性能得到了明显提升。AMD表示,相比于上一代的英特尔Xeon服务器,Turin在SPEC CPU测试中性能提升2.7倍,企业级性能提升4.0倍,HPC(高性能计算)性能提升3.9倍。
  苏妈打了很形象的比方,她表示,如果用Turin服务器替代上一代的至强服务器,只需131台服务器就能达到原来1000台的性能水平,节省87%的占地空间。同时,功耗可以节省多68%。
  AMD还优化了Turin在AI工作流程中的关键动作,包括数据预处理、内存复制、内核启动和任务协调等。这些优化使得CPU在处理GPU协调任务时更高效,比前代产品快28%。
  除了GPU和CPU,苏妈此次还带了的DPU、AI网卡以及ROCm 6.2生态系统,凑齐了一整套“AI全家桶”,给“双英”带来了十足的压力。但当天的AMD股价并没有买账,反而以大跌收场,日内跌幅一度扩大到约5.3%,终收跌4%,创9月3日以来盘中和收盘跌幅。可见,AMD的新品虽然来势凶猛,可只有真正量产,经过客户检验,才能赢得市场的认可。

来源:网络整理

中国电子企业协会

 http://www.ceea.org.cn


推荐阅读

本协会公众号目前开设会员资讯栏目,欢迎各会员单位积极投稿,稿件请以word文档和照片素材,宣传展示品牌特色、价值理念、服务内容、近期取得的科技创新成果、重大技术突破和行业荣誉、重大活动、公益项目、优秀案例、成功经验等展现会员特色和影响力的内容等;发送至协会邮箱,审核后将排期推送。期待您的来稿!  邮箱:lcw@ceea.org.cn



点我访问原文链接