热搜:
引江建设七集团领导同桂林市政协副主席汤桂荔,市委副秘书长、市委办公室主任会谈自来水厂一体化净水器介绍海上作业安全必备梅思安(MSA)气体检测仪,全天候守护作业安全的 “隐形卫士”

快捷

logo

热点

(电子发烧友网报道 文/章鹰)8月12日,破解在2025金融AI推理应用落地与发展论坛上,赖A理黑华为公司副总裁、科技开源数据存储产品线总裁周越峰宣布,线月华为此次和银联联合创新,正式推出AI推理创新技术UCM(推理记忆数据管理其器)和管理系统的破解算法,这项突破性成果降低对HBM技术的赖A理黑依赖,提升国内AI大模型的科技开源推理能力。


该技术是线月一款以KV Cache为中心的推理加速套件,UCM集成了多类型缓存加速算法工具,正式实现推理过程中KV Cache记忆数据的破解分级管理,从而扩大推理上下文窗口,赖A理黑提升推理效率。科技开源“银联的线月实际案例和大量测试显示,UCM显著降低首Token的正式时延,最高降低90%,系统吞吐率最大提升22倍,上下文的推理窗口可以扩展10倍以上,这是对于AI推理系统一个巨大的进步。” 周越峰指出。

华为UCM技术已率先应用在中国银联“客户之声”、“营销策划”和“办公助手”三大业务场景,开展智慧金融AI推理加速应用试点,并且已经取得成果。华为表示,计划于2025年9月正式开源UCM,将在魔擎社区首发,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

AI大模型推理给存储带来哪些挑战?UCM的创新之处如何解读?本文结合中国信通院人工智能研究平台与工程化部主任曹峰、华为数据存储产品线AI存储首席架构师李国杰的观点,进行详细分析。

AI大模型推理给存储带来三重挑战

“ChatGPT的访问量呈现线性增长,最新访问量达到4亿,受益于中国AI大模型DeepSeek爆发,日均调用量也在快速上升,2025年1月开始,中国AI推理的需求增长20倍,未来三年算力需求爆发。IDC表示,2024年算力需求60%是训练,40%是推理,到2027年中国用于推理的算力需求——工作负载将达到72.6%。” 中国信通院人工智能研究平台与工程化部主任曹峰分析说。

当下,AI大模型推理应用落地中,遇到推不动、推得慢和推得贵的三大挑战。首先,长文本越来越多,输入超过模型上下文窗口的内容,推理窗口小就推不动;其次,由于中美在AI基础设施的差距,中国互联网大模型首Token时延普遍慢于美国头部厂商的首Token时延,时延长度为后者的两倍;推得贵,美国大模型的推理吞吐率为中国大模型推理吞吐率的10倍。

华为公司副总裁、数据存储产品线总裁周越峰指出,AI时代,模型训练、推理效率与体验的量纲都以Token数为表征,Token经济已经到来。

在AI基础设施投资,中国和美国有差距,为了保障流畅的推理体验,企业要加大算力投入,但是如何改善AI推理的效率和体验,在推理效率与成本之间找到最佳平衡点?华为推出UCM,以KV Cache和记忆管理为中心提供全场景化系列化推理加速能力。

UCM两大关键能力和创新算法,破解HBM受困难题

HBM是解决"数据搬运"的关键技术。当HBM不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题。华为此次技术突破有望缓解这一瓶颈。

华为重磅推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

UCM的创新之处,在于可以根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,同时融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2至22倍,从而降低每个Token的推理成本。

“实时数据放在HBM当中,短期记忆数据放在DRAM中,其他数据就放在共享存储SSD中,极大提高系统的效率和AI推理能力。针对AI推理平衡成本和效能的挑战,华为推出UCM统一的记忆数据管理器,在两个层面以系统化的方案来解决问题。” 华为数据存储产品线AI存储首席架构师李国杰表示。

一、在底层的框架和机制上提供了多级缓存空间,构建智能管理以及智能流动的基础框架能力。在此基础之上,华为构筑了一系列创新的推理的加速算法和加速特性,包括自适应的全局Prefix Cache,降低首Token时延与单位Token成本。

二、采用动态的Training稀疏加速算法,倍数级提升长序列吞吐和体验。还有后缀检索、预测加速算法、PD检索加速和Agent原生记忆加速。

UCM将超长序列Cache分层卸载至外置专业存储,通过算法创新突破模型和资源限制,实现推理上下文窗口的10倍级扩展,满足长文本处理需求。

中国银联执行副总裁涂晓军分享说,华为与中国银联的联合创新技术试点中,在中国银联的“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒就可以精准识别客户高频问题,促进服务质量提升。

众所周知,目前,AI大模型训练对内存带宽需求呈指数级增长,传统DDR内存已无法满足需求。HBM(高带宽内存)是一种专用内存技术,用于 AI 处理器GPU和 HPC 系统,这些系统中带宽和能效比原始容量更为重要。HBM3 每堆栈可提供高达 819 GB/s 的传输速度,对于支持大型语言模型 (LLM)、神经网络训练和推理工作负载至关重要。

但是去年12月以来美国将HBM2E列入对中国的禁售清单,国产厂商HBM的突破还在推进中,华为推出UCM的重大意义,在于加速推进国产AI推理生态,其核心价值是推进更快的推理响应和更长的推理序列,以及更优化的成本。

中国信通院人工智能研究平台与工程化部主任曹峰认为,国产化AI推理生态建设应该加速,KV Cache已经成为架构优化的焦点,以KV Cache为核心的推理方案迭出,背后依赖的高性能存储、先进调度策略的重要性愈发显现。

李国杰还强调指出,AI是一个快速发展的行业,每6个月就会迎来新一轮的技术革新,UCM不仅定位于当下,解决AI推理问题,未来发展UCM将从KV Cache分层管理走向Agentic AI原生记忆管理和应用加速。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

相关阅读

2025摩托车车险大概多少钱?怎么买?摩托车交强险网上投保

2025-08-25
导读: 想知道 2025 年摩托车车险费用和投保方式?本文详细拆解价格:交强险按排量分 80 元、120 元、400 元三档,商业险按需选

人类、动物与AI:跨越物种的意识探索

2025-08-25
2005年,一项关于意识检测的实验引发关注。一名因车祸昏迷5个月的23岁女性,在脑部扫描中被要求想象打网球。令人惊讶的是,她大脑中与运动相关的区域被激活,表明她理解了这项指令,并试图配合,尽管表面上毫

获红杉、高瓴等顶级机构连续投资,AI初创公司灵感时刻估值超1亿美元

2025-08-25
近日,「灵感时刻」宣布已在1个月内连续完成Pre-A及Pre-A+轮融资,分别由红杉中国和高瓴创投GL Ventures)领投,硅谷基金EnvisionX和Palm Drive跟投,投后估值超1亿美元

科学家直接观测到重费米子量子纠缠

2025-08-25
日本大阪大学和广岛大学科学家合作,首次在铈铑锡CeRhSn)材料中直接观测到受普朗克时间量子力学最小时间单位)调控的重费米子量子纠缠现象。这项发表于《自然》合作期刊《npj量子材料》的研究,为开发基于

中粮各上市公司2017年6月26日-6月30日收盘情况

2025-08-25
中粮集团旗下各上市公司2017年6月26日-6月30日收盘情况如下:6月26日6月27日6月28日6月29日6月30日中粮控股香港)06063.333.263.273.293.24中国食品香港)050

焦煤期货单日暴跌6%!会拖垮动力煤后面看涨?

2025-08-25
煤市播报8月14日焦煤期货市场突发 “跳水”,午盘价格暴跌 6.25%,距离跌停仅一步之遥。这波急跌让持续看多的 “双焦玩家” 措手不及,市场立刻聚焦一

“成功一定很酷”——德智家锻造以服务为核心的品牌竞争力-

2025-08-25
“造车很苦,但成功一定很酷!”——迎难而上,德智家打造以服务为核心的竞争力3月28日晚间,雷军带着他的首款汽车小米SU7举行了上市发布会。在接下来的几天,据业内相关媒体报道,27分钟大定5万台、24小

沧汽老供销大汽水:国潮复古,唤醒味蕾上的时代记忆

2025-08-25
发布者:素萍 浏览量:379发布时间:2025/6/26 14:35:32 在国潮风起云涌、怀旧情绪涌动的当下,沧汽老供销大汽水宛如时光的信使,携着几代人的集体回忆强势回归,

广西消委会开展家电消费体察大讲堂活动

2025-08-25
中国消费者报南宁讯记者顾艳伟)5月28日,广西消委会、广西市场监管局在南宁开展2022年“共促消费公平 绿色低碳消费 智慧健康生活”家电消费体察暨消费教育大讲堂活动。据了解,本次活动主题是“关爱一老一

深入洞察医 疗场景建设需求,嘉宝莉提供完美涂装方案

2025-08-25
【建材网】随着现代生活水平和医 疗技术水平的不断改善,人们与医 疗场所的关系日趋密切,对医 疗卫生环境的要求也越来越高。有调查显示,一个城市的医 疗环境,与该城市的幸福指数有着明显的正相关关系。医 疗

家具选购指南:如何挑选适合你的家具-

2025-08-25
在选购家具时,除了考虑外观和价格,更重要的是要选择适合自己的家具。以下是一些选购家具的指南,帮助你挑选到满意的家具。首先,明确需求。在购买家具之前,思考一下你的生活方式、空间大小和家具的使用目的。例如

各大保险公司团体意外险怎么买?员工团体意外险哪家公司比较好?

2025-08-25
导读: 团体意外险作为一种能够有效转嫁员工意外风险的保险产品,越来越受到企业的青睐。它不仅能在员工遭遇意外时给予经济上的支持,减轻企业的负

初沉池和二沉池的区别在哪里(初沉池的作用及原理)

2025-08-25
初沉池和二沉池的区别在哪里初沉池的作用及原理) 标签: 添加时间:2022-11-24 浏览次数:3987 1、结

同比增长24.71%!新疆7月外送电量创单月新高!

2025-08-25
8月7日,北京电力交易中心预结算数据显示,7月新疆外送电量158.65 亿千瓦时,同比增 24.71%,创单月新高。数据显示其外送增长稳健:2024 年外送 1267 亿千瓦时,居西北第一、国家电网经

贾玲最新动态:正在拍摄新片《转念花开》

2025-08-25
6月16日,上海国际电影节万达电影年度片单发布,张艺谋、贾玲、吴京等著名电影人发来祝福视频。贾玲表示,她正在拍摄新片,大屏幕同步显示的片名是《转念花开》。视频中的“玲儿”状态极

三位一体,震撼升级!北京国际家居产业博览会 — 助力品牌企业产品首发和成长型企业孵化的全产业链平台

2025-08-25
【建材网】家居产业的高质量发展,是促进家居消费的基础。当前居民的家居消费偏好已逐渐向绿色、智能和个性化转变,消费品质也明显提升,而展会作为行业发展的晴雨表和风向标,在把握市场需求,传递消费信息,洞察行

纪念抗战胜利75周年 泉州市举办国防教育中国画展

2025-08-25
画展在泉州海交馆举行 陈小阳 摄)本报讯 记者林书修 通讯员吴应得)9月3日,由泉州军分区、市委宣传部、市国防教育办公室、市文旅局、市文联联合举办的纪念中国人民抗日战争暨世界反法西斯战争胜利75周年国

有备无患 华为卫星通信功能雨季使用上涨10倍

2025-08-25
华为终端BG CTO李小龙透露,北京地区的卫星通信使用用户数在7月28、29日两天比平日上涨了10倍以上。卫星通信功能目前普遍配备在高端机型中,不过对于该功能,仍然存在争论。有人认为卫星通信有备无患,

从“好喝”到“喝好”!令德堂以“真实”破局,重新定义健康饮品!

2025-08-25
发布者:娜娜 浏览量:602发布时间:2025/6/18 17:06:05 在消费升级与健康意识觉醒的双重驱动下,饮料行业正经历一场深刻的变革。据市场调研数据显示,2023年

湾区建设集团领导与广东省汕头市委副书记、秘书长会谈

2025-08-25
11月6日,湾区建设董事局主席方璐与广东省汕头市委副书记、秘书长、市直机关工委书记赖小卫会谈,双方围绕汕头基建投资事宜展开交流。 方璐表示,汕头作为经济特区,在国家政策的支持下,正迎来新的
小编推荐
猜你喜欢
如果觉得快捷不错,还请把快捷分享到你的微信好友、朋友圈、微博等,万分叩谢
「**」反戈相向网为你提供,,,,等 http://m.rhwrtdincrease.xyz/
点我复制链接

俺也是有底线滴

© 2023 反戈相向网 版权所有
为你提供,,,,等 http://m.rhwrtdincrease.xyz/