华为正式开源UCM技术:最大提升22倍 AI推理性能跃升
近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。
UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。
UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。
它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。
目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。

UCM产品架构
-
微软承认Windows 11新问题:记事本、画图、截图通通打不开!好在已修复
近日,不少用户报告称,包括记事本、截图工具、画图甚至Windows 安全中心在内的系统应用均无法打开,并弹出错误代码“0x803F8001”。据用户描述,该错误提示应用在当前账户中“不可用”,并要求用
-
高德地图×数码宝贝联动:加布兽导航上线 全新可进化3D车标
高德地图再度加码IP联动,此次携手经典动漫《数码宝贝》推出重磅合作内容——加布兽定制导航语音包正式上线。同步解锁全新可进化3D车标,瞬间唤醒无数人的童年记忆,成为近期导航类APP的热门话题。此次联动精
-
微软正式推出全新命令行工具winapp!简化Windows应用开发
微软宣布正式推出开源命令行工具winapp的公开预览版,为开发者提供一个统一、高效的一站式开发环境。此前开发原生Windows应用,往往意味着要经历复杂的SDK管理、繁琐的清单(Manifest)编辑
[广告]赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注KnowSafe微信公众号随时掌握互联网精彩
- 建议两款便宜又好用的SSL证书品牌
- CRMChat 开源CRM客服系统
- POC系统配套自动化工具发布
- 反向词典Wantwords – 支持中文及英语词典反向查询的AI文案工具
- 在Z|蚂蚁集团(高至40K/月)诚招云基础设施高级安全、应用安全、基础设施安全等专家
- 什么样的CISO对企业来说是有用的?
- 数据释放空间价值|Whale 帷幄 SDP 定义空间数据未来式
- 创投 | Augury首席执行官Saar Yoskovitz谈人工智能赋能的声音检测技术如何守护机器健康(上)
- ipone13等你来拿!2021 KCTF 秋季赛防守方-征题 火热进行中
- 曲子龙:简单解读一下今天的《个人信息保护法》。
- AndroidNativeEmu和unidbg对抗ollvm的字符串混淆
- 从刷屏的“蚂蚁呀嘿”看人脸识别



