北航杨海龙教授要现场拆解超智融合时代的性能工程,他们团队的实战案例可太硬核了——京东11.11大促用上这套方案后,系统扛住流量洪峰的同时,机器成本直接砍掉90%。清华章明星副教授带来的Mooncake存储方案更是绝了,专门解决大模型推理时的卡顿顽疾。现场还能听到智源研究院门春雷分享的编译优化秘籍,教你怎么把硬件性能榨出最后一滴油。 别看社区才起步,GitHub上代码已经开源,华为昇腾、英伟达显卡都能跑。接下来要联合清华北大中科大这些高校,还有硬件厂商搞生态联盟。说白了这就是给中国AI产业铺新路——以后做模型不用再看国外脸色,算力调度、模型部署全链路自主可控。现场观众还能摸到最新落地的零售业务案例,听说连生成式推荐系统都跑出5倍效率提升呢!
富华优配提示:文章来自网络,不代表本站观点。