GTC25 | 倒计时 1 天!精彩抢先看!火速预约云与互联网线上中文专场

B站影视 欧美电影 2025-03-18 19:19 1

摘要:随着模型性能不断跃升与推理成本持续降低,企业如何通过软硬协同优化实现生产级 AI 效率跨越?如何借力生成式 AI 迈向代理式 AI 的范式革命?答案尽在 GTC 2025 - 云与互联网线上中文专场!明天(18 日)9:30 与您相约线上,直播开启!

随着模型性能不断跃升与推理成本持续降低,企业如何通过软硬协同优化实现生产级 AI 效率跨越?如何借力生成式 AI 迈向代理式 AI 的范式革命?答案尽在 GTC 2025 - 云与互联网线上中文专场!明天(18 日)9:30 与您相约线上,直播开启!

GTC 2025 大会 - 云与互联网线上中文专场演讲

届时,11 家领先和创新的云与互联网企业,带来 13 场 LLM 软硬协同优化最佳实践的分享。

演讲亮点汇总

LLM 优化

【S72580】阿里云 PAI-Megatron-Patch 训练实践分享

【S72647】字节跳动 LLM 2-bit 后量化的加速与部署实践

【S72643】百川智能使用投机采样和计算通信 overlap 优化 decode 效率和 prefill 耗时

MLLM 优化/应用

【S72031】火山引擎使用 GPU 加速图像视频处理,整体速度大幅提升

【S74181】快手视频质量评价和画质增强修复,并实现较原生 PyTorch 5 倍推理加速

【S72639】阿里云智能集团 - 文生图推理加速解决方案,较原生 PyTorch 实现最高 1.8 倍的加速,降低 40% 业务成本

【S74073】美团用于生成式推荐模型的高性能分布式训推框架,实现多业务场景规模效应

【S72995】京东实现生成式召回服务解决方案,以及实现生成式大型模型端到端推理性能优化

数据科学

【S72470】在 GPU 上优化基于位图的集合操作,以提高吞吐量

【S71445】专为资源稀缺语言(例如广东话/粤语)的大语言模型训练技术路线图

您的听讲收益

从上述企业使用 NVIDIA 软硬件解决方案极致优化工作负载的最佳实践中获取灵感

云与互联网主题会议 | NVIDIA GTC 2025

来源:NVIDIA英伟达中国

相关推荐