摘要:随着模型性能不断跃升与推理成本持续降低,企业如何通过软硬协同优化实现生产级 AI 效率跨越?如何借力生成式 AI 迈向代理式 AI 的范式革命?答案尽在 GTC 2025 - 云与互联网线上中文专场!明天(18 日)9:30 与您相约线上,直播开启!
随着模型性能不断跃升与推理成本持续降低,企业如何通过软硬协同优化实现生产级 AI 效率跨越?如何借力生成式 AI 迈向代理式 AI 的范式革命?答案尽在 GTC 2025 - 云与互联网线上中文专场!明天(18 日)9:30 与您相约线上,直播开启!
GTC 2025 大会 - 云与互联网线上中文专场演讲
届时,11 家领先和创新的云与互联网企业,带来 13 场 LLM 软硬协同优化最佳实践的分享。
演讲亮点汇总
LLM 优化
【S72580】阿里云 PAI-Megatron-Patch 训练实践分享
【S72647】字节跳动 LLM 2-bit 后量化的加速与部署实践
【S72643】百川智能使用投机采样和计算通信 overlap 优化 decode 效率和 prefill 耗时
MLLM 优化/应用
【S72031】火山引擎使用 GPU 加速图像视频处理,整体速度大幅提升
【S74181】快手视频质量评价和画质增强修复,并实现较原生 PyTorch 5 倍推理加速
【S72639】阿里云智能集团 - 文生图推理加速解决方案,较原生 PyTorch 实现最高 1.8 倍的加速,降低 40% 业务成本
【S74073】美团用于生成式推荐模型的高性能分布式训推框架,实现多业务场景规模效应
【S72995】京东实现生成式召回服务解决方案,以及实现生成式大型模型端到端推理性能优化
数据科学
【S72470】在 GPU 上优化基于位图的集合操作,以提高吞吐量
【S71445】专为资源稀缺语言(例如广东话/粤语)的大语言模型训练技术路线图
您的听讲收益
从上述企业使用 NVIDIA 软硬件解决方案极致优化工作负载的最佳实践中获取灵感云与互联网主题会议 | NVIDIA GTC 2025
来源:NVIDIA英伟达中国