摘要:12月3日,由全球数字经济大会组委会主办、中国信息通信研究院(以下简称“中国信通院”)承办的2024全球数字经济大会云·AI·计算创新发展大会(2024 Cloud AI Compute Ignite)在北京举办。本次大会以“智启云端,算绘蓝图”为主题,全面展
12月3日,由全球数字经济大会组委会主办、中国信息通信研究院(以下简称“中国信通院”)承办的2024全球数字经济大会云·AI·计算创新发展大会(2024 Cloud AI Compute Ignite)在北京举办。本次大会以“智启云端,算绘蓝图”为主题,全面展示中国信通院在AI云产业领域的研究、探索与实践。旨在进一步促进云计算创新发展,提升AI云产业技术和服务水平。
大会现场对领域近期权威成果进行了颁奖公示,阿里云容器服务团队携手客户,荣获“2024年AI Cloud Native典型案例”。
随着智能算力逐渐在算力结构中占据更重要的位置,传统的通用云计算服务逐步升级成为服务于人工智能技术和应用发展的AI云。ACK云原生AI套件希望为基于Kubernetes运行AI/ML的客户与社区,提供一整套开放、可扩展、高效率的云原生解决方案。本次获评的“基于云原生AI技术的聚宽智能投研平台实践”,是量化金融领域在AI云首批落地的优秀案例。
在智能时代下,量化交易等基于AI与大数据方法的交易方式逐渐成为股票交易中一股新兴力量,聚宽依托阿里云容器服务Kubernetes版ACK,以Kubernetes为底座,同时使用了阿里云NAS、OSS、SLS、GPU共享调度、HPA、Prometheus等云产品和云原生AI套件技术,搭建了一套高效的智能投研平台,支撑因子计算、量化模型训练、投研策略回测等业务场景。
聚宽智能投研平台在算力方面,通过使用阿里云ECS和ECI搭建固定节点加弹性节点的算力池,满足日常研究基础算力需求的同时,灵活应对研究员临时增加的算力需求,通过弹性资源能力将集群平均利用率从不足40%提升至70%以上,大幅节约成本。
在存储方面,根据数据的使用频次、大小、文件数量等因素,分别使用NAS和OSS进行分类存储,缓解了数据源的IO压力,提高数据的读写效率。
在调度方面,引入不同的调度组件,以应对不同类型的任务,对于基础任务,平台通过封装Kubernetes编排,实现云端的分布式运算;对于AI训练推理类型任务,平台引入GPU共享调度能力,实现资源的高效管理与分配,提高资源利用率;针对数据密集型任务,平台通过ACK Fluid一方面统一访问和管理NAS和OSS数据,有效提升数据IO性能,加快任务处理速度,将由于IO延迟带来的计算成本降低至1/10; 另一方面通过使用Fluid python SDK管理数据流程,提升量化研究员的工作效率。
通过AI Cloud在投研平台中的应用,聚宽智能投研平台在量化研究流程中的效率、人力、资源成本等方面都得到了显著优化。原本需要一周以上时间才能完成的因子挖掘、模型训练、结果验证等一整套流程,现在缩短到了1-2天。
ACK云原生AI套件助力聚宽智能投研平台,实现更强生产力、更高生产率和更优性价比。为运行在投研平台上的AI应用提供了“资源共享,高效调度,弹性AI,数据加速,AI任务全生命周期管理”等多项自底向上的优化和创新能力。
阿里云ACK云原生AI套件的技术和产品方案,已帮助来自包括互联网、游戏、自动驾驶、量化金融、在线教育、AI for Science、科研机构等众多领域的行业用户,快速构建其AI平台,以统一的架构和标准化API,适配公共云、专有云、混合云和边缘的需求。同时,阿里云也积极通过开源,与社区共同推进云原生AI的演进和落地。
来源:科技新坐席