(美国AI公司系列研究)Scale AI公司背景调查

B站影视 欧美电影 2025-04-07 19:02 1

摘要:近期,国观智库组织美国研究中心和部分实习生,针对美国硅谷的5家AI公司——Anduril、Scale AI、Open AI、Anthropic、Palantir进行了第一阶段的专项研究,包括产品技术、资金来源、发展历程、核心成员、政府合作等情况。相关成果整理成

审校:朱俊玮 国观智库美国研究中心主任

编者按:近期,国观智库组织美国研究中心和部分实习生,针对美国硅谷的5家AI公司——Anduril、Scale AI、Open AI、Anthropic、Palantir进行了第一阶段的专项研究,包括产品技术、资金来源、发展历程、核心成员、政府合作等情况。相关成果整理成5篇简要报告,陆续刊发,供感兴趣的读者参考。

一、公司基本情况

(一)公司简介

Scale AI是一家专注于人工智能数据标注与治理的美国独角兽企业,成立于2016年,总部位于旧金山,在纽约、华盛顿特区、英国伦敦、中东等地都设有办公室。其创始人是时年19岁的汪涛(Alexandr Wang),他从麻省理工学院辍学后创立该公司,并迅速在AI数据服务领域崭露头角。Scale AI最初以自动驾驶数据标注为核心业务,为谷歌、丰田等公司提供图像、视频等结构化数据的标注服务。随着生成式AI和大语言模型(LLM)的兴起,公司转型为AI数据基础设施提供商,服务范围扩展至文本、语音、传感器数据等多模态数据处理,并通过自研技术平台优化数据标注效率和质量。

2017 年,Scale AI 成立远程任务平台Remotasks,这是一家内部外包机构,在东南亚和非洲设有分支机构,负责培训数据标注员。

(二)资金来源

Scale AI最初成立时,Accel公司合伙人丹尼尔·莱文(Daniel Levine)为其提供450万美元的种子资金和临时总部场地。其他投资者包括龙骑士投资集团(Dragoneer Investment Group)、老虎全球管理集团(Tiger Global Management)和指数创投(Index Ventures)。2019年8月,亿万富翁彼得·蒂尔(Peter Thiel)的创始人基金(Founders Fund)向Scale AI投资1亿美元后,其估值突破10亿美元,获得独角兽地位。2024年3月,在Accel领投的另一轮融资后,Scale的估值达到近130亿美元。2024年5月,Scale AI 又从亚马逊和Meta Platforms等新投资者手中筹集10亿美元,其估值达到140亿美元。

(三)主要产品和技术

Scale AI提供的产品与服务主要包括以下三个方面:一是构建数据引擎,收集、整理和注释数据,训练和改进模型,其产品规模数据引擎(Scale Data Engine)深受世界领先的机器学习(ML)团队的信赖。二是应用人工智能平台,包括专为政府设计的人工智能平台“多诺万”(Donovan)和全栈生成式人工智能平台GenAI Platform。三是对于大语言模型能力和安全性的可信评估,这项服务面对包括公共部门、企业和AI从业者在内的潜在群体。

二、公司发展历程

最初,Scale AI 的商业盈利点是数据标注服务。自动驾驶技术的出现和推广使得各大汽车公司积累了大量道路驾驶视频,但缺乏足够的经验将这些视频数据化成为数字资源。Scale AI敏锐地抓住这一需求,并且积累大量商业资源,这些商业资源在Scale AI向生成式AI平台转型的过程中发挥了重要作用。

汪涛将Scale AI定位为“生成式AI 淘金热中的铁锹和镐”,因为对于任何大型AI平台来说,用于训练的数据质量直接决定了大型语言模型的可靠性,因此Scale AI为 AI 模型的开发者提供了关键资源。这种商业模式依靠庞大的人力资源网络,主要来源是其内部外包平台Remotasks。据悉,Remotasks在全球有超过二十万名临时工,但是Scale AI一直在极力模糊二者之间的关系,也因此引发多起违反劳动法的调查。

除了以相对低廉的成本来提供大规模数据标注服务外,汪涛极其注重与美国政界保持密切关系,这也成为他获得成功的秘诀之一。Scale AI公司与美国政府和军方的关系十分密切,汪涛本人也是科技领域著名的对华鹰派人物之一。在《华盛顿邮报》和《福布斯》对其的专访中,他毫不掩饰地表明中美在AI领域的竞争关系,以及Scale AI将如何协助美国军方保持对中国不断崛起的军事力量的技术优势。特朗普在2024年再次当选美国总统后,汪涛在政治场合的表现更加活跃,他与曾为特朗普及其家族成员提供媒体策略服务的政治顾问亚历克斯·布鲁塞维茨(Alex Bruesewitz)关系匪浅。特朗普上任次日,汪涛就在《华盛顿邮报》上刊登整版广告称“亲爱的特朗普总统,美国必须赢得 AI 战争”,毫不掩饰其咄咄逼人的对华态度。这种态度或许有助于Scale AI拿到更多的政府合同。

三、核心人员

汪涛,Scale AI公司创始人。出生于新墨西哥州洛斯阿拉莫斯,父母是来自中国的移民、物理学家,曾在洛斯阿拉莫斯国家实验室工作。他在洛斯阿拉莫斯高中上学,之后移居硅谷,成为财富管理公司Addepar的一名软件工程师。后在Quora担任软件程序员,并曾短暂就读于麻省理工学院、在高频交易公司哈德逊河交易公司(Hudson River Trading)担任算法开发人员。2016年辍学后,与他人共同创办Scale AI公司。

威廉·霍基(William Hockey),Scale AI公司董事。美国工程师、企业家。他最出名的是创办Column NA以及与他人共同创立和运营金融服务公司Plaid。

迈克尔·克拉西奥斯(Michael Kratsios),Scale AI公司董事总经理兼战略主管。美国企业高管、前政府官员。曾担任白宫科技政策办公室第四任首席技术官、时任总统特朗普的首席技术顾问。2020年7月10日至2021年1月20日,担任国防部研究和工程代理副部长。2021年5月,加入Scale AI公司并担任董事总经理兼战略主管。2024年12月22日,待任总统特朗普宣布将提名克拉西奥斯担任白宫科技政策办公室主任和总统科学顾问。克拉西奥斯在美国人工智能等科技政策领域发挥了极其重要的作用。在他的推动下,特朗普于2017年10月25日签署总统备忘录,呼吁建立无人机系统整合试点计划。他对得到两党支持的《国家量子计划法》的实施工作进行了监督,并在白宫成立国家量子协调办公室。2020年1月,他宣布在白宫成立国家人工智能计划办公室。他与美国盟友合作,制定针对中国的人工智能政策。

Scale AI的不少成员都有美国军方背景,如AI联邦政府业务团队主管马克·瓦伦汀(Mark Valentine)是退役军人;AI联邦政府业务团队成员乔纳森·哈金斯(Jonathan Hudgins)是退役空军军官、原F-15E战斗机飞行员。

四、合作情况

(一)Scale AI与美国政府的合作

1.Scale AI利用公共部门数据引擎为国防、情报和民事机构提供人工智能支持

据公司官网信息显示,该项服务的客户包括美国陆军、空军、五角大楼首席数字和人工智能办公室(CDAO)、国防创新小组(DIU)等。服务主要内容是借助AI辅助注释工具和主题专家团队快速生成高质量数据,对数据切片进行优先排序并解决模型漏洞,通过模型预测与真实数据比较来更新模型。美空军计算机科学家摩根·毕晓普(Morgan Bishop)称:“Scale AI为国防部提供了全面的数据基础设施组件,与其合作的三个月内,国防部AI模型准确性的提高超过了过去的十五个月。”

2022年,Scale AI为美国国防部提供了符合模块化开放系统方法 (MOSA) 的开放数据架构和机器学习运维(MLOps)管道,并帮助其创建配合作战计划(OPLAN)的“数据附件”。这使得美军指控部门能够为自动驾驶车队提供战区行动的关键、预先验证的数据集,包括战区特定的感知模型(光学雷达、摄像头、普通雷达)、分段映射的行进路线、用于检测和识别的战斗序列等级和类型ID、映射到友军机动方案的光电和合成孔径雷达图像等。

2023年,Scale AI被美国陆军和国防创新小组选中,部署其数据引擎以支持陆军的“机器人战车”(RCV) 计划,为在高风险环境中安全实施侦察等任务提供可信赖的自主导航系统。Scale AI提供其数据引擎平台来支持原始数据的收集、整理和标记,以及自主导航软件和计算机视觉算法的AI模型开发、试验与鉴定。

同年8月,Scale AI拿下了美国国防部的合同,为联合部队提供数据管理和注释功能。此功能将在支持多模式数据管道(例如全动态视频、合成孔径雷达和电光图像)方面发挥关键作用。该项服务将被部署到陆军、海军陆战队、海军、空军、太空军和海岸警卫队的非机密和机密工作流程中。

2025年3月,Scale AI与美国国防部签署一项具有里程碑意义的“Thunderforge”项目合同。这是美国防部利用AI智能体(AI agent)进行军事规划和行动的“旗舰计划”,由美国国防创新小组主导,由Scale AI与安杜里尔(Anduril)、微软等“全球技术合作伙伴”团队共同开发和部署AI智能体。这些AI系统将用于建模和仿真、决策支持、行动方案提议甚至自动化工作流程。

2.Scale AI旗下的应用人工智能平台“多诺万”为政府部门提供领先的大语言模型、微调模型和针对关键任务用例的定制AI工作流程

“多诺万”本身就是一个政府AI应用平台,其初衷之一便是适用于国防和情报用例、术语和背景,并满足机密信息不能离开保密网络而发送给开源人工智能模型的需求。“多诺万”的简要工作流程为(1)利用卫星图像、情报报告、出版物等信源和机密网络采集数据;(2)使用针对国防和情报需求调整过的大语言模型来实现关键任务功能:洞察、翻译、编码等;(3)通过交互界面追踪数据源,并将其嵌入现有工作流程;(4)通过提示获取关键信息,快速起草行动方案、简报和总结。Scale AI 与领先的大语言模型提供商合作,将其引入美国政府网络。“多诺万”的客户可访问各种大语言模型,如OpenAI的GPT-3.5、Cohere的Command和Meta的Llama 2等,以选择最适合其任务的模型,并可不受基础设施限制,在机密网络上使用。

3.Scale AI为白宫公共部门测试和评估人工智能的安全性与可靠性

Scale AI帮助更广泛的AI用户了解其优势和安全风险,并与领先的模型构建者合作评估模型的安全性。红队测试是其测试和评估方法的核心。白宫科技政策办公室曾在2023年宣布选中Scale AI来开发生成式AI系统评估平台,用于在当年“DEFCON 31”计算机安全大会上举行的当时规模最大的红队演习。

(二)Scale AI对俄乌冲突的参与

Scale AI在AI领域的巨大军事潜力在俄乌冲突中得到验证,不仅可进行战损评估,还可不断开发和升级深度学习模型,用于描述场景并检测来自商业卫星图像提供商的一系列图像数据集。Scale AI正在利用这种全栈、多智能、人机协作的产品向美国国家安全客户提供信息,包括俄军在欧洲当面和俄乌边境的部署信息。过去几年来,他们利用俄军空中和地面战斗序列数据,连续识别了美军欧洲司令部责任区内的俄军战斗序列变化。他们还使用“卡佩拉空间公司”(Capella Space)的高分辨率合成孔径雷达图像和高分辨率光学图像来提供精度高、时效强的信息。

来源:国观智库

相关推荐