摘要:哈佛大学法学院图书馆今天宣布启动"机构数据计划"(Institutional Data Initiative),通过这项研究计划,哈佛大学法学院图书馆将与图书馆、博物馆、政府机构和其他机构合作,以数据形式发布其藏书。 这些数据可用于各种目的,包括训练人工智能模
哈佛大学法学院图书馆今天宣布启动"机构数据计划"(Institutional Data Initiative),通过这项研究计划,哈佛大学法学院图书馆将与图书馆、博物馆、政府机构和其他机构合作,以数据形式发布其藏书。 这些数据可用于各种目的,包括训练人工智能模型。
机构数据计划(IDI)将首先专注于完善哈佛图书馆扫描的100万册公共领域书籍。 它还将与波士顿公共图书馆合作,将数百万页历史报纸作为数据提供。 虽然这些数据集属于长篇文本,但 IDI 正寻求与其他机构合作开发各种形式的数据,包括科学和生物医学数据。
IDI 的启动得到了微软和 OpenAI 的支持。 在长期资金方面,IDI 计划与几家慈善机构和行业支持者合作。
微软副总裁兼副总法律顾问伯顿-戴维斯(Burton Davis)就 IDI 发表了以下看法:
"微软很荣幸能够支持机构数据倡议的建立,该倡议将致力于增加所有人工智能建设者对知识和高质量数据的访问。 我们致力于实现数据的广泛获取,并为更具包容性的人工智能生态系统赋能。 自 2020 年以来,我们一直致力于消除数据鸿沟,确保每个组织都能获得创新和实现更多目标所需的数据,这对于发展充满活力和竞争力的人工智能经济至关重要。"
微软一直坚信,每个人都可以从围绕开放和可用数据的合作中获益。 事实上,早在 2020 年,微软就发起了开放数据运动,通过该运动,各种规模的组织都可以访问开发人工智能应用所需的数据。
OpenAI 知识产权和内容总监汤姆-鲁宾(Tom Rubin)就 IDI 的推出发表了以下看法:
"长期以来,学术机构一直是人工智能研究和进步的重要合作伙伴,哈佛大学的机构数据倡议就是一个有力的例子。 公共领域在传播知识和创造力方面发挥着至关重要的作用,OpenAI很高兴能支持这一努力。 Zittrain教授在这一重要项目中的领导力令我们深受鼓舞,我们非常期待看到它产生的影响"。
通过提供易于获取的大型数据集,IDI 正在为人工智能技术的进步及其对所有人的可及性做出贡献。
来源:cnBeta一点号