中国信通院李荪等:从“经验驱动”向“标准驱动”,推动人工智能高质量数据集建设
随着大模型技术的迅猛发展,数据集作为人工智能核心三要素之一,在算法趋同、算力普惠的竞争环境中正在构建难以复制的差异化壁垒。高质量数据集的建设是提升AI模型性能的关键,也是推动“人工智能+”行动落地的保障,标志着人工智能发展正在进入“数据驱动”新阶段。
随着大模型技术的迅猛发展,数据集作为人工智能核心三要素之一,在算法趋同、算力普惠的竞争环境中正在构建难以复制的差异化壁垒。高质量数据集的建设是提升AI模型性能的关键,也是推动“人工智能+”行动落地的保障,标志着人工智能发展正在进入“数据驱动”新阶段。
在人工智能领域,有两类模型一直沿着不同的轨道发展:一类擅长"理解"图像和文字,就像一个能看懂图片并回答问题的智能助手;另一类则擅长"创造"图像,就像一位根据文字描述作画的数字艺术家。直到最近,这两种能力很少能在同一个AI系统中完美共存。这正是阿里巴巴集团联合多
在周四,卡内基·梅隆大学的研究人员发布了 LegoGPT,这是一种能根据文本提示创建物理上稳定的 Lego 结构的 AI 模型。该系统不仅能够设计出符合文本描述的 Lego 模型,而且确保这些模型可以在现实中逐块搭建,无论是由人手工搭建还是借助机器人协助完成。
近日,国务院国资委发布首批央企人工智能行业高质量数据集优秀建设成果,国家能源集团龙源电力“风电设备智能诊断与安全防控数据集”成功入选,标志着该公司在新能源数字化建设领域取得新突破。
这篇论文介绍了一个名为MMRel的关系理解基准测试集,旨在解决多模态大型语言模型(MLLM)在处理对象间关系时面临的挑战。该测试集包含超过22K个问题答案对,覆盖三个不同的领域和三种关系类别,并提供手动验证的高质量标签以确保标注准确性。此外,还包括对抗性案例,
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqiz
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqiz
一些图像处理任务,如图像分类和目标检测,已经通过使用卷积神经网络(CNN)性能得到了显著的改进。像ResNet和EfficientNet一样,许多架构在创建时已经在至少一个数据集上取得了出色的结果。训练中的一个关键因素是网络的正则化,它可以防止模型在训练的过程
3D空间设计平台酷家乐母公司群核科技日前对外公开两大技术引擎:群核科技启真(渲染)引擎和群核矩阵(CAD)引擎,并首次介绍其技术底层核心:基于GPU高性能计算的物理世界模拟器。现场,群核科技还推出了群核空间智能平台SpatialVerse,面向AIGC、具身智