打造企业“数智大脑”,达观数据AI Agent 的创新与实践

B站影视 2025-01-06 19:07 2

摘要:近日,AIGC 开放社区专访了达观数据,深入探讨了在AI时代,达观数据如何通过“曹植”大模型、Agent智能体、提示词(Prompt)等技术,推动企业级AI服务的发展,并在垂直领域模型和RAG本地知识搜索方面实现创新突破。

近日,AIGC 开放社区专访了达观数据,深入探讨了在AI时代,达观数据如何通过“曹植”大模型、Agent智能体、提示词(Prompt)等技术,推动企业级AI服务的发展,并在垂直领域模型和RAG本地知识搜索方面实现创新突破。

以下为专访实录。

No.1m 关于AI 大模型“曹植”

Q:请介绍下曹植大模型一些参数和技术细节,包括“曹植”大模型在企业级应用中的独特优势。

A:“曹植”大模型是一款垂直、专用、国产的大模型,具备长文本、多语言、垂直化三大特点。首先从技术层面来看,采用了Transformer的基础架构,70b参数,采用多模型并联(Ensemble)架构,还创新性地应用了混合专家系统(MoE)架构 ,这种架构可以通过将不同参数规模和不同类型的模型相结合,更好地解决垂直行业的问题,提高模型的灵活性和泛化能力。

“曹植”大模型作为一款企业级语言模型,能够针对不同行业的需求,提供更加准确、专业的回答和解决方案。它具有专业垂直性、易用高效性、安全合规性、灵活定制性等优势。比如在金融领域,曹植大模型可以准确地理解和处理各种金融术语、业务流程等,为金融机构提供专业的风险评估、投资建议等服务。并且随着企业的业务需求的多样化,“曹植”大模型管理平台可以根据用户自己的业务场景和需求,轻松地对模型进行微调、定制prompt指令等操作,使得模型能够更好地适应企业的个性化需求。“曹植” 大模型兼容多种基座模型,像百川、智谱、Llama 等第三方基座模型等,企业可以根据自身需求选择融合不同的模型,充分发挥各模型的优势,实现优势互补。我们也很注重企业的数据安全和内容合规性,训练数据与算法模型都是自主可控的,并且全面适配国产信创,让企业能放心用。

Q:在垂直领域模型的训练过程中,达观数据是如何确保模型的高效性和准确性的?如何解决技术、算力、数据等方面的挑战?

A:首先在预训练过程中,运用了通用无监督训练和领域有监督训练,以及大量的专业领域语料,“曹植” 大模型的指令微调数据集中,30% 是通用指令,20% 是 NLP 任务指令,50% 是垂直领域指令,通过这种合理的比例混合,使模型既具备通用的知识,又能深入掌握垂直领域的专业知识,从而更好地应对垂直领域的各种任务。并且针对中文场景做了大量的优化工作,因为中文的语言特点和表达习惯与其他语言有所不同。通过这些优化,“曹植”大模型在处理中文文本时更加准确和自然。例如,在词汇理解、语义分析、文本生成等方面,都能更好地符合中文的使用习惯。

其次在算力方面,“曹植” 大模型适配多种高性能GPU,联合燧原科技、华为昇腾等国产算力平台共同打造大模型国产化解决方案。

并且将“曹植”大模型结合知识图谱、自然语言处理、多模态知识挖掘等技术,提供更强大的知识生产、组织、搜索、问答等能力,从而提升模型在垂直领域的应用效能。

Q:垂直领域模型与通用模型相比,价值在哪?

A:通用模型知识覆盖面广,涵盖了众多领域的知识,数据规模巨大并且多样,但在专业知识的深度上较难达到垂直领域模型的水平。垂直领域模型更注重专业性和企业私有化部署,涉及定制、数据安全、保密性等。垂直领域模型专注于特定行业,比如说,对于金融行业的风险管理,垂直领域模型可以精准地识别各种金融风险因素,包括市场风险、信用风险等。它能够根据特定的金融市场数据、企业财务报表等信息,提供高度精准的风险评估和预测,而通用模型可能只能提供较为宽泛的金融概念解释。而且垂直领域模型更注重行业知识深度,可以根据企业的特定业务流程和需求进行定制化开发,能够满足特定场景需求。不需要像通用模型那样处理海量的、多样化的通用数据。这使得企业在计算资源、存储资源和时间上能够降本增效。

No.2 大模型管理平台的技术架构

Q:达观数据的大模型管理平台是如何设计的?它在支持自研及开源大模型方面有哪些突出特点?

A:平台内置了全栈自主研发的“曹植”大模型,并兼容外部LLaMA2、ChatGLM2、Baichuan、InternLM等多种开源模型,实现各类模型的fine-tuning微调。

我们提供了全面的核心功能:数据管理、模型管理、服务管理、指令管理等。数据管理包括数据标注、清洗、增强和版本迭代;模型管理构建了完善的模型训练流程,支持模型组建立和版本迭代;服务管理提供了简单易上手的场景服务上线流程;指令管理则深度适配不同行业的指令需求,提供定制Prompt模板功能。我们也采用了多模型并联(Ensemble)的创新方法,通过整合经典的知识图谱、搜索引擎等工具和大语言模型,实现了模型性能的优化和提升。并且,模型包括了不同参数规模的多种模型,如数十亿、数百亿等,未来还将研发数千亿的模型。同时,还可以与其他第三方的大模型进行对接,实现模型间的融会贯通,进一步提升模型的价值。

在支持自研及开源大模型方面,我们具备开放的兼容性、一键式灵活部署、安全合规性等特点。全面适配信创体系,支持私域数据对接,确保企业和敏感信息的安全。简单来说,我们的目标就是让大模型的应用既专业又安全,让企业能够轻松上手,快速实现智能化升级。

No.3 Agent智能体在企业服务中的实际应用

Q:请分享一些 Agent 智能体在企业内的应用实例。这些智能体如何在不同的业务场景中实现自动化和智能化?

A:达观Agent办公智能体在各行各业的业务场景中都有广泛应用。在专业场景中,比如在金融行业:银行信贷流水审核、银行监管报送,证券开市期间监控、自动清算结算、托管运营审阅,智能核保、风控管理等;在制造行业:ERP自动录入、数据采集备份、供应链管理等;在通用场景中,像财务管理方面,自动申报纳税;人力资源方面,自动分拣并筛选简历;客服场景中,AI坐席/助手基于自然语言对话解决咨询与服务问题,大幅提高服务效率和效果。

达观Agent是专注于企业级应用的智能体,基于企业的知识库为数据基座,赋予其一些AI技术组件,比如达观自研的“曹植”大模型、IDP智能文本处理、RPA自动化执行技术,打造集合“数智大脑-眼识别-手执行”这样具备专业、智能、可落地的办公智能体平台。通过对文本数据的语义理解、拆解文本、识别元素来解析文档,利用RPA技术模仿人类的办公流程,实现智能交互,可以自动化执行工作处理任务。

No.4 提示词(Prompt)在大模型中的优化策略

Q:在大模型应用中,提示词的设计如何影响模型的输出质量?达观数据是否有特殊的优化策略来提升提示词的有效性?

A:提示词是用户与模型进行交互的桥梁。合适的提示词能明确任务、限定输出范围,引导模型生成连贯、合理且有逻辑性的文本,激发相关知识点以推动深入思考推理。此外,提示词的设计还能优化用户与模型之间的交互体验。一个清晰、简洁且易于理解的提示词能够减少用户与模型之间的沟通成本,使用户能够更轻松地获得所需的输出。这不仅能够提高用户的工作效率,还能增强用户对模型的信任和满意度。在我个人的实践中,我深刻感受到优质提示词带来的效率和时间节省。一个清晰、具体的提示词能够引导模型一次性生成符合用户期望的输出,避免了不必要的反复修改和调整。这不仅提高了工作效率,还节省了大量时间和精力。

达观在提示词方面有优化策略,我们会结合业务场景与数据特点,对提示词进行定制化设计。例如:在金融领域,提示词融入金融术语与业务流程元素,帮助模型理解处理金融问题,生成契合业务需求的精准回答。我们在技术体系中运用了知识图谱来增强语义理解,知识图谱为模型赋予丰富背景与语义关联,用户提问时,模型借此理解上下文语义,生成更准更深度的回答。在实际应用中,注重多轮交互优化提示词,依用户反馈动态调整,精准满足各阶段需求,提升提示词针对性与有效性,引导模型产出合用户期望内容。并且我们产品内置反馈机制与 badcase 分析来提高提示词的质量和效果。

Q:达观数据建议企业客户在提示词(Prompt)层面要进行哪些准备和培训学习?

A:企业需要认识到提示词在AI模型,特别是大模型中的重要性。提示词是引导模型生成符合期望回答的关键,因此,对其进行精细化的设计和优化是至关重要的。

首先,最重要的是要明确业务场景和需求,明确需要AI模型解决的具体问题,以及期望得到的答案类型和格式。这将有助于设计更贴近业务实际的提示词。其次,根据业务场景,收集并整理相关的问答数据,用于后续提示词的优化和训练。第三学习提示词的设计技巧,包括如何选择合适的词汇、句式和语法结构,以及如何通过组合和变换提示词来应对不同的业务场景和需求。最后 掌握提示词的优化方法,包括如何通过数据分析、用户反馈等方式评估提示词的效果,并根据评估结果进行针对性的优化。

No.5 企业级 AI 服务的定制化解决方案

Q:达观数据如何为不同行业提供定制化的 AI 解决方案?在这一过程中,如何确保技术的灵活性和可扩展性?

A:达观通过深入行业调研分析并与专家合作了解各行业特点与需求,基于行业数据特点收集整理数据、选择训练模型并优化,融合行业知识构建知识图谱与开发特定应用模块,提供灵活多样的部署及集成方案,且建立反馈机制持续跟踪行业动态与技术创新,以此为不同行业打造定制化 AI 解决方案。

达观通过采用先进模块化模型架构,结合预训练与微调,构建可配置数据管道与增量学习机制,运用微服务架构开发应用并设置开放标准化 API 接口,安排团队跟踪技术发展并进行前瞻性布局与分层设计技术架构等多方面举措,确保在为不同行业定制 AI 解决方案时技术具备灵活性与可扩展性。

Q:目前有哪些客户采用了达观数据的AI方面的服务和产品,大概都有哪些服务和产品,效果如何?

A:我们的客户群体多为国央企、大型企业为主。金融领域:国有六大行、两大交易所、头部证券公司、监管机构等,采用达观Agent办公智能体来处理银行日常业务;大型企业:通讯行业-中移、中联,制造行业-中国一汽、重汽、上汽、福特汽车等;能源行业-中国石油、国家能源集团、国家电气电网等;运输行业-中远海运、东航、南航等;还有一些媒体、政企。涉及到企业数字化转型,我们帮助企业定制知识库、智能知识管理系统来实现文本工作的智能化应用,帮助企业降本增效。

Q:从达观数据的角度来看,企业级客户在AI应用更注重考虑什么问题?例如安全合规、降本增效、技术创新、社会价值等

A:企业级客户在安全合规上,需要考虑数据加密、访问控制及脱敏等措施,确保数据安全与隐私。通过“曹植”大模型的私有部署,避免数据与公有云接触,降低泄露风险,并助客户满足合规要求,确保AI应用在合法框架内运行。此外,企业期望AI应用削减运营成本,包括人力、时间及资源消耗,通过自动化提升生产效率,优化生产流程,辅助企业决策。在技术层面上,选型与集成需适配现有IT架构,避免孤岛效应;持续迭代优化确保模型适应新数据及业务环境;算法透明度与公平性对复杂决策至关重要,构建用户信任,满足合规需求。

AI应用助力企业提升客户体验,通过个性化产品和服务增强客户忠诚度;同时推动企业产业升级,创新商业模式和业务流程,提升竞争力;并在履行社会责任方面,确保AI技术应用的公平公正与可持续发展,实现经济效益与社会效益的双赢。

No.6 RAG技术的应用

Q:达观数据的RAG产品是什么?有什么特点?

A:我们的RAG产品主要是结合了大模型与RAG技术的智能应用产品,通过将传统的基于检索的问答系统与基于自然语言生成的技术相结合,使得模型能够在生成答案时利用外部知识库中的最新信息,从而克服传统生成模型的一些局限性,如知识更新不及时、容易产生幻觉等。

我们的RAG产品具有多方面显著特点:第一、它能有效解决幻觉问题,将大模型生成变得可控,满足如金融领域严谨性要求;第二、可以构建高效索引体系,融合搜索引擎、向量、知识图谱等多种检索方式,快速精准提取信息;第三、生成答案时能呈现信息来源,增强可追溯性;第四、与金融等垂直领域深度结合,融入专业知识与业务逻辑,贴合业务需求;第五、支持多模态信息整合,具备本地化与定制化优势,在性能和安全性上表现更优。

Q:RAG 技术在企业中如何应用?有哪些比较落地的场景?这一技术如何提高企业知识管理的效率?

A:企业可利用RAG技术构建智能问答系统,在客户服务中快速解答客户咨询、促进企业内部知识共享;可以内容生成与创作,如新闻报道和文案撰写;在金融、法律等行业辅助决策,为投资、办案等提供依据;搭建企业知识库以及培训教育,推动知识管理与传承;便于信息检索与分析,服务市场调研与科研工作;还能优化业务流程,像在生产制造中提高效率、降低成本,在供应链管理里实现可视化与智能化,提升协同效率与响应速度并降低风险等。

No.7 大模型在金融领域的创新应用

Q:在金融领域,大模型是否可以被应用到智能风控和决策支持,或其它场景中?请分享一些具体的应用案例。

A:可以的。金融领域是我们最大的客群行业之一,我们和很多银行、证券、监管机构等都有合作,大模型应用在银行很多业务中,例如:信贷业务中信用评估与风险定价,反欺诈检测,资金用途监控;资金交易业务中,支付结算风险防控,反洗钱业务;银行账户管理,异常检测;市场风险预测与管理,内部合规风险监测等场景都有应用。

以达观多年以来的重要合作伙伴浦发银行为例,我们建立多项紧密合作,以智能风控创新平台获得了上海金融创新奖。并且我们为浦银理财量身定制的“智浦小鹿”项目,前不久入选了《上海全球资产管理中心建设资产管理大模型应用实践与指南》、《2024年人工智能大模型金融领域示范场景及创新应用案例》,这个项目以达观智能问答为窗口,利用曹植大模型的理解、规划和生成能力,通过企业知识库自主问答方式便捷获取企业知识信息,解决跨平台跨系统的任务处理,应用于智能投研、智能交易、智能风控、智慧组合投资等场景,使得员工效率大幅提升并且帮助企业实现数字化转型。

Q:达观数据后续会有哪些重点的技术研究和投入?

A:达观后续会在多方面开展重点技术研究与投入。在大语言模型优化上,着力提升性能,推进多模态融合以及模型压缩与轻量化工作;在行业垂直领域,既会深化金融领域合作以提升专业性精准度,又会向政务、制造、传媒等多行业拓展定制解决方案。同时我们重视人工智能伦理与合规,开发内容监管与隐私保护技术;升级智能知识管理系统,包括完善知识图谱构建与优化知识推理应用;在算力与数据管理方面,与供应商合作优化算力并加强数据治理提升质量;还会持续研发升级 AI Agent 并创新人机交互技术以提升人机协作效率与用户体验,从而推动自身技术发展与多领域应用落地。

No.8 未来 AI 技术的发展方向与挑战

Q:如何看待未来 AI 技术的发展趋势?

A:未来人工智能将继续向更加全面、深入、人性化的方向发展,更广泛地融入人们的日常生活和工作中,成为人类思考、推理和创造的智能伙伴;在垂直领域应用上会不断深化,存在多模型融合趋势,不同模型相互结合以攻克复杂难题;并且人机协作也会越发紧密,在专业领域通过人机交互完成任务,解决大模型现存问题;还会推动知识管理变革,打造企业“数智大脑”,实现企业数字化转型。

Q:如何看待AI技术与人类的发展关系?

A:一方面,二者合作共生,AI 具备强大的数据处理与运算能力,人类拥有创造力、情感理解等特质,两者优势互补。但另一方面,AI 也给人类带来挑战,在就业市场冲击重复性岗位,促使人类转型,还引发伦理道德困境,像算法偏见、生成虚假内容及特殊场景责任界定等。我们作为从业者,最终目的都是为了让AI 促进人类发展,提升生产效率,拓展知识边界,提高人类的生活质量。

来源:AIGC开放社区

相关推荐