摘要:以人工智能技术赋能建筑行业前期咨询工作为目标,探讨了构建人工智能生成可行性研究报告平台的可能性和路径。基于人工智能写作的商业化现状,建筑领域的数字化升级需求以及NLP(自然语言处理)等技术的日渐成熟。通过分析建筑业发展现状和未来趋势,设计了一套实现方案并依次解
以人工智能技术赋能建筑行业前期咨询工作为目标,探讨了构建人工智能生成可行性研究报告平台的可能性和路径。基于人工智能写作的商业化现状,建筑领域的数字化升级需求以及NLP(自然语言处理)等技术的日渐成熟。通过分析建筑业发展现状和未来趋势,设计了一套实现方案并依次解析结构,以颗粒度设计和语言网络为主轴介绍平台数据化的思路,以赋能工程前期咨询工作,加快全行业的产业转型。
1智能写作的市场分析
1.1智能写作的现状
人工智能写作的产品以技术路径角度划分主要有两类:主动创作型和辅助创作型。主动创作型的智能写作应用主要有两点特征。第一是半原创性,与传统写作相比,它仅需用户划定足够精确的颗粒度范围,提供文章所需的关键词即可,接下来的工作将交付程序自行完成,大大降低了人力投入成本,但又未脱离用户对文章走向的把控[1]。第二是高度依赖语言模型,对语言模型的选择直接关系到应用平台的工作模式、处理时间以及结果质量。
然而,在当前的技术边界下,人工智能写作能否达到主动创作能力,无论是从技术还是投资角度都有着很高的门槛。在提高劳动产率和确保良率上,不少产品偏向于选择对作品质量更有保障的辅助创作型。辅助创作相对主动创作而言,从经济角度可缩减研发投入,从产品角度能够轻松得完成商业化。但这一类型的智能写作工具往往聚焦于对原始文本的改造、扩写或填充。
1.2商用产品调研
当前,人工智能写作领域的产品主要集中于内置模板和算法续写两类模式。前者根据不同文案场景内置对应模板,根据用户提供的关键词搭配模板生成文章内容,其优势在于在较低的开发难度下,尽可能保证了写作结果的基本质量及主题贴合度。但其相对保守的智能写作方案决定了此类产品偏向于“写作”而非“智能”,产品维护更新的时间成本、人力成本、经济成本偏高。与之不同的是实行算法续写方案的产品。此类产品高度依赖预训练语言算法模型,以用户视角看,该模式可在维持文章结构的前提下,摆脱模板对应用场景的一定限制;从开发者角度看,优质且独立的算法将成为应对同质竞争的有力武器。然而,由于当前语言模型算法的技术边界限制,该方案所呈现的效果上限明确。
作者以推广度、软件下载量和开发单位背景等多维度论证,在众多方案不一的人工智能写作产品[2]中提取出如表1所示的6个成熟的商业化产品。
表1产品分析 来源:中机院
国内产品的采取方案以内置模板和算法续写为主。以智搜写作和火龙果写作为例,前者提供大量的场景接口,以内置模板作为应用逻辑达到匹配自定义关键词的场景,辅助实现人工智能的目标。而火龙果写作则以预训练语言模型为基础,根据上文内容续写下文选段,并一次生成多种不同走向的续写文案供用户挑选,以实现对文章结构和文笔风格等方面进行调整、优化与再创造的目标。美国的Jarvis.AI是主动创作型人工智能写作工具的代表,它通过使用复杂的神经网络和深度学习,理解和输出数百万个单词。该模型还根据以前生成的AI内容进行学习,以便多样、灵活地输出无穷无尽的文本段落,以成为文字工作者的生产力提升器。而在辅助创作型工具中,以Grammarly为代表的文案斧正软件更受欢迎。通过自身的语言数据库,Grammarly根据文章的自定义目的来微调语法,针对读者的范围,文章的形式,应用领域,语气语境等,调用对应的词汇语法数据库替代不合适当下目标的语句和词汇,通过细微的上下文线索判断文笔情绪。
1.3落地可行性研究报告领域的可行性
基于以上成熟智能生成产品的分析调研,通过分解可行性研究报告结构,捋顺可研报告智能生成的落地可行逻辑。通过基于NLP自然语言处理技术和应用深度学习模型循环神经网络,输入关键要素,通过数据获取、清洗、分析、共享,即可实现可研报告的AI智能生成。而链状循环神经网络可以通过循环保存过往记忆信息,实现模拟人脑的认知判断,每次指定新的项目特征参数时都可以根据过往的记忆序列进行模拟生成相似的文本报告。
近年来,从Transformer中脱胎出的成熟的预训练语言模型BERT和GPT-2语言模型被广泛地应用,这将大大的减少本项目的前期开发投入成本,避免重复“造轮子“的尴尬。可行性研究报告的文本虽然具有创造性,但同时其文本结构也具备一定的格式性。平台内置的模板和数据库可做到精确贴合可行性研究报告的格式属性,将人工智能的功效圈定在可行性研究报告的结构框架下,有效的提高报告生成质量和效率。
2可研智能生成平台的定位
将人工智能写作与可行性研究报告相结合,颠覆前期咨询领域的工作方式,赋能建筑行业的智能化产业升级。通过综上对国内智能建筑特别是可行性研究报告领域的情况研究,当前我国建筑领域的智能化建设还处于初级阶段,在项目进行的各个环节,智能化升级仍存在很大的发展空间。在工程前期咨询阶段,可行性研究报告是决定项目建设成败的重要因素之一,以此领域作为主轴,以差异化为突破口,以技术融合为手段,尽力打造出一款于当前垂直细分领域的首款龙头应用。
3智能生成方案设计
可研智能生成平台将聚焦于智能生成、文本纠错、内容分类三大主要功能模块,为报告编写者实现从材料输入,过滤,分析,生成到纠错的全过程服务。方案设计主要涉及颗粒度划分、语言网络及功能运用。
3.1可行性研究报告的颗粒度
颗粒度划分精准程度直接影响智能生成报告质量的好坏。依据可行性研究报告大纲的结构,构建以一级标题为主,二级标题为辅的颗粒度,分为总论、建设单位及相关简介、建设背景及必要性、选址、政策及行业准入分析、现状及整体改造建议、需求分析及规模、产业分析、市场分析、项目定位、设计方案等三十个基本类别。每项大类细分多个小项,以总论为例,下分项目由来、项目概况、研究内容及编制依据、主要技术经济指标、结论及建议。
3.2语言网络
语言网络涉及BERT和GPT-2。BERT主要实现文本摘要,可捕捉词语和句子级别的representation;GPT-2实现文本生成,预训练语料主要来自THUCNews。语料来自业务报告积累和政府级建设项目网站等,约近百个建设项目可行性研究报告。
算法层由深度学习、知识图谱、机器学习和大数据等功能模块组成,主要解决在海量的结构化信息灌输下,平台如何有效地找到匹配。算法是指对大量已知或未知的对象进行分析并将其转化为可识别结果的过程。这其中,对于深度学习方面的要求尤为重要。首先,识别并抽取要处理的对象,然后选择合适的分类归档方法。再接着使用正确的技术路线来做到对历史记录的数据化存储,构建知识图谱,最终可在下次下一次任务时完成对信息的检索匹配。
3.3功能运用
人工智能可研平台将包含文本语法纠错、文本查重、语义情感分析与改写等能力。功能运用描述如表2所示。
表2功能运用描述 来源:中机院
4学习能力考验与督查
4.1人工智能自主学习能力有限
通过算法成就的自主学习能力也是软件平台在同类型竞品中的天然“护城河”,形成了可持续发展的隐形竞争力。由于当前业界对于语言预训练模型的构建尚处于不成熟阶段,大部分现有产品的质量和技术边界参差不齐,尽管有类似GPT-3和BERT这一类的预训练模型证明了人工智能在生产力升级时的巨大潜力,但这一技术边界仅代表文本完全自主生成的初级阶段。当用户对所产生的文本小幅度的修改,并将重复同一个语句时,人工智能匹配文本与前文文本相比没有任何变化,证明人工智能匹配文本缺乏更正错误和记住错误的逻辑步骤,产品难以记住带有个人印记的写作逻辑。
4.2督查与监管
对人工智能大数据的依赖意味着它对每一种文本作品的著作权发起了挑战。根据我国《著作权法》的规定[5],著作权的主体是著作人,所保护的对象是表达而非思想。人工智能写作的主体虽然不是人类,但在算法的背后依然存在着人为思想引导的证据。即使有人类的参与,也很难判断这项行为于法律层面是否为纯粹的创作行为。虽然目前国内对人工智能写作领域的著作权仍存在诸多争议,但在版权保护的探索实践还在不断进行。
5结语
本文以建筑领域的数字化升级背景为开端,剖析了人工智能可行性研究报告的市场需求和产品定位,以颗粒度为主轴介绍了方案设计的数据化实现思路,以BERT和GPT语言网络探究了方案框架搭建的基本逻辑。如今,随着后疫情时代对劳动力产出效率的要求逐渐提高,行业为深度人员优化,使得人工智能技术赋能详尽性、程序性的工作成为趋势,智能可行性研究报告作为咨询服务数字化升级的突破口,是未来全行业进步的“试金石”,与人工智能有机结合可帮助行业积累充分详备的路径经验,在不久的将来,今天的路线探索可作为成熟的指导建议赋能建筑领域其他业务的智能数字化升级工作,加快全行业的产业转型。(作者:孟献宝,熊跃华,王凯文)
来源:吖吖测评