周蔚华 | 人工智能与知识重构——对人工智能赋能出版业的思考

B站影视 日本电影 2025-03-17 09:09 1

摘要:内容摘要:人工智能正在重塑出版业,并对现有的出版业产生了巨大冲击。人工智能在知识来源、知识真假鉴别、知识构建等方面遵循着与传统知识生产方式不同的底层逻辑。因此,出版业要直面人工智能知识重构对现有知识生产方式的挑战,让人工智能赋能出版业。同时,出版教育界要适应人

内容摘要:人工智能正在重塑出版业,并对现有的出版业产生了巨大冲击。人工智能在知识来源、知识真假鉴别、知识构建等方面遵循着与传统知识生产方式不同的底层逻辑。因此,出版业要直面人工智能知识重构对现有知识生产方式的挑战,让人工智能赋能出版业。同时,出版教育界要适应人工智能知识重构方式的变化,改进出版人才培养模式,全面提升出版人才在人工智能时代的综合素养和能力。

//目录

一、知识及其来源

二、知识类别及判断知识是否为真知识的标准

三、人工智能如何重构知识

四、在人工智能知识重构中出版何为

基辛格在《人工智能时代与人类未来》一书中提出,人工智能有望在人类体验的所有领域都带来变革,“变革的核心将发生在哲学层面,即改变人类理解现实的方式以及我们在其中所扮演的角色”。人工智能尤其是生成式人工智能作为一种新的知识产生方式对传统的知识生产方式产生了颠覆性影响。出版业作为知识的优创、优选、优化和优传的产业,必然更加深切地感受到这种冲击。这就促使我们不得不深入思考:人工智能的知识生产方式与之前的知识生产方式有哪些相同和不同之处?在人工智能条件下,出版价值何在?生成式人工智能不断重塑知识的同时,如何赋能出版业?出版教育如何应对人工智能知识重构方式的变化?本文就这些问题谈一点个人的浅见。

一、知识及其来源

出版的一个重要使命和功能是知识的传承和传播。那么,我们首先就要对什么是知识这个元问题作出回答。事实上,这也是古今中外哲学家们一直关注的核心问题之一。

对于知识,不同的人有不同的理解。《中国大百科全书》提出:“人们在日常生活、社会活动、科学研究、生产实践中获得对事物的认识,其中可靠的成分即为知识。”这里包含三层主要含义,一是从实践中获得,二是对事物的认识,三是其中的可靠成分。《现代汉语词典》对“知识”给出了两种解释:一是指人们在社会实践中所获得的知识和经验的总和;二是指学术、文化或学问。但哲学家们对知识的认识远不止于此。最早对知识作出较为系统探讨的是古希腊哲学家柏拉图,他在不同场景提出了对知识的不同阐述:知识是一个单一命题;知识是带有说理的真信念;知识是各种专门学问、技艺或各门学科;知识是心灵的高级理智能力或理性。柏拉图认为,知识的功能在于促进个人在智力、道德和精神层面的成长。而与他观点对立的哲学家普罗泰戈拉则认为,知识的作用在于使掌握知识的人更有效地知道要说什么和怎么说,因此,知识意味着逻辑、文法和修辞。这些观点一直影响到当代。当代认识论在柏拉图知识学说基础上有所发展,比如,著名美国哲学家雷尔(Keith Lehrer)从分析“知”(to know)开始,对知识概念展开分析,提出了三种知识概念:一是指具有某种形式的能力(competence),二是指对某物或某人有所认识,三是指认识到某种信息。雷尔认为,这三种含义并不是互相排斥的,而是相容的、互相包含的,尤以最后一种含义为根本,因为即使前面两种也蕴含有信息的意思。挪威人类学家弗雷德里克·巴特(Fredrik Barth)从三个维度对知识进行界定:“第一,任何知识传统都包含一个关于世界各方面的实质性论断和观念的语料库。第二,它必须以单词、具体符号、指向手势、动作的形式作为部分表征,在一个或几个媒介中进行实例化和传达。第三,它将在一系列已建立的社会关系中进行分配、交流、使用和传播。知识的这三个方面相互联系。”我认为,巴特对知识的界定是较为全面的,并和人工智能环境下的知识具有较高的一致性。

知识从哪里来?对于这个问题,哲学家们一直争论不休。儒家以孔子为代表,认为知识有两个来源:“生而知之”与“学而知之”。也就是说,有些知识天生就形成了,而有些知识则需要通过后天学习而获得。西方哲学家在知识来源上形成了四种基本流派:

第一个流派是经验论。这种理论源远流长,从赫拉克利特、德谟克里特、卢克莱修到培根、洛克、休谟,一直到当代西方占主流地位的逻辑实证主义。经验论的核心观点认为,知识来源于经验、观察和实验,更确切地说,知识来源于感觉,人们从感觉、知觉、表象出发,形成概念、判断、归纳、推理,等等。经验论者认为,知识形成的基本方式是从经验中进行归纳。人们要获得正确的知识,首先必须从事实出发,通过实验收集各种不同材料,进行比较和排除,从而得出结论,形成知识。他们不承认有公认的、不变的、永恒的真理,不承认有终极的知识公设和理性基础。经验论面临的最大难题是经验不具有普遍性和客观性,同样的认识对象在不同的人那里感觉是不一样的,同样的天气有人感觉挺热,有人感觉挺冷。归纳法得出的结论并非通过严密的逻辑推理得出,它容易受到主观偏见、个人经验等因素的影响,导致结论不可靠。此外,归纳永远无法穷尽对对象的认知。因此,经验论难以解决知识的普遍性和客观性问题。

第二个流派是唯理论。唯理论是为了解决知识的普遍性和客观性这一难题而产生的,唯理论者认为感觉不仅是不可靠的,而且常常是骗人的,因此,一定有一个普遍的、先天的,像2+2=4这样不证自明、确定无疑的东西,它要遵守严格的推理规则,或者像笛卡尔的几何运算式,或者像莱布尼兹的“普遍语言”和“思维推算”,其方法不是归纳而是演绎推理或理性直觉。他们认为,知识体系可以像欧几里得几何学那样,通过几个公理演绎推理而形成,知识可以最大限度地形式化。这种思潮几乎和经验论一样久远,并绵延不断。从毕达哥拉斯、巴门尼德、柏拉图到近代笛卡尔、莱布尼兹、斯宾诺莎、黑格尔,一直到当代理性主义,其最大的特点是推崇理性,认为只有普遍性的、脱离了具体存在的精神、概念或者理念才是真实的知识。理性具有普遍性、客观性和必然性。但理性论的致命缺陷在于,它解释不了这种普遍性的概念或理念从何而来的问题,它受到了来自休谟等经验主义者的尖锐批判。休谟把知识分为关于观念之间的关系的知识和关于外在事物的知识。他认为,唯理论关于知识普遍性的法则只对第一类知识有效,理性固有的观念仅仅与自身相关而与对象无关。因此,关于对象的知识必须建立在感觉经验的基础上,而这类知识只能是或然的。例如,因果关系的知识就仅仅是从经验得来的,而不能来自先天的逻辑推演,因此它不具有普遍性。休谟进而认为,理性是主观上的幻想,仅凭理性演绎去认知世界是不可能的。

第三个流派是批判论,其代表人物是康德。康德力图调和经验论和唯理论,既解决认识的经验来源问题,又解决知识的普遍性、客观性问题,从而一劳永逸地解决“具有普遍必然性的知识如何可能”这一问题。康德一方面承认知识来源于经验和感觉,经验和感觉提供了知识的感性材料,另一方面又认为知识必须具有普遍性,这样就产生了一个矛盾:如果知识来源于经验和感觉,它就不具有普遍性;知识如果具有普遍性就不可能建立在经验基础上,一定来自先天的——即经验的先决条件。这个矛盾如何解决?康德认为如果像经验论那样从知识必须符合对象的角度看当然无法走得通,人们可以反过来思考:让对象符合知识。康德发现,知识本身就有一套先天的、普遍的形式,知识来源和内容具有经验性,而知识的形式具有先天性和普遍性。康德自鸣得意地将这一发现称为“哥白尼式的革命”。但如果对象符合认识,那么人们将“对象”置于何处?康德认为人们所认识的“对象”只是现象,现象背后的那个“物自身”或“自在之物”我们是无法认识的,它只属于信仰。因此,人们要为知识划界,要认识到人类认识能力的有限性或者理性的有限性,把人类无法认识的物自身交给信仰。批判论最终陷入了不可知论。

第四个流派是实践论。马克思主义认识论是实践论。马克思在《关于费尔巴哈的提纲》中鲜明指出:“从前的一切唯物主义的主要缺点是:对对象、现实、感性,只是从客体的或者直观的形式去理解,而不是把它们当作人的感性活动,当作实践去理解,不是从主体方面去理解。唯心主义却把能动的方面发展了,但只是抽象地发展了。”马克思进而认为:“全部社会生活在本质上是实践的。凡是把理论诱入神秘主义的神秘东西,都能在人的实践中以及对这种实践的理解中得到合理的解决。”由此,马克思主义建立了实践(经验)——感性认识(感觉、知觉、现象)——理性认识(概念、判断、推理等)——实践的认识论体系,从而有效地整合了经验论和理性论,并克服了批判论的不可知论,完成了知识来源和知识形成的真正意义上的革命,解决了几千年来不同派别之间的争论。

马克思主义认识论并没有穷尽真理,它一直处于动态的、变化的、发展的过程中。此外,它作为一种宏观的解释,有许多现实的、具体的问题需要进一步加以分析。例如,关于实践论如何解决知识的普遍性问题就一直困惑着哲学界。李泽厚先生试图用积淀说来解决这一问题,他认为普遍必然性问题要放在具有一定客观社会性的人类整体历史的基础上来考察。例如,被唯理论所普遍推崇的先天真理形式(如数学),其最终根源也仍在社会实践的最初的基本形式——原始操作活动中,符号操作——数学构造正好展现着人类所特有的认识能动性,而这种能动性正是人类主体性的文化—心理结构的一个重要方面,这种人类主体性既是主体性的客观方面即工艺—社会结构亦即社会存在方面,也包括社会意识亦即文化—心理结构的主观方面,是人类集体的历史成果的精神文化。因此,应该从人类历史文化积淀中去寻找认识的普遍性和客观性。

从本质上看,上述所有理论都是理性主义者,因此,很多学者将过去的知识体系称为理性主义体系,将近代以来的社会称为理性主义时代。他们的基本逻辑就是“知识的普遍性——客观性——必然性——可靠性”。但当代哲学家对这种理性主义知识观进行了尖锐的批评,马克斯·霍克海默(Max Horkheimer)、让-弗朗索瓦·利奥塔(Jean-Francois Lyotard)甚至称其为“理性的偏执狂”。

但正如《人工智能时代》作者所指出的:随着我们越来越依赖数字增强技术,我们正在进入一个新的时代,在这个时代里,人类的理性思维正在放弃其作为世界现象的唯一发现者、认识者和分类者的头等地位。撇开以叔本华、尼采等为代表的西方非理性主义认识论不谈,我个人认为有两个哲学家对非理性在认识中的作用有卓越的贡献。

一个是奥地利裔英国哲学家维特根斯坦。他抛弃了“确定性”这一理性主义的传统,以一种“生活形式”的哲学来取代逻辑经验主义以科学经验为基础的哲学,以由历史积淀、文化背景等构成的生活形式所产生的习俗的“确定性”,来取代严格的逻辑的确定性,以“家族相似性”概念来取代“普遍性”,“这一检验的结果是我们发现了一个复杂的、重叠交叉的相似网络,而这种相似有时是整体上的相似,有时是细节上的相似”,因此定义和分类所有事物,要求每一种事物都有清晰的界限的做法是错误的。他的这种见解为人工智能和机器深度学习提供了理论基础。

另一位英国哲学家是迈克尔·波兰尼(Michael Polanyi),他认为过去人们把普遍性看作客观性,而排除个体性知识或个人知识,这是错误的。任何知识都涉及特定的、具体的认知个体,认知过程不是预设了某种非个人化的纯然中立的认知机器。“科学中的个人知识不是被创造出来的,而是被发现的,因此,它声称超越了它所依赖的线索而建立起与实在世界的联系。”他声称:“我追寻了个人知识的根源,找到了隐藏在科学的形式主义操作背后的最原始的形式。”个人知识与实在世界相接触,建立了直接的联系,对人类行动和认知的技艺、意义的评价和理解都把我们的个人延伸到隐藏在其背后的综合整体的构成要素,“个人认知这一基本行为的内在结构,使我们既必然参与其本身的形成,又以普遍的意图承认它的结果”。因此,个人知识也具有客观性、普遍性和可靠性。波兰尼进而试图把感觉经验与理性结合起来分析知识的普遍性。他在《个人知识》开篇即通过总结“哥白尼革命的教训”来论述超越感官的缺陷而构建关于宇宙客观性的合理信念。过去人们通过感觉经验认为太阳围绕地球转,而哥白尼通过抽象理论分析证明了地球围绕太阳转,由此,波兰尼提出:“我们应该把那种更依赖于理论而非更依赖于直接感官经验的知识,看作更加客观的。”这就是说,理论知识比直接知识更具有客观性,正是这种客观性使我们有了对实在世界更深刻的看法。

波兰尼提出了两类知识的理论,他说:“人类的知识有两种。通常被描述为知识的,即以书面文字、图表和数学公式加以表述的,只是一种类型的知识。而未被表述的知识,像我们在做某事的行动中所拥有的知识,是另一种知识。”他将前者称为显性知识,将后者称为隐性知识。按照波兰尼的理解,显性知识是能够被人类以一定符码系统(最典型的是语言,也包括数学公式、各类图表、盲文、手势语、旗语等诸种符号形式)加以完整表述的知识。隐性知识和显性知识相对,是指那种我们知道但难以言述的知识。波兰尼认为这类知识往往通过体验、意会、顿悟、直觉、信念、境界、修炼等不可言说的方式而获得,它是一种非理性的知识。波兰尼认为,这类隐默的知识具有怀疑性和批判性,因而更具有创新性,更能体现人的价值。

维特根斯坦、波兰尼的这些知识观对当代后现代主义者产生了重大影响。后现代主义的代表人物利奥塔提出:“后现代科学本身发展为如下的理论化表达:不连续性、突变性、非修正性(nonrectifiable)以及佯谬。后现代科学对以下事物关切备至:模棱两可的、灾变、语用学的悖论等。后现代科学将知识的本质改变了。”弗雷德里克·詹姆逊(Fredric Jameson)在给《后现代状况——关于知识的报告》撰写的序言中也指出:“知识的本质发生了变化,当前的知识与科学所追求的已不再是共识,精确地说是追求‘不稳定性’。而所谓的不稳定性,正是悖误或矛盾论的实际应用和施行的结果。”这意味着知识观念是不断发生变化的,没有一成不变的知识。传统知识观是一种强调科学的知识观,追求知识的客观性、普遍性和中立性,把科学等同于真理。后现代哲学的知识观重视知识的不确定性、突变性、异质性和多样性等特征,并将社会和价值因素作为知识的合理构成性因素予以接受。后现代主义知识观强调知识有多种类型,不仅重视显性的可以用语言表达出来的知识,也关注无法用语言表达,只可意会,不可言传的隐默的知识。后现代主义知识观的这些特征从某种意义上也成为人工智能知识重构的理论基础之一。

二、知识类别及判断知识是否为真知识的标准

关于知识分类,由于划分的标准不同,更是出现了各种各样的说法。按照认识的不同程度,可将知识划分为感性知识和理性知识(康德又在中间加上一种知性知识)。感性知识就是指通过感性认识过程获得的知识,而理性知识是指抽象的理论知识。按照知识来源,一般可将知识划分为直接知识和间接知识。按照知识属性,柏拉图将知识划分为四类:理性、理智、信念和表象,前两者是“本质的理性的认识”,后两者是“关于派生的易逝的东西的意见”,从而形成了知识的四个等级;亚里士多德则把知识分为理论知识、实用知识和创造(技艺)知识三种类别;当代学界沿袭知识属性划分方法,将知识分为事实性的知识、概念性的知识、程序性的知识和元认知性的知识四类。按照知识形态,波普尔将知识划分为主观知识和客观知识,主观知识又称主观意义上的知识或思想,它包括精神状态、意识状态或者行为、反应的意向;客观知识又称客观意义上的知识或思想,它包括问题、理论和论证等。波兰尼提出的显性知识和隐性知识也是按照知识形态进行的区分。经济合作与发展组织的《以知识为基础的经济》在波兰尼知识分类的基础上进而把人类的知识分为四大类:关于事实和现实的知识、关于自然规律和原理方面的知识、关于技能和诀窍方面的知识、关于人力资源方面的知识,前两类为可编码的显性知识,后两类为不能明言的意会知识。德国科学史学家于尔根·雷恩(Jürgen Renn)按照知识系统中的结构,将知识划分为直觉知识、实践知识和理论知识。按照知识效用,弗里茨·马克卢普(Fritz Machlup)将知识划分为实用知识、学术知识、闲谈与消遣知识、精神知识、不需要的知识。按照知识的内在关联和学科特征,可将知识划分为自然科学、社会科学、人文科学和技术科学等,而当代知识划分的一个趋势是打破固有的学科界限,强调不同学科的融合,从而形成所谓的新文科、新理科、新工科、新医科等,这是知识发展的必然趋势。

柏拉图认为,只有经过验证的、“正确的”、被人确信的知识才是真知识。这就涉及“知识何以为真”的问题。围绕着这个问题,哲学家们同样争论不休,由此形成了几种基本观点。

一是符合论。符合论者认为只有认识与对象、思想与实在、命题与事实相符合的知识才是真知识。亚里士多德以及斯多葛学派较早从符合论的角度对真理进行定义,亚里士多德认为:“每一事物之真理与各事物之实必相符合。”因此,黑格尔说:“关于真理的一般有名的定义‘真理是对象和意识的一致’,是被他们提出来了。”从古至今的经验论者都是按照符合论的逻辑去定义知识的真理性的,但具体到符合论的内容,他们的观点则有很多不同,有的强调认识与所认识的事物之间的相符(唯物主义反映论基本都持这种观点),有的强调真理是代表观念的各种符号之间的契合(如洛克),有的强调真理是知觉观念之间的契合(如贝克莱),有的强调真理是知觉范围内对经验事实的或然性的认定(休谟),有的强调真理是“命题”与“事实”之间的符合(逻辑经验主义等),例如罗素就认为:“真理是信念的一个性质,间接也是表示信念的句子的一个性质。真理是一个信念与这个信念以外的一件或更多件事实之间的某种关系。如果这种关系不存在,那么这个信念就是伪的。”从某种意义上说,马克思主义认识论也属于符合论。

二是融贯论。融贯论者认为认识是否为真不能从命题与事实的符合去判断,而应该从命题体系内部的融贯关系,即一个命题与其他命题之间的相互依赖和决定关系,从命题的自明性以及命题之间的无矛盾性或自洽性来说明认识的真理性。这方面近代哲学的代表是斯宾诺莎和笛卡尔,笛卡尔强调观念自身的清楚明白,他认为:“凡是我们极清楚、极明白地设想到的东西都是真的。”斯宾诺莎则认为:“人类知识的顶峰便是心智的能力,即以理性的方式思考永恒——认识‘心智本身的理念’,并通过心智认识到无限的、始终存在的‘作为因的上帝’。”他还认为,这种知识是永恒的,是知识的中级和完美形式。现代贯通论者则认为真理是经验知识系统内诸命题之间的相互贯通性,一个概念的意义只与概念自身所属的体系相关,而与经验、实在等非体系的东西无关。

三是实用论。实用论者认为应该从实际效果出发判明命题性质或观念真假,亦即用有用性作为是否为真的判断尺度。是否有用也就是是否有意义,因此,美国哲学家查尔斯·桑德斯·皮尔斯(Charles Sanders Peirce)把意义的确定作为探究的唯一目标,一种信念如果能够给人带来令人满意的效果,那它就是好的信念,而一切好的信念就是真理。信念本身无所谓真假,只有是否有用,而有用的信念就是能够为人的行动提供一种清楚明白的信念。威廉·詹姆斯(William James)进一步发展了这一观点,认为有用就是真理,“它是有用的,因为它是真的”和“它是真的,因为它是有用的”意义是一样的。波兰尼指出:“在现代,人们把科学真理描述为纯粹的有用假设或解释方法,这就是把康德的调节性原则推广到整个科学。”

四是实践论。实践论者认为实践不仅是认识的来源,也是检验认识正确与否的唯一标准,这是马克思主义认识论的基本观点。马克思在《关于费尔巴哈的提纲》中一针见血地指出:“人的思维是否具有客观的真理性,这不是一个理论的问题,而是一个实践的问题。人应该在实践中证明自己思维的真理性,即自己思维的现实性和力量,自己思维的此岸性。”他进而指出,离开实践去争论认识是否具有真理性或现实性,是一个纯粹经院哲学的问题。

随着近代以来科学技术的飞速发展,上述真理观都遇到了前所未有的挑战,测不准原理(不确定性原理)说明,我们不可能同时精确地测量出粒子的位置和动量,这给符合论带来了巨大冲击。库尔特·F.哥德尔(Kurt F. Gödel)的不完全定理表明,任何一个形式系统,只要包含了简单的初等数论描述,而且是自洽的,就必定包含某些系统内所允许的方法及不能证明为真也不能证明为伪的命题,这又给融通论以致命的打击。它说明,在任何认识中绝对的确定性是没有的。“哥德尔直言不讳地说过,我们没有任何绝对确定的知识。言外之意,哪怕极其简单的事情,我们也无绝对把握说自己完全捕获了堪称终审法庭的客观实在。”哥德尔不完全定理说明,不确定性是人类认识的形式逻辑思维本身固有的,即使在纯粹的数学里我们也无法彻底达到确定性。哥德尔的不完全定理启发了著名人工智能大师图灵。图灵关心的问题是:是否存在能在原则上一个接一个地解决所有数学问题的某种一般的机械步骤?图灵发现这样的机械是不存在的。按照哥德尔、图灵等的观点分析必然得出这样的结论:真理性不能完全被容纳在纯粹逻辑证明的形式主义之中,它需要超越逻辑证明和规范性的运作。人们如果将这一结论用于解释人工智能知识,就会自然地得出结论:人类设计的算法永远无法超越人类自身,它只是在现有知识形式内运行。数论形式系统能谈论自身,但不能超越自身。一个计算机可以修改自身的程序,但不能违背自身的指令——充其量只能通过服从自身的指令来改变自身的某些部分。正因为如此,哥德尔不完全定理对人工智能知识重构理论产生了重大影响,奠定了人工智能的重要理论基础。

三、人工智能如何重构知识

对于人工智能的底层逻辑,著名人工智能专家赫伯特·亚历山大·西蒙(Herbert Alexander Simon)曾反复指出:“若将人类视为行为系统,问题也会变得简单。我们复杂的行为只不过是对复杂环境的外在表现。”西蒙进而从思维心理学、记忆与学习、设计科学、社会设计以及复杂性等方面探讨了人工智能的逻辑。他认为,一个有思想的人是一个自适应系统;人的目标确定了它的内部环境与外部环境的界面,环境中包括了这些储存的信息。人们的行为反映的主要是外部环境的特征,而对内部环境(比如使人们能够思想的生理特征)却了解不多,就是说它是一个黑箱。在西蒙详细论述的上述五个方面的逻辑中,我认为,对于我们理解知识重构具有直接意义的主要是思维心理学、记忆与学习、设计科学这三个方面。在思维心理学方面,西蒙认为,在对外部环境的反映中,人们主要通过信息、概念、搜索策略、记忆参量、组织记忆(通过听觉、视觉、图标信息、语言的和数字的命题信息等)以及自然语言处理等方式获得人工智慧。在记忆与学习方面,信息处理系统所作用的外部环境可分为两大部分,一是通过视觉、听觉、触觉所感知的和通过腿、手、舌发生作用的“真实世界”,二是在长期记忆中储存的可通过识别或联想进行检索的关于这个世界的大量信息(不论正确与否)。在设计科学方面,西蒙认为,“设计理论的主要目标是利用人工智能和运筹学的工具,拓宽计算机辅助设计的能力”。由此,他提出了所谓设计科学的优化方法,内容包括:设计科学的两个中心课题,即在已知备选方案中可作为选择的逻辑框架的效用理论和统计决策理论以及能够推算出哪种方案是最优方案的方法体系;三种备选方案,即设计的形式逻辑(命令逻辑和陈述逻辑)、启发式搜索(因式分解与手段-目的分析)和搜索资源的分配;两种资源分配方式,即层级理论与表象设计理论。西蒙这里论述的虽然是“人工世界”的一般原理,这些理论对于我们理解人工智能如何构建知识这一问题也具有很大的启发意义。

在《人工智能——一种现代的方法》一书中,作者从哲学、数学、语言学、心理学等八个学科方向谈到了人工智能的基础。他们认为,从数学的角度看,逻辑、计算和概率是具有一定水准的学术形式体系,它要解决什么是能导出有效结论的形式化规则、什么可以被计算、我们如何用不确定的信息来推理三个问题,而这三个问题恰恰是人工智能知识重构中的核心要素——算法理论的最核心问题。认知心理学和神经科学力图用所谓的超级计算机模拟大脑的神经元,从而形成复杂的神经网络,并使之“产生”思想和意识(所谓的“机器意识”),他们力图将大脑看作是一个信息处理装置,把心理现象建模成信息处理,认为认知理论应该描述详细的信息处理机制,靠这个机制可以实现某种认知机能。控制论思想家们认为,智能可以使用包含恰当反馈回路、可以实现稳定适应行为的自动平衡装置来创建,现代控制论的目标是设计能随时最大化目标函数的系统,这个系统同时将语言、视觉、规划等纳入优化控制系统。现代语言学力图揭示语言与思维之间的关联性,通过自然语言处理系统将知识翻译成计算机可以用来推理的形式。

知识的获取方式之一是“学习”,人类的“学习”大多数依靠对已有知识的阅读来实现。人工智能既然是“能够执行具有人类智能特征的任务的机器”,那它同样需要具有“学习”的能力,这就是要将人类提炼的见解编码到机器中,把学习过程本身委托给机器。机器学习已经改变了传统的知识获取模式,它不再专注于知识与对象的精确或“确定性”,抛弃了早期人工智能力图通过规则和事实的集合,以明确方式将人类的专业知识编码到计算机系统中的尝试,转向通过从一组图像中学习表征该对象的近似值的方式,也就是“从……专注于将世界简化为机械规则,转向构建现实的近似物”。通过机器学习来创建和调整基于真实世界反馈的模型,现代人工智能可以分析原本可以阻碍经典算法的模棱两可之处,它会衡量结果的质量,并提供改善这些结果的手段,使这些结果能够被学习。深度学习允许神经网络捕捉复杂的关系,并通过大量的资源进行训练,然后对结果进行推断。目前,机器学习主要有三种模式:监督学习、无监督学习和强化学习。“人工智能不像人类理性那样,通过推理得出结论,而是运用自己发展的模型得出结论”,因此,“机器学习需要的是维特根斯坦,而不是柏拉图”。

从上述介绍可以看出,人工智能遵循的既不是经验逻辑,也不完全是理性逻辑,更不是实践逻辑。算法、复杂人工神经网络、控制与反馈、自然语言处理、联结、模糊性、近似性、概率等构成了人工智能知识重构的内在逻辑,它在人类的知识来源、认知及建构规则等方面与传统的知识论遵循着完全不同的逻辑:从知识类别上它所提供的是知性的、理性的、间接的、陈述的(符号、概念、命题)、显性的知识;它无法提供感性的、直接的、操作性的、隐性的(默会的)知识;从知识何以为真的角度看,它所提供的是融贯性知识,是从内在逻辑一致性角度判断为真,无法依据符合论、实用论和实践论来判断为真;从过程看,它不追求精确性和确定性,而追求近似性、模糊性;从方法论角度看,它既不是归纳,也不是推理,而是通过建模以及“家族相似性”(维特根斯坦语)来实现知识的建构。而从其通过“家族相似性”寻求知识构建来看,它又在某种程度上接近符合论的某些特征。对于这一特征,《人工智能时代与人类未来》的作者进行了较为细致的分析:人工智能的潜力在一定程度上可归于它能够通过扫描大量数据集来学习类型和模式,比如经常出现的单词组合、一幅猫的图像等,然后通过识别人工智能已知的相似点和相似物的网络来理解现实。“虽然人工智能永远不会像人类心智那样认识一些事物,但通过与现实模式的匹配积累,它有可能接近人类感知和理性的表现,有时甚至能超过人类。”

由于人工智能构建的知识来源于人类已有的大数据,这些数据既是人类数千年理性知识的积累,又超越了传统知识获取的界限和范围,加上通过不断改进的算法和超强的算力的技术加持,从而使得人工智能在知识重构方面显示出巨大的威力:

第一,人工智能以一种崭新的方式挑战人类数千年的知识生产方式,实现了知识生产方式的革命性变革,极大地加速了人类知识的生产、增长和传播。

第二,它以“黑箱”的方式,以不同于传统认识论和知识论的生产方式,从知识的底层逻辑上进行变革,采用“最优化”的方式直接生成相关问题的系统“答案”,让人们找到了获得知识的某种“捷径”。可以说,生成式人工智能正孕育着一场思维革命,必将给社会各个领域带来全新的变革与挑战。

第三,它极大地拓展了知识生产的深度、广度,提高了知识生产效率。生成式人工智能可以生成多种模态的学习内容,实现跨模态内容转换。它能够实时回答学习者的问题,提供贴近人类对话方式的答疑解惑,突破了以往机械、单调的知识传播模式,拓展了知识交流的深度与广度。它能瞬间搜索出海量需要查询的内容,进而提出新的问题,极大地提高人类信息搜集和整理的效率,让人类的脑力从简单知识搜寻和提问中解放出来,专注于解决复杂问题。此外,它超前的数据处理能力超越了人类,它的辅助决策系统可以觉察到人类尚未决策或可能根本无法决策的部分现实。

第四,它的生成器网络系统可以应用于编码或写作,通过算法和模型生成文本、图片、声音、视频等内容,作者可以简单地将自己需要撰写的问题、大纲等提出来,让生成器填充细节,从而使得知识的生产变得极为便捷。它能显著提高内容生产的效率,并在很多领域有效地取代过去由人来做的工作,比如它可以用于翻译和校对,提高出版工作效率。与此同时,符号识别、语音识别、图像识别等技术能将不同的感觉系统有机整合。

第五,它的语言识别系统可以突破长期以来困扰人类的不同语言之间信息交流的障碍,使得不同文明之间的交流和互鉴变得更为便捷和更具有可操作性,也使得我们所倡导的文化“走出去”变得更具可行性。

第六,它通过虚拟现实系统重构和再现真实的现实世界,改变过去认识主体与认识客体割裂的状况,改变人类认识自然、社会和人自身的方式。

上述几个方面都离不开出版的深度参与,人工智能的基础数据很大一部分是由出版界提供的,它所呈现的消除各种感官之间、认识主体与认识对象之间的割裂现象的方向正是出版深度融合所要实现的目标。随着技术的进步,它在不久的将来会将出版人从那些简单、重复、组合性而无创新性的知识加工体系中解放出来,使其专注于从事有创意、能够体现人的本质力量的工作,这对于出版业来说应该是一种新的机遇。反过来说,出版业提供的数据能够成为其他行业人工智能大模型进行预训练的“养料”,而这种“养料”必将从产品形态及表达方式、价值选择等方面影响人工智能的结果。文字、图像、声音等不同数据的融通将进一步孵化出新的出版服务形态和产业类型,包括虚拟数字人、智能伴读、智慧机器人等人工智能形态,从而改变出版业的业态,促进人类出版走向“数与智”的数字出版新时代。可以说,人工智能向出版业赋予了新的动能,推动了出版业的进步和发展。

但正如人工智能大师西蒙曾经指出的:“我们为科技知识赋予我们巨大的力量而感到振奋,同时我们被科技力量所造成的问题的严重性所震惊,这使我们警觉。”我们在看到人工智能重构知识、助力出版业发展的同时,也要看到它给出版业带来的问题和挑战。这种挑战主要表现为以下几个方面:

第一,从业态上看,人工智能知识重构对现有业态的发展方式构成了挑战。人工智能时代所形成的智慧出版本质上是一个更高阶的出版业态,它能极大提高知识重构的效率。因此,从事一般性知识生产的传统出版业将逐步失去其价值,这对出版业的创造性和创新性提出了更高的要求,转变出版业发展方式的任务将变得更为紧迫。

第二,从事实判断的角度看,人工智能知识重构对知识的选择构成了挑战。人工智能的知识是否为真取决于现有数据库提供的内容是否为真,而目前很多知识是“不真”的。由于人工智能生产内容的海量性,出版从业者及一般读者将面临信息选择的巨大困境,知识爆炸导致可供选择的内容太多,让人眼花缭乱,从而对出版从业者的选择能力提出了更高的要求。与此相关的另一个挑战在于,由于生成式人工智能知识重构方式的变化,作品合法主体的确认将变得困难,对作品“创作”程度的辨析将成为编辑“不能承受之重”。机器对内容的生产可以在“瞬间”完成,这不仅会产生巨量的“作品”,而且极大地增加了内容选择和编辑加工的难度。

第三,人工智能以概率取代了因果,人工智能知识重构本身无所谓价值判断,它的价值取决于数据库中“养料”的价值。人工智能不具备原始的创造性,它能够实现从1到无限大的量的跨越,却无法实现从0到1的质的超越。因此,它对事物价值的判断完全取决于它赖以“生成”的数据库或进行学习性训练的“知识库”的价值。人工智能在某种意义上依赖于全球的数据库或知识库,而西方发达国家尤其是英语世界的数据库在人类知识总库中占据绝对优势,它们几乎垄断了全球有影响力的期刊和出版机构,在数字出版方面也具有先发优势。同时,西方国家在语料库中的数据偏见,有可能对我国的文化安全和数据安全造成威胁,并对社会形成误导。在这种情况下,出版业面临的任务更加艰巨:一要尽可能多地提供高质量的原创性知识内容要素;二要提升内容的传播质量、扩大传播范围;三要借助人工智能对用户画像实现精准传播。更为重要的是要加快中国特色自主知识体系建设,提供尽可能多的具有中国特色、中国风格、中国气派,体现中国价值主张的数据、内容和知识,维护我国的文化安全。李书磊在《深化文化体制机制改革》一文中明确提出:“生成式人工智能是目前最具革命性、引领性的科学技术之一,要尽快完善生成式人工智能发展和管理机制,推动这一重要领域的产业发展、技术进步与安全保障,做到趋利避害、安全使用。”

第四,人工智能没有反思能力,不具备隐默的知识获取能力。日本管理学家野中郁次郎(Ikujiro Nonaka)提出,西方哲学家和管理学家坚信,只有“硬”(可计量、可精确表达)的数据和知识才是有用的知识,这是一种不全面的认识。他认为,知识创新并不是对信息进行简单“加工处理”,而是要发掘员工头脑中潜在的想法、直觉、灵感等隐默知识。隐默知识是通过体验、意会、顿悟、直觉、信念、境界、修炼等不可言说的方式而获得,而人工智能是基于自然语言处理、人工视知觉以及知识表征系统等“知识构架”产生的,对隐默知识的获取能力是人类特有的知识生成能力,人工智能所产生的问题和缺陷,都需要人去克服和纠正。

第五,人工智能知识重构不具备实践能力。人工智能知识重构是在已有数据库中的“内循环”,它无法超越数据库本身,而人的知识从根本上来自人的实践,人在改造自然、社会和人类自身的实践过程中所形成的知识使知识实现了从0到1的飞跃。出版业是一门实践性很强的产业,出版学也是面向产业实践的科学。因此,加强出版业的实践指向,为中国式现代化提供高质量的知识支撑和文化支撑,是摆在出版业面前的一项紧迫任务。

第六,人工智能知识重构对我们传统的人才培养体系构成了挑战。我们过去的课程体系、课程设置以及教学模式等已经不能适应人工智能知识重构环境下的人才培养要求,出版人才培养机构要直面上述挑战,着力培养学生的以下能力:一是培养学生以求真为核心的理性分析和判断能力,使其学会辨别真伪,提高他们的批判性思维能力。二是培养学生发现和提出问题的能力。在提升学习和知识再造能力方面,发现问题和提出问题的能力是极其重要的能力。人工智能可以找到其他人解决问题的答案,可以做一个循规蹈矩的“答卷人”。“出卷人”是具有专业技能的人,找到有新意和创意的答案的人也只能是掌握较多专业知识的人。三是培养学生以向善为核心的价值判断能力,使其学会辨别是非,具有良好的政治素养、道德情操、职业操守和人民情怀。四是培养学生以审美为核心的直觉体验能力,使他们在出版实践中提升创新创造能力。五是培养学生的数据确权和版权保护能力。在人工智能时代,数据、版权将成为数字经济的核心资源,知识成为生产力的核心要素,因此,版权保护将变得越来越重要。出版人要知道如何对数据和知识进行确权,如何有效地维护自身及出版机构的合法权益,如何有效地防范侵权行为。六是培养学生获取隐默知识的能力,使学生在社会实践、出版实践(习)以及人际沟通和社会交往中通过体验、意会、顿悟、直觉、信念和修炼等获得知识。马克思主义认识论是实践论,我们坚信实践出真知,学生只有深入出版实践中才能提升创新创造能力。七是强化学生人机协同能力的培养。人机协同将是未来人工智能的发展方向,我们一方面要强化与人工智能相关专业机构的合作,另一方面要加强人机协同相关课程的设置和相关内容的提供,使学生掌握人机协同的基本能力,并通过人机协同让人工智能助力出版,为出版发展插上技术的翅膀。

作者系中国人民大学新闻与社会发展研究中心研究员,中国人民大学新闻学院教授、博士生导师。

引用格式参考:

GB/T 7714-2015

周蔚华. 人工智能与知识重构——对人工智能赋能出版业的思考[J].现代出版,2024(11):1-12.

CY/T 121-2015

周蔚华:《人工智能与知识重构——对人工智能赋能出版业的思考》,《现代出版》2024年第11期,第1页至12页。

MLA

周蔚华."人工智能与知识重构——对人工智能赋能出版业的思考."现代出版.(11)2024:1-12.周蔚华.(2024). 人工智能与知识重构——对人工智能赋能出版业的思考.现代出版,(11),1-12.

来源:再建巴别塔

相关推荐