摘要:最近,推特网友Jinay做了一件好玩儿的事情。他把arxiv网站上截止2025年5月的近280万篇论文做成了一个三维的“星空图”。在项目网站soarxiv.org上,我们可以用类似游戏的“键盘控制上下左右,鼠标控制视角”的操作,在论文的星空遨游。 其实,早在2
导语
最近,推特网友Jinay做了一件好玩儿的事情。他把arxiv网站上截止2025年5月的近280万篇论文做成了一个三维的“星空图”。在项目网站soarxiv.org上,我们可以用类似游戏的“键盘控制上下左右,鼠标控制视角”的操作,在论文的星空遨游。 其实,早在2018年,我们就曾尝试将集智学园网站开发成了知识星空,产品对外的名称也叫做“星空图”,申请的专利也被授权。
这个尝试背后是对“如何利用产品设计辅助用户学习”这一问题的思考。在专利中还提出了一个更大胆的想法,就是使用强化学习来优化所有的展示方式,以达到用可视化视觉作用到学习者的“潜意识”的目的。这也是集智策划「 大模型时代下的人机交互与协同 」读书会的发心所在。我们也邀请你加入读书会,和我们一起探索未来的人机交互模式会是什么样的图景。如果此读书会报名人数超过200人,我们将重新上线“集智星空图”项目,让大家体验一下不一样的在线学习方式!
关键词:人机交互,在线学习,星空图,知识可视化,学习路径自动生成
这几天我们关注到了一个叫做soarxiv的有趣的项目。作者是推特网友Jinay,他把截止25年5月份发布在arxiv上的将近280万篇论文做成了一个三维的“星空图”。每篇论文嵌入地图,就好像是宇宙中的一颗星星,整个空间构成了一片“知识宇宙”。用户可以结合使用鼠标和键盘在星空中肆意遨游,视觉效果非常酷炫。如果你在arxiv上浏览一篇论文,只需要把对应的网址前加上“so”——也就是将域名改为soarxiv.org,就会自动跳转到soarxiv星空中对应的论文所在之处,即可用可视化的方式了解这篇论文在整个知识地图中的位置。这个产品被推特用户称为“论文版的无人深空”。
这个项目背后的技术目前并没有相关的开源介绍,但仔细考虑后其实并不复杂,技术核心有两点:一是论文空间坐标的生成;二是前端的渲染,包括动画以及和用户的交互操作。在这一项目中,论文在星空中的坐标是基于论文之间的相似性生成,整个宇宙空间本质上是一个由论文文本构建而成的语义空间。也就是说,在星空中距离相近的论文,意味着他们的内容是相似的。前端技术则是在three.js框架的基础上搭建的,以可视化为主要目标,配合着类似游戏的“键盘控制上下左右,鼠标控制视角”的操作,让我们得以在空间中探索。
然而,他们并不是最早这样用“星空图”做人机交互的人,因为早在2018年,我们集智学园其实就尝试过极其类似的事情,而且很多理念早已经走到了前面。当时我们怀着“变革PC交互和知识可视化”的信念,将集智的课程网站开发成了知识星空,而我们这个产品对外的名称也恰恰也叫做“星空图”。我当时有幸作为产品的主要开发者之一,在老板的带领下,参与了产品从调研、设计到开发的全部流程。soarxiv虽然效果炫酷,但更多仅仅起到一个可视化的作用,并没有很多功能属性的设计,相比起来,集智的星空图产品由于依托于集智社区,其背后是一片更为广阔的星辰大海,所以本文想以此为契机重新回顾一下集智星空图产品,以及其背后的故事。
我们当时对于星空图这一产品开发的动机核心在于:传统的列表展示方式对于信息的重要性排序,无论玩出多少花样,本质上只是局限在一个维度上。但用户使用的场景是具有多样性的。相信大部分产品设计者都在列表的排序问题上有过纠结:按照内容的热度?还是重要性?或者上新时间?还是个性化排序?亦或者几种方式的综合?这种“纠结”究其本质,是由于基于列表的展示方式在维度上实际上是大大被局限住了,使得我们必须将丰富的内容信息硬生生地降维到一维线性化的列表,然后再展示给大家,这仿佛人为地增加了一个大大的信息平静瓶颈。
所以,我们产品的核心就是将内容展示空间从一维扩展到了三维。其中两个维度展示内容的位置,而第三个维度是尺度缩放,用于展示不同粗粒化层级的信息。理论上,维度的扩展可以兼容所有一维的信息,所以可以展示的信息只会更加丰富 。
其次,我们对于空间的定义从用户的角度切换到了内容的角度,也就是说,我们基于内容本身生成了一个知识空间,而不考虑用户不同的使用场景 (我们用其他方式来解决使用场景的问题) ——这和soarxiv的做法几乎完全一致。我们把集智学园当时几百节课程根据课程内容、字幕等文本信息提取关键词,并利用表示学习算法进行词向量的转化,最后按照课程的语义相似性将它们嵌入至欧式空间,给每一个课程分配一个空间坐标。这样可视化的好处在于,基于内容的展示是完全客观的,用户可以在这个客观的知识空间中按照自己的喜好进行探索。而且,用户可以很清楚地了解每一个内容在整个空间中所处的位置,从而理解当前学习内容和其他内容的关系,并且从全局的角度对整个知识图谱了然于胸:哪些是核心内容,哪些是边缘内容。
而我们的第三个维度——即纵深维度——也有一些设计——这就是信息的细粒化程度。换句话说,第三个维度恰恰就是尺度的缩放,你越往深了挖,知识星空就给你展示更多的细节信息,反过来你越往浅出走,则该系统会自动地粗粒化信息,给你展示大体宏观的内容。更高维度的展示方式在信息呈现方面有了更高的自由度,同时也可能带来信息负载的问题。而这种利用缩放操作实现不同层级的信息展示就可以有效避免这一问题:当画面视角较高时,展示的主体是课程所属的类别、课程名称等基本信息;当放大某个局部时,画面中的课程会有更多的细节展示出来,比如授课教师、课程时长、相关的标签云等等。所以和soarxive的游戏操作相比,我们星空图更像是在操作平面地图,不同层级的视角会展示不同粗粒化程度的信息。
至于用户的使用场景问题,展示方式就有很多选择了。现在想想我们的设计其实充满了各式各样的创意。首先,每个星空的面积大小就代表着对应内容的热度,所以进入界面最抓人眼球的是那些“大星球”。这就照顾到了想要快速捕捉热点的用户。其次,对于近期新上的课程,我们会用一种“闪烁”的展示方式吸引用户,告诉大家这颗星星虽然小,但它是我们新推出的内容,希望大家把目光吸引过来。
另外,我们会区分用户已完成学习和未学习的内容,每当完成一节课程,已完成的内容在地图上会被“点亮”,非常有成就感。这就让人很有把所有星星都点亮的欲望,而且也是真正意义上的在知识空间中的“开疆扩土”。
还有一个我们非常具有特色的、花了很大的功夫开发、也是我们十分重视的功能,那就是学习路径的生成。在集智的课程网站中,一些课程的学习往往是有前置知识的,这就意味着课程之间的学习存在依赖关系。当然在星空图中,我们可以通过把坐标的不断向外扩张来实现自学的目的,因为相近的位置意味着内容的相似性。但我们也提供了由专家给出的权威学习路径,比如“pytorch入门课程”下就包含了从自然语言处理到计算机视觉的一系列理论和实操课程。当用户启用路径模式时,点击‘pytorch深度学习’这节课程,地图中会自动绘制出一条学习路径,引导用户的学习。
当然,由于二维空间和我们星图的设计,还有很多可视化上的玩法,总而言之和列表展示的方式相比,二维的展示一定是更加自由的。
总之,我们花了将近大半年的时间开发这个星空图,现在想想几乎是在以完成一个科研课题的状态来开发这个工程项目,虽然过程中有诸多艰难,也走了不少弯路。而且网站上线不久后因为种种原因关停,笔者也已许久不从事网站开发的工作。但在发布初期我们还是受到了不小的关注,除了我们自己的用户,还吸引了一些产品经理相关的同行对我们的关注。我们最后还基于这一产品申请了公司当时第一批发明专利。
其实,集智一直以来都在尝试为“如何利用产品设计辅助用户学习”这一问题提出解决方案,集智星空图只是一次大胆的探索。而且我们当时对星空图的畅想也不仅限于此。
我们的专利中其实还提出了一个更大胆的想法,就是使用强化学习来优化所有的展示方式,以达到用可视化视觉作用到学习者的“潜意识”的目的。换句话说也就是,我们认为视觉交互由于打开了很多新的维度,所以它有着更加丰富的可优化空间,比如位置、大小、颜色、闪烁等,那么我们完全可以使用一种强化学习的方式来优化这些变量,以达到更加高效的学习互动。通过强化学习优化,算法的可视化推荐方案有可能会学会利用人类的“潜意识思维”能力,从而在潜移默化中就完成学习了。这实际上是对当前推荐系统的一种颠覆式革新。
这是怎么回事儿呢?现在大多数内容平台 (尤其是用户生产内容UGC类的平台) 内容的展示方式,由于数据量非常大,所以需要借助推荐算法对用户进行个性化推送内容,以实现更高的点击率和转化率。产品的展示并不是人为给定,而是根据用户的行为生成的。而对于星空图来说,这相当于可以基于用户在系统上的交互行为,创造一个独属于每个用户自己的个性化“知识空间”,而这个空间又进一步塑造了用户接下去的注意力流动方式。这种用户和系统的互动就构成了一个产品和用户在“互相学习”的强化学习机制:用户在产品中探索和学习,而产品也会根据用户的交互进一步被重塑。
而如果进一步考虑用户与用户之间的交互,那么学习模式可以进一步升级。试想一下,你如果有机会去follow一位大牛的学习路径,或者可以去他的知识空间里探索一番,看看他当前感兴趣的领域,或者了解一下他的兴趣转移路径,这将是多么新奇的体验。而且对于任何一位初入某个领域的新手来说,这也一定是一个非常有价值的使用场景。这给跨学科的交流和知识的碰撞也带来了可视化的可能性:新的知识在交互中涌现。
总的来说,无论是soarxiv还是集智星空图,背后的精神都是一致的:用更加自由的维度将知识可视化。而集智星空图则更进一步,希望提供一种全新的产品形态,让学习像漫游宇宙一样充满无限可能。如今,在AI的助力下,技术门槛已经不是最大的障碍,真正关键的是我们应该如何继续以好奇心驱动设计,让人与人、人与系统在互动中共同成长。
你觉得我们当年的这个“知识星空”图的创意怎么样?如果喜欢它,那么你想不想让它在互联网上重现?如果想,那就来加入我们最新一期的“ 大模型时代下的人机交互与协同” 读书会 吧,我们承诺,如果报名人数超过了 200 人,我们将把知识星空图重新上线,让你体验不一样的知识探索方式!想不想和我们一起努力一把?
来源:小夭看天下