摘要:在一项研究中,科学家们开发了一种人工智能模型,可以解码大脑信号以重现志愿者打出的句子。在第二项研究中,同一位研究人员使用 AI 来绘制大脑实际如何产生语言,将想法转化为打字的句子。
AI 模型可以使用非侵入性设备扫描您的大脑,并将您的想法转换为打字的句子——无需植入物。
两项新研究揭示了我们如何在数字界面上将想法转化为书面句子。 (图片来源:Meta)
两项新的研究表明,Meta 的科学家们使用人工智能 (AI) 和无创脑部扫描来揭示想法是如何将想法转化为打字句子的。
在一项研究中,科学家们开发了一种人工智能模型,可以解码大脑信号以重现志愿者打出的句子。在第二项研究中,同一位研究人员使用 AI 来绘制大脑实际如何产生语言,将想法转化为打字的句子。
科学家们说,这些发现有朝一日可能会支持一种无创的脑机接口,帮助脑损伤或受伤的人进行交流。
使用类似解码技术的脑机接口已经植入失去通信能力的人的大脑中,但新的研究可能支持通往可穿戴设备的潜在途径。
在第一项研究中,研究人员使用了一种称为脑磁图 (MEG) 的技术,该技术测量大脑中电脉冲产生的磁场,以跟踪参与者打字时的神经活动。然后,他们训练了一个 AI 语言模型来解码大脑信号并从 MEG 数据中复制句子。
该模型以 68% 的准确率解码参与者输入的字母。经常出现的字母更频繁地被正确解码,而不太常见的字母,如 Z 和 K,错误率更高。当模型犯错时,它倾向于替换 QWERTY 键盘上物理上接近目标字母的字符,这表明该模型使用来自大脑的运动信号来预测参与者输入的字母。
该团队的第二项研究以这些结果为基础,展示了一个人打字时大脑中是如何产生语言的。科学家们每秒收集 1,000 张 MEG 快照,每个参与者都输入了几个句子。从这些快照中,他们解码了句子制作的不同阶段。
他们发现,大脑首先生成有关句子上下文和含义的信息,然后随着参与者的键入,生成每个单词、音节和字母的越来越精细的表示。
作者在研究中写道:“这些结果证实了长期以来的预测,即语言生产需要将句子含义分层分解为逐渐变小的单元,最终控制运动动作。
研究小组发现,为了防止一个单词或字母的表示干扰下一个单词或字母,大脑使用“动态神经代码”将它们分开。这段代码不断变化每条信息在大脑的语言生成部分的表示位置。
这让大脑可以连接连续的字母、音节和单词,同时在更长的时间内保留有关每个字母、音节和单词的信息。然而,MEG 实验无法准确定位这些语言表征中的每一个出现在这些大脑区域的位置。
综上所述,这两项尚未经过同行评审的研究可以帮助科学家设计无创设备,以改善失去说话能力的人的交流。
研究人员写道,尽管目前的设置过于笨重且过于敏感,无法在受控实验室环境之外正常工作,但 MEG 技术的进步可能会为未来的可穿戴设备打开大门。
来源:左手牵起右手