摘要:近日,华为推出首款阔折叠屏手机——华为Pura X,其搭载的“眼动翻页”功能,可通过AI技术识别眼神来自动翻页,仿佛意念操控一般神奇。“眼神操控”的魔法是如何实现的?如何重塑我们的生活?
于梅君
主笔、视频制作:于梅君
近日,华为推出首款阔折叠屏手机——华为Pura X,其搭载的“眼动翻页”功能,可通过AI技术识别眼神来自动翻页,仿佛意念操控一般神奇。“眼神操控”的魔法是如何实现的?如何重塑我们的生活?
神奇!只需一个眼神就能“翻篇”
3月20日,华为推出新形态阔折叠手机华为Pura X,功能上实现多项创新,其中最引人注目的,便是华为阅读搭载的AI眼动翻页功能,用户反馈称,阅读电子书的流畅度,“仿佛纸张随风翻动”。
发布会上,华为常务董事、终端BG董事长余承东演示了AI眼动翻页功能。他手持华为Pura X,打开华为阅读应用,选择一本电子书开始阅读。随着他的视线移动至页面底部,页面自动进行了翻页,仿佛手机能读懂他的心思。
余承东表示,这一功能经过百万小时的真实阅读场景训练,能够精准捕捉用户的眼球运动轨迹,实现自动翻页,彻底解放双手。
当然,这个功能也不算太新鲜。比如荣耀在2023年就将眼动追踪功能,加入了Magic5 Pro系列手机。谷歌2020年也发布了一款“Look To Speak”的眼动追踪阅读软件。
苹果公司去年也将眼动追踪带到手机端。在新系统中,苹果将“眼动追踪”功能加入到辅助功能里,打开后,设备便会通过前置摄像头,识别眼睛运动情况。
其实,从智能眼镜的发展中,就能看到眼动追踪技术在电子数码领域的升级之路。早在2013年底,谷歌就申请了一项基于头戴显示器的眼动追踪技术专利。Meta公司也在2022年将眼动追踪加入到头显Quest Pro中。苹果发布的智能眼镜Vision Pro,更是让眼动追踪火了一把。
你的眼神是如何“指挥”屏幕的?
“眼动翻页”听起来很神奇,其实它背后有着严谨的科学原理支撑。这项技术基于软硬件协同及深度学习AI算法,通过低功耗传感器,实时捕捉眼球运动轨迹。眼动翻页的实现,主要依赖于三大核心技术。
人眼检测技术:手机前置摄像头与红外传感器协同工作,通过捕捉角膜反射的光点,实时追踪眼球的位置和运动轨迹。就像用激光笔标记夜空中的星星,系统能精确锁定你的视线焦点。
AI算法解析意图:比如,鸿蒙5系统内置的AI模型,会分析眼球运动的模式——快速扫视、短暂停留还是长时间凝视?例如,当检测到视线在屏幕右侧边缘停留0.5秒时,算法会判定为“翻页指令”,触发响应。
多模态交互协同:“眼动翻页”功能并非孤立存在,而是与语音助手“小艺”联动。若用户眨眼两次或轻声说“下一页”,系统会综合判断意图,避免误触,实现“眼+声+触”的立体交互。
具体来说,华为Pura X采用了前沿的传感器技术,能够持续检测人眼运动状态。同时,系统对眼球进行了3D建模,精准预测用户注视点。
阅读过程中,系统会根据用户注视的距离和方向,计算出用户实际注视的边界,一旦注视点移动到页面底部附近,系统便会判断用户是否已阅读完当前内容,自动进行翻页,无需手动操作。
此外,AI眼动翻页技术还具备自适应校准的能力。随着使用时间增加,系统会不断学习用户的阅读习惯,从而提高翻页的准确性和流畅度。
AI眼动控车:黑科技引领未来出行
“眼动翻页”只是人机交互革命的起点。科学界预测,2025年十大新兴技术中,神经接口与情感计算,或将让设备真正“读懂”人类情绪,有望在智驾、教育、医疗、虚拟现实等领域发挥更大作用。
在2024年世界移动通信大会上,荣耀推出一款眼动控车“黑科技”:将眼动追踪技术搭载在手机上,通过调用手机的前置影像传感器,对眼球的移动进行判断,再配合车控应用程序,即可实现“只靠视线”,就能操控车辆完成启动、熄火、前进和后退等系列操作。
具体来说,用户只需将荣耀Magic 6手机面向人脸,然后该手机的前置镜头,会自动捕捉眼球移动信息,最后通过手机,将这一信号传递给汽车,从而实现眼动控车。
AI眼动控车搭载了最新的深度学习算法,能够精准识别并分析驾驶者的眼动数据,并在不同情况下作出反应。
例如,当用户专注于某一方向时,车辆便会自动调整行驶方向,在危险情况下及时刹车。
AI眼动控车,提升了驾驶便捷性,司机无须频繁操作方向盘,便可轻松掌控车辆。同时,通过简单的眼部动作,用户可快速选择音乐、导航或接听电话。
随着智能化趋势不断深入,AI眼动控车,或将成为智能交通系统的重要组成部分。此外,在安全驾驶方面,眼动分析技术能够监测驾驶员视线偏离前方的时间,并及时提醒纠正,确保行车安全。
视控轮椅:靠眼球转动来指挥
在医疗诊断方面,眼动技术也发挥着重要作用。对一些患有神经系统疾病(如帕金森病、脑卒中等)或眼部疾病的患者,医生可通过眼动追踪系统,监测患者的眼球运动,更准确地诊断病情、提供个性化训练方案。
对肢体活动受限者而言,眼神操控更是独立生活的桥梁。一些瘫痪患者可以利用眼动设备来控制家中的智能设备,如打开电视、调节空调温度,甚至可以用眼动来进行简单的文字输入和网上购物等活动。
上海灵魁智能科技有限公司还研发了一款“视控轮椅”,将为渐冻人、中风患者等带来生活便利。
“视控轮椅”源于眼球的一种本能反应,戴上智能眼镜,当眼球向上时,轮椅将启动;眼球向下时,轮椅将停止;当眼球向左移动时,轮椅将执行左转程序;当眼球向右移动时,轮椅将执行右转程序。
在速度控制方面,“视控轮椅”会根据眼球运动的频率进行速度变化,而且还会根据眼球转动角度的大小,控制转弯幅度,在凹凸不平的崎岖地区,视控轮椅依然能平稳运行。
灵魁智能还研发了“视控病床”“视控医疗影像系统”等创新型产品,在患者行动、医学诊断、智慧治疗等方面,提供系统化的解决方案。
“一眼掌控万物”,还面临不少挑战
谷歌《2025年AI商业趋势》预测,未来多模态交互将成为主流,眼动追踪或与AR眼镜结合,开启虚实交融的新体验,让“用眼神点亮世界”成为可能。
在办公环境中,眼动技术可以实现无鼠标、无键盘的高效操作。例如在查看长篇文档或大量数据报表时,通过眼动翻页和选择,可以快速定位到需要关注的页面和数据部分,提高工作效率。
在智能家居环境中,你只需看着智能电视,通过眼动翻页,就能快速浏览不同的节目菜单,而无需拿起遥控器。
在VR体验中,眼动翻页和眼动交互更是有着广阔的应用前景。游戏玩家用视线锁定敌人,赛车手通过眼神切换仪表信息……这些场景已进入实验室测试阶段。
去年,南京大学研究团队还研发出一种具有眼动追踪功能的隐形眼镜,外观和普通隐形眼镜无异,内部却“大有乾坤”,隐藏的射频芯片,可以高精度追踪眼球运动轨迹并识别眼动命令。
不过,尽管市场应用前景广阔,眼动技术目前还面临着一些挑战:比如精确度、芯片运算能力以及成本不菲等问题。其潜在的安全隐患和伦理问题也值得关注。
比如,强光、眼镜反光或剧烈晃动会导致眼动追踪失效。华为Pura X目前仅支持内屏竖屏使用,正是为了减少干扰。不同人的眼睑形状、瞳孔颜色差异较大,也需要大量数据训练模型。
眼球数据还可能泄露用户注意力偏好、情绪状态等信息,因此,如何确保眼动数据的安全,防止个人隐私泄露,如何在极端情况下保证系统的可靠性等,都是亟待解决的问题。
不过,从华为Pura X的惊艳亮相,到未来“眼控世界”的蓝图,眼动追踪技术,让我们瞥见了人机共生的无限可能。或许不久的将来,随着技术的进一步发展,我们只需一个眼神,便能连接万物。
来源:齐鲁壹点