Two black wireless earbuds, one of which is opened to reveal its internal green circuit board and electronic components, while the other earbud remains intact with visible charging contacts.
VueBuds有与米粒大小相同的微型相机 | 图片来源: Kim等人/CHI '26

科学家已将微型摄像头嵌入市售无线耳塞中,可拍摄低分辨率图像,使用户能够与人工智能系统交流,描述其前方的景象。

华盛顿大学的研究人员开发了他们所描述的第一个将小型相机放入现成的耳塞的系统。其理念是为用户提供一种与人工智能模型交互的方式,使其能够感知并理解眼前的现实世界,这与智能眼镜的定位如出一辙。例如,有人可以将他们的头指向韩国食品包装并说,“嘿,Vue,帮我翻译一下”,系统会做出类似的回应,“可见的文本翻译成英语的 '冷面'。

名为VueBuds的原型使用内置在耳塞中的微型低功耗摄像头拍摄低分辨率黑白图像。这些图像通过蓝牙传输至附近的手机或设备,由一个小型人工智能模型进行处理,并在约一秒钟内对问题作出响应。

所有处理均在设备本地完成,研究人员表示,这有助于保护用户隐私。拍摄照片时,指示灯也会亮起;用户如需删除,可立即进行操作。

该系统完全避免了视频流传输。这在一定程度上是因为蓝牙无法承载持续的海量数据传输,另一方面也是因为更高画质的摄像头会消耗过多电量。相反,它依赖于偶尔的静态图像,在保持系统可用性的同时降低了能耗。

米粒大小的相机

相机本身极其小巧,大约只有一粒大米那么大。其中一项主要挑战是确定其安装位置,以便它能够真正“看到”用户所见的画面。

“我们当时有一个很大的疑问:你的脸会不会把视线遮挡得太多?”耳塞摄像头能可靠地捕捉用户对世界的看法吗?“主要作者Maruchi Kim在一份声明中说,他是Paul G. Allen计算机科学与工程学院的博士生。

研究团队发现,将相机向外倾斜约5至10度,可获得约98至108度的宽视角。当物体距离眼睛非常近,大约7.8英寸时,视野中会出现一个小小的盲区,但研究人员表示,在日常使用中这种情况很少会成为问题。

由于该系统仅采集灰度图像,尚无法回答依赖于颜色的问题。研究人员表示,未来版本有望集成彩色摄像头或更专业的AI模型,但这将导致功耗进一步上升。

“这项研究让我们得以一窥,仅凭通用语言模型和我们配备摄像头的无线耳塞便能实现的可能性,”金解释道。“但我们希望更严格地研究这个系统,比如阅读一本书 -- 比如为视力低下或失明的人 -- 或者为旅行者翻译文本。”

研究人员表示,部分原因在于智能眼镜和VR头显并未在大众中真正普及。他们认为,耳机可能是一种更实用的切入点,因为人们早已习惯佩戴耳机,而且它们也更加隐蔽。

“我们尚未看到大多数人采用智能眼镜或VR头显,部分原因在于许多人不喜欢戴眼镜,而且这些设备往往引发隐私方面的担忧,例如拍摄高分辨率视频并在云端进行处理,”资深作者夏亚姆·戈拉科塔解释道。“但几乎每个人都已经佩戴了耳塞,所以我们想看看是否可以将视觉智能放入微小的低功耗耳塞中,并在此过程中解决隐私问题。

有报道称,苹果正准备推出配备摄像头的AirPods,作为该公司更广泛的人工智能技术和设备野心的一部分。与Meta智能眼镜等配备摄像头的可穿戴设备不同,这些搭载摄像头的AirPods根本不是用来真正拍摄照片或视频的。相反,摄像头可以捕捉用户周围环境的低分辨率图像,从而为情境感知型人工智能提供支持。

关于VueBuds的完整论文可以在这里阅读。