人们曾认为,光线投射到了人的视网膜上,我们就看见了东西。但科学家却发现,视网膜处理的信息量比我们想象的要大得多,处理过程也要复杂得多,因为这些信息不是静态的图片,而是一部部连续播放的“电影”。
人类有着非同一般的视觉能力,但我们对此早已习以为常,很少会有人会想一想:我们究竟是怎样看见东西的?几十年来,科学家们习惯于把我们的视觉处理系统比作“摄像机”:眼睛的晶状体把入射光聚焦在视网膜上的一组光感受器上,在这里将光子转化为电信号,然后沿着视神经输送到大脑,在那里接受处理和加工。
但在最近的研究中,我们发现这样的比喻还不贴切。实际上,视网膜会对视觉信息做大量预处理工作,而后才把一系列尚未完成的影像传输给大脑,以解读这些视觉信息的内容。
在视网膜深处有一群特殊的神经细胞,它们会将一个视觉画面,分割成12条类似于影轨(movietrack)的东西,每条影轨都收录了一幅粗略的影像,描绘外界景观的某一个抽象特征。视网膜会不断更新这些影像,并源源不断地传送给大脑。例如,一条影轨的内容,是一幅勾勒物体轮廓的“素描画”,另一条影轨携带的信息,则与物体的运动方向有关,还有的影轨负责收集光线、阴影等信息,有些影轨传输的信息目前难以归类。
视觉细胞的“交流与合作”
视网膜的结构不仅复杂且极精细,其中包含了多种视觉细胞,正是这些细胞间的“交流与合作”,我们才能看见精彩的世界。
视网膜复杂的结构成就了它的惊人能力。早在一个世纪前,西班牙解剖学家桑迪亚哥·拉蒙·y·卡哈尔首次提出了视网膜通路的经典模型。此后,这一模型不仅被各种教科书反复引用,许多科学家还通过艰辛试验,不断为它补充生理学细节。视网膜是透明的,由一层层神经元构成。离晶状体最远的一层是视锥和视杆细胞,它们吸收入射光线,将光线转换为神经细胞的活动。与视锥和视杆细胞相连的,是10种不同的神经细胞——双极细胞,这些神经细胞有一条专门传输信号的“手臂”(轴突),能伸进中央的“内网状层”。网状层看上去又分成了相互平行的10层。每种双极细胞的轴突只向其中的少数几层传输信号。
在网状层的最内侧,有12种不同的神经节细胞。大多数种类的神经节细胞的“手指”(树突)会伸进不同细胞层,在那里接收来自双极细胞的兴奋性信号。神经节细胞输出的影像,由视神经传送到大脑不同区域进行分析。有些神经节树突的分支会广泛延伸,到处散播信息,还有些分支只会在小范围内延伸,传送高分辨率的信息;有些会对双极细胞释放神经递质(信号分子)的频率增高做出反应,而有些则会对这一频率的降低做出反应。
不过,双极细胞传送给每一层神经节细胞的信息,都不足以拼凑成12幅影像。这些信号受到多种小型神经细胞——无长突细胞的调控。一些无长突细胞在一个细胞层内起横向作用,阻止该层中相隔较远的双极细胞进行信息交流。另一些无长突细胞在细胞层之间,纵向抑制信息交流,这样就避免了不同影像的相互干扰,使每一层细胞专注于自己的任务,以免发生交叉记录信息的情况。
我们看到的每一样东西,都随着时间推移而被视觉系统记录下来。即使是三维空间里的一个静止不动的黑点,也会在我们的视网膜里形成一部“电影”,因为视网膜在连续地观察这个黑点。但和电影院里的不同,神经节细胞里的影像不是一帧一帧地拍出来的,而是连续的信号流。
当我们阅读、找东西、辨认面孔和四处走动时,不同的影像组合是大脑惟一能获得的视觉信息。它们形成了基本的“视觉语言”。
一束光线引发的反应
神经节细胞传输给视神经的影像是什么样子的?为了有一个直观的感受,我们先从简单的试验开始:首先,当一束方形光线射到兔子的视网膜上时,线性排列的神经节细胞有什么样的反应?这是一束边长为600微米的正方形光线,落在了视网膜上一个的特定区域,持续照射了几秒钟的时间。
在这段时间里,我们依次记录了12种神经节细胞接收到的兴奋性和抑制性信号。每一种细胞都有独特反应模式,反应强度也各不相同。有趣的是,虽然被光线照到的细胞都有反应,但其活动并没有贯穿整个光照过程。而当光照结束后,照射区域之外的一些细胞开始活跃起来。
我们该怎样解释这个现象?如果在整整一秒内,所有细胞都输出信号,那整个过程都该显示出活跃的图形,而实际上,信号输出被过滤了;光线照射到的区域都发生了反应,但在时间上却很短,大约只持续了1/10秒,且是在光照开始后的1/10才开始起反应。
12种神经节细胞中的每一种,都会输出一个独特信号,反映视觉世界的一个方面。不过在这个输出信号中,既有来自于双极细胞的兴奋性信号,也夹杂着无长突细胞的抑制性信号。两种信号相互综合、抵消后,才能形成最终的输出信号。
就这样,每种神经节细胞都会沿着视神经,给大脑发送一幅时空影像,每一幅影像都是一对兴奋性和抑制性信号相互综合的独特产物。12种神经节细胞会随着时间推移,连续为大脑发送12幅这样的影像。一束简单的方形光线,就这样引发了不可思议的复杂反应。
眼睛的“滤镜”
我们很想知道,当一个场景跃入眼帘时,比如看到一个正在说话的人,视网膜会作何反应?那12幅影像分别会是什么样的?是不是每一幅影像都只提取特定信息,彼此功能互不重叠呢?
在随后的工作中,我们把来自光束实验的数据输入到一台计算机中,模拟著名的人工视网膜芯片——“细胞神经网络”,这是由美国加利福尼亚大学伯克利分校的蔡少堂和布达佩斯匈牙利国家科学院的塔马斯·罗斯卡研制出来的。在计算机系统中,方形光束被转化为12幅由兴奋性和抑制性信号构成的时空图片,和真正视网膜中所产生的影像十分相似。
我们让受试者坐在相机前说一分钟的话,再把此场景输给编好程序的视网膜芯片,随即产生了7种神经节细胞的影像数据。为了证明芯片的模拟是准确的,我们还让活兔子看一张说话人的脸孔,检测视网膜上一些神经元的反应。我们很快发现,每种神经节细胞都像是一个“滤镜”,从外界场景中提取一个特定的时空图像,并将这些信息编排成独特电影传送给大脑。
实验证明,每种神经节细胞都对一个特定面部特征和动作非常敏感,都能用独特方式解读这个世界。人们能看到这个精彩的世界,12种神经节细胞居功至伟。但是,每一种细胞到底做了哪些贡献呢?在受试者说话时,不同时刻的4帧画面再现了当时的情景:嘴唇如何一张一合,脸的朝向怎样变化等。有些图像时隐时现,让他看起来有些像幽灵。这就是视网膜产生的、大脑所接收的图像。
我们的“电影”只能大致模拟视网膜产生的图像。不过,这些“电影”让我们知道,在人类眼球的后面,那层薄得像纸一样的神经组织,在传出信号前,已把外界景观分解成12个不同的组别了。这些组别相互独立,被完整地传送到不同的大脑视觉区域,一些区域会产生知觉,一些则不会。神经科学面临的挑战,就是了解大脑怎样解读这些信息,如何产生美妙、流畅、完整的视觉图像,以再现视觉世界。(周林文)
来源:青年参考