10月24日,来自伦敦大学学院(UCL)的Maria Chait教授就人类听觉系统对统计规律的追踪进行了精彩报告。本期学术笔记根据Maria Chait教授题为“How brain discovers structure in unfolding sound sequences”的学术报告整理而成。

  听觉系统是一个早期预警系统(early warning system),它不断接受着各个方向的听觉信号,并且对环境进行着持续不断的监控,从而确保了动物与人类的安全,在进化中有着重要作用。听觉系统是怎样追踪外界信息的,是怎样检测出刺激中的规律性结构的?Maria Chait实验室结合行为,脑成像和建模等手段,对这一问题进行了大量研究。

  1.听觉系统对统计规律的敏感性

  环境中有很多有规律的,可预测的信息,人类的听觉系统对这些信息的统计规律有很高的灵敏性。并且,可预测的结构有利于我们更高效地加工信息,当环境中的信息违背了预期时,听觉系统能更快检测到。

  在一项研究中,给被试听一系列由50ms的短音组成序列,被试需要检测出其中一个频率偏移的音(deviant tone)。其中,序列有两种结构,一种是规则结构(图1左,序列中几个特定频率的音组成的周期不断重复),另一种是随机结构(图1右,不同频率的音随机组成)。当deviant tone出现在规则序列中时,检测出deviant tone会更加容易。这是因为在规律的结构中,人们会很快习得其中的统计规律,对接下来的刺激有预期,所以出现违背预期的刺激时,会更容易检测到,即使这些刺激是任务无关的,被试并没有给予主动注意。在规则序列中,大脑对deviant tone也会有更高的响应。

  

  图 1

  

  2.大脑对统计规律的追踪

  既然听觉系统对统计规律有很高的敏感性,那么大脑具体是怎样对统计规律进行追踪的?

  给被试听50ms的短音组成的序列。这些序列有两种结构,一种是RAND-REG(由随机变成规律),即开始出现的音的频率完全随机,从中间某个时刻开始,几个特定频率的音组成的周期开始不断重复。另一种是REG-RAND(由规律变成随机),和RAND-REG恰好相反。被试需要在听出转变后立刻按键(图2)。

  

  图 2

  

  需要多少信息听觉系统才能检测出统计规律的变化?理想观测者模型(Ideal observer model)的拟合结果显示,在RAND-REG条件中,在转变发生后,需要一个周期的长度+4个音出现后,模型才能检测到统计规律的变化(图3)。而对于人类被试来说,在REG的周期较短(10个音)时,表现和模型一致;但在REG周期较长(20个音)时,需要比模型更多的音出现才能检测到变化。这可能和人类记忆容量的有限性有关。

  

  图 3

  进一步让被试在接受声音刺激时完成一个视觉任务。MEG结果显示,在对声音刺激没有投入注意的状态下,大脑仍然能检测到统计规律的变化。在随机变成规律的情况下,刺激引发的RMS(一种反应不同电极之间激活程度的差异的指标)会增高(主要由DC成分导致),并且RMS发生变化的时刻和被试在行为上报告检测到变化的时刻以及理想观测者模型预测的时刻一致(图4)。溯源结果显示,对统计规律的检测主要和双侧听觉皮层,双侧海马以及右侧额下回(IFG)有关,和MMN(失匹配负波)涉及的大脑区域相似(图5)。

  

  图 4

  

  图 5

  

  进一步的,研究者发现这种RMS的增高反应了听觉刺激本身的可预测性而非复杂性。当刺激变得规则后,重复的周期长度不同时(REG5,REG10,REG15),虽复杂性不同,但都有相同的可预测性,因此RMS最终的幅度是一致的(图6A)。而当刺激为非规则时,可预测性会随着序列中不同频率音的数量的增加而下降,因此RMS最终的幅度也会下降(图6C)。

  

  图 6

  3.RMS变化与预测性编码(predictive coding)的联系

  在经典的预测性编码理论中,比起对不可预测刺激的响应,对可预测的刺激的响应更低,和上面发现的结果(RMS的变化)相反。如何理解这一矛盾呢?

  一种可能性是在上面的研究中,刺激呈现的速度较快,被试不能进行主动的预测性加工。而在经典的预测性编码研究中,刺激的呈现速度较慢,被试能进行主动的预测性加工。另一种可能是关注的大脑信号不同,上面的研究主要关注的是DC信号的改变,但之前的研究都进行了高通滤波,没有DC信号,因此观察到的结果不同。

  为了解决这个问题,研究者首先将刺激的速度放慢(在两个音之间插入了200ms的间隙),并且重复了上述研究。结果发现刺激呈现速度放慢后,结果依然没有发生变化,规律刺激(REG)引发的RMS大于随机刺激(RAND)。因此,这一矛盾不是由刺激呈现的速度引发的。紧接着,研究者将信号进行了高通滤波,并观察单个音引发的信号。结果发现,此时规律刺激(REG)引发的信号要低于随机刺激(RAND)引发的信号,和经典的预测性编码实验结果一致。研究者对此的解释是,大脑存在对统计规律的多重追踪。DC信号反应了对一种状态(state)的可预测性的追踪,而高通滤波后对单个音诱发的响应追踪了预测误差(prediction error)。这两种追踪系统可能对应不同的大脑区域。

  4.可预测性与注意

  可预测的刺激会吸引更多注意吗?研究者用行为和眼动手段探究了这一问题。

  首先,研究者在让被试完成一项非常困难的听觉检测任务时,给被试呈现无关的干扰刺激。结果发现,比起随机的干扰刺激,在有规律的干扰刺激下,被试在任务中的表现更好。这说明有预测性的听觉刺激更不会吸引注意。其次,在实验中记录了被试的瞳孔大小(pupil size)。瞳孔大小被认为和唤醒(arousal)有关。结果发现,规律的听觉刺激会降低瞳孔大小,代表着唤醒程度的下降。以上结果说明,可预测性不仅不会捕获注意,反而能为其他任务节省出注意资源。

  总结

  人类的听觉系统对环境中刺激的统计规律有很高的灵敏性,MEG和EEG信号,以及瞳孔大小能反应对统计规律的自动化追踪。在这一领域,以后有更多问题可待研究,如听觉系统是怎样追踪更长的信息的,听觉信息能在记忆系统中维持多久,对统计信息的追踪在不同模态之间有什么样的差异与联系等。

  参考文献

  Barascud, N., Pearce, M. T., Griffiths, T. D., Friston, K. J., & Chait, M. (2016). Brain responses in humans reveal ideal observer-like sensitivity to complex acoustic patterns. Proceedings of the National Academy of Sciences, 113(5), E616-E625.

  Southwell, R., & Chait, M. (2018). Enhanced deviant responses in patterned relative to random sound sequences. Cortex, 109, 92-103.

  Zhao, S., Chait, M., Dick, F., Dayan, P., Furukawa, S., & Liao, H. I. (2019). Pupil-linked phasic arousal evoked by violation but not emergence of regularity within rapid sound sequences. Nature Communications, 10(1), 4030.