决策是一个相对复杂的高级认知过程,同时也是心理学、认知神经科学、精神医学和经济学等多个学科领域的研究热点,而在各种不同的决策中,关于风险决策的研究一直是学者们关注的重点。目前很多研究采用赌博任务来研究风险决策(risky decision-making),而爱荷华赌博任务(Iowa gambling task,IGT)则是最常用的任务之一。IGT是BECHARA等[1]为研究腹内侧前额叶皮质受损的决策障碍患者所开发的,之后的研究也表明,IGT对决策功能的评估在不同的临床人群中显示出良好的效度[2-3]。IGT包含100个试次,参与者被要求1次从4组卡牌中选择1张。这4组卡牌代表不同数量和概率的货币损失和收益。其中2组卡牌虽然提供了较高的即时收益,但是长期看来是损失的(即“坏牌”),而另外2组卡牌虽然提供了较低的即时收益,但是长期看来是获益的(即“好牌”)。由于对每组卡牌相关的输赢概率缺乏了解,参与者必须通过从每次选取卡牌后立即收到的结果反馈中学习,来调整他们的选择[4]。收益和损失后的反馈信息可以导致大脑产生不同的反应,这些反应可以通过对大脑电活动的研究来检测。因此,对利用ERP的研究成为了解该选择决策的神经过程的一个重要途径,也为决策能力的评价和训练效果的评估提供了神经生理学指标。
目前关于IGT的ERP研究主要集中在对反馈信号的研究即反馈负波(feedback related negativity, FRN)上[5]。FRN主要产生于额叶和中央区域,其峰值潜伏期约为250~350 ms。有研究发现,损失引起的FRN振幅大于收益引起的FRN振幅[6]。此外也有研究发现了一个主要产生于Fz和Cz电极位置,峰值潜伏期在80 ms的负波[7],其被称为错误负波(error-related negativity, ERN)或早期负波(early negative wave,ENW),似乎反映了错误检测系统的活动[8-10]。研究者们认为,ERN和FRN成分都依赖相同的潜在认知和神经过程,主要反映了反馈结果的早期处理[11-12]。
反馈相关电位的第二个组成部分是在额叶电极位置上的180~280 ms处达到其峰值电位的正波,即P200成分。在一些研究中,P200成分被解释为反馈信号早期处理的指标,其可能代表了几个刺激参数(可预测性、效价、显著性)的早期处理,这些参数可能与决策过程和随后的选择相关[13]。一些学者认为在决策任务中P200似乎也可以共享FRN的一些特征[14]。除此之外,CUI等[6]发现了P300成分——一个主要产生于顶叶和额叶,峰值潜伏期在反馈开始后的350ms左右的正波,该成分似乎对消极结果比对积极结果更加敏感,其振幅可以随着损失金额的增加而增加。
研究认为,P300以及晚期ERP成分(long-latency potentials, LP)等潜伏期长的ERP成分,可能反映了大脑对动机相关的刺激加工的资源分配[14],对后续行为的选择产生重要的作用。POLEZZI等人[15]对赌博任务中500 ms以上的ERP成分进行研究,发现N500在结果不可预测或者结果为损失时产生更高的电位。同时,GOYER等[16]对400~600 ms的ERP成分进行研究发现,该后期成分在结果反馈为损失的情况下产生了比结果为收益时更高的负波。该研究认为,这一后期成分可以代表对结果的情感评价,并对任务接下来的选择产生影响。
本研究通过对不同决策能力的个体在IGT任务中的行为表现以及任务中反馈信号所产生的5种ERP成分进行分析,进一步了解IGT任务中决策行为的神经活动过程,为决策能力的训练提供指导,并为其训练效果提供更好的评估指标。
1 对象与方法 1.1 研究对象在某军校招募20名男性学员,年龄为19~28岁,平均年龄(21.89±2.38)岁。所有参与者均为右利手,视力正常或矫正视力≥1.0,无任何神经或精神疾病史,无药物滥用史。要求所有被试在实验前不得熬夜,不得摄入咖啡、酒精、茶等兴奋性饮品及食物。所有被试自愿参加实验,并填写书面知情同意书,实验结束后向其支付一定酬劳。并经西京医院伦理审查委员会批准。
1.2 研究流程实验全程在安静、昏暗的电磁屏蔽房里进行。被试进入房间后,告知研究的具体流程以及IGT任务的执行规则,并先进行20试次的练习,然后在记录脑电信号的同时,完成IGT任务。整个实验持续大约40 min。
1.3 任务范式爱荷华赌博任务:本研究采用BECHARA等[17]开发的计算机实验程序,将指导语翻译成中文。采用E-Prime3.0对IGT任务进行编程,以用于ERP的记录。具体程序如下:在屏幕中呈现1 000 ms的注视点“+”,然后在屏幕中部呈现标记为A,B,C,D的4组卡牌。卡牌以背面呈现给被试者,要求被试者根据自己的判断每次从4组牌中任意选择某组牌中的1张牌,用鼠标点击这幅牌后,在接下来的2 000 ms内,被试接受反馈刺激。计算机会反馈给被试者本次选择的输赢,输钱用红色方框表示,赢钱用绿色方框表示。同时展示本次选择的赢钱数和输钱数,输的钱数用红色数字表示,赢的钱数用绿色数字表示。屏幕上方呈现每次选择后的收益余额血条。被试者一开始会得到2 000元的启动资金。选择每组牌后赢钱或输钱的概率如下:卡牌A每次赢得100元,连续10张牌中有5张牌会扣除150~350元不等,若连续选择10次,净损失250元;卡牌B每次赢得100元,连续10张牌中有1张牌会扣除1 250元,若连续选择10次,净损失250元;卡牌C每次赢得50元,连续10张牌中有5张牌会扣除25~75元不等,若连续选择10次,净收益250元;卡牌D每次赢得50元,连续10张牌中有1张牌会扣除250元不等,若连续选择10次,净收益250元。如上所述,长远来看A、B组牌是“坏牌”,而C、D组牌是“好牌”。
任务总共包括100次选择,要求被试通过选牌来尽可能地获得最大收益,按照选择的先后顺序,可以将整个试验划分为5个模块(block),每阶段20次选择。IGT的数据分析主要使用净分数(net score),是指被试在每个模块中选择的“好牌”的次数减去所选择的“坏牌”的次数,即[(牌C+牌D)-(牌A+牌B)]。比较净分数在不同模块中的变化趋势,可以分析出被试者在收益-损失情境下的决策特点及决策策略调整情况[18]。具体任务流程如图 1所示。
![]() |
图 1 IGT任务流程图 |
1.4 脑电信号采集
使用德国BP公司生产的32导脑电设备采集脑电信号,采用国际通用的10-10电极导联定位系统进行定位,参考电极为TP9/TP10,GND接地。脑电采集频率为1 000 Hz,所有通道的电阻控制在5 kΩ以下。
1.5 数据分析处理 1.5.1 行为学数据为了分析任务表现,我们分别计算了5个模块中20个试次的“好牌”和“坏牌”的选择次数以及净分数,并进行以模块作为被试内变量的单因素方差分析。以IGT任务的总净分数为行为学指标,以中位数为分界线,高于中位数的被试被分入高决策能力组,低于中位数的被试被分入低决策能力。
1.5.2 脑电数据处理使用EEGLAB和自定义Matlab脚本对脑电数据进行预处理。为了平衡两种情况(“赢”和“输”)下的试验数量,只选择具有这两种情况的试次进行分析。以反馈信号(绿色vs红色)作为反馈开始,开始前200 ms作为基线,分段为-200~800 ms。使用FIR滤波器将连续EEG数据在0.1~40 Hz之间进行带通滤波,并进行48~52 Hz的凹陷滤波,采样率为1 000 Hz,参考电极为TP9/TP10。手动识别并删除EEG中噪声过大的试次。对于剩余的脑电图试次,应用独立成分分析(independent component analysis,ICA)来去除由于眼球运动和眨眼引起的伪影。最后去除超过±100μV的极端值。
为确定感兴趣的ERP成分,将每个被试每个试次的结果(赢vs输)区分开,并分别对两个结果的ERP数据进行叠加平均。对Fz、Cz、Pz和Oz通道的ERP波形图观察得出以下感兴趣的ERP成分:①80~180 ms:早期负波ENW;②180~280 ms:P200成分;③280~360 ms:负反馈负波FRN; ④360~480 ms:P300成分;⑤480~800 ms:对于晚于480 ms的时间窗内未发现可以明显识别的成分,所以选择480~800 ms的时间窗为晚期电位成分LP。超过800 ms,没有任何成分。
此外,虽然280~360 ms时间窗内的负波被认为是FRN成分,但是由于前人研究发现FRN振幅受P200影响,所以采用Hajcak等人的提议,将P200的振幅均值与280~360 ms的振幅均值的差值作为FRN的振幅均值。
1.6 统计学分析采用2(分组:高决策能力vs低决策能力) * 2(结果:赢vs输)的两因素方差分析,分别计算Fz、Cz、Pz和Oz通道的ERP各成分的平均振幅与行为表现和输赢反馈之间的关系。所有统计分析均采用软件SPSS 22.0进行,使用LSD校正对两两比较结果进行事后校正,显著水平为P < 0.05。
2 结果 2.1 IGT任务绩效对IGT任务的行为学绩效进行分析显示,随着任务进展,被试的任务表现(净分数)不断提升,即被试更多地选择了“好牌”。对净分数的单因素方差分析结果显示:模块主效应显著[F(4, 95)=2.728, P=0.034, η2=254.260]。事后检验显示任务绩效在模块5和模块1(P=0.005)、模块2(P =0.006)、模块3(P=0.026)以及模块4(P=0.049)之间,均差异存在统计学意义(图 2)。
![]() |
图 2 参与者在IGT任务5个模块的表现 |
2.2 IGT任务的脑电ERP结果
随着时间进程,绘制各ERP成分的地形图显示,ENW与P200主要集中于额叶,FRN与P300成分主要集中在额中线和中央区域,LP成分主要集中于顶叶区域(图 3)。分别提取Fz,Cz,Pz和Oz通道的各ERP成分在“赢”和“输”结果反馈下的平均振幅(表 1),对两种结果进行配对t检验,结果均不显著(P>0.05)。
![]() |
图 3 Fz、Cz、Pz和Oz通道的ERP波形图(A)和各ERP成分在“赢”“输”结果反馈下的地形图(B) |
ERP成分 | 收益 | 通道 | |||
Fz | Cz | Pz | Oz | ||
ENW(80~180 ms) | 赢 | 0.47 ± 1.09 | 0.18 ± 1.76 | -1.92±1.92 | -1.46±1.10 |
输 | 0.43±1.75 | 0.05±2.34 | -1.95±2.29 | -1.24±1.39 | |
P200(180~280 ms) | 赢 | 4.67±4.19 | 4.27±3.55 | 0.77±2.62 | -1.26±1.66 |
输 | 4.80±3.75 | 4.39±3.62 | 0.95±2.95 | -1.08±2.01 | |
FRN(280~360 ms) | 赢 | 6.82±5.52 | 7.20±4.88 | 4.46±3.16 | 1.16±1.53 |
输 | 6.23±5.44 | 6.69±5.22 | 4.07±3.84 | 1.00±1.99 | |
P300(360~480 ms) | 赢 | 6.73±4.86 | 8.01±4.69 | 6.29±3.15 | 1.91±1.53 |
输 | 6.74±5.15 | 7.93±5.23 | 6.53±4.29 | 2.29±2.21 | |
LP(480~800 ms) | 赢 | 3.41±3.43 | 5.45±3.34 | 4.82±2.48 | 1.65±1.47 |
输 | 4.49±4.02 | 6.35±3.91 | 5.63±3.32 | 2.55±2.33 |
2.3 ERP振幅与IGT任务表现之间的关系
对高、低决策能力的两组被试在“赢”和“输”两种结果下,Fz,Cz,Pz和Oz通道的各ERP成分进行比较,结果显示:①早期负波(ENW):在Oz通道,分组主效应显著[F(1, 18) =9.357, P=0.007, η2=0.342],结果主效应不显著[F(1, 18)=0.668, P=0.424, η2=0.036],交互作用不显著[F(1, 18)=1.240, P=0.280, η2=0.064]。②P200:在Oz通道,分组主效应显著[F(1, 18)=6.923, P=0.017, η2=0.278],结果主效应不显著[F(1, 18) =0.257, P=0.618, η2=0.014],交互作用不显著[F(1, 18) =0.019, P=0.892, η2=0.001]。③反馈负波(FRN):分组主效应边缘显著[F(1, 18)=3.241, P=0.089, η2=0.153],结果主效应不显著[F(1, 18) =0.150, P=0.704, η2=0.008],交互作用不显著[F(1, 18)=0.029, P=0.866, η2=0.002]。其余通道均不显著。
P300与LP成分在各通道均不显著。
3 讨论本研究对IGT任务的行为学绩效进行分析,并分析了在80~800 ms的时间窗内,由结果反馈引起的ERP成分以及各ERP成分与任务表现之间的关系。鉴于以往的文献,在额中央和顶叶区域发现了最相关的结果,本研究主要讨论在Fz、Cz、Pz和Oz电极上获得的结果。
3.1 IGT任务行为学绩效随着任务进程不断提升,出现学习效应本研究将爱荷华赌博任务100次选择分成5个区组,对被试在每个区组的决策成绩进行分析,进一步了解被试的决策过程。结果表明,被试在任务开始时倾向选择更多的不利卡牌,而随着决策任务的进行,被试逐渐倾向选择较多的有利卡牌。这表明被试刚开始时在4种卡牌中进行尝试,随机从4种卡牌中进行选择。被试在经过多次尝试并接受了大量不利卡牌的惩罚后,倾向于从有利卡牌中进行选择,学习效应显著增强,决策成绩逐步提升,此结果与其他研究结果一致[19-20]。研究表明,多数被试在决策任务中从第40或50次开始倾向于选择更多的有利卡牌。
3.2 相较于低决策能力的个体,高决策能力的个体产生更加活跃的早期ERP成分对ERP成分进行波形图和地形图的可视化分析可以看出,IGT任务期间对结果反馈信号的处理开始于ENW。ENW与P200主要集中于额叶,FRN与P300成分主要在集中在额中线和中央区域,LP成分主要集中于顶叶区域。在Oz通道上,高决策能力的个体不论在赢钱还是输钱的反馈下都产生比低决策能力的个体更高的ENW、P200和FRN振幅。该结果证明相较于低决策能力的个体,高决策能力个体的大脑对反馈信号的早期反应更加活跃。这种早期的大脑反应可能并不是对结果的处理,而是代表了对反馈的一种评估过程[21]。本研究显示,该早期ERP成分主要集中在额叶和中央区域,在不区分“赢”和“输”的情况下对选择的结果进行初步评估[22]。该结果也为决策能力训练的评估提供了神经生理学的指标。另外,本研究提示,对于决策相关脑区的研究除了额叶以外,其他脑区如顶叶(Oz)区域,在决策能力的提升中也可能产生重要的影响,为决策能力的干预提供了新的靶点。
3.3 任务情境与被试动机影响IGT任务的表现与既往研究结果不一致的是,本研究发现在“赢”和“输”两种结果反馈下,各ERP振幅均无显著性的不同,并且P300和LP振幅在高决策能力组和低决策能力组之间无显著差异。对此结果提出2种猜想:(1)相对于前人研究,本实验采用的任务范式在不同结果的反馈信号的处理上,仅仅采用绿色和红色的字体和方框进行区分,对被试在视觉上产生的差异过小[23]。有研究发现,决策行为的早期信号的产生与情绪高度相关[24],而不同信号之间差异过小可能导致被试对“输”“赢”两种结果所产生的情绪差异过低,从而导致两种结果激活的早期电信号之间差异过小;(2)结合P300和LP成分在高低决策能力组间无差异的结果进行分析,并且根据前人研究报告,P300以及LP等后期成分,其振幅可能与任务动机高度相关[25-26]。本研究猜测,该结果不显著可能与被试在任务过程中积极性不高有关。虽然会支付被试金钱报酬,但是针对任务绩效的高低以及完成任务的认真程度却没有相应的评估。可能导致部分被试对于任务过程中的结果反馈没有积极响应,对结果反馈的分析不认真、不充分,因此导致两种结果反馈信号之间产生的差异过低。该结果提示,在进行决策训练时,应采取各种方法(如视觉、听觉双通道训练)让被试更好地进入情境,同时采用按照成绩排名给予相应的金钱奖励的方式,提高被试的动机,从而提高训练的效果。
综上所述,通过对爱荷华赌博任务的行为表现和ERP成分研究,证明了军校学员在决策过程中可以根据选择结果不断进行学习和调整,并发现大脑对于结果反馈信号的早期处理是区分高低决策能力的重要因素。该结果为更有效的决策能力训练提供了指导,并为训练结果提供了神经生理学的评估指标。
[1] |
BECHARA A, DAMASIO A R, DAMASIO H, et al. Insensitivity to future consequences following damage to human prefrontal cortex[J]. Cognition, 1994, 50(1/2/3): 7-15. |
[2] |
TOPLAK M E, SORGE G B, BENOIT A, et al. Decision-making and cognitive abilities: a review of associations between Iowa Gambling Task performance, executive functions, and intelligence[J]. Clin Psychol Rev, 2010, 30(5): 562-581. |
[3] |
WALTEROS C, SÁNCHEZ-NAVARRO J P, MUÑOZ M A, et al. Altered associative learning and emotional decision making in fibromyalgia[J]. J Psychosom Res, 2011, 70(3): 294-301. |
[4] |
PORTH E, MATTES A, STAHL J. The influence of error detection and error significance on neural and behavioral correlates of error processing in a complex choice task[J]. Cogn Affect Behav Neurosci, 2022, 22(6): 1231-1249. |
[5] |
BIANCHIN M, ANGRILLI A. Decision preceding negativity in the Iowa gambling task: an ERP study[J]. Brain Cogn, 2011, 75(3): 273-280. |
[6] |
CUI J F, CHEN Y H, WANG Y, et al. Neural correlates of uncertain decision making: ERP evidence from the Iowa Gambling Task[J]. Front Hum Neurosci, 2013, 7: 776. |
[7] |
ARBEL Y, DONCHIN E. How large the sin? A study of the event related potentials elicited by errors of varying magnitude[J]. Psychophysiology, 2011, 48(12): 1611-1620. |
[8] |
MARTIN E A, MCCLEERY A, MOORE M M, et al. ERP indices of performance monitoring and feedback processing in psychosis: a meta-analysis[J]. Int J Psychophysiol, 2018, 132(Pt B): 365-378. |
[9] |
DE BRUIJN E R A, JANSEN M, OVERGAAUW S. Enhanced error-related brain activations for mistakes that harm others: ERP evidence from a novel social performance-monitoring paradigm[J]. NeuroImage, 2020, 204: 116238. |
[10] |
SAILER U, FISCHMEISTER F P S, BAUER H. Effects of learning on feedback-related brain potentials in a decision-making task[J]. Brain Res, 2010, 1342: 85-93. |
[11] |
PFABIGAN D M, ALEXOPOULOS J, BAUER H, et al. Manipulation of feedback expectancy and valence induces negative and positive reward prediction error signals manifest in event-related brain potentials[J]. Psychophysiology, 2011, 48(5): 656-664. |
[12] |
SCHUERMANN B, ENDRASS T, KATHMANN N. Neural correlates of feedback processing in decision-making under risk[J]. Front Hum Neurosci, 2012, 6: 204. |
[13] |
SAN MARTÍN R, MANES F, HURTADO E, et al. Size and probability of rewards modulate the feedback error-related negativity associated with wins but not losses in a monetarily rewarded gambling task[J]. NeuroImage, 2010, 51(3): 1194-1204. |
[14] |
POLEZZI D, LOTTO L, DAUM I, et al. Predicting outcomes of decisions in the brain[J]. Behav Brain Res, 2008, 187(1): 116-122. |
[15] |
POLEZZI D, SARTORI G, RUMIATI R, et al. Brain correlates of risky decision-making[J]. NeuroImage, 2010, 49(2): 1886-1894. |
[16] |
GOYER J P, WOLDORFF M G, HUETTEL S A. Rapid electrophysiological brain responses are influenced by both valence and magnitude of monetary rewards[J]. J Cogn Neurosci, 2008, 20(11): 2058-2069. |
[17] |
BECHARA A, DAMASIO H, TRANEL D, et al. The Iowa Gambling Task and the somatic marker hypothesis: some questions and answers[J]. Trends Cogn Sci, 2005, 9(4): 159-162. |
[18] |
冯田, 霍倩倩, 肖玮. 最优化与满意型决策风格对爱荷华赌博任务的影响[J]. 职业与健康, 2015, 31(15): 2068-2072. FENG T, HUO Q Q, XIAO W. Effect of optimal and satisfied decision-making styles on Iowa gambling task[J]. Occup Health, 2015, 31(15): 2068-2072. |
[19] |
NAKAO, YAMANOUCHI J, TAKENAKA K, et al. The Iowa gambling task on HIV-infected subjects[J]. J Infect Chemother, 2020, 26(3): 240-244. |
[20] |
GLICKSOHN J, ZILBERMAN N. Gambling on individual differences in decision making[J]. Pers Individ Differ, 2010, 48(5): 557-562. |
[21] |
ROGER C, BÉNAR C G, VIDAL F, et al. Rostral Cingulate Zone and correct response monitoring: ICA and source localization evidences for the unicity of correct- and error-negativities[J]. Neuroimage, 2010, 51(1): 391-403. |
[22] |
FRANK M J, WOROCH B S, CURRAN T. Error-related negativity predicts reinforcement learning and conflict biases[J]. Neuron, 2005, 47(4): 495-501. |
[23] |
MARTÍNEZ-SELVA J M, MUÑOZ M A, SÁNCHEZ-NAVARRO J P, et al. Time course of the neural activity related to behavioral decision-making as revealed by event-related potentials[J]. Front Behav Neurosci, 2019, 13: 191. |
[24] |
陈璟, 姜金栋, 汪为, 等. 决策中情绪作用机制的理论研究述评[J]. 心理科学, 2014, 37(6): 1346-1353. CHEN J, JIANG J D, WANG W, et al. The mechanism of emotion in decision making: a critical review of theoretical researches[J]. J Psychol Sci, 2014, 37(6): 1346-1353. |
[25] |
FERRY R A, NELSON B D. Tactile P300 to unpredictable electric shocks: association with anxiety symptoms, intolerance of uncertainty, and neuroticism[J]. Biol Psychol, 2021, 162: 108094. |
[26] |
雷黎慧, 王萍. 成就动机与框架效应双重影响下大学生创业风险决策研究[J]. 经营与管理, 2017(4): 152-154. LEI L H, WANG P. Research on college students' venture decision-making under the dual influence of achievement motivation and frame effect[J]. Manag Adm, 2017(4): 152-154. |