科研进展
  • 科研进展
  • 人脑表征抽象词语组织维度研究

            抽象词汇,比如,“真理”、“正义”、“创新”、“规则“,没有具体外界指向物体或事件,是人类抽象思维的基础和体现。它们是如何被大脑所表征和加工的?人类大脑中抽象意义组织规律与人工智能领域自然语言处理中通过文本分析建构出来的语义网组织规律是否相似、有何异同?

            2017年11月,北京师范大学认知神经科学与学习国家重点实验室毕彦超课题组王晓莎博士和吴畏等同学,与中国科学技术大学大学语音及语言信息处理国家工程实验室(科大讯飞共建)凌震华等团队合作,在国际神经科学权威杂志《Cerebral Cortex》发表了题为“Organizational Principles of Abstract Words in the Human Brain”的研究论文, 结合认知行为研究、脑功能影像学、计算语言模型等多种手段,检验了抽象概念在人脑几个不同神经系统尺度中的组织规律,特别是对比了文本计算模型与神经活动模式的相关。发现人脑对于抽象词汇在不同神经尺度上存在多种组织维度—在语言脑区系统上遵循文本计算模式(如word2vec向量空间距离)规律;而在全脑尺度,即大尺度分布式表征模式上,遵循多维语义特征规律。

            认知心理学对抽象语义表征方式有两个角度的经典思路,一种是通过语言中词汇之间的关系模式进行表征,一种是通过多个维度的经验性特征进行表征(如情绪、社会、空间性等)。该研究针对360个抽象词汇,从这两个角度出发,构建了词与词之间“语言文本计算表征相似性”、“多维语义特征相似性”两种组织维度空间。对于语言信息,该研究借助人工智能领域自然语言处理中单词表征的经典算法(LSA和word2vec),从大规模文本语料库中提取词语与文档之间或者不同词语之间共同出现的统计规律,将词语语义进行向量化表征,进一步计算得出抽象词语两两之间在语言信息上的距离矩阵(图1左);对于经验信息,在十三个反映经验信息语义特征维度上收集了每个抽象词语在各个语义特征相关程度的评定,并基于此构建了抽象词语两两之间在经验信息上的距离矩阵(图1右)。以主观评定得到的抽象概念两两之间的距离为金标准分析发现,语言信息和经验信息得到的抽象概念语义距离之间存在一定程度的相关(图2a),且与主观评定的抽象概念距离之间均显著相关,提示语言信息和经验信息对于抽象概念的语义空间都有着独特的贡献。


    图1. 抽象概念语言信息和经验信息距离矩阵的MDS视觉化呈现
     
            为考察大脑是否有特定系统遵循哪种信息维度组织抽象概念,通过任务态功能磁共振(fMRI)实验,采集分析得到了受试者在加工这360个抽象词时候每个词语的全脑激活模式,在脑区局部水平、语言和语义系统水平和全脑水平等三个神经尺度上构建了抽象词语神经模式的距离矩阵。随后利用表征相似性分析比较神经激活模式矩阵、语言信息和经验信息矩阵,发现抽象概念的经验信息分布式表征在多个脑区及全脑模式上(图2b&d),而语言经验则与高级语言加工系统整体的激活模式显著相关(图2c)。
     

    图2. 语言信息和经验信息影响抽象概念加工的多尺度神经基础
     
            综上,该研究发现抽象语义信息的多层次、多维度人脑表征基础,也初步发现人工智能文本计算语义图谱与人脑语义系统子成分的对应关系。这项研究获得了国家重点基础研究项目、国家自然科学基金、中央高校基本科研专项资金等项目的资助。
     
    论文链接:
    Wang X#, Wu W#, Ling Z, Xu Y, Fang Y, Wang X, Binder JR, Men W, Gao JH, Bi Y*. Organizational Principles of Abstract Words in the Human Brain. Cerebral Cortex, 2017, in press. https://academic.oup.com/cercor/advance-article-abstract/doi/10.1093/cercor/bhx283/4653778?redirectedFrom=fulltext