中心研究人员在《心理学报》发文揭示人工智能语言优势和不足

发布者:管理员发布时间:2025-02-25浏览次数:17

近日,中心高承海教授和党宝宝副教授在国内心理学高水平刊物《心理学报》上发表了题为“人工智能的语言优势和不足:基于大语言模型与真实学生语文能力的比较”的文章,从大语言模型与真实人类比较的视角,揭示了人工智能的语言优势和不足。



人工智能技术迅猛发展,新的算法模型不断涌现,尤其以GPT等大语言模型为代表的生成式人工智能横空出世,从根本上改变了人机交互和知识生产的方式,为人类社会发展和教育教学活动带来了革命性的机遇。高承海课题组采用混合研究方法的解释性序列设计,聚焦大语言模型语言处理本身,提出了大语言模型语言能力的评价指标体系;通过比较大语言模型与真实学生语文能力的异同,揭示了大语言模型语言能力的优势和不足;并通过国外大语言模型GPT和国产大语言模型ERNIE在语文能力上的不同表现,验证了大语言模型的文化适应性和文化偏差问题。

研究1结果发现,相对于真实学生,GPT-4现代文知识的准确性较高,但其古代诗文和语言文字运用的准确性较低;GPT-4规范性得分与真实学生相当,情感性和创造性超过及格水平、但低于真实学生,且前者最优个体的规范性、情感性得分与真实学生最高分持平。研究2基于文心ERNIE-4重复验证了上述结果, 但发现ERNIE-4的规范性得分高于真实学生。研究结果对于人工智能自身发展和人工智能辅助教学有重要启示。具体而言,我们一方面要重视和利用人工智能在知识、规范上已经取得的算法优势, 并不断提升情感、创造等领域的人性化、个性化生成能力;另一方面要正视人工智能对人类社会的颠覆性影响, 反思和培养人类在情感、创造上的独特优势。同时,未来的人工智能技术、特别是国产语言大模型应加强对中文语料库的训练, 提高其在中文语境下的语言能力和文化话语权;在利用GPT等西方人工智能体辅助语文教学过程中,应当加强人机合作,引入现代汉语的智能辅助教学系统,并充分发挥人类在古代汉语及情感性、创造性表达上的优势。

该文以西北师范大学为第一署名单位,西北师范大学西北少数民族教育发展研究中心高承海教授和党宝宝副教授为论文共同第一作者,厦门大学吴胜涛副教授为论文通讯作者。研究得到国家社会科学基金项目(22BSH094)的资助。

论文信息:高承海, 党宝宝, 王冰洁, 吴胜涛. (2025). 人工智能的语言优势和不足:基于大语言模型与真实学生语文能力的比较.心理学报.

链接本文: https://journal.psych.ac.cn/xlxb/CN/10.3724/SP.J.1041.2025.002