《科学报告》14日发表的一项人工智能(AI)研究指出,大型语言模型(LLM)AI机器人在创造性思维任务上或能超越一般人类,该任务要求受试者想出日常用品的替代用途(发散性思维的一个例子)。不过,得分最高的人类受试者依然能超过机器人的最佳答案。
发散性思维通常是指与创造性相关的一类思维过程,需要为特定任务想出各种不同创意或对策。发散性思维一般通过一种名为“替代用途任务”(AUT)的项目进行评估,受试者被要求在短时间内想出某个日常用品的其他用途,越多越好。受试者的回答从4个类别进行打分:流利度、灵活性、原创性和精细度。
此次任务需完成4个物品(绳子、盒子、铅笔、蜡烛)的AUT。研究人员比较了AI和人类的答案,通过语义距离(回答与物品原始用途的相关度)和创造性给回答的原创性打分。
芬兰图尔库大学、挪威卑尔根大学及斯塔万格大学认知与行为神经科学实验室联合团队用一个计算方法,在0—2的范围里量化语义距离,在1—5的范围里量化创造性,让不知道受试者身份的人类打分者对他们的答案进行客观评价。平均而言,AI的回答在语义距离(0.95相对于0.91)和创造性(2.91相对于2.47)的得分上显著高于人类的回答;人类回答在这两项的得分差距更大——最低分远低于AI的回答,但最高分普遍比AI高。最佳人类回答在8个评分项中的7项都超过了所有AI的最佳回答。
以上结果表明,当前AI想象创意的能力至少已与一般人类相当。但团队强调,他们只评价了涉及创造性评估的单项任务的表现,今后的研究或能探索如何将AI融入创造性过程来提升人类表现。
人类对自己头脑最引以为傲的是什么?是我们永不枯竭的创新思维。如果人工智能在这方面超过我们又会怎样?我的第一观感是:不敢相信、不愿接受、不能认可。不过细思量之下,这一测试首先对创造性的描述和考察都有限,研究人员也强调了,它只是“独立单项任务”的表现。但在现实世界中,我们的创造性的发挥是在复杂且多元交错的环境中进行的。而且,即便是这样单项的考核中,人类创意的最高点,仍然是机器尚无法企及的。
来源:科技日报