人類能夠?qū)ψ匀唤缰械奈矬w進(jìn)行概念化,這一認(rèn)知能力長(zhǎng)期以來(lái)被視為人類智能的核心。當(dāng)我們看到“狗”“汽車”或“蘋果”時(shí),不僅能識(shí)別它們的物理特征即尺寸、顏色、形狀等,還能理解其功能、情感價(jià)值和文化意義。這種多維度的概念表征構(gòu)成了人類認(rèn)知的基石。隨著ChatGPT等大語(yǔ)言模型(LLMs)的爆發(fā)式發(fā)展,一個(gè)根本性問(wèn)題引起學(xué)界關(guān)注——這些大模型能否從語(yǔ)言和多模態(tài)數(shù)據(jù)中發(fā)展出類似人類的物體概念表征?
近日,中國(guó)科學(xué)院自動(dòng)化研究所與腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心合作,結(jié)合行為實(shí)驗(yàn)與神經(jīng)影像分析,首次證實(shí)多模態(tài)大語(yǔ)言模型(MLLMs)能夠自發(fā)形成與人類高度相似的物體概念表征系統(tǒng)。這項(xiàng)研究為人工智能認(rèn)知科學(xué)開(kāi)辟了新路徑,更為構(gòu)建類人認(rèn)知結(jié)構(gòu)的人工智能系統(tǒng)提供了理論框架。
傳統(tǒng)的人工智能研究聚焦于物體識(shí)別準(zhǔn)確率,卻鮮少探討模型是否真正“理解”物體含義。自動(dòng)化所研究員何暉光提出,“當(dāng)前AI能區(qū)分貓狗圖片,但這種‘識(shí)別’與人類‘理解’貓狗的本質(zhì)區(qū)別仍有待揭示。”該團(tuán)隊(duì)從認(rèn)知神經(jīng)科學(xué)經(jīng)典理論出發(fā),設(shè)計(jì)了一套融合計(jì)算建模、行為實(shí)驗(yàn)與腦科學(xué)的創(chuàng)新范式。團(tuán)隊(duì)采用認(rèn)知心理學(xué)經(jīng)典的“三選一異類識(shí)別任務(wù)”,要求大模型與人類在物體概念三元組中選出最不相似的選項(xiàng)。通過(guò)分析470萬(wàn)次行為判斷數(shù)據(jù),團(tuán)隊(duì)首次構(gòu)建了AI大模型的“概念地圖”。
該研究在海量大模型行為數(shù)據(jù)中提取出66個(gè)“心智維度”,并為這些維度賦予語(yǔ)義標(biāo)簽。研究發(fā)現(xiàn),這些維度是高度可解釋的,且與大腦類別選擇區(qū)域的神經(jīng)活動(dòng)模式顯著相關(guān)。研究還對(duì)比了多個(gè)模型在行為選擇模式上與人類的一致性。結(jié)果顯示,多模態(tài)大模型在一致性方面表現(xiàn)更優(yōu)。
進(jìn)一步,研究發(fā)現(xiàn),人類在做決策時(shí)更傾向于結(jié)合視覺(jué)特征和語(yǔ)義信息進(jìn)行判斷,而大模型則傾向于依賴語(yǔ)義標(biāo)簽和抽象概念。研究表明,大語(yǔ)言模型內(nèi)部存在著類似人類對(duì)現(xiàn)實(shí)世界概念的理解。
相關(guān)研究成果發(fā)表在《自然-機(jī)器智能》(Nature Machine Intelligence)上。研究工作得到國(guó)家自然科學(xué)基金、中國(guó)科學(xué)院基礎(chǔ)與交叉前沿科研先導(dǎo)專項(xiàng)、北京市自然科學(xué)基金及腦認(rèn)知與類腦智能全國(guó)重點(diǎn)實(shí)驗(yàn)室的支持。
來(lái)源:中國(guó)科學(xué)院自動(dòng)化研究所
網(wǎng)站簡(jiǎn)介 / 廣告服務(wù) / 聯(lián)系我們
主辦:華夏經(jīng)緯信息科技有限公司 版權(quán)所有 華夏經(jīng)緯網(wǎng)
Copyright 2001-2024 By m.612g.cn