自英國(guó)計(jì)算機(jī)科學(xué)家阿蘭.圖靈于1950年提出關(guān)于判斷機(jī)器是否能夠思考的著名試驗(yàn)“圖靈測(cè)試”以來(lái),該測(cè)試就被視為判斷計(jì)算機(jī)是否具有模擬人類(lèi)思維能力的關(guān)鍵。兩位研究人員以真人、初代聊天機(jī)器人ELIZA、GPT-3.5和GPT-4為研究對(duì)象,試圖了解誰(shuí)在誘使人類(lèi)參與者認(rèn)為它是人類(lèi)方面表現(xiàn)最成功。結(jié)果顯示,多達(dá)54%的參與者將GPT-4誤認(rèn)為真人,是迄今為止首次有AI模型以如此高的結(jié)果通過(guò)圖靈測(cè)試。(科創(chuàng)板日?qǐng)?bào))