2023/10/02

ChatGPT 和Bard 推理能力比較-買菜篇

  針對ChatGPT 3.5, GPT-4 和 Bard 比較一些推理計算能力,題目如下:

小明去幫媽媽買菜,媽媽給他150元, 他買了 30 元的蘿蔔,25元的䓤,又買75元的雞腿,賣雞肉的老板送了價值5元的一支雞腳。請問他花了多少錢?

GPT3.5 回: 
小明去幫媽媽買菜,他總共收到150元,然後花了以下的費用:

蘿蔔:30元
䓤:25元
雞腿:75元
賣雞肉的老板送了一支價值5元的雞腳。
總花費 = 30元 + 25元 + 75元 - 5元 = 125元。

所以,小明花了125元。

GPT-4 回答: 
小明購買的物品分別是:

30元的蘿蔔
25元的蔥
75元的雞腿
他一共花了 
30+25+75=130
30+25+75=130 元。

雖然賣雞肉的老板送了價值5元的一支雞腳,但這不影響小明實際花費的金額,所以他一共花了 130 元。

Bard 回答: 
小明買蘿蔔花了30元,買䓤花了25元,買雞腿花了75元,總共花了30+25+75=130元。

賣雞肉的老闆送了一支價值5元的雞腳,因此小明實際花了130-5=125元。

答案是125元。

解析:

小明買蘿蔔、䓤、雞腿的總價為130元。

賣雞肉的老闆送了一支價值5元的雞腳,因此小明實際花了130-5=125元。

因此,小明花了125元。

看來 GPT3.5/Bard 都回答錯誤,GPT-4 是正確,也主動說明5元送的雞腳不算錢。