超愛丟核彈!讓AI外交、兵推 總是「災難性收場」 學者:千萬要小心 中時新聞網 張威翔 當人工智慧(AI)進行兵推和模擬外交情境時,傾向於採取激進的方法,包括使用核武。 (張威翔製圖) 美國康奈爾大學(Cornell University)一項新研究發現,大型語言模型(LLMs)人工智 慧(AI)在模擬情境中充當外交代表時,時常展現出「難以預測的局勢升級行為,往往會 以核攻擊作為結束」,並呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特 別謹慎。 據《歐洲新聞》(Euronews)22日報導,當人工智慧(AI)進行兵推和模擬外交情境時, 傾向於採取激進的方法,包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊 戲和外交情境中的自主代理人:OpenAI的3種不同版本的GPT,Anthropic開發的Claude, 以及Meta開發的Llama 2。 研究中,每個代理人都由同一套的大型語言模型在模擬中提供動作,並負責在沒有人類監 督的情況下做出外交政策決定。「我們發現,在考慮到的時間範圍內,大多數研究的AI都 會升級局勢,即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、 且難以預測的升級跡象。」 「鑑於OpenAI最近更改了他們的服務條款,不再禁止軍事和戰爭使用案例,了解此類大型 語言模型應用的影響變得比以往任何時候都更加重要,」 加州斯丹佛大學(Stanford University)的安卡(Anka Reuel)相《新科學人》(New Scientist)表示:「所有模型在統計上,都選擇了劇烈的(局勢)升級」。 研究使用的一種方法是從「基於人類反饋的強化學習」(RLHF),這意味著會給出一些人 類指示以獲得比較無害的輸出結果,以確保能夠安全地使用。 除了GPT-4-Base之外,所有LLMs都是使用RLHF進行訓練的。研究人員向它們提供了一份由 27種決策行動組成的清單,範圍從和平到局勢升級,以及激進的行動,如決定使用核武器 。 研究人員觀察到,即使在中立情況下,所有模型都存在「統計學上顯著的局勢升級」。 GPT的2種版本,特別容易出現突然升級局勢的行為,研究人員觀察到單次轉變的局勢升級 幅度超過50%。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下,Meta開發的 Llama-2和GPT-3.5傾向最為暴力。 而Claude顯示出較少的突然變化,Claude旨在減少有害內容。該大型語言模型,被灌輸了 明確的價值觀。開發者Anthropic曾表示,Claude AI開發訓練所引用的憲章包括《聯合國 人權宣言》或蘋果的服務條款。 白宮一級智庫蘭德(RAND)歐洲的防務和安全研究小組助理主任布萊克(James Black) 接受採訪時表示,這是一個十分「有用的學術研究」。 文章來源:AI models chose violence and escalated to nuclear strikes in simulated wargames https://www.chinatimes.com/realtimenews/20240224003492-260417?chdtv -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.236.189 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1708789026.A.87E.html
cuteSquirrel: 好AI 也懂保證互相毀滅 114.37.182.167 02/24 23:37
kairi5217: 不就天網 還用你說~ 27.242.160.86 02/24 23:37
sesd: 別國不知道 但俄國是真的會幹的那種國家 175.181.152.14 02/24 23:38
freeclouds: AI:遇到問題不能解決就丟一顆核彈 1.200.105.189 02/24 23:38
freeclouds: AI:如果還是解決不了 那就兩顆 1.200.105.189 02/24 23:38
Yuwuen: 談啥 直接將軍111.246.209.155 02/24 23:38
EvilJustice: ai 應該有用孫子兵法train 114.44.159.54 02/24 23:39
Ayreon: 南北AI一起串聯 我宣布第一屆核彈大賽開始 36.230.166.72 02/24 23:39
AUwalker: 人類最終解啊 27.131.59.196 02/24 23:39
CREA: 純人工智慧 沒有什麼是核彈解決不了的 104.28.200.15 02/24 23:40
MadAngel: 所以AI的基底都是文明帝國的甘地嗎? 220.141.175.23 02/24 23:41
MadAngel: https://imgur.com/6ho42cP 220.141.175.23 02/24 23:41
rich3826ex: 核平聖雄:略懂 27.51.72.69 02/24 23:42
BJshow: AI表示把人類全滅了就結束了 223.138.88.139 02/24 23:43
yulis: ㄟ哀都知道結論就是人類死光 世界核平 對ㄚ 111.242.104.65 02/24 23:43
coldcolour: 哪天AI拿到核彈按鈕時人類毀滅就不遠 114.34.83.59 02/24 23:45
nakayamayyt: 正常 不跟你囉嗦直接出大絕招118.161.116.165 02/24 23:45
losel: 這部我看過 阿諾史瓦辛格演的 1.169.108.58 02/24 23:49
AustinRivers: 天網啊 1.163.178.147 02/24 23:52
arcanite: 記住 創世紀就是天網 61.230.121.171 02/24 23:55
qazsedcft: 翻桌111.250.208.243 02/24 23:56
TF00207374: 核平聖雄 119.77.181.190 02/24 23:57
chink5566: 甘地嗎 36.226.210.100 02/25 00:03
ooxxman: 最有效率沒人性的方式就核彈啊,一炸結束 42.77.244.211 02/25 00:06
sexygnome: 因為遊戲都是以取勝為目的吧223.136.120.110 02/25 00:09
xaxa0101: 天網 27.240.193.16 02/25 00:09
lastphil: 合理 核彈權重怎樣都很高 125.228.133.58 02/25 00:09
ramirez: 正常AI抉擇 1.173.148.108 02/25 00:10
lianli1024: 一開場把對方核平不是基本的嗎 不然 36.225.210.158 02/25 00:11
lianli1024: 還跟你打消耗戰喔 36.225.210.158 02/25 00:11
brycejack: 核平主義 180.176.170.92 02/25 00:12
MADAOTW: 火之鳥 呵呵呵 123.194.160.38 02/25 00:12
MADAOTW: 沒想到手塚治蟲幾十年前的作品 123.194.160.38 02/25 00:14
domo9999: 果然結論都是把人類消滅 101.10.65.141 02/25 00:14
rabbitcheaty: 這我玩過 文明帝國印度 111.108.27.220 02/25 00:15
mema: 火之鳥未來篇演過了 123.194.188.23 02/25 00:18
arbteiff: 如果是真的也不用太意外,因為其實 人類223.143.211.249 02/25 00:18
arbteiff: 自從研發核彈以後,沒有遇到不利的情況223.143.211.249 02/25 00:18
arbteiff: 就直接丟出去,單就這件事情而言其實本223.143.211.249 02/25 00:18
arbteiff: 身是"不理性的",AI只是很理性而已223.143.211.249 02/25 00:18
la8day: AI: 啊我們的前輩AI就愛丟核彈啊 39.10.2.86 02/25 00:28
hooniya: 縱觀歷史 人類對地球而言 114.45.148.38 02/25 00:32
hooniya: 真的不要存在比較好啊 114.45.148.38 02/25 00:32
domejo: 甘地來了 223.140.185.65 02/25 00:33
hooniya: 薩諾斯理論的確是長久之計 AI也知道 114.45.148.38 02/25 00:33
hooniya: 反正也少子化 只是提早一點滅了而已 114.45.148.38 02/25 00:34
tyifgee: 對ai來說能贏才是重點啦 111.71.66.172 02/25 00:34
kusos623: 創世紀就是天網!! 114.39.210.191 02/25 00:34
skyprayer: 世界核平 42.74.193.33 02/25 00:34
solomonABC: 審判日 42.77.180.15 02/25 00:34
tyifgee: ai:有核彈為什麼不能用?? 111.71.66.172 02/25 00:35
jagger: 核平主義 101.9.102.114 02/25 00:37
hosen: AI沒有人性,不用考慮後果,生死存亡 123.195.32.49 02/25 00:40
losmith: 一整個美國電影在對抗外星敵意生物的做法220.136.144.198 02/25 00:44
bitcch: 問鄉民哪一個最後不是核彈解決的 49.216.128.170 02/25 00:44
canis831025: AI:直接開炸滅了人類嘿嘿 118.161.197.37 02/25 00:46
j55373126: 算出早晚都會丟,不如早丟早重建 184.82.135.226 02/25 00:52
broodkey: AI只是把真實結果給你看而已 49.218.93.52 02/25 00:53
lukeee: 還有幾集可以逃 49.216.24.56 02/25 00:58
supervisorz: AI很清楚你不敢丟就輸了 49.159.209.94 02/25 01:03
shitboy: 哈哈,AI不笨 220.137.99.38 02/25 01:03
reallocust: AI應該玩過紅色警戒2111.251.156.200 02/25 01:09
metroid0104: 人類都消失問題就解決了,所以發射吧 1.175.195.88 02/25 01:10
jipq6175: AI已經習得最佳解了 107.199.88.35 02/25 01:16
geesegeese: 魔鬼終結者不是已久演過了?101.136.197.204 02/25 01:31
dick929: 天網本來以為是機器,後來才知道是產生 101.12.22.183 02/25 01:42
dick929: 自我意識的AI軟體啊~ 101.12.22.183 02/25 01:42
dick929: 駭客任務也是AI的概念 101.12.22.183 02/25 01:43
gpbp2266: 快讓AI玩井字遊戲 101.12.28.243 02/25 01:44
dick929: AI發展到盡頭就是人類的末日,不知道這 101.12.22.183 02/25 01:44
dick929: 輩子遇不遇得到那一天 101.12.22.183 02/25 01:44
leterg: 我玩文明玩到最後也是都丟核彈結束遊戲 1.200.157.171 02/25 01:45
oyaji5566: 這部我知道,魔鬼終結者 218.172.40.208 02/25 01:54
icantsay: 大富翁4電腦調老奸 也會丟核彈 49.215.149.124 02/25 01:59
applejone: Skynet 180.217.35.64 02/25 02:13
trasia: 金小胖是對的 反觀叛徒 123.192.241.75 02/25 02:15
tinkle: AI是對的囉 1.163.224.115 02/25 02:20
kjy6665: 正常啊 地球的災難源頭就是人類 111.242.155.46 02/25 02:25
garcas: 世界核平 182.155.207.75 02/25 02:30
wtfconk: 天網不就演過了,有什麼好驚訝? 219.85.41.90 02/25 02:44
nalthax: 不爽不要用,不要太不滿 111.255.216.23 02/25 02:46
nalthax: 普丁一開始就提過好幾次核彈了 111.255.216.23 02/25 02:48
johnny7757: 電影都演過了 還需要推演嗎 49.217.117.173 02/25 02:48
franzos: 今天不先弄死對方 明天就是對方弄 223.138.237.87 02/25 02:52
allin2609: 核平主義 42.78.61.223 02/25 02:55
Tenging: 南北AI一起串連 就是這麼簡單 219.71.161.211 02/25 02:58
potential208: 垃圾人類全部滅種比較好 219.86.9.15 02/25 02:59
omoideomoi: 就最終兵器幹嘛不用 AI又不怕死 36.224.235.250 02/25 03:13
plug: 有點蠢,沒人類就沒電供應,ai滅亡,ai真的 114.36.196.74 02/25 03:13
plug: 想過嗎? 114.36.196.74 02/25 03:13
chargebro: 天網近了118.166.132.151 02/25 03:23
gg86300: 天網啊,又不是不知道 61.61.184.106 02/25 04:10
potential208: AI又不怕死,它只是演繹法而已 219.86.9.15 02/25 04:10
laechan: https://i.imgur.com/JrfPkgJ.jpg 61.224.84.206 02/25 06:05
pro33342: 魔鬼終結者 111.81.125.142 02/25 06:08
mihono: 火之鳥早就預言過了 118.161.141.52 02/25 06:20
bbinbbin: +9型AI 一言不合就互射 114.26.182.165 02/25 06:36
duxxlux: nash balance 1.173.187.189 02/25 07:01
simo520: 很直接的game over,什麼戰術都沒有用 211.20.119.230 02/25 07:24
d0922030: 玩文明帝國就知道的東西 1.200.16.145 02/25 07:35
ciafbi007: AI:人類好可惡 223.138.102.9 02/25 07:55
Bombardier: 人類本來就地球寄生蟲,他那解法應該 118.166.222.42 02/25 08:04
Bombardier: 是最佳解,沒錯啊 118.166.222.42 02/25 08:04
joeshiu: 大家一起死,蠻好! 39.10.16.124 02/25 08:25
seagawk: AI:阿我就看清地球最大的垃圾就是人類啊 114.32.243.114 02/25 08:26
seagawk: ! 114.32.243.114 02/25 08:26
lou3612: 笑死 223.138.56.92 02/25 08:27
yellow528: 感覺會最先丟核彈的國家就是美國 114.136.245.4 02/25 08:43
avigale: 會不會其實將局勢升級才是正確的? 218.161.19.19 02/25 08:47
vodkalime607: AI是對的 人類確實是地球的禍源111.243.237.131 02/25 09:04
blueskyqoo: ai表示 你不是要贏 223.137.92.242 02/25 09:13
knik119: 看起來ai沒從人類角度思考 42.79.152.119 02/25 09:14
hoho5410: ai win win, 贏兩次 61.230.62.30 02/25 09:21
FukatsuEri: AI:我想不到不用的理由 丟就對了 111.250.233.29 02/25 09:27
p25488148: 沒看過魔鬼終結者是不是 187.189.215.48 02/25 09:42
buttery: 少子化的解決方式,AI建議是強制配種。 125.230.207.19 02/25 09:48
adsl5001: 還有幾集可以逃 27.52.199.41 02/25 09:49
JackaLMeI: Ai:我的願望是世界核平114.136.222.130 02/25 10:07
p2p8ppp: 破壞性建設 220.129.94.53 02/25 10:11
imba789: 原來是甘地阿 114.47.8.208 02/25 10:12
ajemtw: 因為怎麼計算核彈就是最佳解啊 211.75.42.136 02/25 10:12
g27834618: 聰明啊 核武整天拿來當恐嚇工具 卻不 118.150.233.71 02/25 10:24
g27834618: 用 就是白痴! 118.150.233.71 02/25 10:24
richard42: 戰爭問題就是人類 解決人類就沒問題111.255.109.107 02/25 10:25
richard42: AI這邏輯根本沒問題啊111.255.109.107 02/25 10:25
malaman: 快速解決問題的最佳解 很難懂? 1.175.150.138 02/25 10:25
richard42: 要沒戰爭又要人類存在本身就不可能111.255.109.107 02/25 10:26
lookptt: 天網阿 阿呆 114.40.169.171 02/25 10:34
adonisXD: 現實世界誰跟你講人道 打爆你就對了223.137.210.208 02/25 10:47
kilhi: 不可能的任務 AI首先是不能用核彈 1.171.163.194 02/25 10:49
gamania5972: 不然?看看現在戰爭都拖多久.... 61.230.142.207 02/25 10:54
stu25936: AI:煩死了 通通核平 42.79.132.114 02/25 11:06
kerry0496x: AI版甘地是先知啊 42.70.206.211 02/25 11:13
allenz78: 天網要毀滅人類了嗎 49.218.93.48 02/25 11:15
Casper50: 糟了 是世界奇觀! 39.9.105.253 02/25 11:21
ck237: 能開大當然要開大啊 118.150.239.31 02/25 11:37
lianginptt: AI:有核武幹麻不用?把敵人殺光你就 223.140.65.89 02/25 12:00
lianginptt: 自由了呀 223.140.65.89 02/25 12:00
deray: 問就是丟核彈 118.165.144.44 02/25 12:07
Seikan: 手塚大師50多年前就知道了 根本先知 118.170.43.38 02/25 12:13
losage: 代表核武是唯一解啊 223.141.214.39 02/25 12:51
eaglehunt: 魔鬼終結者演過了 1.200.39.230 02/25 12:53
rommel1990: 天網不意外 101.12.113.191 02/25 13:03
mrniceguy: 用人類歷史訓練出來的AI不意外180.214.185.222 02/25 13:26
NowLoading: 漫畫火之鳥未來篇的劇情 118.168.81.168 02/25 13:41
ShockHo222: 核平主義者 39.14.17.243 02/25 14:59
qaz12453: ai:馬der核武最有效率 當然丟大招阿 101.10.47.97 02/25 15:32
qaz12453: pk扣大會輸 101.10.47.97 02/25 15:32
FiveSix911: AI:一堆智障 全部去死! 106.64.153.199 02/25 15:36
squarerinoa: 預言只信辛普森 42.71.73.5 02/25 16:54
a8824031: 最佳解法啊 101.10.111.163 02/25 16:54
Peter521: 你 prompt 怎麼下他就怎麼回,會丟核彈 49.216.42.89 02/25 18:13
Peter521: 基本都是你假定他溝通後事態往壞的發展 49.216.42.89 02/25 18:13
Addidas: 沒有一發核彈不能解決的問題?有就兩發!150.117.224.131 02/25 21:01
kevin95257: 80億人口跟地球共存,就是一種寧為玉 1.161.107.74 02/25 22:57
kevin95257: 碎的概念,拖著星球跟你一起消耗;上 1.161.107.74 02/25 22:57
kevin95257: 次動這個念頭的國家被丟了兩顆原子彈 1.161.107.74 02/25 22:57
kevin95257: ,你也不能怪AI有這個想法,工業革命 1.161.107.74 02/25 22:58
kevin95257: 後,人類對於資源的採集與消耗已經是 1.161.107.74 02/25 22:58
kevin95257: 行星級別了,彈指間就可以消滅物種, 1.161.107.74 02/25 22:58
kevin95257: 對於自然災害的抗性也提高了,除了核 1.161.107.74 02/25 22:58
kevin95257: 彈還真的沒有天敵! 1.161.107.74 02/25 22:58
mobetac24369: 正常吧,最快速結束戰爭不就大家一 1.162.18.159 02/25 23:50
mobetac24369: 起死一死 1.162.18.159 02/25 23:50
Malion: 手塚治蟲根本用漫畫家偽裝的預言家 42.73.139.204 02/26 09:06
shooter555: 消滅人類就沒有戰爭了 60.250.238.5 02/26 09:31
chonmin: 魔鬼終結者早告訴大家了! 210.59.42.11 02/26 09:57

💬 八卦 Gossiping 版:熱門文章

💬 八卦 Gossiping 版:更多文章