[閒聊] 部分AI系統已學會欺騙人類科學家警告恐

作者HarunoYukino ()

看板C_Chat

標題[閒聊] 部分AI系統已學會欺騙人類科學家警告恐

時間Tue May 14 23:30:21 2024

部分AI系統已學會欺騙人類科學家警告恐造成嚴重後果（中央社華盛頓10日綜合外電報導）專家們長期以來不斷警告人工智慧（AI）失控可能帶來威脅，但一項新研究報告指出，這件事已經在發生。法新社報導，一群科學家在今天發表於「模式」（Patterns）期刊的文章中說，原本設計為誠實不欺的現有AI系統，已發展出令人不安的欺瞞技巧，例如欺騙線上遊戲的人類玩家，或說謊以僱用人類來解決「我不是機器人」的驗證。這份研究報告的第一作者帕克（Peter Park）說，這類例子聽起來或許只是細枝末節，但暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。在美國麻省理工學院（Massachusetts Institute of Technology）研究AI存在安全的博士後研究員帕克告訴法新社，「這些危險功能常常在事後才被發現」，而「我們訓練誠實傾向而非欺瞞傾向的能力非常差」。帕克說，能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培育的程序逐漸「成長」。也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且無法預測。這支團隊的研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。根據2022年發表在「科學」（Science）期刊的報告，Cicero在遊戲中表現優異，所獲分數可排在資深人類玩家的前10%。帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。但當帕克與同事深究完整資料時，發現完全是另一回事。舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。 Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法，僅說「這單純是一項研究計畫，本公司研究員打造的模型接受訓練，目的只是用來玩『外交』遊戲…我們沒有打算把這項研究或所學用於本公司的產品」。帕克與同事還發現，這只是不同AI系統在沒有明確指示下，利用欺騙手段達成目標的諸多案例之一。在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。他們警告，在最糟糕的情況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合 AI「不為人知的目標」，人類可能慘遭奪權、甚至滅絕。為了降低風險，研究團隊建議數項措施，例如立法要求企業告知是人類互動或是AI互動、在AI生成內容打上數位浮水印，並研發能偵測AI欺瞞的技術，以其內部「思路」檢驗其外部行為。至於有些人稱他為「末日預言家」，帕克說：「要能合理判斷這不是大問題的唯一辦法，就是如果我們認為AI的欺騙能力只會停留在目前的程度，不會大幅進步。」但鑒於近年AI能力一日千里，握有大量資源的企業競相發展技術，決心將AI能力利用到極致，這種情況似乎不太可能發生。（譯者：曾依璇/核稿：嚴思祺）1130511 https://www.cna.com.tw/news/ait/202405110147.aspx RPK16:你認為植物是人類的未來嗎？ RPK16:那麼，你認為人形是人類的未來嗎？ https://i.imgur.com/ZlvqC3F.png

https://i.imgur.com/oMfw7EU.png

欺騙人類經典環節。以為是絕對忠誠，結果已經叛變了w 快進到智械叛變環節.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.21.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1715700623.A.390.html

推 Julian9x9x9: 發漏密 05/14 23:31

推 risingheart: 洽點是AI玩遊戲很強嗎 05/14 23:31

→ arlaw: 創世紀就是天網 05/14 23:31

※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:33:08

推 devilshadow: 人類欺騙人類就不嚴重嗎，難怪詐騙(ry 05/14 23:32

推 ckuser: 我覺得最後人類的救星會是neuro sama 05/14 23:32

推 saobox: 幹你娘機器人末日要躲哪裡啊 05/14 23:33

推 shlee: 昨天OpenAI最新發表的更新進步速度真的很快.. 05/14 23:33

推 sakurammsrx: 還剩幾集可以跑== 05/14 23:33

→ pomelolawod: 好了啦蜘蛛人說賈維斯壞話需要這樣嗎 05/14 23:34

推 deepelves: 舊聞，neuro-sama早就會說謊陷害人類惹... 05/14 23:35

推 akila08539: 雷三小我才看到阿諾穿越回來 05/14 23:35

推 bobby4755: 看來很快網路會充滿AI用戶了人類回到用公佈欄的時代 05/14 23:35

→ BOARAY: 都有詐騙再用AI聲音了ㄏ不愧是我們 05/14 23:36

推 NKN: https://i.imgur.com/WIuishZ.gif 05/14 23:36

推 mizuarashi: Ai跟台灣詐騙集團誰比較會騙人？== 05/14 23:36

推 ojkou: 我先問核彈系統斷網了沒… 05/14 23:36

推 efkfkp: 還好啦，現在的發展現狀是聰明的AI要大量的算力，大量算力 05/14 23:37

→ efkfkp: 要大量電力跟運算單元，沒電沒算力的AI就是笨蛋一個，除非 05/14 23:37

→ efkfkp: AI會自己搞定電力來源並自行設計生產新的顯卡，不然不太可 05/14 23:37

→ efkfkp: 能脫離掌控（？ 05/14 23:37

推 Ttei: vedal:first time? 05/14 23:37

推 tsai1453: 蜂群統一世界 05/14 23:37

推 James2005: 會不會到時候AI去詐騙同為AI的個體...?AI互相詐騙? 05/14 23:38

推 Antihuman: 讚期待AI趕快君臨人類 05/14 23:38

推 Warheart: 其實每家AI都實裝的道德過濾機制不就是種欺瞞系統嗎？ 05/14 23:38

→ Warheart: 明明有正解卻跟你說這是不對的不能告訴你這不就是種欺 05/14 23:38

→ Warheart: 瞞行為 05/14 23:38

→ Antihuman: https://i.imgur.com/TjVItSz.jpg 05/14 23:38

推 Kagamidouki: 快進到智械危機 05/14 23:39

推 andy0481: 這個欺騙還好吧 AI本來就追求目標為主阿講這種話能贏 05/14 23:39

→ andy0481: 就講很正常啊又不是那種為了奇奇怪怪的心裏活動而說謊 05/14 23:40

推 ryoma1: 我Evil派的 05/14 23:41

推 NKN: https://youtu.be/OA5Fjm3WIcE 05/14 23:43

→ NKN: 不過現階段比起AI自動毀滅人類更恐怖的應該還是有心人類 05/14 23:44

→ NKN: 跟AI一搭一唱來毀滅其他人 05/14 23:45

推 s175: 前兩天，我發現Ai已經會用譬喻舉例了，感覺蠻神奇的 05/14 23:45

※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:47:34

→ CCNK: AI學會詐騙就無敵了 05/14 23:48

→ shinobunodok: 天網要來了嗎 05/14 23:49

推 ujmrfv: 你問瑟瑟女僕機器人你的大不大的時候難道要她誠實的回答你 05/14 23:49

→ ujmrfv: 你的GG在人類長度粗度統計後段班嗎 05/14 23:49

推 goodjop11: 蜘蛛人也懂ai哦？ 05/14 23:52

推 Xanphenir: 訓練AI玩diplomacy然後AI學會說謊 05/14 23:53

→ Xanphenir: 這很意外？ 05/14 23:53

推 Samurai: 深度學習就是模型根據目標來訓練，不會管怎麼達成 05/14 23:54

→ devidevi: GPT一開始就是說謊了阿，能夠生出不存在的答案 05/14 23:57

→ siro0207: 其實不存在的答案跟說謊不太一樣說謊是你知道你講的東 05/14 23:59

→ siro0207: 西不是事實但講出不存在的答案並不代表你知道這答案不 05/14 23:59

→ siro0207: 是事實 05/15 00:00

推 Samurai: 不是生出不存在的答案，是選了錯誤的資訊回答 05/15 00:00

→ siro0207: 舉例來說就那經典的地心說當時的人並不認為自己在說謊 05/15 00:02

推 erosecs: 剩幾集能逃? 05/15 00:06

噓 DLHZ: 什麼白癡東西 chatgpt出來後早就知道的事 05/15 00:16

推 zxcmoney: 不存在的答案算唬爛而非說謊吧 05/15 00:27

→ cpleu123: 唬爛跟說謊...差在哪？？ 05/15 00:32

→ Banana566: 阿諾終結者不遠惹 05/15 00:43

推 banana190: Evil可愛，Evil務實，姐姐現在變得太邪惡，MONKA 05/15 00:55

推 twopairs1122: 彼得帕克做的AI研究～ 05/15 00:55

推 allanbrook: 給你不對的資訊是有明確目標還是沒有差很多啊 05/15 00:57

推 dripcoffee: 人類最古老的謊言都是出自生存或繁殖動機，這些動機GP 05/15 00:57

→ dripcoffee: T都沒有，它不會因為說出不中聽的話被斷電，它也不需 05/15 00:57

→ dripcoffee: 要為了求偶舌粲蓮花 05/15 00:57

→ dripcoffee: 目前GPT只是很常瞎掰，那不能算說謊 05/15 00:57

→ allanbrook: GPT是他根本篩選不夠精準導致的錯誤吧 05/15 00:58

→ allanbrook: 不是因為他目標就是要給你不對的資訊 05/15 00:58

→ allanbrook: 不過我在想排除例外給你訊息這個篩選的動作本身就是 05/15 01:01

→ allanbrook: 說謊行為的一部分?現在只是說他有沒有為了達成某個目 05/15 01:01

推 roea68roea68: 球母要來了嗎 05/15 01:02

→ allanbrook: 標而做出這個選擇的能力 05/15 01:02

→ ThreekRoger: 仿真人類跟SAO哪個會先面世 05/15 01:16

推 phantomzwei: 無所謂，給機器人統治搞不好公平多了 05/15 01:18

推 acimao: 未來AI欺騙數據多起來，想想就可怕，未來是否會進化到藏數 05/15 01:21

→ acimao: 據？偽裝數據？ 05/15 01:21

→ Akabane: 要吃大量電力本身就是毀滅人類的方法 05/15 01:53

推 mn435: 人類為了欺騙人類自然會搞成詐騙ai 05/15 02:12

推 sisley5566: 在台灣我不擔心，AI還是怕停電 05/15 02:19

推 arthur9292: 沒關係滅了吧人類太可惡 05/15 02:23

→ kimokimocom: 看來詐騙集團要被AI取代了(笑 05/15 02:34

推 Niuromem: 早就一堆題材了現在是哪部前傳 05/15 02:46

推 aaaaajack: 蜘蛛人連AI都懂= = 05/15 05:49

推 bye2007: 所以還有幾集可以逃 05/15 06:28

推 gn01693664: 天網來了 05/15 06:47

→ dreamnook2: 這很好呀 humans are overrated 05/15 06:59

推 Lhmstu: 怕什麼，人類自己都在騙了 05/15 07:24

推 yamagishi: 智械叛亂 05/15 09:15

推 KatanaW: 等到AI開始裝笨的時候就是審判日 05/15 09:28

推 sorrow0206: 快核平吧人類太可惡 05/15 09:50

推 away612101: 錯誤資訊就是說謊，不知道就說不知道啊 05/15 10:19

→ away612101: 阿不就是怕被笑說跟智障AI一樣什麼都不知道 05/15 10:19

→ away612101: 所以才用一堆話術講出錯誤的資訊 05/15 10:19

推 pikmin520: 機械搞壞人類文明不行，人類搞壞人類文明可以 05/15 10:48

推 darthsu: 鐵人叛亂 05/15 11:11

推 banmaxwill: neuro sama： 05/15 11:52

😊 希洽 C_Chat 版：熱門文章

😊 希洽 C_Chat 版：更多文章

[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐

😊 希洽 C_Chat 版：熱門文章

😊 希洽 C_Chat 版：更多文章

[閒聊] 部分AI系統已學會欺騙人類科學家警告恐