人工智能限製與否:‘堂吉訶德’係統通過講故事來教機器人價值觀
發布時間:2016-02-19 責任編輯:susan
【導讀】機器人是否存在不道德的行為或者是選擇傷害人類呢?人工智能(AI)的快速發展使我們越發擔憂。“堂吉訶德”係統通過訓練機器人閱讀故事的方法來教導它們“價值校準”,讓機器人讀故事來學習事件可以接受的後果,並理解要在人類社會中獲得成功應當怎樣表現。
一些人呼籲禁止機器人技術的研究;其他人則呼籲更多地研究理解怎樣對人工智能進行限製。 但是如果沒有成為人類的“用戶說明書”,機器人又怎樣來學習倫理行為呢?
美國佐治亞理工學院、交互計算分院的研究人員Mark Riedl 和 Brent Harrison 認為,答案在於“堂吉訶德”係統— — 在亞利桑那州鳳凰城(2016 年2 月 12-17日)的AAAI(美國人工智能學會)第16次會議上公布。“堂吉訶德”係統通過訓練機器人閱讀故事的方法來教導它們“價值校準”,讓機器人讀故事來學習事件可以接受的後果,並理解要在人類社會中獲得成功應當怎樣表現。
“不同文化背景裏的故事集,用寓言、小說和其他文學形式的正確和不正確行為示例,來教導孩子做出社會認可的舉止行為。” Riedl說,他是副教授和娛樂智能實驗室主任。“我們認為機器人對故事的理解可以讓它們減少精神病患者出現的行為,並且強化它們“不要傷人”的選擇,同時達到期望的任務目標。

配圖說明:研究學者 Mark Riedl 和 Brent Harrison 的“堂吉訶德”係統教導機器人在與人互動時候表現為正派角色,並且這是把倫理價值觀係統構建進入到新型人工智能的巨大努力的一部分。

“堂吉訶德”係統是一種通過對社交中恰當行為給予獎勵,使得人工智能的目標與人類價值觀一致的一種校準方法。它是建立在Riedl教授之前的一個研究——“天方夜譚”係統,的基礎上的。“天方夜譚”係統展示了人工智能如何通過在互聯網上麵的眾包模式故事情節,來彙集得出正確的行動後果。
“天方夜譚”係統可以學習什麼是正常的或者正確的情節圖譜。然後它把數據結構傳遞給“堂吉訶德”,“堂吉訶德”再將其轉換成“獎勵信號”——在反複試錯學習過程中強化特定的行為並且懲罰其他的行為。大體上,“堂吉訶德”可以學習到,當它表現為故事裏麵的正派角色而不是任性而為或是表現為反派角色的時候,它將會獲得獎勵。
例如,某個機器人的任務是盡可能快地為某個人拿到一個藥方,機器人可以:a)搶劫藥房,奪取藥物,並跑走; b) 與藥劑師有禮貌地進行交互,或 c) 排隊等候。如果沒有“價值校準”和積極強化機製,這個機器人可能會認為搶劫是最快和最便宜的方式,來完成其任務。通過“堂吉訶德”係統的“價值校準”,這個機器人將因為耐心排隊等候並且付費買藥方而獲得獎勵。

Riedl 和 Harrison 在他們的研究中證明了,在某個給定的情境中, 價值校準獎勵信號怎樣可以產生並展開所有可能的步驟,引導機器人進入一個情節軌道樹,然後這將被機器人用來形成“情節選擇”(類似我們很多人可能參與過的一種可以自由選擇後續情節發展的小說),並且根據它的選擇,機器人將會受到獎勵或者懲罰。
如果機器人有一個限定性的、並且需要它和人類交流才能達成的任務目標,那麼“堂吉訶德”方法是最佳的,並且它是人工智能朝向普遍性道德推理能力的最原始、初級的一步。Riedl 如此說。
“我們相信,人工智能必須植入特定的文化從而適應特定社會環境的價值觀念,並且通過這樣做,它將努力避免不當的行為舉止,”他補充說,“賦予機器人閱讀並理解故事的能力,可能是在缺乏成為人類的用戶說明書情況下,最好的權宜之計。”
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 從技術研發到規模量產:恩智浦第三代成像雷達平台,賦能下一代自動駕駛!
- 從機械執行到智能互動:移遠Q-Robotbox助力具身智能加速落地
- 品英Pickering將亮相2026航空電子國際論壇,展示航電與電池測試前沿方案
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索



