亚洲二区三区在线,久久久久高清毛片一级,亚洲综合一区二区三区不卡,中文不卡av

歡迎訪問科技網!

您當前的位置: 首頁 > 科技新聞

讓機器與人有共同價值觀,這個火熱的人機對齊問題恐怕是個偽命題

發布時間:2024-02-06 05:50:53 來源:返樸 字號: [ 大 ] [ 中 ] [ 小 ]

機器學習的飛速發展,已經讓人類的擔憂與日俱增。如果不加深思,絕大多數人會同意,有必要讓人工智能做的事情與人類的目的相符,即讓機器和人擁有一致的價值觀,這就是當前火熱的一個研究命題——“人機對齊問題”(the alignment problem)。仿佛對齊問題的研究成敗會直接影響人類的命運。

對此,美國科技暢銷書作家布萊恩·克里斯汀(Brian Christian)在其新書《人機對齊》中,精煉地描繪了機器學習的發展史和前沿研究,且與許多科學家們直接對話,向讀者介紹了世界上第一批積極應對對齊問題的學者是如何苦心孤詣地去制定對齊計劃。這部書出版后引起較大反響,但是,“人機對齊”問題的意蘊真如我們的一般想象嗎?長期從事人工智能哲學研究的復旦大學徐英瑾教授認為,所謂“人機對齊”問題深究起來其實是個偽問題,需要徹底反思并澄清其前提。

《人機對齊》(湖南科學技術出版社,2023年6月),布萊恩·克里斯汀著,唐璐譯

撰文 | 徐英瑾(復旦大學哲學學院教授、上海人工智能實驗室顧問)

人-機對齊問題的實質,就是如何讓人工智能產品的行為輸出符合人類的預期。布萊恩·克里斯汀的著作《人-機對齊》(湖南科技出版社2023年)討論的也便是這樣一個問題。全書資料詳實,可讀性強,為一般讀者了解西方的科技倫理界討論人-機對齊的前沿問題提供了不少有用的信息。不過,仔細讀一下這本書,我們就會發現全書對于“公平”問題的討論占據了非常大的篇幅,可見作者非常憂心人工智能系統的運用會強化人類社團的某種既有偏見,特別是種族歧視與性別歧視。

很多人都會認為對于此類問題的關涉乃是正常的,因為既然人類的普世價值顯然是反對種族歧視以及類似的偏見的,人工智能產品的輸出就需要與該價值觀“對齊”。然而,更仔細的考察會立即讓我們發現這種觀點自身所包含的矛盾。矛盾的一面是:反對特定形式的歧視固然是被普遍承認的價值;但矛盾的另一面卻是:目前主流機器學習技術所得到的“偏見”其實就是來自于從互聯網上找來的大量人類實際輸出的內容——換言之,這些“偏見”已經反映了一部分人類的價值。現在,新的問題就冒出來了:“價值對齊”這個概念所涉及的,很可能是某種特定的價值(如羅爾斯的自由主義價值)以及某些地方性價值觀(如保守派價值)之間的沖突。因此,所謂人與機器之間的價值沖突,可能涉及的便是具有不同價值觀的人群之間的意見沖突

這里需要注意的是,英語中“偏見”(prejudice)一詞本身是帶有貶義的,其所指涉的乃是缺乏事實依據的主觀意見。但從認知科學的角度看,智能體往往需要在巨大的時間壓力與稀缺的情報環境下進行決策,因此,智能體對于未來形勢進行的判斷往往難以避免主觀性與武斷性的嫌疑。就好比對于老鼠來說,如果它們發現自己的親戚吃了某種氣味的食品死了,整個族群都不會去碰這種食物——而這種基于小樣本的決斷顯然是既主觀而又武斷的。但它們顯然無法承擔因為輕信此類食物而死去的風險,因此,規避此類食物就完全符合吉仁澤(Gerd Gigerenzer)基于生態學考慮而提出的“理性之節儉性”(the frugality of rationality)標準。從達爾文主義的立場上看,人腦雖然比老鼠的神經系統復雜很多,但依然會根據“理性之節儉性”的標準節省運作能量。譬如,有女子若在戀愛中曾被戴眼鏡的男子欺騙,她以后就會一直規避此類男子。不難看出,其判斷得以產生的運作邏輯其實與老鼠躲避某類食物的邏輯并無不同。很顯然,我們對世界的理解基本都基于此類“偏見”之中。有鑒于這些“偏見”對于節省人類認知成本的重要性,將其一股腦地貼上負面標簽可能是不合適的。一個更適合的提法可能是來自德語單詞“Vorsichit” 的“前見”——這詞顯然聽上去比“偏見”顯得更為中立。

一種基于“前見”的文本解釋策略是基于德國哲學家伽德默爾(Hans-Georg Gadamer,1900-2002)的詮釋學的,而他的相關觀點卻又是與當下流行的人-機價值對齊學說的哲學預設是彼此不同的。按照目下的人-機對齊敘事模式,人類的目標乃是一個客觀的存在,而人工智能系統運作的目標就是抵達該目標,就好像球員的目標是要將球踢進球門那樣。而在伽德默爾看來,詮釋文本的目標并不是一種客觀的存在,而是解讀者、文本自身與時代環境相互作用后形成的一種“視域融合”的產物。也就是說,怎樣的文本解讀答案算是客觀答案,得看具體的歷史語境。一個答案此時算是客觀的,在彼刻就會被認為是不再客觀。因此,來自解讀者的主觀性因素就會像滲入雞尾酒的果汁一樣,無法再被消除了。從這個角度看,那種將目標與手段加以截然二分的人機對齊理論的基本方法論前提就可能是成疑的。

——那么,我們難道就可以憑借“容納主觀性”的名義而去容納種族歧視與性別歧視了?

對于這樣的一個問題,一種伽德默爾式的回答是:我們當然要反對種族歧視與性別歧視,但這不是因為這是一個需要被預先肯定的價值目標,而是因為人類歷史發展的現行階段已經無法容納種族歧視與性別歧視。換言之,如果我們需要去同情性地理解古希臘時代的歷史背景的話,我們也就需要同樣具有同情心地去理解亞里士多德對奴隸制的容忍。這也就是說,不存在一種脫離時代背景與特定人群屬性的抽象的“人的價值”——因此,也不存在著針對這一抽象的“人的價值”的人-機對齊運作

上述抽象的討論的具體技術意義是什么呢?假設你需要制造某種具有“緊急避險”功能的人工智能自動駕駛軟件,那么設計者就需要思考在“緊急避險”狀況真的發生的情況下,汽車應當保護哪類對象(比如,在左邊的行人與右邊的行人之間二選一,其情形類似所謂的“電車難題”)。按照主流的人-機價值對齊理論,此類軟件的輸出便需要與全人類的道德直覺相互符合。但麻煩的是:很可能沒有這樣的全人類相通的道德直覺。有些文化主張優先保護兒童,有些文化主張優先保護婦女,有些文化則認為那些自己違背交通法則的個體應該被犧牲,而有些文化甚至主張應當優先去照顧那些具有特殊宗教意義的動物(如正在穿越馬路的一頭圣牛)。其中,哪一種文化提出的意見是正確的呢?以“反對歧視”為特色的自由主義理論在此已經陷入了僵局:緊急避險場景本身就意味著對于某類需要被犧牲的對象的“偏見”。因此,假若一切偏見都需要被犧牲的話,那么這就意味著緊急避險這一類行為自身也需要被取消。但假若是這樣的話,我們也就談不上對于災難后果的任何控制努力了——但這一點本身卻又是不符合大多數人的價值的。因此,人機對齊蘊含的自由主義意蘊將使得人機對齊活動本身變得不可能。而要讓這一悖論得以消除,唯一的解決方案便是在哲學上轉向詮釋學,即承認特定的人工智能系統的運行目標是與特定的文化風土相互聯系的。

對于筆者的上述意見,一種反駁意見是:緊急避險只是我們希望人工智能系統所具有的某項功能之一,而在這個問題上遇到的“對齊目標模糊”問題其實也只是特例。而在別的問題上,我們還是可以澄清“人機對齊”的目標究竟是什么的。比如,大語言模型的運作現在已普遍產生了所謂的“機器幻覺”問題,其表現便是模型會向用戶提供大量貌似很真實但卻并不真實的信息(比如編造完全不存在卻完全可以唬住外行的科學論文)。因為關于此類信息是否真實,其實是存在著一種跨文化的評價標準的,因此,在這個語境中,關于何為人機對齊的目標,應該是沒有什么差異的。一個與之平行的例子則是這樣的:有些人工智能軟件可以通過惡意理解游戲規則,而在游戲中得高分(比如在戰爭游戲中將“多撞擊敵艦”這一獎勵規則誤解為“多次撞擊同一條敵艦”)——但人類用戶顯然不希望這樣的機器被投入應用。因此,消除程序對于規則的惡意誤解,也顯然是人機對齊工作的題中應有之義。在這些場景中,此類工作的目標的客觀性都是確定無疑的。

但從詮釋學的角度看,事情未必如此。究竟什么是“機器幻覺”,什么是“惡意解讀規則”,這本身是特定歷史條件下進行詮釋的產物,并不是純然客觀的事情。舉個例子:在1891年發表的《新學偽經考》中,康有為認為《古文尚書》、《左傳》、《毛詩》等經典都是西漢末年劉歆偽造的,因此,它們都屬于“一本正經的胡說八道”。換言之,如果將劉歆代表的古文經學派的儒家學者都視為一臺碳基大語言模型的話,這些經典的文本本身就是“機器幻覺”正在發作的明證。但康有為的判斷是否正確呢?按照錢穆等學者的考證,康有為對古文經的判斷是錯誤的,而且,目前學界接受的便是錢穆的觀點。這也就是說明,對于信息真假的判斷,本身也是依賴特定的學術共同體的。拓展到自然科學領域去,我們之所以現在認為地心說是錯的,也并不是因為存在著某種客觀真理的標準規定我們必須這么看——毋寧說,這是因為托勒密的天文學體系早就被放棄了。而怎樣的學術規范與學術范式需要被接受或放棄,這本身也是歷史發展的后果。

再來看惡意解讀規則的案例。其實,怎樣的解讀是惡意的,本身也是社會約定的產物。在軍事游戲中反復攻擊一條靶艦來獲得積分被認為是作弊,但在足球比賽中反復攻擊一個球門得分卻被視為是正常的。怎樣的規則解讀才是合理的,取決于游戲設計者的目的與當地文化所起到的各種潛移默化的作用。換言之,不存在著放之四海而皆準的“惡意”評判標準。

我上文的討論試圖得出兩個結論。第一,人機對齊問題必須被改寫為“特定的人類文化與機器的對齊問題”,因為不存在著脫離歷史特殊性與地域特殊性的“人類價值”。第二,假若我們硬是要強化機器需要與之看齊的人類價值標準的齊一性的話,這只會導致某種特殊價值觀對于別的價值觀的壓制。對于人類文化發展的多樣性與可持續性來說,這可不是一個好消息。從這個角度看,英語世界的主流人機對齊敘事方式,需要某種徹底的哲學反思加以澄清其前提。

特 別 提 示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關注公眾號,回復四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

版權說明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯系后臺。

【免責聲明】本文轉載自網絡,與科技網無關。科技網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

主站蜘蛛池模板: 武清区| 武穴市| 庆安县| 枣强县| 高碑店市| 邛崃市| 静海县| 肥西县| 扎赉特旗| 洪洞县| 江安县| 宁波市| 乌鲁木齐市| 长宁区| 壤塘县| 永康市| 隆子县| 乡宁县| 都昌县| 庆云县| 涪陵区| 汝南县| 阜南县| 宝坻区| 蓝田县| 大邑县| 长宁区| 和田县| 连云港市| 鲜城| 福安市| 留坝县| 天台县| 仙游县| 嘉鱼县| 六安市| 嫩江县| 宁武县| 廊坊市| 黄陵县| 文昌市|