點擊右上角微信好友
朋友圈
請使用瀏覽器分享功能進行分享
作者:中國人民大學法學院副教授、未來法治研究院社會責任與治理研究中心主任 郭銳
在人工智能倫理研究中,主流的看法是既然讓人工智能決策已經不可避免,應該將倫理嵌入人工智能技術之中,以便增加人工智能決策的可靠性和安全性。這種嵌入,也稱為“道德算法”。在道德算法的實現路徑上,人們已經考慮了三種進路:自上而下進路、自下而上進路和某些混合式進路。所謂自上而下進路,本質上是把道德規則轉換為用數學符號表達的算法,用一套倫理原則應對一切倫理問題。自下而上進路則模擬了生物進化,通過機器學習和復雜適應系統的自組織發展與演化,使人工智能系統能夠從具體的倫理情境生成普遍的倫理原則。混合式進路是結合前兩者,是目前人工智能算法設計的主流。但是,上述看法仍未離開搖搖欲墜的根基,特別是其倫理知識根基。
“道德算法”的問題在于它仍然是一種消極的應對
在具體的倫理情境中做出道德決定,受制于無法確知因果關系的困境,具體到某個道德決定可能困難重重。從眾多的具體道德決定中生成普遍的倫理原則,更加少不了分歧和爭議。讓人工智能自發形成普遍倫理準則,對人的道德主體性的威脅是致命的。無論是自上而下、自下而上,還是混合式進路,對因果關系難題、終極準則難題的應對仍然不足,這是它們致命的缺陷。
此外,人工智能用于公共決策的語境中,尤其會受現代國家將社會生活“簡單化”的路徑依賴的限制,導致人工智能決策在倫理上的可能盲點。公共決策需要的只是那些幫助決策者對整體進行概括的觀察,且可以在許多不同的情況下被重復使用的信息,故在信息中展現的事實必須是可以類型化、忽略大量相關的特征的事實。例如,社會中的人工作生活都是非常復雜的,但在就業統計中,大量復雜的特征被忽略,最終進入統計的是一些格式化的信息:有收入的就業。無論是人工智能系統任務目標的設定、數據的收集,還是算法的訓練,都與決策者“簡單化”的需求相契合。對數據來源的了解以及數據收集者的度量標準的反思,展現出看似科學、中立的大數據為基礎的決策帶有的無處不在的偏差和歧視的風險。
根本上,“道德算法”的問題在于它仍然是一種消極的應對:無論是自上而下的設計還是自下而上的歸納,如果不觸及動力機制,而只是應對發現的問題,無異于在建造房屋的同時挖走地基。今天的人工智能技術發展存在于市場和國家等制度中,道德算法的進路,并未在這些制度中發掘應對人工智能倫理挑戰的空間。
應對人工智能倫理的挑戰能夠采取的行動
真正能夠幫助我們在人工智能倫理領域前行的,或許不是道德算法這類宏大敘事的路線圖。我們可以做的,是避免將社會生活“簡單化”的狂妄設想,從歷史和哲學中謙卑尋求應對的智慧。下面或許是我們當下能夠采取的一些行動:
其一,我們需要關注人工智能決策的道德維度。在已有的人工智能決策應用領域,要特別關注人工智能決策的道德性,不能想當然地把人工智能決策看作是科學的和不可挑戰的。這既關乎社會對因果關系的正常判斷,也是堅持人的道德主體性的具體表現。例如,對公共決策中人工智能的應用,我們保持應有的關注和警醒。
其二,我們需要對具體情境下的人工智能決策的道德性保持敏感并持續進行論辯。人工智能決策是對個人、團體和社會層面決策的模仿。關于具體情境下的人工智能決策是否合乎倫理,如果我們失去了敏感,麻木不仁,只會讓人工智能系統模仿甚至增強這種趨勢。持續論辯是人工智能的道德決策能夠與人一致的前提。如果人工智能無法在具體的道德決策中校準,當決策遷移到更大人群或不同語境時就可能完全不在人性的道德羅盤上。這個問題同樣關乎社會有沒有健康的因果性判斷和是否尊重人的道德主體性。廣為人知的一個例子是微軟的在線人工智能交互機器人,這個機器人上線后,因為一群人使用大量種族主義詞匯和污言穢語而迅速被同化。類似的還有美國法院的人身危害評估系統,這個系統從已有案例中模仿因而習得了對非裔美國人的系統性歧視。
其三,我們需要在人工智能系統中反映人類社會道德生活的豐富性。將發展人工智能倫理的討論通過立法過程、媒體報道、社區參與推向社會,而不僅局限于技術人員之中。技術社群在遇到倫理問題時向社會保持開放,將社會的反饋反映在人工智能倫理決策中。這種方式能最大限度地幫助人工智能倫理系統學習人類道德,因此是對終極準則難題進行回應的一種實踐方式。這個方面最好的例子是隱私權問題。當社會開始討論隱私權的邊界和保護方式時,人工智能系統的決策也更有可能反映人類社會道德生活的豐富性。
其四,我們必須讓弱勢群體可以在人工智能倫理決策上發出聲音。出現終極準則難題的一個主要原因是,不同的人在道德問題上發言權重的不同。在當代社會,無論是女性主義帶來的倫理爭議,還是殘障群體對“何為殘障”問題提出的質疑,都源于長久以來在社會生活中弱勢群體的失聲。要最大限度地回應終極準則難題,應使弱勢群體在人工智能倫理決策上能夠發出聲音。這方面典型的例子是亞馬遜的人工智能人力資源系統對女性歧視引發的爭議,金融科技領域的人工智能風險控制系統對特定種族、地域人群的低信用評估分數等。