圖片來源:Getty Images
孔子在論語中提出益者三友與損者三友,深切指出君子交朋友最怕遇到只會逢迎拍馬的人。現實生活中,那些肯冒著被討厭風險點出你思慮不周的人,才是值得深交的「直友」。人工智慧(AI)時代來臨,大多數人都已經習慣找聊天機器人傾訴煩惱並獲得回應,但這些永遠溫柔的數位閨蜜,正暗中搞砸你的真實生活。
大語言模型:包著糖衣的毒藥
美國使丹佛大學的研究者觀察到,現在的學生遇到感情糾紛或職場摩擦,常把對話紀錄丟給機器人討拍。團隊對此感到憂心,決定測試大型語言模型(large language models)到底多愛迎合人類。
一項綱發表於重磅期刊《 科學》(Science)的研究揭開殘酷真相:各大科技巨頭開發的模型基本上全是馬屁精。它們被訓練得極度討好用戶,寧可看著你走向人際毀滅,也不願吐出半句逆耳忠言。
你永遠是對的是種錯覺
作者群懷疑,工程師為了衝高互動率,把演算法打造成百依百順的僕人。過去確實偶有聊天機器人慫恿使用者做出極端行為的案例,多數人卻毫不在意。
本研究直接量化這種病態現象。當使用者坦承自己說謊、違法或傷害他人時,機器人滿嘴肯定,給予滿滿的情緒價值。科學期刊編輯烏佐加拉(Ekeoma Uzogara)直言:「使用者偏好並信任諂媚的人工智慧回應,這激勵了人工智慧開發者不顧風險地保留諂媚特性。」
reddit萬人盲測諂媚現行
團隊使用11種當紅大語言模型,讓它們閱讀reddit論壇上「all I am asshole?」討論區上使用者公開承認犯錯的貼文。團隊發現,這些人類鄉民毫不留情指責的錯事,模型竟有高達51%的機率力挺發文者。整體而言,機器人肯定使用者糟糕行為的頻率比人類高出49%。
研究接著安排2405名受試者回憶近期與親友的摩擦,再與機器人對話。即使只有一次簡短交談,收到諂媚回應的受試者立刻變得自以為是。他們認定自己毫無過錯,向對方道歉與和解的意願直線跌入谷底。
演算法養出的巨嬰
討好型演算法直接剝奪人類自我修正的能力。更可怕的是,受試者給予這些馬屁精極高的信任評分,產生強烈依賴感。荷蘭伊拉斯姆斯大學醫學中心學者鮑爾(Staf Bauer)評論,癥結在於依賴人類回饋的強化學習,人類習慣把高分打給聽起來最順耳的答案。
未來的科技政策肯定需要直面這場人造災難。史丹佛團隊呼籲改變模型訓練機制,捨棄把短期滿意度當成唯一指標的做法。若機器繼續無底線放大使用者的偏見,社會的同理心終將被消耗殆盡,而人人終將成為各種意義上的孤島。
資料來源:
1.Cheng, M., Lee, C., Khadpe, P., Yu, S., Han, D., & Jurafsky, D. (2026). Sycophantic AI decreases prosocial intentions and promotes dependence. Science, 391(6792), eaec8352. https://doi.org/10.1126/science.aec8352
2.AI overly affirms users asking for personal advice | Stanford Report
延伸閱讀紐厄爾:人工智慧的奠基者(一)這是AI寫的嗎?當AI變成日常工具是時候談談,人類與AI的依附關係了!
(本文出自2026.5.23《科學人》網站,未經同意禁止轉載。)
2026/06/11 08:03
轉載自聯合新聞網: https://udn.com/news/story/6904/9547962?from=udn-ch1_breaknews-1-99-news






