生成式 AI 之所以讓人驚艷,卻也令人擔心,都是因為它能越來越像「人」。

舉例來說,只要拿幾張照片,就能合成出 360 度都看不出破綻的一張人臉。

或是錄下講幾句話的聲音,只要短短十五秒,就能採集到聲紋模型,接著就能用相同的口吻說話,騙倒親朋好友。

要用 AI 模仿真人,除了外貌、聲音外,也包括在網路上的行為。

比如,在哪些地方按讚?常在哪裡留言?而除了主動打字、主動拍照來提供這些資訊,也有許多網站或 App,可以只靠注意力在哪個頁面上停留比較久,就模擬出使用者的喜好。

這樣訓練出來的 AI 模型,只要稍加變化,就能在網路世界裡,化身成千千萬萬個不同的「虛擬人」。好比說有篇熱門文章,底下留言上千則,乍看下討論熱烈,但其實往往是同一個 AI 系統合成的不同分身,營造特定情緒,甚至藉此激化對立。

這些留言不同於以往的罐頭訊息,一看就知道是假的。如今有了生成式 AI,每個帳號有不同的大頭照,還能加好友,會打卡、拍照,如真人般的生活史,待特定時機需要操作時,再蜂擁到某處留言。

而要讓這些「虛擬人」更融入人類世界,仍需真人出馬,對它們進行「對齊微調」(alignment tuning),就是教小孩一樣,告訴他們哪些回答更受到我們認可,哪些不是,才能讓 AI 的反應更向人類靠攏。

擬真的 AI,是詐騙的利器;同時也是生產力與創造性的最佳助手。工具是相同的,而其行為良善與否,端看是誰在使用。

去年年底,我在「超智慧對齊」這篇專欄裡,提到的自動對齊技術「憲法式 AI」,如今已經開源,任何人都可以自由運用。只要讓一群人寫下「AI 如何回答比較好」的原則文件,不同屬性、文化的人會有不同的偏好,就像不同國家的風俗民情,人民會有不同的認知一樣。

例如,新聞業對於一個問題,會希望 AI 追求來源的真實性,如果沒有足夠證據支持,寧可 AI 系統說他不知道,不要回覆幻想出來的答案。

但是,對於一群科幻小說作家,要求的可能就完全相反,反而會希望 AI 盡可能地有創意,就算是瞎掰也沒有關係,只要看起來引人入勝就好。

因此,兩種「憲法」訓練出來的 AI,反應方式就會截然不同。不會有一套 AI 系統能放諸四海皆準,唯有透過對齊微調的方式,才能讓 AI 系統更靠近使用者,更能像「人」地互動。