AI 的成「人」之路

生成式 AI 之所以讓人驚艷，卻也令人擔心，都是因為它能越來越像「人」。

舉例來說，只要拿幾張照片，就能合成出 360 度都看不出破綻的一張人臉。

或是錄下講幾句話的聲音，只要短短十五秒，就能採集到聲紋模型，接著就能用相同的口吻說話，騙倒親朋好友。

要用 AI 模仿真人，除了外貌、聲音外，也包括在網路上的行為。

比如，在哪些地方按讚？常在哪裡留言？而除了主動打字、主動拍照來提供這些資訊，也有許多網站或 App，可以只靠注意力在哪個頁面上停留比較久，就模擬出使用者的喜好。

這樣訓練出來的 AI 模型，只要稍加變化，就能在網路世界裡，化身成千千萬萬個不同的「虛擬人」。好比說有篇熱門文章，底下留言上千則，乍看下討論熱烈，但其實往往是同一個 AI 系統合成的不同分身，營造特定情緒，甚至藉此激化對立。

這些留言不同於以往的罐頭訊息，一看就知道是假的。如今有了生成式 AI，每個帳號有不同的大頭照，還能加好友，會打卡、拍照，如真人般的生活史，待特定時機需要操作時，再蜂擁到某處留言。

而要讓這些「虛擬人」更融入人類世界，仍需真人出馬，對它們進行「對齊微調」（alignment tuning），就是教小孩一樣，告訴他們哪些回答更受到我們認可，哪些不是，才能讓 AI 的反應更向人類靠攏。

擬真的 AI，是詐騙的利器；同時也是生產力與創造性的最佳助手。工具是相同的，而其行為良善與否，端看是誰在使用。

去年年底，我在「超智慧對齊」這篇專欄裡，提到的自動對齊技術「憲法式 AI」，如今已經開源，任何人都可以自由運用。只要讓一群人寫下「AI 如何回答比較好」的原則文件，不同屬性、文化的人會有不同的偏好，就像不同國家的風俗民情，人民會有不同的認知一樣。

例如，新聞業對於一個問題，會希望 AI 追求來源的真實性，如果沒有足夠證據支持，寧可 AI 系統說他不知道，不要回覆幻想出來的答案。

但是，對於一群科幻小說作家，要求的可能就完全相反，反而會希望 AI 盡可能地有創意，就算是瞎掰也沒有關係，只要看起來引人入勝就好。

因此，兩種「憲法」訓練出來的 AI，反應方式就會截然不同。不會有一套 AI 系統能放諸四海皆準，唯有透過對齊微調的方式，才能讓 AI 系統更靠近使用者，更能像「人」地互動。