近來生成式AI(Generative Artificial Intelligence)的快速發展,為全球帶了一股衝擊性的產業變革力量,其強大的內容生成能力可有效地支援內容創作者的工作,甚至取代創作者本身。AI取代人類工作的趨勢正快速發展中,依據人力資源公司Challenger, Gray & Christmas, Inc.報告指出,今年5月美國減少的工作職位中,約有4千個職位可歸因於AI。
由於生成式AI模型是透過大量資料進行學習,這些用以訓練學習的資料往往未獲授權,因此也引起侵害著作權的疑慮。美國編劇工會今年5月的罷工,主要訴求之一就是要求不得利用AI撰寫或改寫劇本,也不得將會員寫的劇本拿去訓練AI,凸顯出內容創作者對AI取代其工作以及侵害其作品權益的雙重擔憂。由此可見,AI透過學習創作者過往的工作成果而發展出來的內容生成能力,已經威脅到創作者本身的工作權。
生成式AI是什麼
生成式AI是AI的一種應用類型,透過學習大量的資料集(dataset),抽象分析出資料的本質規律和機率分布,進而自動生成新的資料,這些資料可能是文章、圖片、音樂、影片、程式碼等內容。使用者只要輸入提示詞(prompt),AI即可自動生成相應的內容。
目前生成式AI模型的學習訓練,主要應用以下幾種技術:
生成對抗網路
Generative Adversarial Networks
由兩個神經網路組成,一個是生成器,負責生成新的資料,另一個為判別器,負責判斷資料的真假。兩個網路相互對抗、不斷調整,最終目的是使判別器判斷不出資料是生成的還是學習用的資料。
轉換器模型
Transformer Model
採用注意力或自我注意力機制的神經網路,可藉由追蹤序列資料中的關係,學習上下文之間的脈絡及意義,並且可以平行處理整個序列,提高效率和準確度。
長短期記憶網路
Long Short-Term Memory Network
屬於循環神經網路(Recurrent Neural Network)一種,可以處理序列資料,如文字、語音、時間序列等。具有記憶單元,可以保存長期的相關資訊,適合處理和預測時間序列中間隔和延遲非常長的重要事件。
擴散模型
Diffusion Model
透過對資料進行添加雜訊過程,來模擬資料在隱藏空間(Latent Space)的擴散方式,然後通過學習逆轉這個擴散過程,來恢復原始資料或生成新資料,適合處理圖片、影像等資料。
生成式AI已有各種應用產品問世,如撰寫文章的ChatGPT、Jasper,繪製圖像的Midjourney、DALL·E、Stable Diffusion,生成影片的Maverick、BHuman,影像剪輯的Descript、Vidyo.ai,音樂合成的MuseNet、Boomy,聲音剪輯的Cleanvoice、Podcastle,以及撰寫程式碼的GitHub Copilot等。
<span class="g-head">生成式AI相關應用產品發展</span>
烽火延燒的著作權侵權爭議
2022年8月底一幅利用Midjourney生成,名為《太空歌劇院》(Théâtre D’opéra Spatial)的畫作在一場數位藝術競賽獲得冠軍,掀起AI作畫是否屬於人類藝術創作的熱議。這幅畫向公眾展現出AI強大的圖片生成能力,也讓更多人瞭解AI生成內容的能力來自於大量資料的學習,進而引發AI學習是否涉及侵權的討論。
內容創作者實際使用AI生成工具時,陸續發現AI開發者未經授權而使用其作品的證據,如AI可精準地提供知名作者小說的摘要,可以生成特定插畫家風格的作品,甚至直接提供工程師撰寫過的程式。從2022年底軟體工程師集體控告OpenAI、GitHub開發的程式碼生成器侵權,各內容產業紛紛出現AI侵權爭議,網路圖庫公司Getty Images於2023年初針對Stability AI提起侵權訴訟,指控該公司未經授權使用Getty上千萬張圖片去訓練AI模型Stable Diffusion,侵害到Getty的版權。
文化內容創作者不但出現反對AI生成內容運動,也針對AI開發公司未經同意而將其作品用於AI學習提起侵權訴訟,如Kelly McKernan等三位視覺藝術家集體控告Stability AI、Midjourney與DeviantArt等公司、美國喜劇演員Sarah Silverman與兩位作家共同控告Meta和OpenAI等。
音樂唱片公司則採取更直接的禁止行動,要求各影音平台下架旗下歌手的AI深偽作品,Spotify也於5月下架平台上的AI生成歌曲。美國唱片業協會則要求Discord關閉分享大量版權歌曲的AI Hub伺服器,並交出那些上傳與分享歌曲的用戶資料。
面對這些侵權指控,AI開發公司主張使用版權物進行AI訓練屬於美國著作權法中的合理使用,因此無須經過授權,不過創作者顯然不這樣認為,相關侵權訴訟仍持續出現。
不少網路內容平台為避免爭議紛紛禁止上架AI生成內容,如日本最大的同人作品數位發行平台DLsite在5月宣布停售AI生成的圖像作品,Steam也於6月拒絕了內含AI生成素材的遊戲申請上架。而Adobe於今年6月宣布新推出的AI生成圖像產品Firefly,強調其學習的資料均來自於自有圖庫、開放授權與公有領域的作品,以避開可能的侵權爭議。
{{trace-4b-1="/style-guide"}}
各國政府動起來
生成式AI的侵權爭議涉及兩股龐大商業利益的競合,一邊是快速成長的AI產業以及各種應用市場,一邊則是涵蓋影視、音樂、出版與遊戲等內容的娛樂產業,如何規範AI學習涉及的版權內容也成為許多內容產業大國必須處理的重大課題。
由於歐盟、英國、日本等國家為了促進大數據與機械學習的技術發展,規定基於研究或非商業目的進行的文字與資料探勘(Text and Data Mining)無須事先取得授權。因此日本政府於今年5月底發布書面文件,說明依據日本著作權法,利用版權內容進行AI學習開發,原則無須取得授權,但利用AI生成作品,並進行散播或販售,就可能產生侵權行為。日本對於侵權的認定聚焦在AI生成的內容,而非AI學習過程。
而歐盟於今年6月14日通過的AI法案,則規定必須揭露AI學習所使用的版權內容,希望透過AI學習過程的透明化以兼顧AI創新與著作權保護。而美國著作權局於今年5月陸續針對文學與軟體、視覺藝術、影視、音樂等內容產業召開公聽會,收集業界對於AI與著作權的意見,以作為研擬對策之依據。
另一個文化內容大國南韓於今年5月初宣布,將針對AI生成內容的著作權相關議題訂定新的標準與指南。而臺灣政府除了草擬AI基本法,經濟部也成立專案小組,針對生成式AI的著作權爭議研擬相關指引。
合理使用的範圍
由於全球主要的生成式AI模型開發公司多為美國企業,所以AI侵權訴訟目前大多發生在美國,美國法院的判決不但會牽動全球生成式AI與娛樂內容兩大產業的龐大利益,也將影響未來AI的全球規範架構。
雖然各項侵權訴訟結果尚未塵埃落定,不過美國最高法院今年5月對於攝影師Lynn Goldsmith控安迪沃荷基金會(Andy Warhol Foundation)侵權的判決,可能會危及主張AI學習屬於美國著作權法中合理使用的立論基礎。
本訴訟案起源於1984年Goldsmith將其拍攝的歌手王子(Prince)肖像照授權沃荷創作成雜誌封面。2016年王子過世時,基金會將沃荷利用Goldsmith的照片創作但未發表的《橘色王子》(Orange Prince)作品授權雜誌作為封面以紀念王子,Goldsmith發現《橘色王子》係以其拍攝作品加工創作,因而提起侵權訴訟。基金會主張該作品創作屬於一種對原作的轉化性使用(Transformative Use),屬於著作權的合理使用範圍。
不過最高法院認定2016年當作雜誌封面的《橘色王子》與1984年雜誌封面的王子圖像有相同使用目的,且均有商業性質,因此非屬合理使用。這意味著AI生成的新作品如果與學習用的原作品有類似的使用目的與性質,法院可能不會認定為是對原作的合理使用。
{{trace-4b-2="/style-guide"}}
生成式AI的著作權爭議通常也夾雜著侵害人格權與隱私權等問題,如利用AI生成歌手聲音可能會侵犯歌手的人格權,OpenAI也被控利用個人醫療紀錄訓練ChatGPT,義大利政府曾因ChatGPT涉有蒐集用戶資料的疑慮而禁止在義大利使用,直到更新隱私保護政策後才同意開放。
此外,AI強大的內容生成能力不只威脅內容創作者的工作權,也可能因為易於產出各種虛假資訊與假新聞,引發更嚴重的社會道德與安全危機。因此如何建立有效的AI監管制度,現已成為各國政府當務之急。