曾經(jīng)熟悉的聲音還能當真嗎?AI語音克隆技術(shù)引發(fā)爭議
2023年06月08日 11:02 來源:科技日報

  【今日視點】

  ◎本報記者 張佳欣

  1970年4月,披頭士樂隊解散,數(shù)百萬歌迷們傷心不已。50多年后的今天,人工智能(AI)正在將“逝去的記憶”復活,重新創(chuàng)作和重新想象披頭士樂隊的演唱。

  AI聲音模擬得如此逼真,也引發(fā)了一系列倫理和法律問題,甚至導致了電信詐騙的出現(xiàn)。據(jù)澳大利亞Insider Guides網(wǎng)站報道,最新報告顯示,2022年澳大利亞人因詐騙損失了創(chuàng)紀錄的31億美元。

  聲音克隆易被騙子利用

  在電信詐騙中,騙子用AI軟件掃描語音記錄并復制,準確率高達99%。他們可以從社交媒體的視頻和其他上傳音頻中提取片段,將其輸入AI軟件,重現(xiàn)聲音并說出不同短語或句子。

  澳大利亞悉尼科技大學電氣與數(shù)據(jù)工程學院副教授迪普·阮晉勇表示,AI模型可以將相對較短的語音片段和字符串片段重建為連貫的句子。有些模型和算法只需一分鐘甚至更短時間,就能合成一段相當高質(zhì)量的克隆聲音。

  阮晉勇表示,先進的AI模型和算法可以很好地合成聲音,以至于“普通人很難區(qū)分克隆的聲音和真實的聲音”。

  美國《時代》周刊報道稱,幾個月前,亞利桑那州的一個家庭以為接到了綁架電話,電話里的聲音聽起來與親人的聲音別無二致,結(jié)果發(fā)現(xiàn)這是一個完全由AI制造的騙局。越來越多騙局的出現(xiàn)讓人們擔心AI可能成為威脅人們的技術(shù),而且這種技術(shù)很容易獲得。

  AI讓普通人變歌星

  AI聲音克隆也擴展到音樂領(lǐng)域,人們用該技術(shù)創(chuàng)作出與明星的聲音完全相同的歌曲。最近,一位名叫“Dae Lims”的創(chuàng)作者在社交媒體發(fā)布了幾首用AI創(chuàng)作的歌曲。

  “好聽哭了!這太美了!”一位聽眾在《New》歌曲下評論道,這首歌是保羅·麥卡特尼2013年的單曲,它在AI的幫助下被重新制作,并由麥卡特尼的朋友、1980年已故的約翰·列儂“演唱”其中的部分橋段。

  類似的例子還有今年4月,國外網(wǎng)友“Ghostwriter977”用知名說唱歌手Drake和R&B歌手The Weeknd的聲音對AI進行訓練,模仿兩人音樂風格生成了“合唱”歌曲《我袖子上的心》。這首歌一經(jīng)發(fā)布,便在社交媒體瘋傳。

  “我們真的進入了一個新時代!币晃宦牨娫谠u論中回應(yīng)道,“甚至無法分辨什么是合法的,什么是假的。”

  作曲家、美國斯坦福大學音樂與聲學計算機研究中心助理教授帕特里夏·亞歷桑德里尼表示,最近大量的AI曲目代表了一項技術(shù)的成熟,該技術(shù)一直在呈指數(shù)級發(fā)展,但在過去十年中基本不為公眾所關(guān)注。這意味著,現(xiàn)在人們可以對AI進行任何方面的訓練,但“我們不能指望它會取代人類創(chuàng)造藝術(shù)和文化的豐富歷史”。

  給音樂行業(yè)帶來威脅

  對于音樂行業(yè)來說,AI克隆聲音生成音樂的影響是巨大的。隨著技術(shù)進步,在不久的將來,人們可以利用某款軟件很容易地將自己的歌聲轉(zhuǎn)換為自己最喜歡的歌手的聲音。

  事實已經(jīng)證明,AI對版權(quán)界產(chǎn)生了巨大影響。

  在《我袖子上的心》案例中,作為兩位歌手簽約的唱片公司,環(huán)球音樂集團(UMG)很快提出了版權(quán)主張,并要求從流媒體服務(wù)中撤下這首歌曲。

  紐約的音樂版權(quán)律師馬克·奧斯特羅則表示,AI生成的音樂是一個“灰色地帶”。

  版權(quán)如何界定?什么程度的復制才是“合理使用”?又怎么阻止其不合理性使用的擴大化?

  美國國家音樂出版商協(xié)會(NMPA)主席兼首席執(zhí)行官大衛(wèi)·伊斯雷特表示,應(yīng)允許詞曲作者和音樂出版商更好地保護他們的作品免受未經(jīng)授權(quán)的使用,這在AI時代將受到前所未有的挑戰(zhàn)。

編輯:陳少婷