台灣新聞通訊社-輝達最新生成式AI「Fugatto」 1指令搞定音效、悲傷語氣也能模仿

“>

” style=”max-width:100%;”>

▲Fugatto AI系統可依照使用者輸入的文字指令,自動產生或改變任何音樂、人聲及音效。(圖/翻攝自NVIDIA官網)

輝達(NVIDIA)研發團隊推出全新音訊人工智慧系統「Fugatto」,只要輸入文字指令,就能自動產生或改變任何音樂、人聲及音效。這套系統不僅能創作音樂、去除或新增樂器、改變口音與情緒,還能產生前所未聞的全新音效,為音樂創作、遊戲開發及廣告製作開創嶄新可能。

科技畫重點

■採用25億參數及32顆NVIDIA H100 GPU晶片運算

■可依照文字指令產生或改變任何音樂及音效

■支援多種語言及口音轉換功能

■整合多項AI技術創造前所未聞的音效

輝達應用音訊研究經理Rafael Valle表示,Fugatto是首個展現多任務學習能力的基礎生成式AI模型,可根據不同指令組合產生多樣化的音訊效果。系統運用「ComposableART」技術,讓使用者能自由組合不同指令,例如讓文字以法語口音及悲傷語氣朗讀。

“>

” style=”max-width:100%;”>

▲Fugatto AI系統能讓小提琴發出貓叫聲,創造前所未有的新音效。(圖/翻攝自NVIDIA官網)

多白金唱片製作人兼詞曲創作者Ido Zmishlany指出,Fugatto讓音樂創作者能即時產生全新音效,為音樂創作開啟新篇章。廣告公司也能運用此系統,快速為現有廣告配音加入不同口音及情緒,製作多版本廣告。遊戲開發商則能依遊戲情節即時產生音效,提升遊戲體驗。

Fugatto由來自印度、巴西、中國、約旦及南韓等地的研發團隊共同開發,訓練資料包含數百萬筆音訊樣本。系統採用25億參數,搭配32顆NVIDIA H100 GPU運算晶片進行訓練,未來可望應用於更多音訊創作領域。

更多新聞:智慧生活與EV雙贏!南韓77年電子大廠改組4大公司 影響5千員工

關鍵字:輝達,NVIDIA,人工智慧,AI,音訊,音效,Fugatto,Rafael Valle,GPU,音樂創作,語音技術,音訊合成,遊戲音效,廣告配音

2024/11/26 13:47

轉載自三立新聞網: https://www.setn.com//News.aspx?NewsID=1569818&utm_campaign=viewallnews