智通财经APP得悉,英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式人工智能(AI)模型,旨在为制造音乐、电影和视频游戏的人们供给服务。
依据英伟达的说法,这款模型名为Fugatto(Foundational Generative Audio Transformer Opus),能够运用任何文本和音频文件来生成或修正音乐和声响。
例如,该模型能够依据文本提示创立音乐片段,从现有歌曲中删去或增加乐器,改动声响中的口音或心情,乃至宣布从未听过的声响。
英伟达运用音频研讨司理、管弦乐队指挥兼作曲家Rafael Valle表明:“咱们期望创立一个能像人类相同了解和发生声响的模型。”
英伟达指出,广告代理商能够运用Fugatto快速定位多个区域的现有广告,并在配音中参加不同的口音和情感。此外,视频游戏开发者能够运用人工智能模型修正游戏中预先录制的财物,以适运用户在玩游戏时不断改变的动作。
Fugatto能够使小号宣布狗吠声或萨克斯管宣布喵喵声。该公司弥补说,经过微谐和少数的歌唱数据,研讨人员发现它能够处理未经预先练习的使命,比如从文本中生成高质量的歌声。
英伟达表明,Fugatto的完好版别运用了25亿个参数,并在包括32个Nvidia H100 Tensor Core GPU的Nvidia DGX体系进步行了练习。该模型的全体作业耗时一年多。
Fugatto或许会与Runway等草创公司以及 Meta Platforms(META.US)等大公司的相似技能打开竞赛。10月,Meta 发布了名为Movie Gen的人工智能模型,该模型能够依据用户提示创立传神的视频和音频编排。
本年 2 月,ChatGPT制造商OpenAI推出了Sora,它能够依据文本指令创立传神且赋有想象力的场景。这家由微软(MSFT.US)支撑的公司尚未向大众发布文本转视频模型。
更多港股重磅资讯,下载智通财经app
更多港股及海外理财资讯,请点击www.zhitongcaijing.com(查找“智通财经”);欲参加智通港股出资群,请加智通客服微信(ztcjkf)
本文源自:智通财经网
现在,AI不仅能作诗绘画,还能挖矿超越99%的传统勘探项目未能成为矿山。在曩昔的30年里,成功率急剧下降,而本钱却在上升。而打破这一沉寂的是AI。本年2月,AI探矿技能草创公司KoBold Metal...
财联社5月16日讯(修改 黄君芝)美国联邦调查局(FBI)周四正告称,一种歹意短信进犯正在针对政府官员及其熟人,黑客正经过人工智能(AI)生成语音信息,假充美国高级官员,以获取他们的数据。FBI表明,...
来历:明话频道胖东来商贸集团近来发布声明,称近来发现多个第三方渠道的账号,未经授权私行使用AI技能手段生成于东来先生的声响,并关于东来先生或胖东来商贸集团享有著作权的视频内容进行不合法编排和篡改,参加...
中新网北京5月12日电(记者 吴涛)“开口说话,不是跟着生长,人人都会具有的才能。”据世界卫生安排估量,全球约有10亿残疾人,仅在我国,就有超1700万视障者、2300万听障者和7000万读写妨碍者。...
修改:修改部 HYZ【新智元导读】开年放大招!阶跃星斗重磅晋级 Step 系基座模型全家桶,一口气连更上新 6 款模型。作为业界公认的「多模态卷王」,这家 AI 明星公司现在已具有业界最全模型矩阵。接...
胖东来商贸集团11月24日发布声明。内容如下:近来,公司在第三方网络渠道发现多个账号,未经授权私行运用AI技术手段生成于东来先生的声响,并关于东来先生或公司享有著作权的视频内容进行不合法编排和篡改,参...