设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

AI 绘画火得,AI 唱歌火不得?

果壳硬科技 2022/11/19 19:31:05 责编:远生

同样是 AIGC,有些人正在用 AI 源源不断地生成梗图,有些人则用 AI 生成音乐;同样是 AIGC 生成音乐,有些在模仿人类,有些在复刻经典。AIGC 是个工具,在不同人的手里产生不同的价值,这个数字可能高达数万亿美元。[1]

在 AIGC 面前,还有谁不跪下

临近 2022 年尾声,AIGC 成为今年最受关注的技术关键词之一。只需要几句描述,就能让 AI 进行联想并作画,通过最直接、最快速的视觉反馈,给人类对艺术的常规理解带来冲击。

属于比较不怎么样的 AI 绘画

通过上一篇文章《AI 厂工什么时候开始赛博搬砖?》,你大概已经知道了 AIGC 是什么以及投资现状。如果展望一下未来,作为 Gartner 口中的“2022 年五大影响力技术之一”,到 2025 年,AIGC 所创造的数据可占到所有已生产数据的 10%。[2]

Gartner 发布的 2022 年技术成熟度曲线 [3]

虽然目前 AIGC 在视觉上的竞争更加充分、发展更快,也更吸引眼球,但是音乐作为人类文化与情感的重要载体,AI 其实也在对该产业进行改造 —— 只是更加潜移默化。

标签、算法、神经语言识别等功能,几乎成为音乐类 App 的标配,它们可以自动生成歌单并推送给用户。现在你打开 QQ 音乐,应该有不少人把选择权直接丢给了“每日 30 首”和“个性推荐”。

如果谁想体验一下音乐品味被嘲笑的感觉,那 AI 也可以提供贴心服务。2020 年底,网络杂志《The Pudding》推出了一款人工智能应用“How Bad Is Your Spotify?”[4] ,该应用的数据库里输入了数以百万计的 Pitchfork 评论、reddit 帖子和唱片店推荐,通过分析用户的 Spotify 播放列表,在嘲笑其音乐品味过于“初级”,或痴迷某个歌手“到了令人不舒服的程度“,热情的 Twitter 用户甚至曾一度挤爆了 Pudding 网站。

AI 对音乐的改造没有止步于兴趣分析或者品位鉴赏。2014 年播出的美剧《天蝎计划》(Scorpion,S2E8)中,讲了一个在当时颇为科幻的故事:一名博客音乐家写出了可以不断制造“神曲”的程序,却因此招来杀身之祸 —— 凶手正是另一个运用程序写歌谋利的创作者。

8 年过去,在大平台们的努力下,《天蝎计划》中的幻想很快成了现实。AI 终于打算真实地对音乐创作过程下手了!

他们都在玩 AIGC,他们都有美好的未来

2016 年 6 月,世界上第一首人工智能创作出的 90 秒钢琴音乐作品诞生,它来自谷歌与加州艺术学院联合推出的“Magenta”项目。

此后,AIGC 音乐越来越多,底层技术则分为两条路子。

一条路子,是“自动作曲”。2017 年,索尼 CSL(计算机科学实验室)人工智能程序 FlowMachines 推出的《老爸的车》(Daddy’s  Car),就是 AI 作曲的成绩,号称 “第一首完全由人工智能创作的完整歌曲”;微软的 AI 则通过分析学习几十首圣诞颂歌,推出过一首名为《城市欢乐时光》(Joyful Time in The City)的 AI 歌曲。

比起 90 秒作品,完整的 AI 自动作曲可谓前进了一大步。但它们仍需从人类浩如烟海的历史音乐作品中汲取灵感,是人类艺术灵感的延伸,像《老爸的车》这样的作品,作曲和编曲由 AI 完成,和声与填词由人类作曲家帮助搞定;《城市欢乐时光》也需要人类辅助完成。其实,这类音乐作品谈不上“完全由人工智能创作”,更多是技术圈地自萌,听众实际接受度得打个问号。

另一条路子,则主打“AI 自动合成音乐作品”。比如腾讯音乐阿波罗声音实验室研发的声音合成技术引擎“凌音”,高度还原和复刻歌手的声音特点,重现艺人经典声音,首位 AI 歌手发布于今年 7 月,基于杨超越的声音合成,只需要歌手 10 分钟左右的录音就能很好地复刻出原声,甚至可以在演唱中带“感情”。此后的成熟作品有《没有寄出的信》(复刻和重现邓丽君的声音),《愿你被这个世界温柔以待》(复刻和重现梅艳芳的声音)。

“自动作曲”与“凌音引擎”的不同之处是,“自动作曲”模仿音乐,“凌音引擎”是使用自主设计的深度神经网络模型,加上既有声音风格元的“合成音乐”,后者并不避讳使用了人类历史上精华艺术作品,并复刻这些艺术风格。

这也是 AIGC 类音乐的另一个发展方向 —— 与其让机器搞原创音乐,不如让机器辅助人创作音乐,并且比起单纯的输出歌曲,还可以做得更多,改变我们过往体验音乐的方式。

谷歌 AI 音乐项目 Magenta 的技术负责人道格拉斯・艾克(Douglas Eck)在接受《科学》杂志(Science)采访时认为,AI 已经是国际象棋高手,但如今已成为人类棋艺精进的帮手,音乐也一样,如今不管机器学习速度有多快,人类都能以更快速度适应和利用 AI 技术来辅助创作,玩出新意 [5]

说得直白点,AI 大可不必取代人类,做个趁手的工具也挺好。而最需要 AI 工具生成内容的,可能不在现实,而在虚拟世界。

也就是,如何把“中之人”彻底数字化。

把 AI 用到刀刃上

AIGC 的音乐进化到今天,已经不同于过往的自动语音合成技术,而是具有更高复刻度,引擎渲染后的 AI 声音在音色、语气上与真人更加接近,在演唱上也更有表现力和“感情”。目前“凌音”技术不仅能让 AI 演唱(官方称“合成“)已存在的曲目,用户也可一键定制由 AI 作词、谱曲、演唱的合成歌曲。

在这种环境下,人们面对的问题是:如何让元宇宙数字人唱跳 Rap 打篮球?

这并不容易,因为视频世界中不仅需要音乐,还要求具备音乐(乐器 / 人类)的声音、口型、表情、动作等元素,更丰富的场景下,还需要舞蹈、运镜、灯光……

如果你使用腾讯音乐天琴实验室的“Music XR Maker 系统”,完全可以实现这些需求,而且应用场景多样化,该系统的首位虚拟人小琴于今年 10 月推出,用 AI 驱动的方式,基于音乐去生成舞蹈表演和歌唱元素,目的是提升运营效率和虚拟人的真实、趣味性。这也给会议、客服、新闻播报等场景提供了更好的解决方案。据了解,很快也将会有一位从“次世代”远道而来、经过层层遴选的“超级歌手”在 TME 出道,或许她将颠覆我们对唱歌的想象,成为开辟“音乐虚拟偶像元年”的天降紫微星。

“不同于大投入定制化的头部虚拟偶像,我们希望将 Music XR Maker 打造成一套高效率、低成本产出数字人的平台,同时让数字人具备更强的实时内容生产能力,让任意音乐、舞蹈、舞台等元素的互动结合成为可能。”QQ 音乐技术副总裁周文江谈到。

元宇宙的 AIGC 音乐也得赚钱啊

2022 年,扎克伯格 100 亿美元烧出来的元宇宙社交平台地平线世界(Horizon Worlds)留存量感人,今年 10 月 16 日,Meta 内部文件被曝光,其中显示地平线世界的月度活跃用户数量不足 20 万,远未达到原本 50 万的预期,且兴趣时长仅仅一个月。

说来好笑,作为一个虚拟世界,元宇宙最缺的却是人,最难的是打造一片好的土壤来吸引人共同创作。

相比较来说,国内另一个元宇宙案例则更为务实,今年 7 月 16 日,腾讯音乐旗下的虚拟音乐嘉年华 TMELAND 联合百事可乐打造了一场沉浸式虚拟 3D 演出。这场虚拟化音乐演出为元宇宙实验提供了内容和主题,而这次商业合作,也给未来虚拟场景营销提供了“标准模板”。这可能是国内 AIGC 领域第一个大商业客户买单的案例。诸多品牌主加持到元宇宙的内容共建中,也将丰富生态,形成有一个有生命力的营销场景。

纵观音乐产业,从早期的 1.0 唱片时代音乐内容的输出集中在少数有资源的专业人士手中;进入到 2.0 流媒体时代,更多音乐从业者参与进来,推荐和分发机制让他们得到了展示机会;随着 3.0 的到来,AIGC 甚至让音乐消费者也拥有反向输出和参与共创的能力。持续加强对 AI 的投入,音乐平台的未来或许是一块比想象中更肥沃的土壤。

足够多的高粘性用户、人对音乐永不厌倦的欣赏、已经培养成型的付费习惯、逐步推进的共创工具(不直接介入创作甚至还能够避免版权纷争)、多元化的场景碰撞,谁说音乐平台不是一块比游戏化的元宇宙更佳的土壤呢?

“元宇宙从来都不是一蹴而就的事情,我们可以利用我们已经成熟的技术,去实现一个基础的版本,然后不断的去提升各项技术,去完善元宇宙体验。”针对音乐 + AI 的更多可能性,天琴实验室计算机视觉负责人董治说到:“我们在 AI 驱动上的核心能力,它们都有一个共同点,就是通过音乐,用 AI 的方式,去生成虚拟世界的各项基础元素。“

关于 AI 艺术的一些后话

从 AI 写稿,到 AI 作画,再到 AI 音乐与视频,AIGC 始终面临一些争议:如果生成的内容不够好,那它存在的意义是什么?如果它生成的内容足够好(且这可能是未来的必然),那它会激起新一轮职业替代恐慌吗?人类的精神娱乐生活会被 AI 接手吗?

这也许是一系列纠缠恒久的话题。技术乐观主义者经常会说,工具的好坏取决于使用者的目的。

实际上,互联网一直在做的,就是让更多人更方便地享受到科技提升带来的乐趣,音乐领域也如是。如果我们在国内把凌音引擎、Music XR Maker 等工具开放给所有有需要的音乐人、制作机构或者内容公司,再通过音乐元宇宙和 AIGC 帮助听众尽快进入到虚实结合的音乐体验中,未来甚至成为全民在音乐领域共创的得力工具,让每个人能按照自己的想象去制作音乐,享受音乐,那也许是个更值得期待的未来。

References:

  • [1] Generative AI: A Creative New World 2022.9.9 https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/

  • [2] Predicts 2021: Artificial Intelligence and Its Impact on People and Society  https://www.gartner.com/en/documents/3995104

  • [3] What’s New in Artificial Intelligence from the 2022 Gartner Hype Cycle https://www.gartner.com/en/articles/what-s-new-in-artificial-intelligence-from-the-2022-gartner-hype-cycle

  • [4] How Bad Is Your Streaming Music? https://pudding.cool/2020/12/judge-my-spotify/

  • [5] Science:How Google is making music with artificial intelligence https://www.science.org/content/article/how-google-making-music-artificial-intelligence  doi: 10.1126/science.aan7216

本文来自微信公众号:果壳硬科技 (ID:guokr233),作者:干麻鸭, 编辑:一萌 

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:AI

软媒旗下网站: IT之家 辣品 - 超值导购,优惠券 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 魔方 酷点桌面 Win7优化大师 Win10优化大师 软媒手机APP应用