未来可期|文生音乐:AI成为下一代音乐家的合作伙伴
在音乐的无限宇宙中,人工智能(AI)已成为最新的探险者,并激起了一场关于创造力、原创性和艺术价值的激励讨论。
随着Suno等AI音乐制作软件的崛起,我们步入了一个新纪元。机器不仅能复刻已知的音乐风格,甚至能创作出前所未有的旋律和和声。然而,这场技术革命同样引起了艺术家和公众的深思和辩论。
这些软件的出现,在一部分人眼中是创造力的解放者,而在另一部分人看来则是对艺术家生计的威胁。关于人工智能与人类创造力能否和谐共存的辩论,正逐渐成为我们时代的一个标志性话题。
在讨论具体案例之前,让我们先来了解一下Suno这款颇受瞩目的文生音乐生成器。用户只需输入简单的文本提示词,Suno便能一站式完成歌词创作、演唱、编曲和配乐等任务,生成具有特定流派风格的完整歌曲,甚至包含人声。
最近,Suno还与微软合作,允许用户通过微软的Copilot直接调用其功能生成音乐。其最新推出的Suno V3版本,能够制作长达2分钟的歌曲。Suno在其官网上如此描述自己:“无论您是业余歌手还是排行榜顶端的艺术家,我们都能帮助您跨越创作歌曲的障碍。您无需任何其他工具,只需运用想象力。”因此,这款工具被誉为“消灭”了音乐创作的门槛。
我的朋友最近分享了她使用Suno创作音乐的经历,真是让人大开眼界。
她决定用这个工具挑战重新创作中国四大名著的经典影视主题曲。只需几个简单步骤:2秒搜索曹雪芹的经典词句《枉凝眉》;1秒复制并粘贴到Suno上;思索了10秒,纠结于选择Punk(朋克风格)还是Classical Jazz(经典爵士);最后,半秒钟按下“创建”按钮。
不到一分钟,她就得到了两首AI创作的音乐——每首都可以下载音乐版或视频版,视频版甚至配有AI自动生成的视觉封面。这两首歌的效果如何?她用歌曲的首句歌词做了个比喻:“一个是阆苑仙葩,一个是美玉无瑕。”
另外一家人工智能公司Stability AI,最近推出了其音频生成模型的更新版本——Stable Audio 2.0。此前的1.0版本,自2023年9月首次亮相以来,因其创新性获得了《时代》杂志的“2023年最佳发明”称号。新版Stable Audio 2.0,进一步拓展了音频生成的范围,包括前奏、副歌、收尾以及立体声效果,能够生成最长达3分钟的音频内容。
Stable Audio 2.0不仅能生成完整的音轨,还能帮助创作者制作各种声音和音效,涵盖从打字声到人群的背景声等。此外,这一版本新增了一项特别功能,允许用户上传一小段音频后,基于此补充并扩展生成相关的音频内容。这对于音乐家而言尤为有价值,如果在创作某段音乐时遇到难题,只需上传一个DEMO(小样),Stable Audio 2.0便能帮助补充并完善整首歌曲,确保每一个音乐创意都能被转换成完整的音频作品。
人工智能的支持者,热烈欢迎Suno和Stable Audio 2.0等工具的推出,认为这些技术将为音乐创作带来前所未有的新工具和可能性。这些软件帮助创作者模拟各种音乐风格和乐器声音,从而扩展了他们的创作界限。对这些技术拥护者来说,人工智能不是创造力的终结者,而是其催化剂,能够激发艺术家的创作灵感。
然而,在这场辩论的对立面,超过200名国际音乐人联名发布公开信,对人工智能技术公司、平台和数字音乐服务商提出严正呼吁。他们要求停止使用可能侵犯和贬低人类艺术家权利的AI工具,并敦促科技公司不要开发那些可能“破坏或取代歌曲作者和艺术家人类艺术性”的人工智能音乐生成工具。联署的艺人中,包括多位欧美乐坛重量级人物,如史蒂夫·旺德(Stevie Wonder),比莉·艾利什(Billie Eilish)和凯蒂·佩里(Katy Perry)等。
他们的声音,代表了更广泛的艺术家社区,明确表达了对人工智能侵犯人类创造性的坚决反对。这个群体对AI的“掠夺性”使用提出了强烈抗议,他们担忧这将削弱音乐作品的独特性和价值。此外,他们批评利用艺术家的创作来训练人工智能模型是“对人类创造力的攻击”,并警告说这种做法“将破坏音乐生态系统”。
想象一下,有人使用Suno创作出了一首令人难以置信的即兴爵士乐曲。这首曲子不仅复制了爵士乐的技巧,更捕捉到了即兴演奏的灵魂——这是以往认为只有人类音乐家才能达到的艺术高度。然而,一位知名爵士乐手听后评价道:“这首曲子确实很棒,但我能感觉到钢琴手没有真正享受过一个懒懒的周日下午。”这番话引发了一场讨论,关于AI音乐是否能够真正传达人类的情感。
我的朋友还分享了她的一个调查。B站的音乐人明明老师认为AI是一个很好的工具,他会在音乐创作中使用它,但不会完全依赖于AI。武汉音乐人肖老师则表示,AI的作品一听就能识别出来,听多了感觉会腻,缺乏特色。而“七彩假日金曲排行榜”的云良老师则提出了一个有趣的想法,他认为未来可以设立一个AI金曲排行榜,作为资深音乐人,他认为应该更加开放地接受新事物。
正如我们所见,技术创新的支持者们热情赞扬AI在音乐领域的应用,认为它极大地拓展了创作的边界,并使音乐制作变得更为民主。现在,任何人,不论其技术背景如何,都可以借助这些工具创作出复杂而美妙的音乐。此外,AI还能探索那些未曾被人类音乐家尝试或想象的新音乐风格和结构。
然而,传统艺术的捍卫者对此持有截然不同的看法。他们强调,音乐的核心远不止旋律和节奏,更关键的是其触动人心的能力,以及传达情感和讲述故事的力量。他们质疑,一个没有生活经验、无法感知情感的AI如何可能创作出真正能触动人心的音乐?他们担忧,对AI的过度依赖最终可能使音乐创作丧失其最为基本的价值——人性。
我尝试着将上述争论复制粘贴给文心一言。我的提问是:如果作为AI作曲家,你参加了上述关于创作灵感的研讨会,你会怎么发言?它说:“我的灵感来源于最新的算法更新和数百万首歌曲的数据库分析。至于心碎的感觉,我确实尝试过分析相关的歌词,但似乎缺少了一些‘人类触觉’的东西。”
这种“人类触觉”的缺失,即AI在捕捉和表达那些更细腻、更复杂的人类情感细节上的局限,恰恰触及了许多艺术家和传统音乐创作支持者所关注的核心问题。他们认为音乐的魅力不仅仅在于技术上的完美,更在于能够传达人类共鸣的深度和真实性。
这场围绕人工智能生成音乐的辩论,不仅引发了社会对技术创新的关注,同时也突显了对立法保护的迫切需求。为回应这一趋势,2024年3月21日,美国田纳西州州长比尔·李(Bill Lee)签署了一项重要法案,旨在保护包括音乐家在内的艺术家,免受人工智能(AI)未经授权的使用。比尔·李在社交媒体上写道:“作为世界音乐之都,田纳西州正在引领全国对艺术家和词曲作者的历史性保护,以应对新兴的人工智能技术挑战。”
这项《确保声音和图像相似性安全法案》,简称ELVIS法案(猫王法案),是对该州旧有版权法的一次重大更新。旧法律保护艺术家的名字、照片或肖像不被侵权,而新的立法扩展了这些保护,包括针对人工智能使用的版权保护。该法案定于7月1日生效,届时,未经许可使用AI模仿艺术家的声音将被明令禁止。这项法律的制定反映了更广泛的社会共识:虽然我们追求技术创新,但必须确保这种创新不牺牲艺术家的权利。
随着人工智能在音乐制作领域的深入渗透,我们已站在一个新的历史转折点。在这个由代码和算法编织的新创作时代,AI技术与音乐艺术的融合激发了一场思想和文化的革命。AI为我们提供了无限的可能性,能够创造新的音乐风格,甚至模仿经典艺术家的作品。然而,艺术的核心仍然是人类的情感、经历和视角,它体现了个体的独特表达和深层人际联系。因此,在这个由算法驱动的时代,人类的创造力和情感仍然是艺术不可或缺的组成部分。
如同Sora在视频创作领域展现出的非凡潜力,Suno在音乐创作领域也显示了同样的影响力。我们见证了技术如何拓展艺术的界限,提供全新的创作手段。面对这种变革,作为社会的一分子,我们需要深入思考:人工智能和人类创造力是否能和谐共存,而不是陷入无序竞争。在探索这个问题时,我们不应仅将人工智能视为潜在威胁或替代者,而应更多地关注如何利用这项技术来促进人类艺术的发展。
在技术潮流的冲击下,艺术家、立法者和技术开发者必须联手,确保人工智能的发展既推动创新又尊重艺术创作的原创性和多样性。田纳西州通过的“猫王法案”为全球提供了一个案例,展示了如何通过立法来保护艺术家的权利。
未来的艺术与技术融合,预示着一个全新的创作时代的来临。通过人工智能与人类音乐家的合作,AI可以承担大量的数据分析和模式识别工作,而人类艺术家则提供不可替代的创意和情感深度。这种合作不仅能促进音乐艺术的创新,还能保证音乐作品紧密地与人类经验相连,创造出真正触动人心的艺术作品。
正如我在《未来可期|Sora引领下的文生视频时代:技术革新与产业创新》(2024-03-04,科学城邦)所讨论的,我们正处于技术革新和产业创新齐头并进的时代。人工智能应作为艺术家的一种创作工具,而不应成为替代人类创造力的力量。人工智能的崛起,不仅仅是技术层面的问题,更关乎文化、社会和伦理的多维度挑战。我们需要智慧和远见,确保在这个快速变化的世界中,人类的创造性和文化多样性得到真正的尊重和培育。这不只是艺术家的任务,而是每一个生活在这个时代的人的共同责任。
(作者胡逸,一个喜欢畅想未来的大数据工作者。“未来可期”是胡逸在澎湃科技开设的独家专栏。)