未来可期｜文生音乐：AI成为下一代音乐家的合作伙伴

胡逸

2024-07-04 13:10

来源：澎湃新闻

在音乐的无限宇宙中，人工智能（AI）已成为最新的探险者，并激起了一场关于创造力、原创性和艺术价值的激励讨论。

随着Suno等AI音乐制作软件的崛起，我们步入了一个新纪元。机器不仅能复刻已知的音乐风格，甚至能创作出前所未有的旋律和和声。然而，这场技术革命同样引起了艺术家和公众的深思和辩论。

这些软件的出现，在一部分人眼中是创造力的解放者，而在另一部分人看来则是对艺术家生计的威胁。关于人工智能与人类创造力能否和谐共存的辩论，正逐渐成为我们时代的一个标志性话题。

在讨论具体案例之前，让我们先来了解一下Suno这款颇受瞩目的文生音乐生成器。用户只需输入简单的文本提示词，Suno便能一站式完成歌词创作、演唱、编曲和配乐等任务，生成具有特定流派风格的完整歌曲，甚至包含人声。

最近，Suno还与微软合作，允许用户通过微软的Copilot直接调用其功能生成音乐。其最新推出的Suno V3版本，能够制作长达2分钟的歌曲。Suno在其官网上如此描述自己：“无论您是业余歌手还是排行榜顶端的艺术家，我们都能帮助您跨越创作歌曲的障碍。您无需任何其他工具，只需运用想象力。”因此，这款工具被誉为“消灭”了音乐创作的门槛。

我的朋友最近分享了她使用Suno创作音乐的经历，真是让人大开眼界。

她决定用这个工具挑战重新创作中国四大名著的经典影视主题曲。只需几个简单步骤：2秒搜索曹雪芹的经典词句《枉凝眉》；1秒复制并粘贴到Suno上；思索了10秒，纠结于选择Punk（朋克风格）还是Classical Jazz（经典爵士）；最后，半秒钟按下“创建”按钮。

不到一分钟，她就得到了两首AI创作的音乐——每首都可以下载音乐版或视频版，视频版甚至配有AI自动生成的视觉封面。这两首歌的效果如何？她用歌曲的首句歌词做了个比喻：“一个是阆苑仙葩，一个是美玉无瑕。”

另外一家人工智能公司Stability AI，最近推出了其音频生成模型的更新版本——Stable Audio 2.0。此前的1.0版本，自2023年9月首次亮相以来，因其创新性获得了《时代》杂志的“2023年最佳发明”称号。新版Stable Audio 2.0，进一步拓展了音频生成的范围，包括前奏、副歌、收尾以及立体声效果，能够生成最长达3分钟的音频内容。

Stable Audio 2.0不仅能生成完整的音轨，还能帮助创作者制作各种声音和音效，涵盖从打字声到人群的背景声等。此外，这一版本新增了一项特别功能，允许用户上传一小段音频后，基于此补充并扩展生成相关的音频内容。这对于音乐家而言尤为有价值，如果在创作某段音乐时遇到难题，只需上传一个DEMO（小样），Stable Audio 2.0便能帮助补充并完善整首歌曲，确保每一个音乐创意都能被转换成完整的音频作品。

人工智能的支持者，热烈欢迎Suno和Stable Audio 2.0等工具的推出，认为这些技术将为音乐创作带来前所未有的新工具和可能性。这些软件帮助创作者模拟各种音乐风格和乐器声音，从而扩展了他们的创作界限。对这些技术拥护者来说，人工智能不是创造力的终结者，而是其催化剂，能够激发艺术家的创作灵感。

然而，在这场辩论的对立面，超过200名国际音乐人联名发布公开信，对人工智能技术公司、平台和数字音乐服务商提出严正呼吁。他们要求停止使用可能侵犯和贬低人类艺术家权利的AI工具，并敦促科技公司不要开发那些可能“破坏或取代歌曲作者和艺术家人类艺术性”的人工智能音乐生成工具。联署的艺人中，包括多位欧美乐坛重量级人物，如史蒂夫·旺德（Stevie Wonder），比莉·艾利什（Billie Eilish）和凯蒂·佩里（Katy Perry）等。

他们的声音，代表了更广泛的艺术家社区，明确表达了对人工智能侵犯人类创造性的坚决反对。这个群体对AI的“掠夺性”使用提出了强烈抗议，他们担忧这将削弱音乐作品的独特性和价值。此外，他们批评利用艺术家的创作来训练人工智能模型是“对人类创造力的攻击”，并警告说这种做法“将破坏音乐生态系统”。

想象一下，有人使用Suno创作出了一首令人难以置信的即兴爵士乐曲。这首曲子不仅复制了爵士乐的技巧，更捕捉到了即兴演奏的灵魂——这是以往认为只有人类音乐家才能达到的艺术高度。然而，一位知名爵士乐手听后评价道：“这首曲子确实很棒，但我能感觉到钢琴手没有真正享受过一个懒懒的周日下午。”这番话引发了一场讨论，关于AI音乐是否能够真正传达人类的情感。

我的朋友还分享了她的一个调查。B站的音乐人明明老师认为AI是一个很好的工具，他会在音乐创作中使用它，但不会完全依赖于AI。武汉音乐人肖老师则表示，AI的作品一听就能识别出来，听多了感觉会腻，缺乏特色。而“七彩假日金曲排行榜”的云良老师则提出了一个有趣的想法，他认为未来可以设立一个AI金曲排行榜，作为资深音乐人，他认为应该更加开放地接受新事物。

正如我们所见，技术创新的支持者们热情赞扬AI在音乐领域的应用，认为它极大地拓展了创作的边界，并使音乐制作变得更为民主。现在，任何人，不论其技术背景如何，都可以借助这些工具创作出复杂而美妙的音乐。此外，AI还能探索那些未曾被人类音乐家尝试或想象的新音乐风格和结构。

然而，传统艺术的捍卫者对此持有截然不同的看法。他们强调，音乐的核心远不止旋律和节奏，更关键的是其触动人心的能力，以及传达情感和讲述故事的力量。他们质疑，一个没有生活经验、无法感知情感的AI如何可能创作出真正能触动人心的音乐？他们担忧，对AI的过度依赖最终可能使音乐创作丧失其最为基本的价值——人性。

我尝试着将上述争论复制粘贴给文心一言。我的提问是：如果作为AI作曲家，你参加了上述关于创作灵感的研讨会，你会怎么发言？它说：“我的灵感来源于最新的算法更新和数百万首歌曲的数据库分析。至于心碎的感觉，我确实尝试过分析相关的歌词，但似乎缺少了一些‘人类触觉’的东西。”

这种“人类触觉”的缺失，即AI在捕捉和表达那些更细腻、更复杂的人类情感细节上的局限，恰恰触及了许多艺术家和传统音乐创作支持者所关注的核心问题。他们认为音乐的魅力不仅仅在于技术上的完美，更在于能够传达人类共鸣的深度和真实性。

这场围绕人工智能生成音乐的辩论，不仅引发了社会对技术创新的关注，同时也突显了对立法保护的迫切需求。为回应这一趋势，2024年3月21日，美国田纳西州州长比尔·李（Bill Lee）签署了一项重要法案，旨在保护包括音乐家在内的艺术家，免受人工智能（AI）未经授权的使用。比尔·李在社交媒体上写道：“作为世界音乐之都，田纳西州正在引领全国对艺术家和词曲作者的历史性保护，以应对新兴的人工智能技术挑战。”

这项《确保声音和图像相似性安全法案》，简称ELVIS法案（猫王法案），是对该州旧有版权法的一次重大更新。旧法律保护艺术家的名字、照片或肖像不被侵权，而新的立法扩展了这些保护，包括针对人工智能使用的版权保护。该法案定于7月1日生效，届时，未经许可使用AI模仿艺术家的声音将被明令禁止。这项法律的制定反映了更广泛的社会共识：虽然我们追求技术创新，但必须确保这种创新不牺牲艺术家的权利。

随着人工智能在音乐制作领域的深入渗透，我们已站在一个新的历史转折点。在这个由代码和算法编织的新创作时代，AI技术与音乐艺术的融合激发了一场思想和文化的革命。AI为我们提供了无限的可能性，能够创造新的音乐风格，甚至模仿经典艺术家的作品。然而，艺术的核心仍然是人类的情感、经历和视角，它体现了个体的独特表达和深层人际联系。因此，在这个由算法驱动的时代，人类的创造力和情感仍然是艺术不可或缺的组成部分。

如同Sora在视频创作领域展现出的非凡潜力，Suno在音乐创作领域也显示了同样的影响力。我们见证了技术如何拓展艺术的界限，提供全新的创作手段。面对这种变革，作为社会的一分子，我们需要深入思考：人工智能和人类创造力是否能和谐共存，而不是陷入无序竞争。在探索这个问题时，我们不应仅将人工智能视为潜在威胁或替代者，而应更多地关注如何利用这项技术来促进人类艺术的发展。

在技术潮流的冲击下，艺术家、立法者和技术开发者必须联手，确保人工智能的发展既推动创新又尊重艺术创作的原创性和多样性。田纳西州通过的“猫王法案”为全球提供了一个案例，展示了如何通过立法来保护艺术家的权利。

未来的艺术与技术融合，预示着一个全新的创作时代的来临。通过人工智能与人类音乐家的合作，AI可以承担大量的数据分析和模式识别工作，而人类艺术家则提供不可替代的创意和情感深度。这种合作不仅能促进音乐艺术的创新，还能保证音乐作品紧密地与人类经验相连，创造出真正触动人心的艺术作品。

正如我在《未来可期｜Sora引领下的文生视频时代：技术革新与产业创新》（2024-03-04，科学城邦）所讨论的，我们正处于技术革新和产业创新齐头并进的时代。人工智能应作为艺术家的一种创作工具，而不应成为替代人类创造力的力量。人工智能的崛起，不仅仅是技术层面的问题，更关乎文化、社会和伦理的多维度挑战。我们需要智慧和远见，确保在这个快速变化的世界中，人类的创造性和文化多样性得到真正的尊重和培育。这不只是艺术家的任务，而是每一个生活在这个时代的人的共同责任。

（作者胡逸，一个喜欢畅想未来的大数据工作者。“未来可期”是胡逸在澎湃科技开设的独家专栏。）

责任编辑：吴跃伟

图片编辑：金洁

校对：张艳