浅谈suno ai音乐生成

苏打是药

2024年03月18日 19:07

最近Suno AI的智能生成音乐引起了部分讨论，该算法生成的完成度远高于谷歌之前的那个模型。之前的模型存在音质较差，clip间衔接不连贯等诸多问题。对比之下suno产生的影响可能是爆杀。

我们先看一下suno有哪些特点

优点：

1. 操作简单，成本较低。输入歌词及曲子描述就能在一分钟完成一个生成的长片段。

2. 质量完成度高，各种组成非常教科书。好听程度上能吊打一众音乐

3. 混音质量也较好，可能会为之后的ai混音做铺垫

缺点：

1. 成分复杂的歌较难复刻。例如音准比较难定位的一些即兴音乐以及古典音乐，还有配器组成较为复杂的音乐。

2. 风格容易出现趋向性的同质化（贴标签

3. 容易出现差异化的质量。

4. 音质较差，很难应用于高解析度的音乐

首先谈一下可能对音乐产业的影响。

1. 这么一个低成本的工具，假如普及，那首先衔接的就是短视频行业的音乐。因为他们刚好抓的是下沉市场，也刚好贴合定位。这会洗刷掉很多质量不高的音乐。同时结合AI换声（孙燕姿…），可能会出现很多vocalfake和musicfake的情况，音乐可以成为一个黑盒产业。

2. 当音乐素材变得极为容易获得时，缝合艺术可能会进展到一个新的高度。比较技术的mashup或者蒙太奇类型音乐可能会发展，也会发展音频剪辑。

3. 当音乐市场需要对冲自动化生产的量产AI产物时，中高端市场可能会更加崇尚定制化音乐以及个性化音乐。中端市场会把价格压到很低去与AI进行硬性指标对抗，高端则会产生溢价空间

接下来是一些衍生的方向

1. 线下live及演出。追求真实的人当发现音乐不再那么真实的时候，会寻求跨维度的三次元体验

2. 音乐教育。量产的高完成度音乐的普及，同时也会带动教育产业。其中可能教育产业已经有的断层，假如不能及时去填平容易出现野蛮生长的情况。AI音乐的崇尚会去否定一些爱好者的价值

3. 全景声与空间音频的普及。这类音乐素材并没有那么多去学习，而且假如学习，成本会相对大不少。现在的智能设备的迭代，以及软平台都在推崇空间音频类音乐。现在已经逐渐出现了全景声与空间音频下放的土壤

4. HIFI设备与Hires，与混音。之前也提到AI音乐生成的是码率不高的文件，因此音质需要往超越AI音乐的方向发展。其实现在已经有了高码率与传输的土壤，AI音乐可能可以促使软硬件上的下放。而HIFI设备则作为经过层层加工后对高音质及高解析的一种检验。同时混音上，听感好但混音糊的作品可能会有危机感，因为AI学习频响感觉成本并不难。混音的侧重点可能会逐渐从听感好变成清晰分离度高及声场还原。

以上便是我对这玩意大概分析

这玩意真tmd好玩！嘿嘿嘿…

cv33276159

分享至

投诉或建议