最近Suno AI的智能生成音乐引起了部分讨论,该算法生成的完成度远高于谷歌之前的那个模型。之前的模型存在音质较差,clip间衔接不连贯等诸多问题。对比之下suno产生的影响可能是爆杀。
我们先看一下suno有哪些特点
优点:
1. 操作简单,成本较低。输入歌词及曲子描述就能在一分钟完成一个生成的长片段。
2. 质量完成度高,各种组成非常教科书。好听程度上能吊打一众音乐
3. 混音质量也较好,可能会为之后的ai混音做铺垫
缺点:
1. 成分复杂的歌较难复刻。例如音准比较难定位的一些即兴音乐以及古典音乐,还有配器组成较为复杂的音乐。
2. 风格容易出现趋向性的同质化(贴标签
3. 容易出现差异化的质量。
4. 音质较差,很难应用于高解析度的音乐
首先谈一下可能对音乐产业的影响。
1. 这么一个低成本的工具,假如普及,那首先衔接的就是短视频行业的音乐。因为他们刚好抓的是下沉市场,也刚好贴合定位。这会洗刷掉很多质量不高的音乐。同时结合AI换声(孙燕姿…),可能会出现很多vocalfake和musicfake的情况,音乐可以成为一个黑盒产业。
2. 当音乐素材变得极为容易获得时,缝合艺术可能会进展到一个新的高度。比较技术的mashup或者蒙太奇类型音乐可能会发展,也会发展音频剪辑。
3. 当音乐市场需要对冲自动化生产的量产AI产物时,中高端市场可能会更加崇尚定制化音乐以及个性化音乐。中端市场会把价格压到很低去与AI进行硬性指标对抗,高端则会产生溢价空间
接下来是一些衍生的方向
1. 线下live及演出。追求真实的人当发现音乐不再那么真实的时候,会寻求跨维度的三次元体验
2. 音乐教育。量产的高完成度音乐的普及,同时也会带动教育产业。其中可能教育产业已经有的断层,假如不能及时去填平容易出现野蛮生长的情况。AI音乐的崇尚会去否定一些爱好者的价值
3. 全景声与空间音频的普及。这类音乐素材并没有那么多去学习,而且假如学习,成本会相对大不少。现在的智能设备的迭代,以及软平台都在推崇空间音频类音乐。现在已经逐渐出现了全景声与空间音频下放的土壤
4. HIFI设备与Hires,与混音。之前也提到AI音乐生成的是码率不高的文件,因此音质需要往超越AI音乐的方向发展。其实现在已经有了高码率与传输的土壤,AI音乐可能可以促使软硬件上的下放。而HIFI设备则作为经过层层加工后对高音质及高解析的一种检验。同时混音上,听感好但混音糊的作品可能会有危机感,因为AI学习频响感觉成本并不难。混音的侧重点可能会逐渐从听感好变成清晰分离度高及声场还原。
以上便是我对这玩意大概分析
这玩意真tmd好玩!嘿嘿嘿…