工作室

    音乐中的AI

    音乐中的AI

    多年来,由AI驱动的音乐的可能性一直在音乐行业的表面下方,但直到2022年Chatgpt发行,AI周围的更广泛的对话才开始传播到主流中。现在,我们正处于一些音乐家和音乐行业专业人士对AI驱动音乐的可能性着迷的时刻,而另一些则对未知的人保持警惕,尤其是当监管仍处于起步阶段时。音乐发行公司Ditto的一项研究发现,近60%的被调查的艺术家说他们在音乐项目中使用了AI,而28%的艺术家表示他们不会将AI用于音乐目的。

    伯克利音乐学院音乐商业/管理系副主席克里斯托弗·沃尔斯(Christopher Wears)是AI音乐技术的拥护者。他甚至写了一篇硕士论文,说华纳音乐为什么应该在2016年投资AI(剧透警报:他们以及其他所有主要标签)。 Wares已将AI介绍给他在Berklee的课程,并看到了学生的反应不同。
    Wares说:“我的一些学生喜欢AI,并且已经以不同的方式使用它,而另一些学生则不希望与它有关。” “对话中有很多激烈的辩论,我试图鼓励我的学生拥抱技术,并找到新的方法来改善其创作过程。”

    另一个课程作者和讲师具有类似的心态,是Ben Camp,他是伯克利音乐学院的歌曲创作副教授,也是《揭露歌曲:歌曲创作成功的技巧和技巧》的作者。自2016年以来,他们听到了“爸爸的汽车”之后,这是AI的首批流行歌曲之一,他们在甲壳虫乐队的音乐中训练了“爸爸的汽车”。

    该营地还为学生提供了在课堂上学习AI的机会,只要他们事实检查他们从Chatgpt或任何大型语言模型中学习的所有信息。

    坎普说:“我认为每个人都必须做出自己的选择。” “我的意思是,我有朋友仍然使用翻转手机,因为他们不满意将所有信息在手机上获取。我有一些仍然有座机的朋友。所以我并不是说:“嘿,大家,你需要这样做。”但这肯定在这里。它不会消失。它只会变得更好。”

    无论您是在音乐中积极使用AI还是有一些疑问,都越来越清楚AI将来将在音乐行业中发挥重要作用。凭借商品和营地的专业知识,我们讨论了音乐行业中AI的当前状态,包括现在可用的工具。

    什么是AI音乐?

    在定义AI音乐的含义之前,让我们首先定义人工智能。这是商品的定义:
    “人工智能就像计算机的智能;这是一种使机器能够模仿人类思维或行为的技术,例如解决问题,学习或识别模式。”

    在音乐的背景下,AI技术已经达到了它可以生成,组成和增强以前由人类执行的音乐内容的地步。 AI音乐可以采取多种形式和类型的帮助,从从头到尾创作整首歌,再到编写作曲的特定方面,混合和掌握制作,语音克隆等。我们还将列出一些可以执行这些任务的特定AI音乐工具,其功能打开了Pandora的版权问题。

    历史

    人工智能起源于音乐,带有转录问题:在执行时将表演准确地记录为音乐符号。 PèreEngramelle的“钢琴磁带”方案是一种自动录制音符时间和持续时间的方式,以便可以轻松地将它们手工抄录到适当的音乐符号中,首先是由1752年的德国工程师JF Unger和J. Holfield实施的
    。1957年,1957年, Illiac I(伊利诺伊州自动计算机)创建了“弦乐四重奏的illiac Suite”,这是一种完全由计算机生成的音乐。该计算机由作曲家莱贾伦·希勒(Lejaren Hiller)和数学家伦纳德·艾萨克森(Leonard Isaacson)编程为执行此任务。 :V – VII在1960年,俄罗斯研究员鲁道夫·扎里普夫(Rudolf Zaripov)发表了世界上第一篇有关使用URAL-1计算机的算法音乐创作的论文。
    1965年,发明家Ray Kurzweil开发了可以识别音乐模式并综合新作品的软件。计算机首先出现在测验节目中,我有一个秘密。

    到1983年,Yamaha的Kansei音乐系统已经引起了人们的关注,并于1989年发表了有关其开发的论文。该软件使用音乐处理和人工智能技术来实质上解决转录问题的简单旋律,尽管高级旋律和音乐复杂性是较高的旋律当今仍被认为是困难的深度学习问题,并且近乎完美的转录仍然是研究的主题。

    1997年,一项名为“音乐智能实验(EMI)实验的人工智能计划”在构图的任务上,他的作曲家表现出色,这是模仿巴赫风格的音乐。 Emi后来成为以其创造者的名字命名的更复杂算法的基础。

    2002年,由法国作曲家和计算机科学家弗朗索瓦·帕切特(FrançoisPachet)领导的巴黎索尼计算机科学实验室的一群音乐研究人员开发了Continuator,这是一种独特的算法,能够在现场音乐家停止后重新启动作曲。

    艾米丽·豪威尔(Emily Howell)在2009年发行了她的第一张专辑《从黑暗》(Darkness,Light)发行了她的音乐AI。从那时起,各个团体已经出版了更多的AI作品。
    2010年,IAMUS成为第一个以自己的风格创作出原创现代古典音乐的AI:“ Iamus的Opus 1”。该计算机位于西班牙马拉加大学(马拉加大学),可以通过各种音乐风格生成完全原创的音乐。 2019年8月,创建了一个大型数据集,其中包含12,197首Midi歌曲,每首具有自己的歌词和旋律,是为了调查使用深厚有条件的LSTM-GAN方法从歌曲歌词中产生旋律的可行性。

    随着生成AI的进步,模型已经开始出现,可以从简单的文本描述中创建完整的音乐作品(包括歌词)。该领域的两个著名的Web应用程序是Suno AI,该应用程序于2023年12月推出,并于2024年4月推出。

    软件应用程序

    查克

    查克(Chuck)在普林斯顿大学(Ge Wang)和佩里·库克(Perry Cook)在普林斯顿大学开发,是一种基于文本的跨平台语言。通过提取和分类其在音乐作品中找到的理论技术,该软件能够根据所学到的技术综合全新的作品。该技术由Slork(Stanford笔记本电脑乐团)和Plork(普林斯顿笔记本电脑乐团)使用。

    自动点唱机

    Jukedeck是一个允许人们使用人工智能创建原创的,免版税音乐的网站。该团队于2010年开始开发音乐生成技术,并于2012年成立了一家公司,并于2015年公开启动该网站。该技术最初是基于规则的算法构图系统,后来由人工神经网络替换。该网站已被用来生产超过100万张音乐,并且使用它的品牌包括可口可乐,Google,UKTV和伦敦自然历史博物馆。 2019年,该公司被Bytedance收购。

    morpheus

    Morpheus是伦敦皇后大学的Dorien Herremans和Elaine Chu的一项研究项目,由欧盟玛丽·斯克索德斯卡·弗里(Eu MarieSkłodowska-Curie Project)资助。该系统使用基于可变邻域搜索算法的优化方法将现有的图案片段转换为具有给定水平的音调压力的新片段,这些片段应在整个片段中动态变化。这种优化方法集成了模式检测技术,以确保生成音乐中的长期结构和重复主题。由Morpheus创作的作品在斯坦福大学和伦敦举行。

    艾瓦

    AIVA成立于2016年2月,在卢森堡成立,是一项为任何类型的媒体提供配乐的程序。 AIVA背后的算法基于深度学习体系结构。 Aiva还被用来构成一个名为“ In The Edge”的摇滚曲目,以及与Singer Taryn Southern合作的2018年专辑I Am AI,称为Love Sick Sick。

    Google紫色

    自2016年推出以来,Google的洋红色团队已发布了几本AI音乐应用程序和白皮书。2017年,他们发布了Nsynth Algorithm和Dataset,这是一种开源的硬件乐器,旨在使音乐家更容易使用算法。该乐器已被诸如Grimes和Yacht之类的著名艺术家在其专辑中使用。 2018年,他们发布了一个名为钢琴精灵的钢琴即兴应用程序。随后是Magenta Studio,这是一套5个MIDI插件,可让音乐制作人开发现有的音乐。 2023年,他们的机器学习团队发表了一篇有关GitHub的技术论文,描述了Musiclm,这是他们开发的专有文本到音乐发电机。

    复活

    Riffusion是由Seth Forsgren和Ike Martiros开发的神经网络,它使用声音模式而不是音频产生音乐。它是作为稳定扩散的微调而创建的,稳定扩散是一种现有的开源模型,用于从频谱图中生成图像。这将导致一个模型,该模型使用文本提示生成可以反傅立叶转换并转换为音频文件的图像文件。尽管这些文件只有几秒钟,但该模型也可以使用输出之间的潜在空间将不同的文件插值在一起。这是使用称为IMG2IMG的稳定扩散模型的功能来实现的。最终的音乐被描述为“ de otro mundo”(超凡脱俗),尽管不太可能取代人造音乐。该模型于2022年12月15日发布,该代码也可以在Github上免费获得。它是从稳定扩散中得出的许多模型之一。复兴被归类为基于AI的文本到音乐发生器的子集。 2022年12月,穆伯特(Mubert)类似地使用稳定的扩散将描述性文本变成音乐循环。 2023年1月,Google发表了一篇有关其文本到音乐发电机的论文,称为Musiclm。

    Spike AI

    Spike AI是由Spike Stent与儿子Joshua Stent和朋友Henry Ramsey合作开发的AI驱动音频插件,该插件分析了曲目,并在混合过程中提出了有关清晰度和其他方面的建议。通过接受Spike Stent的个人数据训练的聊天机器人进行沟通。该插件集成到数字音频工作站中。

    音乐应用

    人工智能有可能通过基于创建者的提示来产生轨道迭代来影响生产者创造音乐的方式。这些提示使AI遵循艺术家试图实现的特定风格。

    AI还用于音乐分析中,该音乐已用于特征提取,模式识别和音乐建议。

    作品

    人工智能对组成部门产生了重大影响,因为它影响了作曲家/生产者的思想,并有可能使新移民更容易获得该行业。随着音乐的发展,它已经与制作人合作使用。艺术家使用此软件来帮助产生想法并通过提示AI遵循适合其需求的特定要求来识别音乐风格。该技术对组成的未来影响包括仿真和融合样式以及修订和改进。这些类型的软件的开发可以使新移民更容易进入音乐行业。制片人使用了像chatgpt这样的软件来执行这些任务,而ozone11(例如Ozone11)的其他软件则用于自动化耗时且诸如掌握之类的复杂任务。

    风险和危害

    多年来,音乐家,制作人和其他人一直在使用非生成AI工具。雪儿(Cher)在四分之一多世纪前以“相信”为“相信”,而无数的艺术家用它来“纠正”他们的语气。唱片公司使用AI来扫描社交媒体,以无需许可使用他们拥有的歌曲,而Shazam在识别音频方面的工作方式几乎相同。工程师使用它来简化混合和掌握过程。最近,回到导演彼得·杰克逊(Peter Jackson)使用该技术将单个曲目从混合录音中隔离到重建工作室的对话,并创作丢失的甲壳虫乐队歌曲。

    但是,这些辅助工具与Suno和Udio(例如Suno和Udio)的生成AI应用之间有一个关键区别,Suno和Udio可以从几个单词中创建全歌曲。所有新音乐AIS的工作方式有所不同,并继续发展,但是它们通常以与其他生成A​​I工具相似的方式运行:他们分析了一个庞大的数据集并使用其中发现的模式来做出概率预测。

    为此,开发人员收集了大量歌曲(通过与许可证持有人的协议和/或未经许可刮擦公开可用的数据)及其相关的元数据(艺术家和歌曲标题,流派,年份,描述,注释,任何相关的内容并可用)。所有这些通常都是由全球南方低薪工人成为可能的,他们以巨大的规模注释了这些数据。

    然后,开发人员为机器学习模型准备了此数据集,该模型(简而言之)是一个庞大的连接网络,每个连接都分配了数值“重量”。然后,人类通过教导该模型来“训练”模型以观察数据集中的模式,并通过评分其预测来为模型提供反馈。基于这些模式,该模型可以采用一小部分音频或文本提示,并预测接下来会发生什么,然后在此之后会发生什么,依此类推。

    开发人员调整权重以从相同的输入中产生更多可听和可预测的结果。 AI驱动的音乐发电机结合了两条技术:专业人士在工作室中使用的音乐工具数十年,以及使日常用户可以利用其力量的大型语言模型。任何AI音乐生成器都只能与训练的数据一样好。这些系统需要大量数据,并且在偏置数据集上训练的模型将在其输出中重现这些偏见。这个巨大的音乐盒中包括谁的声音,谁被排除在外?当今的AI模型倾向于排除大量音乐,尤其是从录制技术和非西方起源的音乐传统中。正如当前设计的那样,它们更可能在类型或风​​格中产生刻板印象的声音,而不是任何异常的东西,更不用说创新或有趣的。生成的AI系统易于平庸,但是在边缘上可以找到先验的音乐。

    “如果音乐家开始依靠在排除世界上大多数文化和语言的选择性数据集训练的预测模型,那么人类创造力和多样性将丢失什么?”罗格斯大学关键AI倡议主席Lauren Me Goodlad告诉我。

    从法律的角度来看,观看AI模型从工作中学习的音乐家与《纽约时报》,《盖蒂》以及其他正在起诉AI公司的出版商和创作者的担忧:数据的来源。虽然一些公司只谨慎地仅在许可数据上训练模型,但其他公司则使用他们可以动手的一切,认为公共领域中的任何东西都在公平地使用了此目的。 RIAA是美国的主要音乐贸易机构,现在正在起诉Suno和Udio,以“侵犯版权……大规模侵权……”。 (披露:Vox Media是与OpenAI签署合作伙伴关系的几个发行商之一。我们的报告在编辑上仍然独立。)

    民意调查通常表明,大多数人不反对未经许可就复制公共数据的AI公司。但是,尽管桌上有许多引人注目的诉讼,但尚不清楚法律制度将如何影响公司未经许可采矿的所有人类创造力,更不用说弥补了它们。如果这些做法没有尽快遏制,那么最少的谨慎的球员将迅速获得权力,并随之而来的幻想游说者和律师。 (Callousness:不仅适用于机器!)这些问题现在正在紧迫,因为它们会随着时间的流逝而难以解决,而且一些领域的一些正在向后推。 Ed Newton-Rex于去年秋天推出了AI驱动的音乐和声音发电机稳定音频时,曾是AS稳定AI的音频副总裁。

    几个月后,他就数据收集的立场离开了公司:牛顿 - 雷克斯的团队仅在许可数据上培训了稳定的音频,但该公司的领导人向美国版权所有公众发表了公众评论,称AI开发是可以接受的,具有公平用途保护的现有内容的变革性和社会利益。”为了打击无执照的刮擦,牛顿 - 瑞克斯(Newton-Rex)创立了经过公平训练的培训,该培训验证并证明了AI公司使用的数据集。目前,非营利组织只能证明公司数据集中的内容是否已得到适当许可。总有一天,它将能够考虑到更细节的细节(例如,是明确同意使用这种使用或根本不选择退出的艺术家)以及其他问题,例如减轻偏见。

    作为合唱和钢琴音乐的音乐家和作曲家,他认为这是该领域的转折点。牛顿 - 雷克斯说:“生成的AI模型通常与他们的培训数据竞争。” “老实说,人们只有有限的时间听音乐。有限的特许权使用费。因此,通过这些系统创造的音乐越多,人类音乐家的音乐就越少。”

    正如FTC主席Lina Khan上个月指出的那样,如果一个人创建了AI公司复制的内容或信息,然后AI Generator所产生的内容或信息与原始生产商竞争,以“为了将其驱逐出市场并转移到市场上业务……这可能是违反反托拉斯法律的不公平方法。
    马克·里布特(Marc Ribot)是200多名音乐家之一,他在今年早些时候签署了反对这项做法的艺术家权利声明,他是音乐工作者联盟AI指导委员会的积极成员。 Ribot自1970年代以来是一名执业吉他手,他看到了技术如何塑造该行业,观看记录预算数十年来一直稳步收缩。

    Ribot说:“我不以任何方式,形状或形式反对技术本身。”失去了他在90年代创作的主录音后,他本人使用AI将单个曲目与最终组合隔离开来。但是他认为当前时刻是在拥有它的公司变得太大以至于无法调节它的公司之前,将目前的时刻视为反对技术的关键机会。
    Ribot说:“有用和灾难性之间的真正分界线非常简单。” “这全是关于音乐的制作人还是要输入的其他内容(作为培训数据)具有真正的,功能性的同意权。 [AI音乐生成器]吐出消耗的东西,并且经常用大部分受版权保护的材料生产出东西。那就是输出。但是,即使他们没有,即使输出没有侵犯,输入本身也在侵犯。”

    Ribot说,音乐家长期以来一直对AI漠不关心,但是在过去的几年中,以及对监视资本主义和公民自由的更多了解。

    虽然几年前的音乐家可能已经将彼此视为竞争对手 - 即使馅饼越来越小,仍然有一些艺术家可以致富 - AI对整个行业构成了威胁,甚至可能不会受益他们。

    AI可以和可以做什么

    人工智能创建的最早的音乐示例之一可以追溯到1956年:由Illiac I计算机组成的弦乐四重奏作品,并由伊利诺伊大学在Urbana-Champaign教授Lejaren Hiller和Leonard Isaacson编辑。

    近年来的技术飞跃之后,Holly Herndon,Arca,Yacht,Taryn Southern和Brian Eno等艺术家现在正在使用Generative AI来尝试其创造性实践。 AI产生“幻觉”和其他荒谬结果的趋势虽然在其他情况下危险,但可能是音乐中灵感的来源。正如其他音频技术已经通过它们的不和谐所定义的 - CD失真,8位压缩一样,破裂的人声音太强大,无法发出喉咙,“事件对于旨在记录他们的媒介太重要了”,作为Brian Eno在一年中写道,附录肿胀 - 当最独特的音乐时,生成的音乐可能最有价值。拥有计算机科学博士学位的音乐家伊万·帕兹(Ivan Paz)正在为自己的现场表演开发AI系统。

    从空白屏幕开始,他实时写代码(供观众阅读),并通过响应其发出的声音来训练模型,这可能是出乎意料的,刺耳的,或者只是灾难性的。结果有点像演奏乐器,而且也像与另一位音乐家一起即兴演奏。帕兹说:“如果您的算法在非常低的水平上运行,那么您会觉得自己正在演奏乐器,因为实际上您正在调整合成的参数。” “但是,如果该算法确定了音乐的形状,那么这就像与一个确定接下来会发生什么的经纪人一起玩。”

    为了在今年早些时候在巴塞罗那的当代文化中心举行的展览,Paz与歌手Maria Arnal合作,为她的声音创建了音色的模型。他们要求访客演唱简短的歌曲。然后,该模型将这些声音与Arnal的声音混合在一起,以创建新的歌声。在另一个项目中,Paz的同事Shelley Knotts训练了自己的作品模型,以避免在作品中重复:它分析了她的音乐来检测模式,但没有暗示她最有可能的下一步行动,而是表明持续的可能性较小。

    AI音乐演变的下一步可能归结为处理速度。通过某些类型的模型可以实时编码,但其他模型则花费太长时间来渲染音乐以在现场表演中创建音乐。像合成器这样的电子仪器最初是为模仿声音而设计的,并随着时间的流逝而发展了自己独特的角色。 Paz认为生成AI的最终潜力是创造我们目前无法想象的新声音,更不用说生产了。在这种情况下,AI可以协助表演者 - AI比数字调谐器或延迟踏板更有可能“替换”音乐家。

    但是,音乐行业的其他角落正在采用AI,以实现更具破坏性的目的。虽然AI可能不会(也永远不会)比人类更好地创造音乐,但现在可以以更快的速度和更大的规模创建可接受的音乐 - “可接受”通常是曲目必须清除的唯一条形。

    在大多数情况下,当您听到音乐时,您不知道是谁创建的。您在广告中听到的叮当声。电影或电视节目,播客或视频游戏中的环境分数。循环嘻哈生产商样本。这是该行业最有可能被生成AI颠覆的一部分。彭博社报告说,老师正在使用Suno创建音乐教学辅助工具。 Gizmodo指出,Adobe Project Music Control的目标受众是另一个AI驱动的音乐发电机,他们希望快速,便宜地制作背景音乐,例如Podcasters and YouTubers,能够指定心情,音调和长度曲目。
    无论您喜欢它,甚至注意到它,这些类型的音乐历史上都是由人类创造的。但是自动化的AI音乐发电可能会使这些音乐家的工作损失 - 他们中的许多人都利用这些收入来支持他们更具创造力,但在财务上不太可行的追求。您可能永远不会在舞台上见到AI音乐家,但是由于技术,您仍然可能会看到人类音乐家更少。

    就他们的角色而言,音乐行业的有影响力的参与者已经相信AI将成为他们业务的中流 - 他们担心谁会获得收益。 Spotify不会限制AI生成的音乐,除非它是彻底的模仿,否则会冒着诉讼的风险。 Universal Music Group(UMG)和YouTube已推出YouTube音乐AI孵化器,以与UMG艺术家开发AI工具。同时,在人类艺术竞选联盟中,UMG还是150多个组织之一,包括ASCAP,BMI,RIAA和AFL-CIO,该组织旨在为在创意领域中使用AI的道德框架建立道德框架。他们不想禁止这项技术,但他们确实想要结果。

    每天有100,000多个新曲目上传到流媒体服务,数字流媒体平台有很大的动力来减少用户玩耍的免费特许权使用费的份额。去年,Spotify仅支付了90亿美元的特许权使用费,这是其140亿美元收入的大部分。这家世界上最大的音乐流媒体公司历史上提高了自由轨道的可用性和可见性,并且可能会继续这样做。 AI驱动的音乐发电机是一种创建免费音乐的简便方法,可以将真正的皇家款式艺术家从流行的播放列表中取代,从而将流媒体收入从艺术家转移到平台本身。

    有一个新的力量,还有一个新的危险,对知名艺术家来说是一种新的危险。中风后,乡村明星兰迪·特拉维斯(Randy Travis)遇到了麻烦,更不用说唱歌了,但是在AI的帮助下,他对现有的目录进行了训练,他可以数字地重现他的人声。

    同时,一个匿名的制作人可以创建一个令人信服的Drake/Weeknd合作,并增加数百万的流。 5月,在德雷克(Drake)与肯德里克·拉马尔(Kendrick Lamar)的现实牛肉中,生产商Metro Boomin遭到了抨击。 Metro Boomin发布了一个带有AI生成的样品的节拍,供任何人使用,Drake然后进行了采样并翻阅,并将新曲目发布到流媒体服务中。威洛尼乌斯国王(King Willonius)利用乌迪奥(Udio)创建了地铁吊坠重新混合的原始曲目,他聘请了一名律师来保留其贡献权的权利。
    这些最新的示例表明,音乐如何迅速制作的音乐可以很好地挤出音乐。在流媒体经济中,数量和速度是一切:激励艺术家产生数量,而不是质量。

    音乐家杰米·布鲁克斯(Jamie Brooks)说:“ [未来的AI生成的热门歌曲]并不是人们回去研究他们继续与唱片时代的出色发行的方式。”布鲁克斯(Brooks)以自己的名字和乐队精英体操和默认的性别发行了唱片,并在她的新闻通讯中写了关于音乐行业的博客。 “但是它仍然会产生参与度,因此,在Spotify图表顶部的任何内容都不意味着要持久的世界,这只是那天娱乐而又从未想过,对所有这些公司来说都是一件好事。他们不需要这是赚钱的艺术。

    当今的许多技术主要是为了模仿或简化,这可以促进业余主义。文件共享使强制性记录收集到具有硬盘驱动器和调制解调器的任何人都可以访问,手机摄像头使人群中的每个人都可以记录该节目,现在流式音频为我们提供了所有适合我们的情绪和广告群体量身定制的动态播放列表。生成的AI也可以使非专家的音乐创作更加容易。这不仅可以改变我们听到的音乐,而且可以改变我们与整个形式的关系。如果创作热门歌曲比编写病毒推文不需要更多的精力,那么社交媒体中当前包含的许多创意能量可能会被重定向到基于提示的音乐。

    布鲁克斯将其视为一种回归现象,强调了直接的永恒深度,以音频模因和针对最复杂的听众的开创性单曲来登上排行榜,就像电波曾经是由空的歌曲所占据的,例如“带我去舞会游戏, ,”由两个从未去过棒球比赛的人写的。

    布鲁克斯说:“这就是这些服务将推动音乐的方向。” “这根本不是关于创造力的。在这些模型的工作方式和算法提要之间,这只是过去的一个很大的存储库。它不会以声音向前发展记录。它将加速从美国流行文化中心到垃圾桶的记录。”

    版权和AI音乐

    音乐行业中围绕AI的最讨论的问题之一是通过AI生成的工作赚钱的问题,尤其是在使用现有受版权保护的材料培训算法的情况下。 2023年3月,美国版权局发起了一项计划,以调查与AI相关的版权问题。坎普有信心监管机构会介入并创建一个补丁,但他担心由于艺术家在美国的美国版权系统而难以解决问题。

    坎普说:“许多法律和最终导致我们现代版权系统的先例根本不符合目前的音乐中发生的事情。” “我确实相信创作者应该拥有作者身份,应该被记入并应得到补偿。但同样,我们这样做的整个系统已经过时了。”

    AI音乐仍在合法的灰色区域中,这提出了一个问题,即在艺术家被AI通过AI赢得,补偿和同意使用其作品或相似性的情况下是否有可能进行妥协,而不会限制使用AI技术的音乐创造力的潜力。在某种程度上,艺术是其他艺术的衍生作品,什么是灵感,什么是盗窃,目前是模糊的。一些唱片公司开始反击。

    2023年5月,环球音乐集团(Universal Music Group)呼吁流媒体服务阻止AI生成的音乐的使用,称其使用其艺术家音乐来训练其算法,并在必要时采取法律行动。 Spotify的回应是在其平台上删除了7%的AI生成音乐,相当于成千上万的歌曲。 2023年7月,UMG呼吁国会制定一项全国性的政策,以保护创作者免受AI驱动的版权侵犯。唱片公司是加入人类艺术运动的40名成员之一,该组织提倡负责AI。

    在美国,当前的法律框架倾向于将传统的版权法应用于AI,尽管它与人类的创造过程有所不同。但是,仅由AI创作的音乐作品不受版权保护。在版权办公室的实践纲要中,版权办公室表示,它不会授予“缺乏人类作者的作品”和“办公室不会登记由机器创建的作品或仅通过随机或自动运行的机械过程创建的作品人类作家的任何创造性意见或干预。” 2022年2月,版权审查委员会驳回了对AI生成的艺术品的版权申请,理由是“缺乏维持版权要求的必要人类作者”。

    欧盟(EU)的局势与美国的局势相似,因为它的法律框架还强调了人类参与受版权保护的作品的作用。根据欧盟知识产权办公室和欧盟法院的最新判例法,原创性标准要求作品是作者自己的知识创造,反映了作者的身份,这在创造过程中所做的创造性选择证明了这一点,需要特定水平的人类参与。由欧盟Horizo​​n 2020研究与创新计划资助的重建欧洲项目深入研究了AI生成的内容所带来的挑战,包括音乐,提供法律确定性和平衡保护,鼓励创新,同时尊重版权规则。 AIVA的认可标志着音乐作品领域中关于作者和版权的传统观点,使AI表演者可以发行音乐并获得特许权使用费。这种认可使AIVA成为对音乐制作中AI正式认可的先驱。

    稳定性AI,OpenAI和Google等团体的人工智能取得的最新进展导致针对包括AI音乐在内的生成技术提起了许多版权侵权诉讼。如果这些诉讼成功,那么机器学习模型的数据集将使这些技术限制在公共领域。

    德雷克和周末

    尽管语音克隆的法律先例不多,但对于名人来说,它可能属于他们的宣传权,因为违反了他们的形象,名称和声音。去年的一个关键例子是,当一个名字叫代笔人的tiktoker使用AI的名字在Drake和The Weeknd之间创建了假二重奏,称为“我的袖子上的心”。此后,这首歌已被删除,但版本仍在互联网周围浮动。

    “一方面,您可以说这是一项原始作品,” Wears说。 “另一方面,可以将其视为一种侵权形式,因为AI在未经他的明确许可的情况下通过分析他的目录学会了以Drake的风格写歌词。另一个问题是未经授权使用艺术家的名字和肖像。”

    使用AI复制某人的名字和相似性的能力正在困扰音乐行业以及整个娱乐业。当前的SAG-AFTRA罢工的主要要求之一是保护创作者免受训练AI发电机的作品,而演员免于未经同意而复制他们的肖像和声音。

    AI的道德问题

    版权只是围绕AI的许多道德问题之一,重要的是要记住,该技术及其发展并非没有后果。

    一个直接关注的问题是培训数据集的偏见。一个例子是说唱歌手FN Meka,他于2022年与国会音乐集团签约,但后来由于种族刻板印象而丢弃了合同。

    坎普说:“大问题之一是垃圾和垃圾。” “如果我们正在培训这些语言模型,或这些图像发生器或这些音乐生成器的固有偏见,固有种族主义的数据,那么我们要问的一切都将使这些刻板印象永存。我们需要确保我们拥有良好的数据,并且正在监视它。”

    监视该数据也不是没有危害的。另一个道德问题是培训过程,称为“强化学习”,其中涉及对一系列令人不安的内容提供人类反馈。 《华尔街日报》的最新一集播客《杂志》上有一位肯尼亚数据工作者,其中包括培训Chatgpt以非常高的心理健康为代价区分“对与错”。

    坎普说:“基本上,它给人以大拇指或对回应的大拇指。” “这是不适当的回应吗?它太暴力,图形还是令人不安? Openai向肯尼亚的人们签订了这项工作,每小时向他们支付2美元来阅读这些回复。因此,请想象一下每小时付费2美元以出现工作,并阅读一些最恐怖,心理上令人不安的文字,然后您要这样做10个小时,然后您回家,所有这些都在脑海中旋转。因此,现在的香肠有很多缺陷。”

    音乐深击

    音乐中AI的更新生的发展是使用音频深击伪造现有歌曲的歌词或音乐风格,以类似于另一个艺术家的声音或风格。这引起了人们对技术合法性及其使用的道德规范的许多担忧,尤其是在艺术身份的背景下。此外,它还提出了一个问题,即谁被认为是这些作品。由于AI不能拥有自己的作者身份,因此当前的猜测表明,直到对机器学习技术做出进一步决定,就不会有明确的答案。 Google和Universal Music Group已开始制定最新的预防措施,这些措施已考虑到特许权使用费和信用归因,以使制片人能够复制艺术家的声音和风格。

    “我的袖子上的心”

    在2023年,一位名为“代表作者977”的艺术家创建了一个名为“心中的心中的袖子”的音乐剧,它通过向各自的艺术家喂食一组人声曲目来克隆了德雷克的声音和《周末》,从而创造了一种深度学习算法每个艺术家的声音都可以与原始歌词与原始参考人声相匹配。该曲目是为了格莱美奖提交的,以考虑最佳说唱歌曲和年度最佳歌曲。它传播开来并在Tiktok上广受欢迎,并获得了观众的积极回应,导致其在2023年4月在Apple Music,Spotify和YouTube上的正式发行。许多人认为该曲目完全由AI软件撰写,但制片人声称该曲目声称该曲目声称他仍然由他完成歌曲创作,制作和原始人声(在转换之前)。这首歌后来从格莱美提名列表中删除,因为它不符合格莱美的考虑要求。环球音乐集团将曲目从所有音乐平台中删除。这首歌是使用人工智能来克隆语音的转折点,从那时起,模型是为数百种(即使不是数千人)的流行歌手和说唱歌手创建的。

    “那是从哪里来”

    2013年,乡村歌手兰迪·特拉维斯(Randy Travis)的中风使他无法唱歌。同时,歌手詹姆斯·杜普雷(JamesDupré)代表他巡回演出,表演了他的歌曲。特拉维斯(Travis)和长期制片人凯尔·莱宁(Kyle Lehning)于2024年5月发行了一首新歌,名为“ where theres there”,这是特拉维斯(Travis)中风以来的第一首新歌。该录音使用人工智能技术来重现特拉维斯的声音,该声音从40多种现有的人声录音和杜普雷的录音中汇编而成。

    AI音乐工具

    现在,我们已经介绍了AI的本质,以及其一些主要缺点,我们可以讨论存在的AI音乐工具。在2023年的伯克利(Berklee),在波士顿伯克利音乐学院校园举行的年度音乐会议上,Wares分享了一些AI音乐工具。您现在可以开始学习,有些您可能只想学习。

    Bandlab Songstarter

    BandLab的Songstarter应用程序是一个由AI驱动的歌曲发生器,可让您选择一种类型,输入歌曲歌词(和表情符号),它将产生免费的想法。然后,您可以将这些想法带入他们的工作室功能,以使其成为自己的工作室。如果您需要一些最初的灵感,这是开始歌曲的好方法。

    Midjourney

    作为最受欢迎的AI驱动图像发生器之一,Midjourney可用于创建专辑粉艺术,歌曲封面,海报,Spotify Loops,Merch Images等。它与其他AI驱动的图像发生器不同的是它的超现实,类似梦想的风格,它可能更适合音乐项目。该程序易于使用,但是有明确的学习曲线。像许多新技术计划一样,请务必在潜水之前观看一些教程。

    混合整体

    混合Monolith插件是AYAIC的自动混合系统,甚至可以消除您的混音。在《混音在线文章》中,开发人员说:“其目的不是自动创建成品组合,而是要在轨道之间建立基本的增益关系并确保适当的增益调整。”

    Landr AI掌握

    兰德(Landr)的AI掌握工具使您可以将轨道拖放到程序中,然后将其分析并为样式和音量提供简单的选择。选择这两个选项后,该程序将掌握您的曲目,为您提供更多文件类型和分发方法的选项。兰德(Landr)拥有超过2000万条与计划的曲目。

    艾瓦

    AIVA是一项人工智能计划,已接受了历史上30,000多个标志性分数的培训。您可以从几种不同的预设音乐风格中进行选择,从现代电影到二十世纪的电影,从探戈到爵士乐。然后,您可以选择输入密钥签名,时间签名,节奏,仪器,持续时间等。如果您不知道要输入什么,AIVA将为您做。最后,您可以生成轨道,自定义仪器并上传各种文件类型。作为订户,您为创建的所有内容都有完整的版权许可。

    为音乐家而言

    Openai的Chatgpt是使用最广泛的AI工具之一,可用于音乐家。该公司目前正在接受联邦贸易委员会的调查,因此您应该采取预防措施,了解与Chatgpt共享的信息,并验证您从Chatgpt收到的任何事实。

    考虑到这一点,该程序确实有可能减少您在任务上花费的时间,这些任务使您无法真正制作音乐。自发布以来,Wares和Camp就一直在尝试Chatgpt,并提供了一些特定的技巧,音乐家和音乐专业人士可能会发现有用。

    社交媒体策略

    对于业余音乐家来说,社交媒体可能是一个巨大的时间,Chatgpt可以帮助减轻负担。 Wares说,您可以开始告诉Chatgpt您是哪种艺术家,您播放的音乐类型以及您的爱好和兴趣是什么。然后,您可以在接下来30天的Tiktok,Instagram,Facebook或您使用的任何社交媒体平台上要求30件内容。您不仅可以请求社交媒体内容的想法,而且还可以要求Chatgpt创建优化的字幕和标签。

    巡回技术骑手

    巡回演出时,音乐家通常会雇用某人创建一个技术骑手,概述了展开演出所需的所有细节。这可能包括设备,舞台设置,声音工程,照明,款待,演出合同,旅游行程,场地选项,门票价格等等。 Wares说,Chatgpt可能是写那个技术骑手的人,最近与乐队合作,使用该技术计划他们的巡回演出。

    Wares说:“我们首先创建了他们的技术骑手,其中包括后排要求,详细的输入列表,甚至是特定的麦克风建议,都是基于一些简单的提示。” “然后,我们要求在东北部的巡回赛行程中提出建议,我们应该为门票收取多少费用,以及基于乐队粉丝群的独特兴趣和人口统计的商品创意。在一个小时内完成了几天的时间。”

    写歌歌词

    如果您需要帮助写歌歌词,需要灵感或想使用一些单词建议,那么Chatgpt可能是一个有用的歌曲创作工具。 Camp举例说明了与前伯克利学生朱莉娅·佩里(Julia Perry)合作的例子,朱莉娅·佩里(Julia Perry)(他们为伯克利(Berklee)的文章采访了有关人工智能和音乐的文章),以使用chatgpt来产生歌曲创意。

    坎普说:“我们在谈论宇宙是如何魔术的,以及她如何想表达关于宇宙的深层,不可知的真理。” “而且我基本上将她所说的一切都凝结成两三个段落,然后说[chatgpt],给我20首歌曲的开场白。”

    他们最终将20个选项之一作为新歌曲的起点。

    内容写作

    Chatgpt可以帮助完成各种内容编写和文案任务,无论是编写新闻稿,具有多个角色长度的简历,专辑发行策略,博客文章,网站副本,电子邮件等。

    协议和合同

    在理想的世界中,您将有一个律师写和审查所有协议和合同,但这并不总是现实或负担得起的。在某些情况下,您可能想让Chatgpt草拟协议,而不是什么都没有。这可以用于管理协议,乐队协议,拆分表,绩效协议等。但是,同样,娱乐律师在可能的情况下总是最好。

    人在哪里?

    当前的AI生成音乐状态比真实一代更混杂。这并不是真正的致敬乐队,而是一种广泛的复兴方法。它只能从培训数据中产生声音,虽然它可以通过新的方式组合,混合和折射这些元素,但除此之外,它不能真正进行实验。

    音乐家会告诉您,只有有限数量的音符可以播放,或者所有声音只是频率和波长的问题,因此只有有限的数量可以用纯粹的音乐术语来完成。但是,音乐不仅仅是安排一些和弦或节奏,就像创建食谱不仅仅是从有限的成分和技术清单中选择一样。

    罗科(Ribo)是一位吉他手,以其实验和能够从不同影响中吸收并将其混合到新事物中而闻名。乍一看,这听起来很像是由生成AI的支持者提出的价值主张,但他说,人与机器做同样的事情之间存在根本差异。

    Ribot说:“如果没有引用某人的话,我就无法独自度过12杆布鲁斯。” “我们必须赋予人权的特权才能做到这一点。我非常擅长知道我何时越界。我知道我可以引用查理·帕克(Charlie Parker)的歌曲的这一部分而不是查理·帕克(Charlie Parker)的歌曲,而且我知道我可以很难搞砸它,而且会很酷。”
    Ribot 1990年的专辑《无根世界》包括Jimi Hendrix的“ The Wind Croies Mary”的封面。向Hendrix致敬,Ribot的版本是抽象的,歌词在刮擦的吉他上吠叫,与吉他音调以外的原始歌曲几乎没有相似之处,忽略了Hendrix的旋律,和弦和节奏。尽管如此,Ribot还是将其列为专辑中的封面,并在每次销售或流中支付机械特许权使用费。
    Ribot说:“该系统需要保留,值得为之奋斗。” “当我们坐着记录时,我们没有薪水最低工资。即使我们的表演,我们也无法保证。 [版权]实际上是我们拥有的唯一经济权利。”

    Ribot的话语实践是一个悠久传统的一部分:音乐作为一种媒介是由对以前发生的事物的认识和尊重,可以成长和改变的,而不仅仅是回收的。 “驱动音乐变化的是人们的情绪,他们的需求和可能性以及他们所爱的东西以及生气的变化。人们可以学会接受感情,事件和生活充实,并用吉他或钢琴代表他们。随着经验的扩展,历史延长和需要表达和想法的乐队,它扩大了领域。”

    从历史上看,音乐家与观众之间存在神圣的合同,暗示着真实性和人性。在参加时代巡回演出的数百万泰勒·斯威夫特(Taylor Swift)的球迷中,许多人可以为您提供有关她个人生活的详细说明。碧昂斯,哈里·斯泰尔斯,埃尔顿·约翰或任何最大的巡回艺术家的观众也是如此。您需要一个真正的人来卖掉体育场。如果他们不认为自己会识别表演者,没有人会看着蒙面的歌手。

    当我们有意听音乐时,我们经常在诠释学上听,好像这首歌是通向更大的了解他人的经历和观点的门口。考虑涅rv。由于Grunge的美学偏差在正确的时刻遇到了现代工作室技术,所以NeverMind不仅吸引了众多的听众,这不仅是因为它的声音,而且还因为Kurt Cobain的个人弧线 - 焦虑的郊区孩子的流星崛起和悲惨的早期死亡,他成为了一个成为一个焦虑的郊区孩子摇滚超级巨星(Rock Superstar)公开具有挑战性(某些)流行歌星惯例,与人共鸣。

    乐队承认启发他们的音乐家(Pixies,Gap Band和其他人)最终是Cobain,他的乐队成员及其合作者所做选择的独特产品,这是他们经验和理想的表达和反映。根据定义,艺术是人类决策的产物。

    像其他形式的音乐过程一样,一些AI生成的音乐仍然保留了人类元素:因为像伊万·帕兹(Ivan Paz)和雪莱·诺特(Shelley Knotts)这样的艺术家在很大程度上依赖自动化模型,他们创建了系统,对其运作方式做出无数的决定,并决定要做什么?使用它产生的任何声音。
    但是,威胁人类音乐家的AI音乐,它只需几个单词并从中产生全部歌曲,它本质上是有限的,因为它只能从数据的及时向内和向后看,从不向外,因此永远不会前进。吉他是几个世纪前发明的,但是在1940年代的Rosetta Tharpe的鼎盛时期之前,AI模型在音乐上接受了训练。嘻哈是一种基于抽样和重新包装其他艺术家作品的音乐风格(有时是原始艺术家不喜欢的形式或环境),但是1973年之前接受音乐训练的模型将无法创建类似的东西那。

    人们听音乐的原因有无数的原因,但是人们制作音乐的原因同样有很多。人们已经在互相发出声音已有数千年了,在大多数情况下,想象以谋生为生是愚蠢的 - 甚至不可能考虑放大它,更不用说记录下来了。人们还是做音乐。

    这里有一个紧张感,早于AI。一方面,唱片公司和数字流媒体平台在很大程度上认为,音乐市场希望获得最重要的认可,因此很多钱来自既定艺术家的目录的销售,其中一份报告表明,这些销售额为70个。 2021年美国音乐市场的百分比。榜首的听起来越来越相似。流媒体平台算法通常一遍又一遍地播放相同的歌曲。

    另一方面,人类对惊喜,创新,违法行为的内在需求。每个人都不同。大型公司的目标(基本上是规模和监督)与整个用户和个人用户的目标不同,其用户群就会越大,它就越倾向于自动化。 AI音乐生成器或动态生成的播放列表或任何其他算法预测系统的好坏都不是好是坏:结果完全取决于谁在运行它们以及目的。

    但是无论发生什么事情,任何公司都不会在音乐上垄断。没有物种。鸟做。蜜蜂做。海中的鲸鱼做。其中一些在人耳上很漂亮。但是,即使有了所有自然的旋律,人类已经创造了所有音乐,并且AI将帮助创造或创造自己的所有音乐,人类创造和表达自己的冲动。音乐出于商业主义以外的其他原因存在于我们的世界中。

    原因通常很简单:一个人或一群人认为应该存在,然后就这样做。无论机器泵出多少声音污泥,它都将继续存在。

    拥抱还是抵抗?

    在AI和其他新兴技术方面,反复出现的主题之一是,它们将来将成为音乐行业(以及大多数行业)的重要组成部分,并且忽略它们将不会帮助该行业的未来领导者。

    “我认为AI可以帮助我的学生提高生产力并支持他们的创作过程,并让他们专注于最重要的事情,这是创建和表演音乐或探索新的商业想法,” Wears说。 “但是,作为负责任的教育者,我必须确保我的学生不会过于依赖这些工具,并且我一直在寻找使用AI的方法来帮助发展他们的批判性思维能力。”

    营地同意,还鼓励人们按照AI的不断发展来做自己满意的事情。

    坎普说:“我当然鼓励您,如果您想保持最新并使用技术来推进您在地球上的目的,那么,是的。” “但是就像我说的那样,我有使用房东的朋友。我有喜欢购买乙烯基记录的朋友。 AI在这里。它具有巨大的影响。您不必使用它,但是很多人选择。”

    AI在伯克利在线

    最近,Berklee Online发起了一项名为ARIA:AI增强现实和沉浸式应用程序的计划。该项目由Berklee Online支持和音频技术副总监Gabriel Raifer Cohen和Berklee音乐学院校友副总监。

    Raifer Cohen说:“像计算器,计算机,互联网和搜索引擎一样,Genai将留在这里。” “忽略所有这些工具易于获得的现实是对学生的损害。 。 。 。教学生如何最好地(负责任地)将这些技术用作授权工具,这可能比试图与之抗争的努力更值得。”

    仅仅因为AI将在音乐行业的未来中发挥重要作用,并不意味着我们不能批评这项新技术或倡导安全措施。他说:“与此同时,我们必须抵制无意识地使用Genai的平庸和创造性的不敏感性的传播,同时保持道德上的意识和积极性。” “这并不容易,但是我们必须考虑,AI的发展也为潜在的变革性教育经历打开了机会。” Raifer Cohen说,作为ARIA计划的一部分,Berklee Online将继续探索这些新工具,只有在对其进行了测试和彻底研究之后,学校才能考虑在课堂上实施它们。 “最终,我们不能忘记,对于学生,老师,观众和创作者,所有这些强大的工具就是这样:工具,” Raifer Cohen说。

    免费注册

    免费注册并免费获得一个项目