最近,“AI孙燕姿”成了B站网红,B站上流传的各种“孙燕姿”翻唱其他歌手的视频,点击量往往超过了十万,甚至有些突破百万。
在一个又一个视频里,印着孙燕姿头像的光盘缓缓旋转,由其声音翻唱的各种经典或流行歌曲包括周杰伦的《发如雪》《爱在西元前》、刘欢的《好汉歌》等等。
弹幕评论给AI孙燕姿的歌曲视频增加了更多乐趣。有人说:“这是中了十香软筋散的好汉唱的吧?”还有人说:“听到孙燕姿唱这首歌,这辈子值了。”
利用AI模拟人声、生成歌曲,是AI技术的一大进步,但同时也带来各种各样的问题。例如,用AI翻唱歌曲,可能涉及版权问题。
图源:Pexels
而AI技术的发展,也让文化娱乐行业的工作者感到了巨大危机——也许有一天,他们的工作将被AI取代。
AI歌手走红网络
对于当下的许多年轻人来说,孙燕姿这个名字,已经有些陌生了。
2021年,一名14岁的网友在NGA论坛发帖:“给大家推荐一个冷门华语歌手孙燕姿”,话题立刻登上了微博热搜,无数80后、90后网友感叹,在00后的世界里,孙燕姿竟然也成了“时代的眼泪”。
二十多年前,周杰伦、孙燕姿等歌坛“天王天后”,曾经引领了一代人的青春。如今,那个华语歌坛最璀璨的时代已经过去,流行歌手的唱片、歌迷的彩铃、卡拉OK里略显模糊的MV,对很多人来说,成为了久远的记忆。
但这一次,AI让孙燕姿翻红,再次成了名人。
根据许多歌迷鉴定,AI孙燕姿与其本人歌声相似度非常高,无论是音色、唱腔,还是极具个人特征的咬字和尾音,都能够以假乱真。由AI孙燕姿翻唱的《发如雪》等歌曲几乎难辨真假,而与歌手本人风格迥异的《好汉歌》则因极具反差感,激起了网友玩梗的强烈欲望。
AI孙燕姿引发歌迷和网友疯狂的同时,也带动了资本市场的热度。5月11日,与AIGC相关的华策影视和其他多支影视传媒股涨停收盘,有券商分析师认为,拥有经纪业务的影视公司掌握大量艺人版权素材,结合AIGC,互动版本的AI艺人将应运而生。
同时,这位分析师也认为,比起上次的元宇宙风口,这次AIGC的风口更加“靠谱”,因为阶段性的进展正在发生。
AI孙燕姿的原理,是通过开源的生成式语音训练模型收集素材,进行训练。首先,需要把孙燕姿的歌曲去掉伴奏,或截取孙燕姿的访谈、对话视频,获取没有伴奏、混响的原始声音,然后把素材作为目标音色输入到模型中进行训练,得到一个孙燕姿音色的模型,转换任意的歌声,最后进行后期处理。
或许,AI歌手在未来有广阔的前景,除了娱乐性的AI歌手视频,词曲作者也可以借助不同歌手的AI模型生成样带,进行试听之后,为歌曲匹配到风格最合适的演唱者。此外,唱片公司还可以发布旗下歌手的音色模型供用户有偿使用。
图源:Unsplash
对于已故歌星、演员的粉丝来说,AI技术也是一个福音:人们可以通过AI技术生成逝者的声音模型,重现那些令人念念不忘的声音。
目前,B站上已经有人发布了已故相声大师马三立的单口相声,通过一个叫“SoVits AI”的开源项目,生成了一段马三立的虚拟表演节目。在这段节目中,马三立的头像与电脑绘制的长衫结合在一起。
在节目开头,马三立的声音说道:“我们这儿其实来说挺新鲜的,都是高科技啊这是,叫什么人工智能,AI搞出来的,都是假的,没有真人……您在这听个味道吧。”
很多网友期待,可以用AI“复活”更多逝世名人的声音,如张国荣、黄家驹等,在建立声音模型后,可以为他们撰写与个人风格匹配的新作品,或者演唱他们所属乐队的新歌,让他们在逝世多年以后,以另一种方式再次为他们的粉丝献唱。
AI合成声音被滥用,后果可能很严重
尽管AI歌手前景广阔,“复活”已经去世的知名歌星、演员也令观众充满期待,但它仍然可能涉及侵权问题。另外,AI模拟声音也可能带来一系列伦理和法律的风险。
技术更新的速度,已经超过了知识产权法律更新的速度,经过人工智能提取的歌手音色模型,尚未被纳入现行知识产权法律保护范围内,但利用AI歌手翻唱其他歌手的作品,至少已经涉及原唱歌手、词曲作者的版权。
按照相关法律规定,除非著作权人声明不得使用,对已经合法录制为录音制品的音乐作品进行翻唱、二次创作等可以不经著作权人许可,但应当按照规定支付报酬。
被用作素材的孙燕姿声音同样可能涉及“侵权”。律师、学者普遍认为,虽然音色和唱腔不受到著作权法的保护,但按照《商标法》规定,声音和文字、图形等一样,可以作为商标申请注册。
另外,根据《民法典》规定,对自然人声音的保护参照适用肖像权保护规定,以防止声音被混淆、滥用、冒用、不正当使用,损害声音主体的合法权利。
是否起诉“AI孙燕姿”的制作者,需要孙燕姿自行决定,截止到目前,孙燕姿尚未在其个人微博上做出回应。
AI歌手可能侵犯相关各方的权利,除此之外,用AI生成人声,可能还会为社会带来其他更严重的法律和伦理问题。
图源:Pexels
随着通信技术的进步,电信诈骗成为了各个国家都要面临的问题。过去的电信诈骗多半是通过文字信息伪装成熟人,或通过电话伪装成各个机构的工作人员进行诈骗,但在AI声音模型技术辅助下,骗子可以很轻易地模仿熟人声音进行诈骗。
在国外,已经发生了AI语音诈骗的案例。据报道,4月初,加拿大有犯罪分子利用AI技术行骗,他们合成了受害者亲人的声音模型,实施电话诈骗,在3天内骗了8名老年人。受害者表示,骗子使用的声音和亲人一模一样,难以分辨。
得到语音素材并不难,诈骗者既可以通过黑客手段、非法购买信息等渠道获得素材,也可以通过不断拨打骚扰电话,以“广撒网”的方法获得语音素材,经过AI训练和后期处理后,制作成足以乱真的语音信息。
除此之外,AI语音的侵权使用可能还会造成伦理问题。例如,如果有人收集网红、主播的声音进行AI训练,用于提供软色情服务,既违反法律,也会对当事人的名誉、心理造成伤害。
4月11日,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,有法律学者认为,这是对人工智能进行管理的良好开端,但在未来,仍然需要制定更详细的规定,对使用人工智能的各个主体进行更加明确的责任认定,对提供模型的服务商、内容生产者和发布者进行责任区分。
文娱产业创作者开始反击
对人工智能的未来感到担忧的,不只是法律界学者,还有各类文化工作者——AI在文化领域的应用,可能会让他们的工作岌岌可危。
前段时间,聊天机器人模型ChatGPT走红,它的本质是一种大型预训练语言模型,可以和人类通过人机对话的形式沟通。
在各个社交平台上,网友们纷纷晒出自己与ChatGPT的对话,它可以检索信息、生成文案,一些网友也表达了对ChatGPT的担忧:它可以让写作效率更高,在未来,这可能导致相当一部分靠“码字”吃饭的记者、编剧、作家甚至社会科学研究人员失业。
除了文字工作者,插画师、视频制作者、教师也担心自己的“饭碗”被AI抢走。人类剪辑一条视频、绘制一张画可能需要几个小时的时间,但AI只需几分钟就可以完成。
目前,ChatGPT可能并不会和人类“抢饭碗”,因为AI的力量还不够强大。
一位研究历史、艺术的工作者告诉价值星球,在试用了ChatGPT之后,他“松了一口气”,因为ChatGPT在专业领域获得的训练材料还比较少。当他试图让ChatGPT写一段关于昆曲的文字,他发现ChatGPT缺乏基本常识。
另一位用AI生成画像的网友则发现,在他提供给AI的几张素材中,只有一张自拍合照被生成了勉强能看出长相的绘画,“但是人脸闪烁着奇怪的星形光芒,眼镜框也扭曲了,看起来十分恐怖。”而其他照片生成的图片则更加诡异,风景变成了扭曲的色块,人像则全部变成了二次元风格的“纸片人”。
不过,随着训练素材的增加,以及人工智能技术的发展,未来AI确实可能对各行各业造成威胁:只要添加的训练素材足够多,AI的“学习能力”更强,它就可以生成更加精美、更加准确的作品。
而且,很多文字、艺术工作者创作的作品版权并不属于自己,而是属于公司。在公司面前,个人的力量过于渺小,一旦公司把作品用作训练素材,作者很难采取有效的措施通过法律维护权益。
面对这种可能出现的威胁,美国好莱坞的编剧们已经坐不住了。5月2日,美国编剧协会(WGA)与电影制作、流媒体公司谈判破裂后宣布罢工,除了呼吁提高薪资待遇,他们还要求限制人工智能的使用,例如不允许公司将编剧的原创作品提供给AI进行训练,不承认AI作品的原创定义。此前,在谈判中,WGA要求制片公司“确保编剧不被强迫改写AI创作的剧本”。
图源:Pexels
WGA的罢工队伍经过迪士尼、华纳、Netflix等大型制片公司和流媒体公司的门口,他们手中的牌子印有“WRITERS GUILD ON STRIKE(编剧协会正在罢工)”的统一标语,以及编剧们手写的口号。
有人打出“AI没有灵魂”的标语,有人打出“用AI代替高管”,希望把矛盾转移到更高薪的其他行业;还有人幽默地吐槽ChatGPT写作能力较差:“我让ChatGPT写一个标语,但它的表现很烂。”
目前,没人可以预测这次罢工会持续多久。
在这一次罢工之前,美国编剧已经十几年没有发生过大罢工了。上一次罢工发生在2007年到2008年之间,持续了100多天,导致美国电影业损失高达20亿美元,2008年电影电视金球奖颁奖典礼被迫取消,只公布了获奖名单。
WGA宣布,在达成协议之前,任何WGA成员都放弃收入,并不会再撰写新的剧本。这意味着,如果无法就编剧报酬和人工智能两个问题达成协议,好莱坞影视行业目前600部作品或将受到影响,2万名员工有可能停工、失业,损失高达810亿美元。
最近一段时间,谷歌、百度、腾讯、华为等国内外大厂已经开始竞相布局AI,2023年或许成为真正意义上的“人工智能元年”,而各行各业对AI技术的担忧也越发严重,担心AI成为一个“潘多拉魔盒”,打开它将造成人类无法预测的后果。
许多专家认为,AI并不会真正取代人类的工作,它只是人类工作的辅助者,帮助承担较为初级的工作,例如属于简单重复劳动的校对、生成文字、剪辑视频、绘画等,但真正的创意是无法被AI取代的。以编剧行业为例,AI可以写出通顺的文字,但很难通过对社会的深入观察产生创作灵感,写出一个有新意或发人深省的故事。
然而,任何领域都遵循“二八定律”,能够站在成功的巅峰、获得较高收入的,永远是少数人,大多数人都在从事重复的劳动。
编剧的常态是为已经设计好的大纲撰写分场剧本,插画师的常态是按照甲方的需求画出他们想要的图片,教师的常态是讲解基础知识……如果AI足够强大,并取代大部分基础工作,仍然会造成相当严重的失业。
《未来简史》作者尤瓦尔·赫拉利在书中提出了“无用阶级”这个新概念,他认为,随着生物工程、人工智能等技术的革新,未来99%的人都将沦为“无用的人”,他们做的工作无法超过计算机和人工智能。
在一次采访中,赫拉利对大型公司收集用户数据、发展人工智能的未来表达了担忧:“(如果)只有少数精英拥有了数据、权利,而大多数人却没有,那些拥有了数据的人,可能比你自己更了解你,他可以预测你的行为和决策,操控你的选择和想法,为你做决定。”
因此,赫拉利呼吁,要让大多数人能从新技术中获益,而不只是少数精英。
技术的更新,往往会超过很多人的学习能力。在智能手机的浪潮中,我们已经看到很多老年人不会使用智能手机,沦为“技术难民”,而比起智能手机,AI波及的人群可能更加广泛,影响也更加深远。
解决新技术带来的法律问题,乃至社会和伦理问题,已经迫在眉睫。如果等到AI已侵入每个人的日常生活再做出反应,可能为时过晚。面对这种可能颠覆人类生活的技术,态度无论如何谨慎也不算过分。