在阿尔法狗于2016年至2017年先后战胜围棋高手柯洁、李世石多年之后,人工智能再度吸引全球目光。2022年9月,在美国科罗拉多州的一场艺术竞赛中,游戏设计师杰森·艾伦使用AI绘图工具生成的作品《太空歌剧院》在数字类别比赛中夺得头奖,这在艺术史上是人类第一次把奖项颁给人工智能生成的作品。
仅仅几个月后,ChatGPT席卷全球,成为最受欢迎的AI软件,甚至掀起全球的“AI竞赛”。
当人工智能从前沿领域来到日常生活的边缘,不可避免地,人们将重新思考和讨论有关艺术与科学的问题:在人工智能的影响下,艺术何为、人类需要怎样的艺术、如何评价AI生成艺术的价值,等等。或许我们可以借此机会更加深入地理解人工智能演进的逻辑以及艺术领域的重要变化。
01 从图灵测试到ChatGPT
2月15日,在阿联酋召开的2023年世界政府峰会上,埃隆·马斯克在远程访谈中说:“人工智能已经发展了相当长时间,它只是并不具备大多数人能使用的用户界面。ChatGPT所做的,是在已有若干年的人工智能技术上添加了一个可用的用户界面,且还将会有更先进的版本问世。”
20世纪50年代,人工智能技术(以下简称AIGC)初步萌芽,由艾伦·图灵提出著名的“图灵测试”;20世纪末至21世纪初,AIGC技术从实验性向实用性转变,但还无法直接进行内容生成。
如今,随着生成式对抗网络(GAN)的提出,深度学习算法不断迭代,人工智能生成的内容百花齐放——从2018年的GPT-1到2022年初的GPT-3和InstructGPT模型,ChatGPT在此基础上产生,嵌入了人类反馈强化学习以及人工监督微调,因而具备了理解上下文、连续对话等诸多特征,解锁了海量的应用场景。
这样一款拥有强大学习和交互能力的人工智能对话模型,属于AIGC模态划分中的文本生产领域,此外,还有音频生成、图像生成、视频生成、游戏生成、3D生成等,业已取得丰硕的成果。其中,图像生成技术和艺术的关系最为密切。2022年下半年,AI创作工具层出不穷,虽然创作质量参差不齐,但基本都与自然语言的图像转化关系密切。
02 AI图像生成平台涌现
2022年初,推出ChatGPT的OpenAI公司曾发布过图像生成工具DALL·E 2。在此模型中,自然语言(文字)能自动生成图像,创作者还可以根据结果不断优化,它在艺术和设计领域均有准确的应用场景,如插画创作、产品设计、平面设计等方面。
此外,人工智能公司Stability AI推出了Stable Diffusion。相比OpenAI,Stable Diffusion采用开源和去中心化模式,任何人通过开源代码和在线工具都可以开发和使用,符合其平台理念“AI bythe people, for the people”。这款模型更加追求图像的艺术化和风格化,擅长艺术类图像生成,且可以调整多种参数。
与有微软加持的DALL-E 2和高额融资的Stable Diffusion不同,Midjourney还只是个独立的研究机构,人员精简。其最突出的特点就是社区化运营,该模型搭建在Discord聊天软件中,用户可实时发布作品,也可以借鉴其他用户的作品和词条。只要输入“/imagine”的提示符,就像召唤魔术的咒语,系统会在60秒内生成4张新图像,用户可在此基础上改进或提升视觉品质。
中国的科技公司自然也不会缺席人工智能的开发,除了百度集团推出文心一格外,阿里达摩院也推出模型M6,且主要应用在阿里电商体系中。设计师只需输入本季的设计需求,如颜色、款式、面料等,M6便会设计出大量服装作品,设计师再从中挑选拓展设计。如此,M6承担了助力设计师或初级设计师的职能,得以让设计师专注于创意和决策,提升工作效率也减少了运营成本。
除了以上的图像生成工具外,还有Imagen Video、Make-A-Video、RunwayML等AI视频生成工具,腾讯AI Lab、超参数等游戏生成工具,Magic3D、DreamFusion等3D生成模型。
总体而言,智能技术与艺术工作者的融合协作已不可避免,低门槛的创作工具让艺术更为“民主”,绘画技术和软件技术不再成为壁垒,但随之出现的艺术的版权问题、监管问题也将更加严峻,社会更需要有真正创意、设计策略和用户洞察力的好设计师。
03 “艺术已死”之忧重现
值得注意的是,AI创作也早已进入了艺术品拍卖市场、艺术品修复等多个领域,引起更为广泛的关注。
2018年10月,佳士得纽约拍卖行以43.25万美元的价格出售了一幅由算法生成、类似于19世纪欧洲肖像画的作品《Edmond de Belamy》。这幅版画由法国艺术组织Obvious在Midjourney上创作完成,售价为最高估价的45倍,震惊了整个艺术界。
2022年12月,由百度文心一格续画的民国才女陆小曼未尽稿、联同著名海派画家乐震文补全的同名画作《未完·待续》在云朵轩30周年拍卖会中以110万元落槌成交,是全球首次AI山水画作的成功拍卖。
当五花八门的AI创作工具问世、AI艺术作品不断涌现并获得认可时,究竟谁才是艺术家?这些还能算作艺术吗?我们该如何看待技术与艺术的关系,以及如何自处?
尽管人类疑虑重重,但技术发展在资本的驱动下,人工智能介入艺术领域且占据重要地位将成为一种必然。如果说“艺术之死”尚且属于小部分人的担忧,更多人担心的则是人类最终是否会被人工智能取代;进一步则是,人类是否会在AI面前失去想象力,且艺术是否正在远离人性?
笔者认为,那些宣称“艺术已死”或将AI拒之门外的艺术家及评论家,与150多年前反对摄影术的前辈们是如此相似——19世纪法国诗人和艺术评论家夏尔·波德莱尔认为摄影是“艺术最致命的敌人”。20世纪,很多艺术家们同样拒绝使用数字编辑工具和计算机。他们深信人类才是艺术的本质来源,技术会剥夺人类对艺术表现的掌控。
然而,就算是画笔、颜料和纸张,无一不是技术进步的产物,人类从未在没有技术的情况下发展自身。
即使是完全没有人参与的创作,艺术同样存在。艺术史的进程不同于科学史,它不会借进步主义呈现一种单一性,而是逐步走向“文无第一”的丰富性,这便是杜尚“小便池”的意义——作为艺术品的“泉”意味着传统艺术走向更广阔的丰富性的开端。此后,艺术不仅决定于作品形式,更决定于创作者意图和受众的理解。
艺术家索尔·勒维特说过:“想法变成了制造艺术的机器。”或许,想法从来都是制造艺术的机器,现代艺术只是重新唤醒了人们的意识。
这块人脸形状的水磨石出土于南非马卡潘斯加特,距今约300万年前,目前收藏在伦敦自然历史博物馆。它是一块天然的流水塑形,未经人工雕琢的、约6厘米宽的红褐碧玉。可以想象,当我们的祖先将这样一块石头从河边拾起,细细欣赏并带回家中收藏时,艺术便悄然产生了。
这意味着人类已经开始辨认自己族群的面部特征,并能够对其他事物的形象进行观察并产生联想。艺术品不一定要为人所创作,但一定记录着文字所不能传达的人的意志和活动。
而人工智能为了追求运算的效率,所牺牲的恰恰是原本被当做目标的智能,它将越来越成为有效的工具而非有意志和思考能力的主体。
在“太空歌剧院”系列画作中,尽管素材是来自人工智能所学习的庞大数据库,但灵感是属于艾伦的——他花费了80个小时,对这幅画进行了900多次迭代,依靠编辑庞大的词汇库来完成画作,某种程度上他更应被称作诗人而非画家。实际上,即便使用相同的词汇,也不太可能生成一模一样的“太空歌剧院”了,因为接受相同描述的AI可以生成不同的结果。
而百度文心一格也在众多技术人员和艺术专家的操作下,经历了AI学习、AI续画、AI上色、AI生成诗词等多个步骤,应对完成了人机绘画流程融合、可控性、高分辨率等三大挑战。人工智能的改良是为了让AI能更加了解人类的指令,以便描绘出人们发出指令时心中构想的图像。
04 脆弱性、有限性激发的创造力
作家沃尔特·基恩在一篇名为《没有人工智能艺术这种东西》的文章中写道:“人工智能对作家曲折、痛苦的内心戏一无所知。它只是编写、筛选和分析,最后加以执行。它不会勇往直前,它不冒任何风险。只有人类,我们这些脆弱的物种才可以。如果只是按下一些按钮,那就不是艺术,不是吗?”
尽管人工智能极大地加速了艺术作品生产和淘汰的速度,但在数字时代长大的人们的价值观也在飞速变化。我们看待物质的稀缺性、所有权和占有方式都不一样了。未来,AI艺术会变成一件稀松平常的事情,人们会更关注人类在创作过程中所遭遇的挫折和苦难、所表达的灵感和愿望。
但用AI创作的人们已不再等同于使用画笔或按下快门的人们。艺术家不可能再仅仅专注于眼前的景象和脑海中的念想,而需要找到并学会与AI进行沟通和合作的方式。
杰森·艾伦在接受媒体采访时表示:“人们需要‘克服他们对技术的否认和恐惧’,人工智能是一个工具,就像画笔一样,没有人,就没有创造力。”
人工智能不断进步,去满足人类对于艺术的想象,对设计的需求,本身才是AI艺术最具价值的地方。如同从古埃及埃赫纳顿雕像发展至古希腊古典时期持矛者雕塑,人类不断变化的表达欲求和创作智慧在艺术的演进中得以呈现。如果我们无法想象一种没有技术的未来,却又担心技术带来所谓“悲剧性的春天”,我们又怎能要求艺术将自身隔绝于技术之外?
05 感知提升是人工智能给艺术的机会
我们为什么要用人工智能做艺术?人工智能仅仅是工具吗?在人工智能发展和元宇宙场景等的发展背景下,人的神经系统和感觉器官得到极大延伸。日常生活里,人们通常以亚里士多德的“五感”为准绳,但最近的神经学研究指出平衡感、热感、痛感等也是极为重要的感觉。
在元宇宙艺术的创作和欣赏中,目前主要仰仗的感官是视觉和听觉,毕竟80%以上的信息是由视觉来处理的,但实际上在感知外界刺激时,视觉反应的灵敏程度远远低于听觉。
在五感中,嗅觉是一个值得额外关注的器官。它的工作系统非常特殊——是五感中唯一一个不经过丘脑神经元,而是直接进入大脑的初级嗅觉中枢。这个中枢叫嗅球,位于眉间头骨的后方位置,与杏仁核、海马体直接相连,前者进化自大脑中专门负责监测化学物质的区块,后者主要用于存储长期记忆——这也就不难理解,为什么当闻到熟悉的味道时,人总会在脑子中想起与这个气味相关的情景。
由于气味并不是人类首选的交流方式,因而它在人机交互和沉浸式环境方面尚未得到广泛应用,但同时这也意味着它的开发前景广阔。
在人工智能和数字媒介艺术创作中,利用各种媒介对体验者的各个感官进行全方位刺激,虽然体验者的各个感官会相应发挥作用,但在实际情况中它们并非各行其是,而往往是彼此照应、相互合作。在生物学中,这一情况被称为跨模态(Cross-modality,也译作多模态),即整合或融合两种及两种以上的感官技术,通常是沉浸式环境的特征之一。
通俗来说,就是我们平常所说的“通感”“联觉”。主体的多感官体验此时变成了超感官体验,因为其视觉被支持进入数字艺术世界的那些作为人体感官延伸和超越之物的媒介增强了。
人工智能艺术会不断用视觉化的场景追问存在、知觉和世界的本质,从宏观到微观,再放大到宏观,在维度的不断切换中,人自身的感知系统不断提升,并构建出人工智能艺术时代的基础。
人工智能艺术是人类的“自我绵延”,是自我、意识、生命等现象的存在即变化发展特性,这些事物的变化发展是连续不可分割的过程——在这个过程中,后面的状态包含前面的状态。正如柏格森“绵延”理论所呈现的,“在绵延中过去和现在变为同一,而且继续与现在一起创造……崭新的事物。”
作者:弋语可系清华大学美术学院硕士研究生;高登科系清华大学艺术博物馆博士后