时间: 2024-09-05 12:40:42 | 作者: 党建专栏
复旦大学新闻学院博士研究生程博在《传媒观察》第8期刊文,聚焦插件在计算平台与社会文化交织背景下的崛起,特别是其作为ChatGPT、文心一言等大模型的扩展工具所发生的角色转换。通过结合计算机的历史,从软件研究和文化技艺理论视角分析插件,揭示它如何成为技术革新和社会文化转变的参考系统,并且构成二者交接转化的本体节点和本体操作。在人人皆有望成为开发者的时代,以“原媒介”更新“元媒介”,旨在回归和重构元媒介与计算机的开放性、扩展性和实验性等多重属性之间的关联,探询插件开发作为微观实践调节人类生活世界的可操作性。将插件作为媒介研究新的关键词,为我们理解媒介与社会文化之间的互动和进行媒介实践提供了新基点和新视角。
在生成式AI时代,大语言模型成为新的计算平台。这次的兼容性目标不再停留在技术范围内,而是意图与用户的日常生活进行全方位耦合,使大语言模型成为社会文化系统运转的数字基座和通用媒介。但是,大语言模型的技术通用性如何转变为社会文化层面的媒介通用性?从已有的实践来看,多个大语言模型厂商都不约而同地将视线瞄准了“插件”,尝试赋予大模型使用工具的能力,并认为“未来,插件将成为大模型的标配,更好地解决用户个性化、复杂化的需求”。如OpenAI将插件看作是延伸ChatGPT的“眼睛和耳朵”,从而联系和影响现实世界。百度则是用插件为文心一言装上“手和脚”,做到“读万卷书,行万里路”。
科技巨头们的默契不止于此,它们在平等地为每个用户更好的提供一个统一模型的基础上,鼓励第三方开发者(包括各类服务提供者、专业数据拥有者,甚至只是有创意有想法的普通用户)自主开发插件,实现个人的智能体自由。OpenAI鼓励人人开发创建自定义版本的ChatGPT(即“GPTs”)。百度则是直接喊出了“人人皆插件开发者”的口号。
将人对插件的开发与全世界的更新相联系,这在人类文明史上是开创性的。为何是插件?用微软首席技术官凯文斯各特(Kevin Scott)的话来说,插件是“让PC变得伟大的东西,让互联网变得伟大的东西,让手机变得伟大的东西”。
本文认为插件理应如马诺维奇所言,能够推进媒介研究所需的新名词、新范畴和新操作,使人们更好理解当下的技术和社会文化形态。所以本文还将从能够“勾连起微观的技术操作与宏观的文化差异和社会变迁”的文化技艺(Cultural Techniques)理论展开对插件的阐释,最终串联起与插件相关的术语、对象、结构和思想,从中尝试提出理解媒介的新基点和新概念,为人类对媒介及其形塑的社会文化进行反向调节提供新的参照。
插件作为一种技术对象或技术形式实际并不新鲜。如浏览器上的多种扩展项、Adobe系列媒体编辑软件中的各色滤镜和插件、手机上的应用服务卡片,等等,插件早已深入人们的日常生活。插件在不同的语境中指涉不同的形式,可以是一段代码、一个被封装的对象、一个脚本或者是一个第三方应用程序,也可以是一个音乐合成器、MIDI键盘、外接屏,等等。除此之外,插件无论是在中文语境下还是英语语境下,都有多个称谓,并且彼此之间多可以替换使用,比如插件(plug-in、plugin、add-on、addon、add-in、addin)、外挂(plugin、hack)、外设(peripherals)、加载项/附加组件(add-on)、附加项(addin)、扩展(extension),等等。由此可见,插件及其变体的身影早已分散在整个互联网乃至现实世界中。从软件研究的方法来看,针对插件的数字话语建构就是要将其看作一个关键词,持续收集和明确有关插件的一系列关联和解释,在不同的术语、对象、结构和思想之间建立联系,使其变得可理解和可操作。
依据大英百科全书的解释,插件(plug-in/add-on/extension)是指“在不改变主机程序本身的情况下为主机程序增加新功能的计算机软件。大范围的应用于数字音频、视频和网页浏览,能够使程序员在无需用户脱离程序环境的情况下更新主机程序”。得益于插件的支持,软件能轻松实现在程序发布之初未能提供但用户要的功能。所以在像Google Chrome、Microsoft Edge、Firefox等浏览器中都配置有插件商店,智能手机上的APP store、微信的小程序也是同理。
插件不都是软件,还可以指用来插入电源插座或电路的物件。在20世纪初的技术文献中,插件最早指的就是由晶体管组成的可插拔的电路单元,能够方便机器维护和换新。世界上第一台超级计算机“Atlas”的创新性特征之一就是使用了名为“Extracode”的硬件插件。Extracode可以入特殊的插槽中,以添加在硬件层面直接执行的新指令或功能。现在打开作为计算机骨架的主板,最为直观的视觉体验就是所有板块上都分布有数不尽的插槽,这些插槽就是供能够拓展和增强底板功能的插件板使用的。
对插件的开放性支持塑造了新的计算文化形态,使得计算机能够作为一种媒介发挥调节作用。如媒介考古学者尤西帕里卡(Jussi Parikka)所言,“在经历了20世纪80年代的‘革命’之后,计算机慢慢的变多地被设计成‘插件式’系统,以满足没有专业相关知识的人的需求。从某一种意义上说,这一转向的核心是对计算机的一种新的文化认知和理解。”这种新的文化通常被称为用户友好文化(user-friendly)。也能说,数字媒介的出现完全得益于与人类感官存在接口的插件内化的过程,用户都能够使用包括鼠标、键盘、摄像头、语音输入装置、图形用户界面在内的各式插件来完成与计算机的交互。也得益于插件的装配,人类用户才能在连通网络世界和远距空间的同时,保留自然的交互方式。
如果说温思罗普-扬以硬件、软件、湿件的三合一来指称计算机,那么作为湿件的人类一样能作湿件-插件来理解,特别是随着麦克卢汉“媒介即人的延伸”(“extensions”是插件的另一种代称)反转成为“人是技术的延伸”。ChatGPT和文心一言这样的大语言模型构成了用户神经系统的延伸,但作为大模型的延伸(眼、耳、手、脚)的插件却是由用户开发和组装的。换言之,基于生成式人工智能的个性化AI智能体(AI agent),恰恰不是通过人工智能直接生成的,而是与人类智能体共同生成的,在二者的一次次prompt和响应中生成。所以,是硬件、软件和湿件共同组装为一个完全插件化的生成性系统。我们自然要对《黑客帝国》系列电影中所描绘的未来人类身体与矩阵之间不可自主控制的插拔保持批判性的审视,但在当下,同样毋庸置疑的是,人类或计算系统都必须在与对方反馈耦合的过程中存有和存续。正如温思罗普-扬所总结的,无论是人创造工具还是技术控制人的腐朽立场都应该摒弃。人与技术之间始终存在着最为原始和根本的耦合,新技术只会更强调它是人类的本体论条件,二者共同进化。“最终来说,人类与机器的一起发展为媒介理论划定了界限,媒介理论将不得已认识到这一点。”
构成计算系统先验程序的插件,为计算机附加了可编程的本质属性和原生特质。可编程性又赋予了新媒体“不死性”,其新就在于“更新”,始终作为一种“未来媒介”存在。而随着软件程序在社会各个层面的广泛渗透和重组,可编程也早已超越了程序员以纯粹的代码指令编写配置软件程序的狭义内涵,成为了人们通用的经验加工系统和参考体系。广泛的用户参与和协作推动着人类世界“可编程的愿景”。媒介研究同样要与人类操作和技术演化一起更新。
可编程的新媒体是一个有自己新型标准和体制空间的领域。一开始,马诺维奇把新媒体阐述为包含计算机层和文化层并且相互影响的层级性组合。以“跨码”的格式转换重建着文化的计算机化,即“在含义和(或)语言层面,文化的范畴和概念可以替换为计算机的本体论、认识论和语用学所衍生的新范畴和新概念”。这样一来,计算机的可编程性就从媒介视角转译为“跨码性”,马诺维奇用“元媒介”(meta-media)来对此进行特别指称。计算机作为元媒介的本质就是“模拟其他媒介的能力”。但此一阐述存在的问题就在于,计算媒介完全被简化成了一个只是整合旧的模拟媒介技术的新型媒介,是将已知的和熟悉的媒介再中介化为看似美妙的数字化的东西,计算媒介的本体属性并没有正真获得揭示。
随着代码软件成为“我们与世界、与他人、与我们的记忆和想象的接口——世界赖以沟通的通用语言和世界赖以运行的通用引擎”,马诺维奇不得不更新对元媒介的认识,更准确地说,是将计算机的可编程性从跨码性复归到插件的本体操作上。马诺维奇认识到,软件与20世纪的工业产品所存在的最大不同在于,前者是高度可塑和可延展的,特别是在面向对象编程作为一种软件开发范式和计算的方法论普及开来以后,“可以描述的一切事物都能由单一行为组成块的递归组合来表示”。这允许程序员通过创建、分发和复用离散的封装对象进行软件的发明创造,也就是一切都可以被模块化进而“从称为功能或过程的可复用的小部件设计计算机程序”。以往各式媒介的独特属性或技术特征现在都成为可以在计算机中被组合构建的软件模块。
虽然马诺维奇借由重新定义软件的插接本质而更新了对元媒介的理解,但同跨码性和层级性相耦合的元媒介并不与插接技艺相兼容。此外,“meta-”(μετά)这一希腊语前缀蕴含着一种对一切存在者更高抽象层级上的存在的讨论,但计算媒介的本质恰恰是非本质的或去本体论的。用西格特的话来说,计算媒介是一种插接操作本体,是在由插件驱动的集成涌现中获得定义和再定义,而这一过程是持续进行的。所以现在的问题就转变为我们该如何从操作本体论出发重新概念化“软件之后的媒介”,或者说如何定义永久可扩展的媒介。其实在马诺维奇自己的多本著作中,已经提及了更为合适的概念——“原型”(prototype)。原型是技术在开放式交互过程中某些保持不变的内核、结构,不同的软件版本总是基于原型来不断地衍生,所以原型也往往是某一范畴中最原始和最有代表性的成员,如ChatGPT之于GPTs。
随着软件研究领域的逐渐开拓,原型在马诺维奇的潦草使用之后被吸纳为新的关键词。更关键的是,原型设计的运作模式与插件的操作链几乎无缝兼容和耦合。原型最常出现在实验室、产品设计和创客文化的讨论中,其一般定义是“有形地展示一个想法以测试其可能性,并与利益相关者(经理、合作者、潜在用户)分享”,指涉范围有“表达、表现或思想的中介;用于共享、协作、沟通、测试的工具;论证和愿景的体现;行动或讨论的道具”。原型因而能够说是一种通过众包组织进行发明创新的成长性平台,其操作网络同样是行动者、器具和技艺的配置。
不止于此,与计算机的开放式架构和永久更新一样,原型也具有“开放性”(openness)和“虚构性”(fictionality)的双重属性。开放性是指原型对转换和变形保持开放,其本有的不完成性(incompleteness)鼓励涉众“玩乐”(play),希冀玩家在与原型互动的过程中不停地反馈需求,实现产品更新迭代。应用市场上的“beta版”“测试版”等就是基于原型的开放性考量发布的“有缺陷”程序,内测用户成为产品完善的必要一环。虚构性则是指原型通常是对想象场景的物质化呈现,是一个可以发展、探索和具体化假设的试验场,以图开辟新的研究领域或创造新的可能性。早期的谷歌眼镜、近来大热的苹果Vision Pro以及要取代智能手机和APP的Ai Pin、Rabbit R1等都属于意图开辟某一新型商品市场的原型机,是面向未来的实验性预测或有待进一步开发的创新提案。所以综合看来,原型通常是“不稳定的、临时的、不确定的、不统一的、易于转换和重新定义的,处于一个动态的生命周期中,在已造和未造之间有”。这与艾伦凯最初所定义的元媒介意涵产生了共鸣,“元媒介是活跃的——可以对质询和实验作出回应——而这些过程也将让学习者参与双向对话”。
因而或许可以用“原媒介”(proto-media)来复归元媒介与计算机的复杂关联,凸显其开放性、扩展性和实验性等多重本体属性,并能支持和动员多元行动者的协作操作。原媒介同各品牌的原型机一样,其于人类社会的意义不在于自身的技术进步,而是人们在其基础上衍生扩展出的后续操作。以计算技术为内核的原媒介将始终处于一种可编程和再编程的状态,等待被发明创造出新的媒介形态和交互实践。因此能说,原媒介将重新定义一个“技术性的精神和实践的世界”,人们通过彼此的发明创造来做沟通,从始至终保持着对技术重新组合和再构的关注。如ChatGPT的“GPTs store”、字节跳动的“Coze”以及腾讯的“腾讯元宝”平台,作为生成式AI时代的“APP Store”,面向所有开发者开放,可以基于各厂商的大模型自由创建、分享和使用个人开发的插件、bot、智能体。
事实上,从ENIAC确立插接的可编程本体操作,到计算媒介的永久可扩展性即永远更新的不死性,操作链上的行动者们所打交道的一直是原媒介。只是借着人人皆开发者的时代契机,我们才发现,用户从未与一个处于完整和完成状态的媒介交互过,硬件会换代,操作系统和应用程序会更新。所以硅谷有“原型之地”之称,工程师、设计师、经理和经营销售团队夜以继日地生产着硬件、软件和其它有关技术文明概念的原型。而现在,无论是因为技术的进步,还是科技厂商追逐市场的需要,原媒介的编程接口开始向普通用户开放,开发方式和价值定位都发生了改变。
时至今日,计算技术的迭代使编程拥有了更为广义的内涵,自然语言成为继能源、信息之后的又一新生产力。以往常常由艺术家所扮演的媒介先锋的角色,现在既可以是OpenAI、Adobe和百度这般的技术机构,也可以是独立程序员、黑客和设计师等掌握一定专业技能的少数人群,更可以是基本上没有编程知识储备的普通用户。例如上述提到的ChatGPT和文心一言,通过开放插件支持和无代码编程,允许用户和开发者创造个性化的应用。这些插件可以是简单的问答模板,也可以是复杂的交互式故事生成器,它们扩展了模型的边界,使得大模型成为一个可由用户依据需求一直更新和定制的原媒介。马诺维奇也不得不感叹说,新媒介的发明从未像今天这般容易,可以由一个人或一小群人开发并便捷地向外传播。由插件矩阵构成的媒介文明正在涌现,每个人的自我表达、需求和创意都可以在快速开发出的插件中获得满足和具现。
永久更新的原媒介,人人皆开发者的时代承诺,全球硅谷对全球工厂的取代,所有这些变革都是插件技术不断迭代升级所催生的媒介生态革命。
在社会文化形态层面,拉图尔的《实验室生活》正在转变为“生活实验室”(living labs)。实验室以原型开发替代了论文的生产,是原型指涉内容的空间化体现和原型常态化生产的主要场所。这其中存在着一种双向运动。首先,纯粹自主的科学现在“下降”到“技术性科学”(techno-science)的层次;其次,日常社会关系则“上升”蜕变为本身就是实验室生活的形式。一言以蔽之,科学和社会现在都是技术性的。不仅是媒体实验室、人文实验室、黑客实验室、科技孵化器、创客空间等机构在社会中创造了“实验室热”(Laboratory Fever),而且是人类的整个生活世界已经以实验室为原型进行了改造(如智慧城市),加速着技术革新与社会文化的开放融合和交接转化。所以在后大众媒介时代,不是人人都有麦克风,而是你我皆可为插件开发者,作为插件、开发插件、组合插件,才能作为非异化主体从科技厂商和专业机构对改变社会的技术操作垄断中逃逸而出,接入能动更新世界的进程。
(载《传媒观察》2024年第8期。原文约15500字,题目为《插件:理解媒介的一个新基点——基于文化技艺理论视角的分析》。此为节选,注释从略,学术引用请参考原文。“传媒观察杂志”公号全文链接:。)