Luna Nova Magical Academy first-year student.
#StandWithMinorities
Blog | https://renn.engin... |
GitHub | https://github.com... |
Cannot speak | 🇹🇼🇺🇸🇯🇵🇨🇦 |
Blog | https://renn.engin... |
GitHub | https://github.com... |
Cannot speak | 🇹🇼🇺🇸🇯🇵🇨🇦 |
我不會試圖在 SNS 說服支持或反對罷免個別選區的罷免投票,不過近期客觀研究數據可以證實台灣輿論正嚴重受到境外勢力介入
听了一个大学里的跨学科social & culture研究中心关于AI的讲座,题目是Behind the magic of AI - The Mirage of Total Automation and its Hidden Workers,然后刷了下象,看到一个关于某期讲解AI技术(DeepSeek)播客的笔记,播客题目查了下是“逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学””。两者对比起来我突然意识到关于AI的(本该是最cutting edge的)技术讨论中经常让我感觉到的那种神奇的obsolete究竟是什么——他们讲的内容在tech上是最前沿的,但他们在理解更大的(超出狭隘的tech product边界本身的)system/生产方式如何被建构和运作上是outdated的。
或许可以解释为什么tech领域的人更相信AI是“智能/intelligence”、像人,而社会/人文学科的却在强调相反(毕竟后者擅长的就是制造和解构ideology,揍)。
以下记录一下讲座上听到的一些之前没有太见到过的关于AI生产和运作的perspectives以及和我之前知识擦出的新火花:
1. AI作为产品不是单纯的一个model product,也同时是一个data product。无论是准备training dataset还是检验模型的输出正确性、校正bias、维持“正常”运作都是data labour;甚至在当下,更多的data labour不是大众以为的准备training dataset,而是更靠后的verifying/refining/alignment任务。AI业界和公司总在强调“不是纯堆数据”是掩盖AI产业的(human) labour-intensive性质的narrative的一环。正如AlphaGO总被描述为AI战胜人类的重大里程碑,但实质是tech+很多很多人类群体战胜了一个人类个体。在这个意义上,(过于)简单粗暴地说,AI能“像人”恰恰是因为它不tech的那部分就是大量人类的data labour组成的。(挺讽刺的是AI这个对human data labour refining但宣称仅仅是high tech伟大成就的手法又转头被DeepSeek拿来对OpenAI进行refining但宣称只是自己的成就<-至少是模糊其辞试图misleading)
2. AI产业(以及其它类似高科技产业)中labour的定义和形式(multiform, everywhere, visible or invisible)已经超出了大众对劳动/上班的传统理解。当下的digital labour超越了传统的“产品/product”边界。过去无法想像的劳动形式已经成为了普遍现状,比如为尚未存在的产品劳动(e.g. Uber司机的驾驶data被Uber用来训练自己的无人驾驶产品或者贩卖给无人驾驶汽车公司)、为已经被贩卖掉的产品继续劳动(e.g. ChatGPT用户在对话中提供的语言data和在对话后的“打分”或者“帮助我们改进”被用来继续训练AI模型)。而AI公司和资本利用了这一点让人们做free或者nearly free/underpaid的data labour (以及社会学家和女性主义者要说这就是千百年来女性domestic labour的某种延续嘛:零碎、隐蔽、不被承认)。而且它们非常擅长把这些data labour包装为gamification甚至entertainment,比如各种“证明自己不是robot”的图片识别、拼图验证。讲座中提到的一点我认为非常重要:ChatGPT从一开始严重的bias甚至inappropriate language问题到几年后看起来甚至比很多人都要“客观/温柔/耐心”,不是仅仅靠技术工程师/科学家的改进,而是海量用户在和ChatGPT的交互中通过feedback在collectively“教”它该做什么/不该做什么,换句话说,用户实质上在使用产品的同时免费给它做quality control的labour。但是这部分labour没有得到任何报酬和credit/recognition。AI公司对这种labour的downplay乃至denial显然是有意的。(还有一种labour我认为是“读者”labour,即AI创作需要人类“读者”付出劳动去make meaning,这也是被AI产业和公司试图偷窃的credit。这一点我几天前写过一条 https://bgme.me/@phyllisluna/114096521366030547 ,这里不展开)
3. 平台/platform对于AI产业的重要性常常被忽视。数字平台不仅仅是扮演传统商业的“中间人/middleman”角色,它本身是marketplace和firm/公司的hybrid/混合体:marketplace提供了digital labour的交易场所和digital work的分配和验货场所,而hierarchical的公司结构能下达清晰的commands。大型平台同时既是靠AI来function的(各种AI和算法驱动),又是生产AI产品的公司(得到的data被用于继续训练AI),比如Amazon和Uber。AI用纯synthetic data(即AI自己生产的数据)继续loop训练(至少目前)只能产生crap,但在平台上它能持续不断地“吸(新的、人类的、免费的)血”。
4. AI确实可以并正在被用来创造“平等/equality”,但这并不是AI自带的属性。社会人文学科的学者们研究揭露了另一个大众的错觉:在AI的usage & deploy phase(即使用阶段),它确实在某些应用情境中可以推进平等(e.g. 对于知识的access、让一些services比如心理咨询变得affordable),但往往只是给已经存在的推进平等手段accelerate/加速(e.g. 知识共享、聊天/心理咨询作为照护),而不是它“发明”了新的approach——需要警惕AI产业的narrative如何偷走这些preexisting approaches(和人们)的credits。并且这不能“抵消”掉AI在制造过程中的对inequality/不平等的加剧问题。以及我想再step back一下:AI被用来作为solution的许多问题是否只能靠AI或者科技来解决?比如心理咨询的affordability问题该靠提供(看似廉价但隐形代价高昂并且会继续制造新问题的)AI咨询,还是更radical地重新思考/建立人和人之间的照护网络、反抗制造了大量心理问题的社会结构?Not Just Bikes之前做了一期长视频分析无人驾驶是否真的能解决城市交通问题(spoiler alert:不能),我认为可以提供一个思考的契机: https://bgme.me/@phyllisluna/114009089820954252
High tech往往把自己包装成radical、innovative的,但内核经常是conservative、extractive的。AI也不例外。
已经有了很多对大数据/LLM AI实质不存在“智能/intelligence”的分析和讨论了,不过我觉得单靠这些还是不能deal with“但我和AI聊天的时候它甚至比很多人更耐心/有同理心/关心我/懂我啊”或者“AI写的诗就是(比很多真人写的更)有趣啊”的大众直观感知。固然当下人们缺乏情感互助支持、心理咨询日益被商品化,倾诉需求很容易被导向AI,因此对承认AI只是冷冰冰的机器/代码在情感上拒绝,但哪怕这一点先放一边,还有其它因素影响着人们对AI的“人格化/anthropomorphize”倾向。其中至少有两个不相同但有所关联:作为人,我们日常习惯的对“intelligence/consciousness/emotion”的判断方法是一种shortcut,在某些情况下有致命缺陷;作为现代人,我们承认AI的“(创)作者/author”身份导致它像人类authors那样在写作-阅读/write-read活动中获得了本不属于的credits(i.e.捧得太高),所谓的AI创作其实是“AI创作-人类阅读”。 第一点这里不展开,推荐一篇以前提过的详细谈这个的文章( https://bgme.me/@phyllisluna/113001311647216962 )。(过于)简单来说,我们总结出的很多描述人类特质的criteria是建立在对象是人的前提下,因此仅适用于人。举一个粗暴的例子,某个人用丝线织了一张精美的大网,我们会称赞ta心灵手巧或者聪明,但同样的因果逻辑不适用于蜘蛛。AI也是类似。 这里想详细谈一下的是第二点,为什么作为现代reader/viewer,我们会无意识给予了author过多的credits。本雅明在《讲故事的人》(1936年)里讨论了故事/story和现代初期出现的(长篇)小说/novel的区别:讲故事的人和听故事的人之间的关系是可转换的——听故事的人(们)从别人那里接受一个故事,如果它足够有趣/打动他们,他们会记住并在日后用自己的方式再讲给另一个/些人听,人们的经验通过故事的重述得到融合传播(乃至成为更广泛的人类的经验);而小说不是这样的,小说的作者和读者都是孤单的。还有一点本雅明没有提到的是:讲故事是双向交流,讲故事的人会根据听故事的人修改故事(以便符合他们的理解),因此哪怕是同一个人在讲,ta也是在不断“重述”;而作为文本/text(而非语言/oral),小说通常来说默认只有一个“定稿”(哪怕多稿也只存在于很短的时间里,不像故事可以有非常长的版本时间跨度,后者的版本改动甚至可以用来做为社会文化长期变迁研究的素材),它拒绝被重述(潜在的改造)。拒绝被重述让小说得以归属于某(几)个特定的作者成为可能——这和更早期的故事默认不属于特定的个体有本质的区别。而这个区别又造成了更深远的影响。首先,习惯了小说/novel形式的现代人更倾向于把某个作品归属给一个明确具体的“作者/author”,哪怕它事实上是群体创作/collective creation或者联合创作/collaboration,比如伊利亚特和奥德赛需要有一个作者“荷马”,又比如艺术家-缪斯组合里那个缪斯总不被承认是作者。而“作者”概念又进一步为作品圈下了领土/确立了所有者,作品被视为作者的某种财产/property,阅读被视为一种读者的passive行为(不能对作品产生影响)。因此作者/author占有所有的荣耀/credits(以及权威/authority)——作者literally & figuratively就是(the) Creator/God。 但这只是一个illusion。“故事”和“小说”之间事实上并没有那么泾渭分明的界限,阅读小说某种程度上是读者对小说-故事的内部“重述”。最简单粗暴的解释是很熟悉的“一千个人眼中有一千个哈姆雷特”,但这尚没有彻底撬动“作者权威”。罗兰巴特在《作者之死》(1967年)里提出掌握一切的author-God是不存在的,读者的阅读行为/reading总是在actively参与meaning-making的劳动/work。换句话说,meaning-making是一个event而非(static) object,它不能在作者结束作品的写作时完整得到,而必须在读者阅读的行为中完成,也因此作者无法占有全部的权威(即巴特所说的从author到scriptor的转变)。这种“重述”最有意思的表现形式我认为是同人小说。同人小说以小说-故事的形式/form实现了对原文本(小说-故事)的critical reading / analysis / commentary,可以说是一种对“讲故事”的radical延续(或许也是因此原作者/author或者版权所有者总对它们产生严重焦虑——对失去作者权威的恐惧)。 以上分析我们也可以很容易地推衍到非文字/语言的其它领域。潘诺夫斯基谈到所谓的“作者本意”是不牢靠的、作者总是会基于个人经历、时代背景、社会文化环境等等因素在作品中作出无意识的选择(也因此multiple readings是可以并且理应并存)。更近的是Mieke Bal提出的sign-event概念,认为sign的meaning是不稳定的、在观看的过程中被观看者诠释/interpret。她举了一个特别有意思的例子:Rembrandt Research Project这个机构致力于“鉴真”伦勃朗画作,但观看者在以“我看的是伦勃朗真迹”的这个信念下的观看event中创造了(打引号的)“伦勃朗”,无论看的是真迹与否——这距离AI写诗的情况非常近了。 (补充一下,Mieke Bal认为作品本身对读者/观看者的解读范围是有所影响的,即读者/观看者固然可以read against grain,作品总会更encourage某些readings、让它们更顺遂。) 绕了这么一大圈,我们终于来到了作者-读者/scriptor-reader的dynamic上。对作者权威的过度推崇导致了对读者agency的贬低和忽视。但在meaning-making的event中,读者是不可缺失的。哪怕是“没有读者”的作者在写作时也需要想像一个潜在的读者(以及ta也总是自己的读者)。而反过来,作者是可以缺失的吗?当我们问出这个问题,我们就接近了AI创作(-人类阅读)的核心。作者坍缩到极致、读者的agency占据全部的情形早在AI甚至计算机出现前就已经发生过了无数次:人们试图从烧过的龟板、骨头、咖啡渣里读出未来/命运,在天空的云彩中看到猫狗恐龙…… 或者可以换一个问题:AI能/会读它自己写的诗/看自己拍的电影吗? “AI创作(-人类阅读)”中人们常常只关注所谓的创作过程(实质上是某种程度的随机鹦鹉/stochastic parrots,即对输入语料的条件性随机重组),却看不到真正有趣的事情是发生在那之后的人类active阅读时。我认为这种盲目既是一种“作者中心/author-centric”的惯性,也是一种有意的引导:让人们更拜倒于科技进步的脚下、更心甘情愿为之付费/付数据/付劳动(并且贬值/devalue真正的人类创作)。 把AI创作讲清楚了,我们就也能谈谈对话式AI了。某种程度上,对话是一种mini写作-阅读循环:一方基于对另一方作品的解读去写作自己的作品,如此往复。但问题在于AI并不能“阅读”,它只能pattern-matching,并且是把人提供的信息/data作为pattern-matching的criteria之一丢进随机过程里;每一次写作-阅读中真正“创造”新东西/做meaning-making的work只有人。对话式AI从这个角度上说本质是一种“诈骗犯/算命先生”。(已经有很多人分析过对话式AI哪怕不收集个人隐私信息也可以利用人在对话中提供语料做未来的AI训练,这里不展开了。) AI没有“心”,无论善意还是恶意,它就是一个empty surrogate,也因此可以作为vehicle承载它背后的人/资本的任何意图。或许这是我们认识到它为什么可以没有“心”也依然被我们看起来像人之后所需要面对的情形。 #ArtificialUnintelligence