
凌晨五点,内罗毕的天还莫得亮,迈克尔·杰弗里·艾什亚(MichaelGeoffreyAsia)仍然睡不着。失眠曾经持续好多年了。自从他运行替东谈主工智能系统“计帐寰宇”,覆按机器若何言语、若何安危东谈主、若何效法爱,他的体格就再也难以回到正常的情状。
他会在更阑想起我方曾写下的那些句子——饰演一个长期在线、长期关注、长期知谈该说什么的东谈主。好多时候,那些“我领会你”“我想你”“我爱你”并不属于他,却要由他发出去,最终变成平台不错计量和售卖的服务。
迈克尔常说:“东谈主工智能其实并不‘智能’,每一个AI背后都有东谈主的样子。”在他看来,今天的生成式AI高涨不单是算法、芯片和数据中心的故事,也引诱在一套很少被磋磨的东谈主类基础措施之上——散布在肯尼亚、印度、菲律宾、巴西等全球南边国度的无数低薪外包数据工东谈主。他们支撑着这场AI茁壮,却很少被动作期间产业的主体。
作为曾在多家大型科技企业外包平台责任8年的资深数据劳工,迈克尔原来学的是航空货运代理,却因休闲、虚浮、孩子生病和家庭债务,被动进入这条数字工作链。
他的故事揭开了一个被期间狂热隐敝太久的事实:今天被全球追捧的东谈主工智能,公众看到的往往是模子智商、本钱参加和居品竞赛,却很少看到背后那条漫长、潜伏而脆弱的工作链。
这条工作链包括数据标注员、内容审核员、聊天审核员、测试员、指示词编写者,以及无数处于层层外包底端的数字工作者。他们整理数据、计帐互联网上最恶浊的内容、覆按机器效法东谈主类情谊、修正模子诞妄,却承受着低薪、高压、创伤和险些无法申报的工作环境。
正如罗马上帝教教宗良十四世近期对AI的警示中说的:科技不不错捐躯东谈主性为代价,毫不可让AI控制东谈主类。他将AI带来的风险比作历史上的侍从制,提醒寰宇警惕将“克扣东谈主”再次常态化。
如果说第一次工业改造留住的标识性图景之一,是英国煤矿里周身煤灰、面貌窘迫的工东谈主,那么AI时间粗略也正在造成我方的工作图景:那些在期间茁壮背后承受低薪、高压、失眠与神气创伤的数据劳工。他们的故事告诉咱们——AI的“智能”并非臆造出生。东谈主们看到的是它越来越像东谈主,却很少看到,确凿的东谈主如安在这条链条上被耗尽。
迈克尔并不是独逐一个付出代价的东谈主。他说,仅在肯尼亚,此刻就至少有50万东谈主从事着类似责任。一年半前,他和同伴创立了肯尼亚数据标注者协会(DLA),试图把那些分散、千里默、互相隔断的经验再行汇聚起来。他反复说:“咱们不可一边建造AI,一边失去建造AI的东谈主。”

AI的“智能”是若何产生的
迈克尔原来并不属于AI行业。他毕业于内罗毕航空学院,学习航空货运代理,但愿进入航空物流行业,但恒久求职无门。确凿把他推入这条产业链的,是一场家庭危急。
休闲数月后,女儿在学校被严重烫伤;一年后又查出胃部问题,查验截止呈癌症阳性。那是2020年疫情最严重的时候,航班停摆、流动受限,迈克尔却不得不经久守在病院,濒临一个癌症患儿和不停增多的医疗开支。那时他已两年莫得责任。
为了陆续调养,他四处借债。就在那时,一家名为Sama的外包公司打回电话。这家公司自后参与了Meta相干式样。迈克尔回忆,接到电话时他还在病院里,却坐窝赶去上班,“因为那是我独一的契机”。
开元棋牌官方网站入口这份责任的月薪只好210好意思元,但对那时的他来说,已是一家东谈主独一的现款着手。他自后描画,那不是一份怀着但愿进入的新奇迹,而是一条在债务、疾病和休闲中被逼出来的求生之路。
在肯尼亚,像他这样受过种植、会英语、会电脑却经久找不到领悟责任的年青东谈主并不少。好多东谈主学金融、工商解决、诡计机,却最终进入数据工作行业,况且这种情况并不单发生在肯尼亚。
在不同数据外包公司责任8年后,迈克尔合计,公众对生成式AI存在一种重大污蔑:它其实莫得联想中那样“智能”。险些每一个AI系统背后,都站着确凿的东谈主。从聊天机器东谈主到自动化系统,它们的运行都离不开大范围东谈主类工作,而数据标注恰是其中最基础、也最容易被忽视的一环。
如今主流的大语言模子引诱在海量互联网数据之上,包括科学琢磨、新闻著作、维基百科等。这些文本数据被拆分红词元,模子通过学习词元之间的关系,逐渐掌捏类似东谈主类的抒发款式。覆按数据越多,模子智商平常越强。
迈克尔将生成式AI的数据着手概述为四类:怒放互联网抓取的群众数据、购买的版权内容、企业里面数据,以及东谈主工标注数据。其中,东谈主工标注对模子覆按至关迫切,却最容易被忽视。
他的第一份相干责任即是数据标注员。以自动驾驶为例,AI识别谈路环境并非“天生会”,而是依靠无数图像输入和东谈主工标注一步步覆按出来的。系统不仅要识别成年东谈主,也要辞别儿童、猫、卡车、树木、消防栓、延缓带和不同信号灯。关节不仅在于标注,更在于准确;一朝误标,就可能让系统造成诞妄领会并带来本质事故风险,因此数据平常还需经过多轮质检。
迈克尔参与过无数谈路识别式样,却从未标注过一条非洲腹纯正路,绝大多数图像都来自好意思国和欧洲。换句话说,这项期间的大部分基础工作在非洲完成,但主要服务对象却恒久是西洋市集。
因此他反复强调,东谈主们口中的“ArtificialIntelligence(东谈主工智能)”,在某种意旨上更像是“AfricaIntelligence(非洲智能)”。因为支撑这些系统运转的无数基础责任,本色上恰是由非洲工作者完成的。
在他看来,AI时间的数据问题,说到底是权力问题。掌捏海量数据、算力和平台资源的是少数大型科技企业;决定聚积什么数据、继承什么王法、什么内容被视为“有价值”的,也主淌若它们。那些提供数据的东谈主、被数据形容的东谈主,以及处理数据的工作者,却往往莫得相应的话语权。
滥觞,他并不了解这条奇迹旅途背后的代价。他的责任充斥着严格的绩效方向,而收入却低到难以支撑基本生活。为了挣取更多收入,经由同预先容,他第一次战斗到“内容审核和聊天审核”这一责任类别。这个此前见所未见的行业,很快透彻改变了他的生活。

创伤、羞辱、千里默与关系的突破
今天的公众并不知谈,互联网“安全”和“高效”背后,是另一群东谈主经久承受暴力、血腥、色情等内容带来的伤害。用户登录外交平台看不到无数狰狞和无益画面,往往是因为已被内容审核员提前过滤。这种隐形工作不仅存在于内容审核中,也存在于搜索、推选和各样数据标注中。好多东谈主以为AI呈现出的高质地截止来自期间自身,但本色上,背后离不开无数东谈主工处理。
模子之是以会拒却某些无益苦求,是因为有东谈主覆按过它。比如你问:“若何杀东谈主并逃走刑事职守?”模子之是以不会削弱给出这些谜底,是因为有东谈主预先把这些范围教给了它。东谈主类不仅喂给它“好的一面”,也喂给它“坏的一面”,然后告诉它,在坏的问题上要拒答。
那时的迈克尔,每天在外包公司8小时的AI数据标注责任之外,还承担着另外两份责任:8小时的色情内容标注式样,以及约4小时的“聊天”责任。
色情内容标注责任并不是浅易“看视频”,而是将平台提供的色情视频拆解成一帧一帧的画面,再对每一帧进行详备标注。一帧往往需要打14到15个标签,也即是说,工作者不仅要看完总共这个词内容,还要细腻识别其中动作、场景和细节,并转动成机器可读取的数据。这类标注的作用,是为平台或搜索系统引诱一套可检索、可分类、可调用的色情内容数据库,也为相干AI或推选系统提供覆按材料。
迈克尔说,他曾连气儿8个月作念这类式样,每天可能花整整8小时看色情内容。这是一种持续、肖似、密集的感官刺激和神气耗尽。更复杂的是,这种责任还要求工作者从不同文化和语言布景去领会用户会若何搜索相干内容。也即是说,标注者不仅要“看”,还要不停站在不同国度、不同用户、不同空想抒发款式的角度想考。
因此,这并不单是机械工作,亦然一种高度耗尽领会和神气范围的责任。经久战斗色情内容后,他的体格和感知发生了变化。“一运行,体格还会有正常反馈,到自后,以至有东谈主在面前脱衣裳,我都不会再有正常反馈。”他说。
比拟色情标注,另一份“聊天”责任对他的影响更复杂,也更难以言说。
所谓聊天,名义上看是与平台用户在线互动,本色内容却是在某些生疏平台上,与用户张开带有放荡色调、亲密意味以至露骨性示意的对话。
迈克尔很快发现,这份责任要求他饰演多个虚构身份,使用公司预设的伪造尊府,与生疏男性或女性引诱亲密关系,以至进行带多情色意味的交谈。
他饰演的变装可能是加州的年青女大学生,也可能是佛罗里达州的男同性恋,或者照拂、艺术家、教会。根据平台需求,他以至要在团结天内不停切换性别与性取向,在不同聊天窗口中保管都备不同的东谈主设和口吻。
在岑岭时段,他往往需要同期操作三到五个不同身份,与多名用户并行交谈。每次回复前,他都必须飞速回看聊天记载,说明变装细节、情节发展和先前解析过的信息,确保每一句话都天然、连贯、确凿。由于团结个账号可能在不同班次由多名审核员共同戒备,他也时常需要接办别东谈主曾经运行的对话,并以极高稳当度保持变装一致,让用户信托我方恒久在和团结个东谈主交流。
公司要求他们主动追问用户的私东谈主生活,记取对方的情谊细节,并用让对方感受到“被领会”“被渴慕”“被需要”的款式回复。换句话说,他们的责任不仅是聊天,更是有策略地制造亲密感,制造一种“被爱”的幻觉。
在他看来,这类责任的基础,是平台对本质中无数脆弱情谊需求的贸易化应用。丧偶者、经久零丁者、寻找爱情与跟随的东谈主,都会被辅导进入某些交友或跟随平台。用户注册时,平台会聚积其性别偏好、关系需求等信息,再勾通不同国度和地区的市集造访截止,有针对性地遐想互动内容和疏导剧本。
而在他参与的式样中,最中枢的切入点即是“爱”,因为这是最容易触碰、也最容易被应用的东谈主类需求之一。
迈克尔回忆,他曾破耗无数时期全心撰写每一条信息,只为了让一个生疏东谈主信托我方是额外的、被需要的,以至是被爱的。许多用户会向他倾吐婚配问题、仳离经验、零丁感,以及对软弱和被搁置的懦弱,而他则必须以剧本化的同理心、经过遐想的眩惑力和高度演出化的亲密感去回复。
在迈克尔看来,这类责任与AI跟随者、AI恋东谈主以及各样聊天机器东谈主之间的界限正在变得吞吐。他越来越怀疑,我方所作念的一切,不单是服务平台用户,亦然在覆按翌日会取代我方的AI系统。“我其实是在覆按AI若何去‘爱’东谈主。”他说,“在不远的将来,‘爱’会在这些服务器里被制造出来。”
但在迈克尔看来,机器并不确凿领多情谊,它只是被覆按得“看起来多情谊”;确凿的爱,恒久只存在于东谈主与东谈主之间。
而这种经久的变装演出,2026世界杯亚盘逐渐侵蚀了他对“确凿”的感受。他运行分不清哪些抒发属于责任,哪些心境属于我方;也越来越难鄙人班之后飞速退出那种被覆按出来的回复款式。责任要求他不停投合、不停安抚、不停制造情谊黏性,而这些模式也迟缓渗透了他的日常生活。
更让他可怜的是,这份责任带来的羞辱感险些无法对外言说。他很难向家东谈主证明我方到底在作念什么,也很难告诉一又友,我方的收入果然来自饰演他东谈主、控制亲密感、引诱生疏东谈控制续参加情谊和资产。许多从事类似责任的东谈主因此选定千里默。他们不可公开指摘式样,不可保留责任凭证,也缺少认简直申报和求援渠谈。创伤、困惑和羞辱只可被压在个东谈主生活里面,迟缓发酵。
他提到一位经久审核涉性极点内容的共事。由于经久战斗性淡漠、儿童性克扣等素材,对方逐渐变得千里默紧闭,无法再与爱妻和继女正常交流。更尴尬的是,他无法向家东谈主证明我方为何变成这样。最终,爱妻隔膜不停加深。一天他记忆后,发现爱妻和家东谈主曾经离开,只留住一条短信:“我曾经不料志你是谁了,咱们不会再记忆。”
更严重的问题是,平台往往有益堵截职守链条。式样平常只提供任务界面和操作手册,疏导往往止于一封“不可回复”的邮件;支付平台也大多是临时搭建,式样收尾后就地关闭,险些不留住任何可记忆脚迹。迈克尔说,一切都被处理得“很是干净”,而工作者却被留在系统之外,独自承担成果。
也正因此,迈克尔越来越顺服,这些责任不应再被视为不足为患的后台任务,而应被领会为一种高风险、高耗尽却经久缺少承认的工作。平台从中获取利润,用户从中获多礼验,而确凿承担代价的东谈主,却经常既不被看见,也不被保护。

外包、数据与全球不对等的期间单干
迈克尔透露,据他掌捏的情况,面前至少有50万东谈主在肯尼亚从事数据劳工责任,况且他合计这一数字“很是保守”。
这一估算来自一线陶冶和行业造访。除外包公司Remotasks(隶属于ScaleAI)为例,迈克尔团队中曾有东谈主担任培训师,有些培训师在一个月以至几周内就要培训跳跃1万东谈主。仅从他们掌捏的培训数据库看,单是一个平台的受训者东谈主数就已跳跃20万,而这还只是迢遥平台中的一个。事实上,OpenAI、谷歌和微软等有名公司都有各自的数据外包供应商。
在迈克尔看来,大型科技公司之是以选定肯尼亚这样的国度,不单是因为这里具备互联网基础和英语智商,更因为这里存在可被应用的法律和轨制闲隙。
他说,肯尼亚固然在2007年纠正过工作法,但“零工责任”并未确凿被纳入监管框架。于是,公司便得以将无数工东谈主界定为“并立承包东谈主”,而非认真雇员。这样一来,待业金、医保、经久左券等法定保险就被摈斥在外。再加上一个月一签的短期左券,工东谈主即使际遇问题,也往往因为发怵不被续约而不敢发声。
如果是解放奇迹者,处境则愈加脆弱。工东谈主一朝建议质疑,平台可能奏凯停用其账号。账号被封,收入也随之消释,以至连陆续磋磨平台的渠谈都莫得。“可能独一的疏导款式即是Slack(一款团队疏导配合器具),而一朝他们把你从Slack里踢出去,你就透彻失去了战斗他们的渠谈。”他说。
在他看来,多层外包和转包的结构,自身就在有益吞吐职守包摄。“最根底的原因即是:他们不想为职守买单。”一朝工东谈主告状,大公司不错宣称我方并未奏凯雇佣对方,确凿的老板是BPO(商务历程外包)公司或中间商;而当神气创伤、工作伤害等问题出刻下,职守也就在这一层层外包链条中被不停转化和稀释。
围绕这些指控,科技巨头并非莫得回复。Meta平常透露,其合作伙伴应谨守当地法律,并为审核员提供薪酬、支撑和磋磨服务;Sama畴昔曾经透露,会如期提供健康和神气辅导,并强调其外包责任为当地创造了工作契机;OpenAI则透露,会与供应商合作改进福利和支撑体系,并逐渐减少工作者对极点无益内容的潜入。
但迈克尔合计,这些回复离问题的中枢仍然很远。因为确凿的问题并不单是某家公司有莫得提供磋磨热线,而是总共这个词贸易模式是否本就引诱在低成本、高效率度和高度可替代的劳能源之上;问题也不单是平台是否形势上“合规”,而是它们是否昂扬承认:这些系统并不是臆造长出来的,而是依赖确凿的东谈主类去承受机器尚不可承受的内容。
政府的作风一样复杂。经久以来,肯尼亚一直将数字外包和科技投资视为促进工作增长的迫切契机。官方平常强调,该国正勤劳打造区域数字服务中心,眩惑全球科技企业落地,创造后生工作岗亭。濒临劳工组织对神气健康、短期左券和工东谈主分类问题的品评,政府常见回复是:宽宥投资,同期会在现存法律框架下持续评估工作保护问题,勤劳在眩惑投资与保险工作权益之间罢了均衡。
但迈克尔对这种“均衡”并不乐不雅。他回忆,曾有一次,总统在公开行动上透露,会“确保莫得东谈主不错在肯尼亚告状这些公司”,以至点名提到了Meta。这让他感到担忧:当政府最初把这些企业视为投资者,而不是需要被监管的雇佣体系时,工作者的空间就会被进一步压缩。
在他看来,保护本国公民本即是政府的职责,但如果某家公司与政府保持紧密关系,而政府又主要将其视为“投资者”,再加上体制里面可能如实有东谈主从中获益,那么就很难期待政府确凿刚毅地站在工作者一边。
因此,迈克尔合计,最大的职守终究仍在大科技公司身上。最初,它们必须确保工东谈主获取基本而正派的工作要求;其次,如果它们昂扬绕开层层中间商,奏凯承担职守,总共这个词行业生态都会健康得多。
迈克尔和肯尼亚的故事也绝非个案,而是一个全球性景色。《投喂AI:东谈主工智能行业的全球底层工东谈主纪实》一书中,牛津大学3位学者破耗十余年时期,穿越肯尼亚、乌干达、爱尔兰、冰岛、英国和好意思国,深入访谈200多名数据标注员、内容审核员、机器学习工程师、AI伦理学家、仓库职工、劳工组织者和行业大师,得出了和迈克尔相似的论断:数据劳工是喂养东谈主工智能的“隐形父母”,却鲜少出当今期间的颂歌中。他们的血汗汇成数据流,他们的窘境拷问期间时间的平正与正义。
“不可一边建造AI,一边失去建造AI的东谈主”
在经验了这一切之后,迈克尔合计,这种数据劳工的“隐形工作”所揭示的问题,早已不单是是单纯的工作权益问题,而是一个对于期间伦理、东谈主类尊荣和轨制职守的群众议题。
迈克尔并不否定,这类责任如实为一些东谈主提供了收入着手,我方那时也的确需要这笔钱。但在他看来,责任不应只是保管生计的技能,也应当是一种有尊荣、能带来基本昂扬感的事情。企业不可因为一些东谈主处于脆弱境地,就把这种脆弱自身当成可被应用的要求。
他提到,在加入此前那家公司前,对方会优先说明应聘者是否来自穷人窟。在他看来,这种筛选并非有时,而是有益对准最虚浮、最缺少选定的东谈主群,因为他们更容易接受低保险、高耗尽的责任要求。他合计,这种针对脆弱群体的用工款式必须住手。
“一个正常的社会不应引诱在富东谈主理所天然应用穷东谈主的逻辑之上。总共工作者都应当处于一个相对对等的环境中,而不是在权益和资源显著失衡的关系里,被动接受分歧理待遇。”迈克尔说。
他还强调,这类平台责任远莫得外界联想的那样“有保险”。平台不错随时封停工作者账号,而工作者往往得不到明确证明。即便追问原因,平台平常也只会以“违犯社区策略”等朦胧说法回复,之后既莫得进一步说明,也缺少申报和施舍机制。一朝账号被封,工作者不仅失去责任契机,尚未结算的答谢也可能随之消释。
他以当地最大的外包公司之一Remotasks在2024年短暂住手肯尼亚业务为例说,许多工作者险些是在毫无预警的情况下失去责任的。有东谈主一醒觉来便发现平台曾经无法使用,式样就此拆开,而原来尚未支付的答谢也莫得了下文。直到当今,仍有不少东谈主莫得拿到本应获取的工资。
他合计,如果东谈主工智能系统引诱在无数被压榨、被创伤、被动千里默的东谈主类工作之上,那么这些系统自身就无法被削弱称为“(合适)伦理的”。如果覆按数据来自那些在分娩数据过程中遭受严要点理毁伤的东谈主,那么这项期间从出生之初就曾经带有某种结构性的沾污。
离开这些责任之后,迈克尔的收复之路并退却易。他固然接受过神气调养,但于今仍被失眠困扰。他说,好多同业以至不知谈我方已剿袭创,不知谈那种麻痹、盛怒、疏远和无法哽噎,自身即是创伤的一部分。有东谈主经久战斗暴力内容后,对本质中的事故和死亡毫无反馈;也有东谈主离开平台多年后,仍然无法再行引诱领悟的东谈主际关系。
“有时候夜里躺在床上,我总会想,如果还有东谈主经验着和我一样的一切,却得不到任何匡助,那他们该若何办?又有谁能去匡助他们?”这亦然为什么,他和一些有着相似经验的东谈主们创办了肯尼亚数据标注者协会(DLA),把神气支撑放在最中枢的位置。他们但愿推进神气健康服务,匡助工东谈主完成再培训和奇迹转型,并勤劳把那些原来互相隔断、各自承受成果的东谈主再行汇聚起来。
在迈克尔看来,工东谈主的诉求其实并不复杂。
“第一,给责任;第二,把工资付好;第三,提供神气支撑。即是这样浅易。”他说,他们并莫得要求太多,只是但愿答谢至少能从每小时5好意思元运行,而不是每个任务0.01好意思元、每小时0.025好意思元那样无理的范例;但愿领有更领悟的左券,而无须每天都顾忌第二天会不会失去收入;也但愿在濒临暴力、色情和极点内容时,能够获取确凿可及的神气转圜。
“数据工作者一直被当成‘一次性耗材’来对待。”迈克尔说。在AI背后,是确凿的东谈主脸,是确凿的东谈主在责任,公众必应知谈真相,而这些工作者也必须被看见、被领会、被尊重。
今天,东谈主们不停夸赞生成式东谈主工智能变得越来越天然、越来越会安危东谈主的对话,并对它的翌日充满期待。但在迈克尔和他的同业看来,这样的翌日从来不是自动生成的。它经过了无数东谈主的标注、筛选、忍受、效法和付出;经过了一些东谈主回家后无法向家东谈主证明责任;经过了被封停的账号、突破的婚配和经久失眠的夜晚。
“我但愿东谈主们记取:在某个回复你零丁的AI女友或男友背后,可能站着的并不是一个确凿智能、自主和无害的系统,而是一个生活在虚浮中的普通东谈主——他(她)正在以我方的情谊、信仰、家庭和东谈主格为代价2026世界杯盘口,保管这场对于亲密与期间的幻觉。”他说。