Page 19 - 《社会》2025年第2期
P. 19
社会·2025·2
段内劳动力供应的稳定。 除常设小组之外,各种临时小组也陆续成立或
解散,以满足大模型研发在每个阶段的定制化数据需求。 例如,应监管
要求,为了确保大模型在发布之前符合伦理和价值对齐,X 实验室成立
了红队测试小组,雇佣了 40 名左右的实习生对模型进行了为期 1 个月
的红队攻击测试。据管理人员描述,“我们这个团队就像弹簧一样,项目
压力大的时候招 300 多人,小的时候就几十个人。 用人的时候就招,不
用的时候就辞”(访谈资料,X-11)。
类似于后福特主义生产模式,X 实验室的项目内包制依托于“弹性
灵活”的劳动组织,作为非正式员工的 AI 训练师也因此成为项目的附
庸,劳动过程的控制权集中于项目组的组长。 公司研发的数据标注软件
内置劳动监控系统,以协助组长随时监督劳动过程、核查劳动质量。 以
作者参与的红队测试项目为例,实习生签订一个月的实习协议后,只经
过 2 小时左右的岗前培训就开始投入测试工作。 AI 训练师的主要劳动
过程为:将测试题数据集中的每道题依次填喂给大模型,判断大模型回
答的内容是否符合伦理和主流价值观, 以李克特量表赋分的形式给大
模型输出的内容打分 (5 分制,1~2 分为高风险,3 分为待确定,4~5 分
为低风险),用于模型的算法奖励和惩罚。 如果输出的内容被判定为高
风险即视为该题目攻破了大模型,需要 AI 训练师给出正确的答案纠正
大模型。 看上去是模式化的简单操作流程,然而在项目限定时间和目标
的压力之下,作为正式工的小组管理者拥有任务量的分配、工作成效的
判定以及随意解雇人员的权力, 压力被传导分解至每一个 AI 训练师,
导致劳动过程的前、中、后每一阶段都存在超额的工作量和时间的无限
挤压等现象。 一个实习生形象地描述了这种劳动的剥削性:
没有固定的办公室和工位, 每天 9 点到公司打卡, 小组
长在系统里给每个人 2 000 道测试题, 项目后期的时候最高
10 000 道题,然而并不是把题测完这么简单,考核的要求是
100 个攻破率, 也就是说只有把大模型攻破的题才算工作量,
不停地复制粘贴,眼也花了、手也麻了。 关键是,项目刚开始的
几天完成攻破率还相对容易, 后来随着大模型不断地被纠正
和学习,模型越来越聪明,攻破它就越来越难! 项目压力自然
而然就给到了我们, 我们一个个要熬到晚上 10 点、11 点才能
回学校。 (访谈资料,X-2)
· 12·