Page 19 - 《社会》2025年第2期

P. 19

社会·2025·2

段内劳动力供应的稳定。除常设小组之外，各种临时小组也陆续成立或
解散，以满足大模型研发在每个阶段的定制化数据需求。例如，应监管
要求，为了确保大模型在发布之前符合伦理和价值对齐，X 实验室成立
了红队测试小组，雇佣了 40 名左右的实习生对模型进行了为期 1 个月
的红队攻击测试。据管理人员描述，“我们这个团队就像弹簧一样，项目
压力大的时候招 300 多人，小的时候就几十个人。用人的时候就招，不
用的时候就辞”（访谈资料，X-11）。
类似于后福特主义生产模式，X 实验室的项目内包制依托于“弹性
灵活”的劳动组织，作为非正式员工的 AI 训练师也因此成为项目的附
庸，劳动过程的控制权集中于项目组的组长。公司研发的数据标注软件
内置劳动监控系统，以协助组长随时监督劳动过程、核查劳动质量。以
作者参与的红队测试项目为例，实习生签订一个月的实习协议后，只经
过 2 小时左右的岗前培训就开始投入测试工作。 AI 训练师的主要劳动
过程为：将测试题数据集中的每道题依次填喂给大模型，判断大模型回
答的内容是否符合伦理和主流价值观，以李克特量表赋分的形式给大
模型输出的内容打分（5 分制，1~2 分为高风险，3 分为待确定，4~5 分
为低风险），用于模型的算法奖励和惩罚。如果输出的内容被判定为高
风险即视为该题目攻破了大模型，需要 AI 训练师给出正确的答案纠正
大模型。看上去是模式化的简单操作流程，然而在项目限定时间和目标
的压力之下，作为正式工的小组管理者拥有任务量的分配、工作成效的
判定以及随意解雇人员的权力，压力被传导分解至每一个 AI 训练师，
导致劳动过程的前、中、后每一阶段都存在超额的工作量和时间的无限
挤压等现象。一个实习生形象地描述了这种劳动的剥削性：
没有固定的办公室和工位，每天 9 点到公司打卡，小组
长在系统里给每个人 2 000 道测试题，项目后期的时候最高
10 000 道题，然而并不是把题测完这么简单，考核的要求是
100 个攻破率，也就是说只有把大模型攻破的题才算工作量，
不停地复制粘贴，眼也花了、手也麻了。关键是，项目刚开始的
几天完成攻破率还相对容易，后来随着大模型不断地被纠正
和学习，模型越来越聪明，攻破它就越来越难！项目压力自然
而然就给到了我们，我们一个个要熬到晚上 10 点、11 点才能
回学校。（访谈资料，X-2）

· 12·

14 15 16 17 18 19 20 21 22 23 24