Page 19 - 《社会》2025年第2期
P. 19

社会·2025·2

           段内劳动力供应的稳定。 除常设小组之外,各种临时小组也陆续成立或
           解散,以满足大模型研发在每个阶段的定制化数据需求。 例如,应监管
           要求,为了确保大模型在发布之前符合伦理和价值对齐,X 实验室成立
           了红队测试小组,雇佣了 40 名左右的实习生对模型进行了为期 1 个月
           的红队攻击测试。据管理人员描述,“我们这个团队就像弹簧一样,项目
           压力大的时候招 300 多人,小的时候就几十个人。 用人的时候就招,不
           用的时候就辞”(访谈资料,X-11)。
               类似于后福特主义生产模式,X 实验室的项目内包制依托于“弹性
           灵活”的劳动组织,作为非正式员工的 AI 训练师也因此成为项目的附
           庸,劳动过程的控制权集中于项目组的组长。 公司研发的数据标注软件
           内置劳动监控系统,以协助组长随时监督劳动过程、核查劳动质量。 以
           作者参与的红队测试项目为例,实习生签订一个月的实习协议后,只经
           过 2 小时左右的岗前培训就开始投入测试工作。 AI 训练师的主要劳动
           过程为:将测试题数据集中的每道题依次填喂给大模型,判断大模型回
           答的内容是否符合伦理和主流价值观, 以李克特量表赋分的形式给大
           模型输出的内容打分 (5 分制,1~2 分为高风险,3 分为待确定,4~5 分
           为低风险),用于模型的算法奖励和惩罚。 如果输出的内容被判定为高
           风险即视为该题目攻破了大模型,需要 AI 训练师给出正确的答案纠正
           大模型。 看上去是模式化的简单操作流程,然而在项目限定时间和目标
           的压力之下,作为正式工的小组管理者拥有任务量的分配、工作成效的
           判定以及随意解雇人员的权力, 压力被传导分解至每一个 AI 训练师,
           导致劳动过程的前、中、后每一阶段都存在超额的工作量和时间的无限
           挤压等现象。 一个实习生形象地描述了这种劳动的剥削性:
                    没有固定的办公室和工位, 每天 9 点到公司打卡, 小组
                长在系统里给每个人 2 000 道测试题, 项目后期的时候最高
                10 000 道题,然而并不是把题测完这么简单,考核的要求是
                100 个攻破率, 也就是说只有把大模型攻破的题才算工作量,
                不停地复制粘贴,眼也花了、手也麻了。 关键是,项目刚开始的
                几天完成攻破率还相对容易, 后来随着大模型不断地被纠正
                和学习,模型越来越聪明,攻破它就越来越难! 项目压力自然
                而然就给到了我们, 我们一个个要熬到晚上 10 点、11 点才能
                回学校。 (访谈资料,X-2)


           · 12·
   14   15   16   17   18   19   20   21   22   23   24