Mercor 4TB 语音样本被盗

Mercor 是美国一家 AI 初创公司,主要业务是为其他 AI 公司提供专家帮助训练模型和聊天机器人。它招聘专家/合同工时要求对方提供护照或驾照扫描件、自拍和录制一段语音。本月初勒索组织 Lapsus$ 披露它从 Mercor 窃取了 4TB 语音样本。语音样本加上身份证件,引发了合同工们身份被盗用的担忧。已有至少五名合同工对 Mercor 提起了诉讼,指控该公司以训练数据的名义收集语音特征,但并未明确说明这些特征是永久性的生物识别标识符。现有的语音克隆技术只需要 15 秒钟的清晰参照音频,而 Mercor 要求合同工录制的语音长度达到了 2-5 分钟,足够实现语音克隆。