📰 资讯2026年4月24日

OpenAI发布开源Privacy Filter模型：端侧部署的隐私数据检测利器

OpenAI开源PII检测模型Privacy Filter，仅15亿参数，支持12.8万Token上下文，可本地运行无需云端传输。

来源：OpenAI Blog · 查看原文 →

OpenAI于4月22日发布开源模型Privacy Filter，专注于检测和脱敏文本中的个人身份信息（PII）。该模型仅15亿总参数、5000万激活参数，却具备前沿级隐私检测能力，在PII-Masking-300k基准上F1达96%（修正后97.43%）。模型支持最长128000 Token的上下文，能识别八大类别隐私信息：私人身份、地址、邮箱、电话、URL、日期、账号和密钥。核心优势在于支持完全本地部署，数据无需离开设备即可完成脱敏，单次前向传播即可完成所有Token标注。OpenAI内部已使用微调版Privacy Filter处理隐私工作流。该模型基于Apache 2.0许可证开源，开发者可自由下载、微调和部署。

发布于 2026年4月24日 · 更新于 2026年4月24日