返回资讯列表
📰 资讯2026年4月24日

OpenAI发布开源Privacy Filter模型:端侧部署的隐私数据检测利器

OpenAI开源PII检测模型Privacy Filter,仅15亿参数,支持12.8万Token上下文,可本地运行无需云端传输。

来源:OpenAI Blog · 查看原文 →

OpenAI于4月22日发布开源模型Privacy Filter,专注于检测和脱敏文本中的个人身份信息(PII)。该模型仅15亿总参数、5000万激活参数,却具备前沿级隐私检测能力,在PII-Masking-300k基准上F1达96%(修正后97.43%)。模型支持最长128000 Token的上下文,能识别八大类别隐私信息:私人身份、地址、邮箱、电话、URL、日期、账号和密钥。核心优势在于支持完全本地部署,数据无需离开设备即可完成脱敏,单次前向传播即可完成所有Token标注。OpenAI内部已使用微调版Privacy Filter处理隐私工作流。该模型基于Apache 2.0许可证开源,开发者可自由下载、微调和部署。

发布于 2026年4月24日 · 更新于 2026年4月24日