OpenAI 發佈開源權重模型 Privacy Filter ,用於文本中 PII 檢測與脫敏
據官方消息,OpenAI 發佈開源權重模型 Privacy Filter ,用於檢測並遮蔽文本中的個人身份信息( PII )。該模型支持本地運行,可在單次前向處理中完成長文本識別與脫敏,最長支持 128,000 個 token 上下文。Privacy Filter 參數規模爲 15 億、活躍參數爲 5,000 萬,可識別私人姓名、地址、郵箱、電話號碼、網址、日期、賬戶號碼及密碼、 API 密鑰等機密信息。OpenAI 表示,該模型以 Apache 2.0 許可證在 Hugging Face 和 GitHub 上發佈,可用於訓練、索引、日誌和審覈等隱私保護流程。