扫一扫分享
你想想,现在很多公司想把内部文档交给ChatGPT分析,但又担心一个问题:员工的工资数据、客户的身份证号、病人的病历这些敏感信息,一旦被AI“学进去”,会不会泄露出去?会不会被其他用户问出来?
GPTGuard干的事就是:在你把数据发给AI之前,先把敏感信息自动替换掉(比如把“张三,身份证号123456”变成“[姓名],身份证号[已隐藏]”),然后才发给AI处理。AI拿到的是脱敏后的内容,既不影响分析结果,又不会泄露真实信息。
它支持处理PII(个人身份信息)和PHI(受保护的健康信息),保证数据不离开你的存储,同时符合HIPAA(医疗)、GDPR(欧洲隐私法)、中东地区等不同法规的要求。
1. 敏感数据自动识别与脱敏
这是核心功能。系统自动扫描文档中的身份证号、电话号码、姓名、地址、医疗记录等敏感信息,在发给AI之前把它们替换掉。关键点是“保留上下文”——比如把“患者李四,血压140/90”变成“患者[姓名],血压140/90”,AI仍然能理解这是一个患者的血压数据,但不知道具体是谁。
2. 企业文档安全对话
你可以上传公司内部文档(不限数量),然后像用ChatGPT一样问问题。GPTGuard基于RAG(检索增强生成)技术,从你的文档里找答案,同时确保敏感信息不会暴露给AI模型。
3. 支持多种LLM模型
可以选择不同的AI模型来对话,不绑定某一家。你可以在同一个平台里切换。
4. 联网搜索
如果需要参考公开信息,可以在对话中开启联网搜索功能,同时仍然保护你的内部数据不被泄露。
5. OCR图片转文字
支持上传图片(比如扫描的纸质文件、截图),自动识别图片中的文字,然后同样进行脱敏处理和分析。
6. 引用溯源
每次AI回答问题时,会告诉你是参考了哪份文档的哪一段。方便你核实信息,也方便审计。
7. 本地部署或SaaS
可以选择把系统部署在你自己的服务器上(数据完全不离开公司),也可以使用SaaS云版本。两种方式都支持多租户管理。
8. 企业级集成
支持对接企业现有的登录系统(SSO单点登录),可以设置详细的访问权限,记录所有操作日志。
市面上处理AI数据隐私的产品不少,GPTGuard的几个特点:
脱敏但不丢上下文:普通脱敏是把敏感词删掉或者变成乱码,但AI就搞不懂意思了。GPTGuard声称用“保留上下文的脱敏技术”,比如把具体数字替换成“[年龄]”或者“[金额]”,AI仍然能理解这是一个数值。
零数据泄露风险:发往AI模型的是脱敏后的数据,原始敏感信息从不离开你的存储。即使第三方AI服务被攻击,泄露的也只是“患者[姓名]”而不是“患者张三”。
合规覆盖全面:明确支持HIPAA(美国医疗隐私法)、GDPR(欧盟隐私法)、中东地区法规。对于受监管行业来说,这是刚需。
部署灵活:可以本地部署(数据不出公司),也可以用SaaS。大型企业一般会更倾向于本地部署。
| 场景 | 具体问题 | GPTGuard怎么解决 |
|---|---|---|
| 企业内部使用ChatGPT | 员工上传的客户资料、财务报表可能泄露 | 在发给AI前自动脱敏,员工看到的数据是脱敏后的版本 |
| 医疗行业 | 病历、患者姓名、诊断记录受HIPAA严格保护 | 脱敏后安全使用AI做诊断辅助、病历分析 |
| 金融服务 | 客户账户信息、交易记录、信用评分 | 脱敏后用AI做风险评估、市场分析、反欺诈 |
| 法律行业 | 案件细节、客户保密信息受律师-客户特权保护 | 脱敏后用AI做案例研究、合同审查、文档分析 |
| 教育机构 | 学生成绩、个人信息受FERPA等法规保护 | 脱敏后用AI辅助教学、批改作业、分析学习数据 |
| 跨国企业 | 不同国家有不同隐私法规(GDPR、CCPA等) | 自动检查合规性,确保对话内容符合当地法律 |
问:什么是“保留上下文的脱敏”?跟普通脱敏有什么区别?
答:普通脱敏比如把“张三今天请病假”变成“***今天请病假”,AI看到的是缺失信息。保留上下文的脱敏比如变成“[员工姓名]今天请病假”,AI仍然知道这是一个员工的请假信息,可以进行统计分析(比如“最近请病假的员工多不多”),但不知道具体是谁。既能保护隐私,又不影响AI理解。
问:数据会发给OpenAI或其他第三方模型吗?
答:会发给AI模型,但发给的是脱敏后的版本。原始敏感数据保留在你的存储里,不发送出去。你可以选择不同的大模型(包括本地部署的开源模型),如果选择本地部署,数据完全不离开你公司。
问:支持哪些AI模型?
答:平台支持“top LLM models”,具体列表可能需要登录后查看。可以切换不同的模型来对话。
问:我是个人用户,不是企业,能用吗?
答:产品定位主要是企业级。个人用户如果想让ChatGPT处理敏感信息,也可以试试免费版,但很多功能(SSO、审计日志、多租户)是给企业设计的。
问:有免费试用吗?
答:有。官网多处提到“No credit card required. No software to install”,可以先免费试用,不需要绑卡。
问:能处理上传的文档里的图片吗?
答:能。支持OCR功能,可以识别图片中的文字,然后同样进行脱敏处理。
问:AI回答的内容能溯源吗?
答:能。每次使用RAG聊天时,系统会显示参考了哪些文件、哪些段落。你可以回去核对原文。
问:部署方式有哪些?
答:两种。一是SaaS云服务,二是本地部署(On-Premises),部署在你自己公司的服务器上。对于有严格数据合规要求的企业,本地部署更保险。
仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!
手机扫一扫预览