2023大模型安全研讨会 | 张卫明教授作《智能体认知安全》主题分享!

发布时间:2023年12月24日    来源:高维数据

12月23日上午,2023年度大模型安全研讨会在中安创谷全球路演中心圆满举办!高维数据总工程师张卫明教授受邀出席活动并做主题演讲!


本次活动由安徽省安全人工智能研究院主办,合肥瑞徽人工智能研究院有限公司、安全人工智能安徽省重点实验室承办。邀请了 清华大学教授朱军,中电38所副总工程师、研究员马敏,清华大学副教授胡晓林,中软国际副总裁、AIGC研究院院长、解放号总裁万如意,阿里巴巴集团安全 视觉智能负责人何源, 安徽大学教授赵姝等专家、学者共同参与。


张卫明教授受邀参会并以《智能体认知安全》为主题进行分享。


张卫明教授通过介绍在生成式AI带来的智能技术变革下,他对于生成式AI安全风险的思考,指出了安全领域的攻防从传统的网络系统安全转变为深度学习时代的模型算法安全,又转为针对GPT4这类大模型的智能认知攻防。通过"奶奶"漏洞等针对大模型特点的越狱攻击方法,和已经带来潜在安全风险的FraudGPT,说明必须以对待智能体的角度进行大模型安全攻防。

    

 之后,张老师介绍了其团队近期关于大模型安全的相关工作:在AI模型价值观对齐这一领域,针对AI4Science场景,提出SciGuard解决方案,实现超越GPT4的模型安全性。在大模型生成内容检测这一领域,提出通过AI生成文本的遗传性进行被动检测的防御手段,还提出了基于生成模型的可证安全隐写水印主动检测方案,不影响模型生成能力的同时实现人类不可感知的水印嵌入。


此外,还介绍了对于语音模型场景实现的音色水印方案,获得了与会观众的积极好评。

本次活动旨在推动大模型安全领域研究,交流学术产业前沿,为促进安徽省人工智能安全产业发展贡献力量!


- END -