当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

3个月前 (02-24)Deepseek最新资讯183

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

deepseek王炸组合:微信+DeepSeek来了,网友:“王炸组合”!

deepseek王炸组合:微信+DeepSeek来了,网友:“王炸组合”!

deepseek继续扩大生态圈2月15日部分微信用户发现微信搜索已经上线“ai搜索”功能并接入deepseek-r1提供的“深度思考”服务2月16日,记者从腾讯集团确认,微信搜一搜在调用混元大模型丰富...

印度力图打造“本土DeepSeek”,分析师:你们不敢创新

印度力图打造“本土DeepSeek”,分析师:你们不敢创新

凤凰网科技讯 4月16日,金融时报发文,印度正押注于“低成本创新”的传统以及其庞大的科技人才库,以求在全球AI竞赛中迎头赶上,同时在这个快速发展的行业中分得一杯羹。印度总理纳伦德拉・莫迪领导的政府认为...

湛江科技学院DeepSeek版“智能招生问答系统”来啦!

湛江科技学院DeepSeek版“智能招生问答系统”来啦!

湛江科技学院的智能招生问答系统已经华丽大变身,深度融合了DeepSeek大模型,全新升级,重新上线啦!  湛江科技学院的智能招生问答系统已经华丽大变身,深度融合了DeepSeek大模型,全新升级,重新...

美商务部禁止在政府设备上用DeepSeek?

美商务部禁止在政府设备上用DeepSeek?

本报记者 李 萌路透社17日报道称,根据该媒体及知情人士了解,美国商务部下属一些部门最近几周通知员工,禁止在政府设备上使用中国的人工智能(AI)模型DeepSeek。路透社称,美商务部在发给工作人员的...

中国电信助力宁德企业打造DeepSeek智能公文系统

中国电信助力宁德企业打造DeepSeek智能公文系统

数字化浪潮席卷千行百业,中国电信宁德分公司与福建省烟草公司宁德市公司紧密携手,从智慧大屏到智慧指挥中心,不断拓展企业数字化转型的深度与广度。近日,中国电信携手DeepSeek为宁德烟草注入全新动力,以...

医生自嘲“天塌了”!病人查DeepSeek后质疑治疗方案,关键还说对了!AI看病靠谱吗?

医生自嘲“天塌了”!病人查DeepSeek后质疑治疗方案,关键还说对了!AI看病靠谱吗?

本文转自【新民晚报】;“天都塌了!病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的网帖引起网友热议。截至23日14时,...