当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

3周前 (02-24)Deepseek最新资讯46

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

DeepSeek一夜爆红后会取代哪些职业?

DeepSeek一夜爆红后会取代哪些职业?

DeepSeek一夜爆红后会取代哪些职业?随着DeepSeek一夜爆红,人工智能正逐步渗透到生活工作的方方面面。最近,一张各职业被AI取代难易程度图在金融圈引起讨论,根据图解,AI率先取代的是高机械性...

马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?

马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?

《科创板日报》2月11日讯(记者 黄心怡)今日,阿里巴巴创始人马云再度现身阿里园区。《科创板日报》记者了解到,马云出现在夸克所处的阿里智能信息事业群,与员工交流。今日港股开盘后,阿里股价一度上涨触及1...

DeepSeek于知乎开设官方账号

DeepSeek于知乎开设官方账号

3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。文章写道:“DeepSeek-V3/R1...

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

国际投行集体唱多A股DeepSeek不仅震撼了硅谷,还震撼了华尔街。最近一周以来,高盛、美银、德银等国际知名投行轮番发布研报,看好中国科技股,建议做多中国股市。华尔街唱多中国股市的声音正如潮水般涌来。...

DeepSeek详细介绍DeepSeek在商业咨询领域有哪些重要应用场景?

DeepSeek详细介绍DeepSeek在商业咨询领域有哪些重要应用场景?

DeepSeek详细介绍DeepSeek在商业咨询领域有哪些重要应用场景?<think> 嗯,用户之前问过DeepSeek在科技领域哪些应用场景,我详细回答了自动驾驶、智能视频、推荐、助...

Deepseek引发AI+变革浪潮 2025年AI行情可期

Deepseek引发AI+变革浪潮 2025年AI行情可期

本报记者 顾梦轩 夏欣 广州、北京报道2025年新年伊始,中国AI企业深度求索(DeepSeek)的开源大模型DeepSeek-R1在资本市场掀起巨浪。Wind数据显示,截至2月12日,万得Deeps...