最近,智源研究院联合北京大学、北京邮电大学、北京航空航天大学、上海交通大学、中国科学院信息工程研究所、中国科学院计算技术研究所等国内知名机构,正式发布 FlagSafe 大模型安全平台(网页链接)。
平台首批汇聚多个前沿大模型安全研究项目,围绕红队演练、蓝队防御、白盒透视三个核心方向,凝聚国内优势科研力量,共同打造覆盖风险发现、防御治理与机理解释的高标准安全平台。
当前,大模型正加速从虚拟对话迈向物理世界,随之而来的跨模态、跨场景复合风险日益严峻。
面对模型内在欺骗、具身智能失控、多模态恶意对齐等层出不穷的前沿威胁,传统安全能力往往局限于单一模态、单一视域或单一防护环节,难以应对复合型风险。
FlagSafe 以“全面安全”为核心目标,致力于为行业提供一套“评估、防御、可解释”相结合的大模型安全资源池与评测体系。
具身智能机器人

