快讯:Gemma-我们最先进的开放模型
Gemma 在设计时将我们的 AI 原则放在首位。为了使 Gemma 预训练模型安全可靠,我们使用自动技术,从训练集中过滤掉特定的个人信息及其他敏感数据。此外,我们进行了大量的微调和人类反馈强化学习(RLHF),使我们的指令微调模型与负责任的行为保持一致。为了解并降低 Gemma 模型带来的风险,我们进行了强有力的评估,包括手工红队测试、自动对抗性测试,以及对危险活动的模型能力评估。我们在 Model Card 中阐述了这些评估。
Gemma 在设计时将我们的 AI 原则放在首位。为了使 Gemma 预训练模型安全可靠,我们使用自动技术,从训练集中过滤掉特定的个人信息及其他敏感数据。此外,我们进行了大量的微调和人类反馈强化学习(RLHF),使我们的指令微调模型与负责任的行为保持一致。为了解并降低 Gemma 模型带来的风险,我们进行了强有力的评估,包括手工红队测试、自动对抗性测试,以及对危险活动的模型能力评估。我们在 Model Card 中阐述了这些评估。
发表评论