ChatGPT/GPT-4/Llama 电车难题大 PK！小模型道德感反而更高？

6 月 06, 2025 AI前沿

26 0

JS滚动广告

✨ AI前沿 | 每日人工智能最新资讯 ✨

微软对大语言模型的道德推理能力进行了测试，结果发现在电车问题中，尺寸较大的模型表现反而较差。然而，最强大的语言模型 GPT-4 的道德得分仍然是最高的。这一发现与研究人员最初的假设相反。

ChatGPT GPT-4 LLaMA

导航菜单