Back
LLM作为压缩了大量人类偏好描述的集合,实际上已经可以替代许多“手动学习人类偏好”的工作,比如强化学习中奖励函数的设计
llm
rl
人类的文明史,或许就是一部“权力让渡史”。在这个工具塑造我们的时代,我们该如何守护人之为人的自主与尊严?
humanities
technology
society
ai