
确保通用人工智能——比人类更聪明的人工智能系统——造福全人类。
如果人工智能被成功创造出来,这项技术可以通过增加财富、涡轮增压全球经济、帮助发现改变可能性极限的新科学知识来帮助我们提升人类。
AGI有可能给每个人带来令人难以置信的新能力;我们可以想象这样一个世界:我们所有人几乎都可以在任何认知任务中获得帮助,为人类的聪明才智和创造力提供巨大的力量倍增器。
另一方面,AGI也会带来严重的误用、严重事故和社会混乱的风险。因为人工智能的好处是如此之大,我们不相信社会永远停止它的发展是可能的或可取的;相反,社会和人工智能的开发者必须弄清楚如何把它做好。
虽然我们无法准确预测将会发生什么,当然我们目前的进展可能会遇到瓶颈,但我们可以阐明我们最关心的原则:
1、我们希望AGI能让人类在宇宙中最大限度地繁荣。我们不期望未来成为一个毫无条件的乌托邦,但我们希望将好的最大化,坏的最小化,让AGI成为人性的放大器。
2、我们希望AGI的好处、访问和治理能够广泛而公平地共享。
3、我们想要成功地驾驭巨大的风险。在面对这些风险时,我们承认,理论上看似正确的事情,在实践中往往比预期的更加奇怪。我们相信,我们必须通过部署功能较弱的技术版本来不断学习和适应,以最大限度地减少“一次完成”的情况。
首先,随着我们不断创建更强大的系统,我们希望部署它们并获得在现实世界中操作它们的经验。我们相信这是谨慎管理AGI的最佳方式——逐步过渡到一个拥有AGI的世界比突然过渡要好。我们希望强大的人工智能能够加快世界的发展速度,我们认为最好是循序渐进地进行调整。
一个渐进的过渡让人们、政策制定者和机构有时间了解正在发生的事情,亲身体验这些系统的好处和坏处,适应我们的经济,并将监管落实到位。它还允许社会和人工智能共同发展,让人们在风险相对较低的情况下集体找出他们想要的东西。
我们目前认为,成功应对人工智能部署挑战的最佳方法是快速学习和仔细迭代的紧密反馈循环。社会将面临一些重大问题,比如允许人工智能系统做什么、如何对抗偏见、如何应对工作岗位流失等等。最佳决策将取决于技术的发展方向,与任何新领域一样,迄今为止,大多数专家的预测都是错误的。这使得在真空中制定计划变得非常困难。
随着我们的系统越来越接近AGI,我们对模型的创建和部署变得越来越谨慎。我们的决定将需要比社会通常对新技术的应用更加谨慎。
在某种程度上,部署的优点和缺点之间的平衡(例如授权恶意行为者,造成社会和经济中断,以及加速不安全的竞赛)可能会发生变化,在这种情况下,我们将显著改变围绕持续部署的计划。
第二,我们正在努力创造更加一致和可操控的模式。我们从第一个版本的GPT-3模型到InstructGPT和ChatGPT的转变就是一个早期的例子。
更为重要的是,社会在如何使用人工智能的广泛范围内达成一致,但在这些范围内,个人用户有很大的自由裁量权。我们最终的希望是,世界各机构就这些广泛的界限应该是什么达成一致;
短期内,我们计划为外部输入进行实验。世界各机构将需要加强额外的能力和经验,为AGI的复杂决策做好准备。
我们产品的“默认设置”可能会受到很大的限制,但我们计划让用户更容易改变他们正在使用的人工智能的行为。我们相信让个人做出自己的决定,以及思想多样性的内在力量。
随着我们的模型变得更加强大,我们将需要开发新的校准技术(以及测试来理解我们当前的技术何时失败)。我们的短期计划是使用人工智能来帮助人类评估更复杂模型的输出并监控复杂系统,从长远来看,使用人工智能来帮助我们提出更好的对齐技术的新想法。
重要的是,须在人工智能安全和能力方面共同取得进展。分开讨论它们是错误的二分法;它们在很多方面是相互关联的。我们最好的安全工作来自于我们最有能力的模型。也就是说,安全进步与能力进步的比率增加是很重要的。
第三,我们希望就三个关键问题展开全球对话:如何管理这些系统,如何公平分配它们产生的利益,以及如何公平地分享访问权。
除了这三个领域之外,我们还试图建立一种结构,使我们的激励机制与良好的结果相一致。我们的章程中有一项条款是关于帮助其他组织提高安全性,而不是在AGI开发的后期与他们竞争。
在某种程度上,在开始训练未来的系统之前进行独立审查可能很重要,并且对于最先进的努力来说,同意限制用于创建新模型的计算的增长速度。我们认为,关于AGI工作何时应该停止训练运行、决定模型是否可以安全发布或将模型从生产使用中拉出的公共标准非常重要。最后,我们认为重要的是,世界主要政府对超过一定规模的培训有自己的见解。
我们相信人类的未来应该由人类来决定,与公众分享有关进展的信息是很重要的。应该对所有试图建立AGI的努力进行严格审查,并对重大决策进行公众咨询。
第一个人工智能将只是智能连续体中的一个点。我们认为很可能会继续取得进展,可能会在很长一段时间内保持我们在过去十年中看到的进展速度。如果这是真的,世界可能会变得与今天截然不同,风险可能会非常大。一个错位的超级智能AGI可能会对世界造成严重伤害;一个拥有决定性超级智能领导的专制政权也可能做到这一点。
AI能够加速科学发展的人工智能是一个值得思考的特殊案例,也许比其他任何事情都更有影响力。人工智能有足够的能力加速自身的进步,可能会导致重大变化以惊人的速度发生(即使过渡开始缓慢,我们预计它在最后阶段会很快发生)。我们认为,较慢的起飞速度更容易保证安全,在关键时刻,AGI努力之间的协调可能很重要(即使在一个我们不需要这样做来解决技术校准问题的世界里,放慢速度可能很重要,以便给社会足够的时间来适应)。
成功过渡到一个拥有超级智能的世界,也许是人类历史上最重要、最充满希望、也最令人恐惧的项目。成功远非保证,而利害关系(无限的不利和无限的有利)有望将我们所有人团结起来。
我们可以想象一个人类繁荣到某种程度的世界,这可能是我们任何人都无法完全想象的。我们希望为世界贡献一个与这种繁荣相一致的AGI。