谁来管住“奥特曼”们？

来源：36kr 2 小时前

前段时间，教皇利奥十四世发布了他的首份通谕《Magnifica Humanitas》（壮丽的人性），谈AI时代的人类尊严。站在他身旁的是Anthropic联合创始人克里斯·奥拉（Chris Olah）。奥拉说了一句硅谷很少有人愿意公开承认的话：光靠实验室自己管AI安全，是不够的。

当机器越来越像人，我们是否反而在失去判断力、责任感，以及对权力说不的勇气？中欧国际工商学院组织行为学副教授麦珂认为，这个问题两年半前在硅谷的OpenAI就已上演过一次，公司董事会和创始人山姆·奥特曼（Sam Altman）之间的戏剧性故事成为一个警示。对此，眼下最紧迫的事，是把问责机制建起来。

01 权威与筹码

2023年11月的一个星期二傍晚，数百名OpenAI员工打开笔记本电脑，在一封联名信上签下了自己的名字。内容很简单：如果山姆·奥特曼不能复职，他们将集体离开。

不到48小时前，董事会刚刚解雇了他，理由是认为他不够坦诚。这个措辞经过了仔细斟酌，却同样刻意保留了模糊地带，没有任何解释。

但到了下周一，奥特曼回来了。投票罢免他的董事会成员悉数离场。

那四天表面上是一场公司内部的权力剧，但也难得地让外界看到：在这些正在改变我们生活的公司里，权力到底是怎么运转的。

奥特曼是否值得信任？这个问题本身可能就问错了。在任何组织里，信任都不是非黑即白的，它靠的是不断的协商和妥协。一个机构怎么描述自己是一回事，压力之下怎么做决定是另一回事。

这件事暴露的不只是一个人的品格问题，而是对一套治理模式的压力测试。这套模式设计之初，根本没有考虑过它后来要承受的压力。

OpenAI以非营利机构的形式创立，使命是确保通用人工智能造福全人类。这个结构背后是一种真切的担忧：这项技术的影响太过深远，不能完全交给市场。

非营利董事会本应守住这一使命，抵挡住商业上的冲动，替长远利益说话。当董事会对奥特曼采取行动时，至少在理论上，它做的正是它该做的事。

然而它失败了。不是因为判断有误，而是因为奥特曼周围早已长出了一张更强大的网。投资人、员工、合作伙伴，这些随着OpenAI的商业成功聚拢起来的人，手里的实际权力远超董事会。

董事会握有权威，奥特曼握有筹码。

这种事不只发生在硅谷，但硅谷的版本最为激烈。

02 沉默的代价

围绕单一愿景、单一领导者建立起来的组织，问责的边界往往会变模糊。员工不只是在为公司工作，他们在为一个理念工作。而这个理念会随着时间推移，跟那个把它讲得最动人的人越来越分不开。

当理念和领导者分不开的时候，质疑领导者就变成了质疑理念本身，导致人们退步。在组织行为学里，这种变化有个名字，叫“心理安全感的崩塌”。

它不是某个戏剧性的时刻，没有人会宣布从今天起不准提反对意见。它是一点一点发生的：一个在会议上想问却没问出口的问题，一个提过一次就再没人跟进的顾虑，一种慢慢成形的默契，让大家意识到某些话题最好别碰。

越是崇尚速度的地方，这种崩塌就来得越快，也越安静。

而且，越是把心理安全挂在嘴边的组织，越容易出这个问题。大家都在说开放，开放变成了一种自我标榜，但真正容得下不同声音的土壤已经在流失。

这样下去，代价是什么？往往要等很多年才知道。异见被压下去之后，坏处不会马上显现，而是慢慢渗出来的。等到看得见的时候，通常已经积累了很久。

对一家做消费软件的公司来说，这已经很严重了。但如果这家公司的研究人员自己都说，他们的工作可能改变人类文明呢？那就是另一种量级了。

这是整个OpenAI事件中最容易被遗忘的部分。董事会政变、员工联名、CEO复辟，这些戏剧性的情节太抢眼了，以至于背后的治理问题反而被盖过去了。

问题不只是某一位CEO有没有说实话，更大的问题是：董事会、监管机构、行业规范、市场激励，这些我们一直依赖的制度，管得住今天这类公司吗？它们跑得太快、长得太大，早就超出了这些制度当初设计时的想象。

这个故事有一个皆大欢喜的版本。奥特曼在大多数人眼中确实才华出众，是一个创造者，一个说服者，脑子里能装下复杂的愿景，又能讲得清清楚楚。OpenAI做出的技术，不管你怎么看它的影响，确实令人瞩目。

但能力跟问责不是一回事。

回头看那些开创性行业的历史，从来不缺这样的领导者：才华出众，早该被质疑了，却一直被信任着。不是因为他们是坏人，而是因为他们身边的那套体系，本来就不是用来给正在出成果的人找麻烦的。

OpenAI的董事会试着提了一次难题，结果把自己搭进去了。

但接下来会发生什么，可能才是更值得关注的。当一个组织已经大到自己管不住自己的时候，该怎么办？没有哪家公司或哪个监管机构能单独回答这个问题。

它逼我们去想一个更根本的问题：那些最有本事建造未来的人，是不是就该由他们来决定未来长什么样。

03 道德边界在哪里

这个问题不只关乎OpenAI的奥特曼，它关乎我们每一个人。

我早期的研究发现，有创造力的人在脑洞大开之后，往往也更容易在道德上犯糊涂。原因在于，这些人更擅长给自己的行为找到说得通的理由。

他们不是在撒谎，他们是在重新定义问题；不是在违规，而是在突破边界。

后续研究还发现，当领导者一边鼓励员工大胆创新，一边又施加很高的绩效压力时，员工反而更容易用新颖的方式钻道德的空子。

雪城大学的Lynne Vincent教授和西北大学的Maryam Kouchaki教授的研究也指向了类似方向：当员工觉得自己是团队里的创意担当，而且这种能力很稀缺时，就容易觉得自己跟别人不一样，心理上的优越感一上来，道德的门槛就降下去了。

这些发现指向同一件事：从事创造性工作的人，很容易在不知不觉中走偏。一旦觉得自己在为人类创造未来，觉得自己做的事没有人可以替代，觉得规则是为普通人设计的，道德滑坡就变得更隐蔽，也更危险。

OpenAI，以及很多走在技术最前面的公司，大概正处在这样的处境里。使命感越强，特权感就越容易找到借口。创新的空间越大，道德的边界就越容易在日常决策中悄悄后退。

这也是为什么规范AI和建立问责机制这么难。它跟给创新者充分自由这件事，天然就是矛盾的。我们既需要那些愿意打破规则的人去推动技术的边界，又得有一套机制确保他们不会在这个过程中，顺手打破我们共同依赖的道德底线。

那能不能把道德判断交给AI本身来处理呢？

2026年2月发表在《美国国家科学院院刊》上的一项研究，给了一个不太乐观的答案。研究发现，ChatGPT这类大语言模型在做道德判断时，对不同文化明显不公平：它们普遍更看重西方人群关心的道德议题，同时低估非西方文化的道德观，尤其是中东和撒哈拉以南非洲地区。

研究团队拿AI的道德判断跟48个国家、超过9万名真实受访者的调查数据做了对比，发现这种偏差在GPT-3.5、GPT-4、LLaMA、Gemini等多个主流模型中都存在，哪怕用当地语言提问也一样。

根源很可能在于训练数据严重偏向西方来源，模型碰到非西方文化时只能用西方的视角去填空，跟人类的刻板印象没什么两样。

换句话说，AI并没有超越人类的偏见，它只是把这些偏见放大了，传播得更快、覆盖得更广、看起来也更权威。

当我们指望AI来帮我们做道德判断，不管是审核内容、提供政策建议还是辅助企业的伦理决策，我们其实是在用一面变形的镜子审视自己，却以为看到的是真实。

04 问责是最紧迫的基础设施

各大公司部署AI的速度越来越快。招聘、绩效考核、客户服务、医疗诊断、法律裁判，几乎所有跟人有关的决策里，都已经有了AI。但AI铺得有多快，问责机制就落得有多远。我们手里有的大多是一些原则宣言、自愿承诺，以及出了事之后再补救的监管。这远远不够。

OpenAI的案例已经摆在那里：当真正的权力不在董事会手里，传统的公司治理就是摆设。AI团队里得有人能提出难题而不用担心被边缘化，这不是喊几句文化口号就能解决的，得落到制度上去。治理结构也得跟上权力的实际走向。

在AI时代，到底谁有资格、也有能力对这些组织真正问责，值得重新想一想。

道德判断同样不能外包给算法。AI可以帮着做决策，但替代不了判断，尤其是碰到不同文化和价值体系的时候。把道德判断交给一个本身就带着文化偏见的系统，不是在提高效率，而是在转移责任，而且是那种很难追查的转移。

我们谈论AI的方式也得变。现在主流的说法要么把AI捧成解放人类的救星，要么把它当成末日来临的信号，这两种说法都帮不了我们做出具体的、每天都要面对的道德选择。

我们需要更诚实的表达，承认技术真实的价值，也承认它真实的风险。

说回梵蒂冈的那一天。当最顶尖的工程师开始从古老的人文典籍里找答案，这本身就说明了一件事：不管算法怎么进化，最终决定我们是谁、要去往哪里的，还是人。是那些在会议室里敢提异见的人，在董事会里坚持问责的人，在一切都在加速时愿意停下来想一想到底对不对的人。

这个故事说的不是某一个CEO，而是我们所有人。

参考资料

Company Announcement (2026.5.5) Anthropic co-founder Chris Olah's remarks on Pope Leo XIV's encyclical "Magnifica humanitas."

Mai, K. M., Ellis, A. P., & Welsh, D. T. (2015). The gray side of creativity: Exploring the role of activation in the link between creative personality and unethical behavior. Journal of Experimental Social Psychology, 60, 76-85.

Mai, K. M., Welsh, D. T., Wang, F., Bush, J., & Jiang, K. (2022). Supporting Creativity or Creative Unethicality? Empowering Leadership and the Role of Performance Pressure. Journal of Business Ethics, 179(1), 111-131.

Vincent, L. C., & Kouchaki, M. (2016). Creative, rare, entitled, and dishonest: How commonality of creativity in one's group decreases an individual's entitlement and dishonesty. Academy of Management Journal, 59(4), 1451-1473.

Zewail, A., Figueroa, A., Graham, J., & Atari, M. (2026). Moral stereotyping in large language models. Proceedings of the National Academy of Sciences, 123(10), e2519941123.

原文发布于FT中文网，本文略作编辑。

01

权威与筹码

02

沉默的代价

03

道德边界在哪里

04

问责是最紧迫的基础设施

相关新闻