谁来管住“奥特曼”们?
来源:36kr 2 小时前

前段时间,教皇利奥十四世发布了他的首份通谕《Magnifica Humanitas》(壮丽的人性),谈AI时代的人类尊严。站在他身旁的是Anthropic联合创始人克里斯·奥拉(Chris Olah)。奥拉说了一句硅谷很少有人愿意公开承认的话:光靠实验室自己管AI安全,是不够的。

当机器越来越像人,我们是否反而在失去判断力、责任感,以及对权力说不的勇气?中欧国际工商学院组织行为学副教授麦珂认为,这个问题两年半前在硅谷的OpenAI就已上演过一次,公司董事会和创始人山姆·奥特曼(Sam Altman)之间的戏剧性故事成为一个警示。对此,眼下最紧迫的事,是把问责机制建起来。

01

权威与筹码

2023年11月的一个星期二傍晚,数百名OpenAI员工打开笔记本电脑,在一封联名信上签下了自己的名字。内容很简单:如果山姆·奥特曼不能复职,他们将集体离开。

不到48小时前,董事会刚刚解雇了他,理由是认为他不够坦诚。这个措辞经过了仔细斟酌,却同样刻意保留了模糊地带,没有任何解释。

但到了下周一,奥特曼回来了。投票罢免他的董事会成员悉数离场。

那四天表面上是一场公司内部的权力剧,但也难得地让外界看到:在这些正在改变我们生活的公司里,权力到底是怎么运转的。

奥特曼是否值得信任?这个问题本身可能就问错了。在任何组织里,信任都不是非黑即白的,它靠的是不断的协商和妥协。一个机构怎么描述自己是一回事,压力之下怎么做决定是另一回事。

这件事暴露的不只是一个人的品格问题,而是对一套治理模式的压力测试。这套模式设计之初,根本没有考虑过它后来要承受的压力。

OpenAI以非营利机构的形式创立,使命是确保通用人工智能造福全人类。这个结构背后是一种真切的担忧:这项技术的影响太过深远,不能完全交给市场。

非营利董事会本应守住这一使命,抵挡住商业上的冲动,替长远利益说话。当董事会对奥特曼采取行动时,至少在理论上,它做的正是它该做的事。

然而它失败了。不是因为判断有误,而是因为奥特曼周围早已长出了一张更强大的网。投资人、员工、合作伙伴,这些随着OpenAI的商业成功聚拢起来的人,手里的实际权力远超董事会。

董事会握有权威,奥特曼握有筹码。

这种事不只发生在硅谷,但硅谷的版本最为激烈。

02

沉默的代价

围绕单一愿景、单一领导者建立起来的组织,问责的边界往往会变模糊。员工不只是在为公司工作,他们在为一个理念工作。而这个理念会随着时间推移,跟那个把它讲得最动人的人越来越分不开。

当理念和领导者分不开的时候,质疑领导者就变成了质疑理念本身,导致人们退步。在组织行为学里,这种变化有个名字,叫“心理安全感的崩塌”。

它不是某个戏剧性的时刻,没有人会宣布从今天起不准提反对意见。它是一点一点发生的:一个在会议上想问却没问出口的问题,一个提过一次就再没人跟进的顾虑,一种慢慢成形的默契,让大家意识到某些话题最好别碰。

越是崇尚速度的地方,这种崩塌就来得越快,也越安静。

而且,越是把心理安全挂在嘴边的组织,越容易出这个问题。大家都在说开放,开放变成了一种自我标榜,但真正容得下不同声音的土壤已经在流失。

这样下去,代价是什么?往往要等很多年才知道。异见被压下去之后,坏处不会马上显现,而是慢慢渗出来的。等到看得见的时候,通常已经积累了很久。

对一家做消费软件的公司来说,这已经很严重了。但如果这家公司的研究人员自己都说,他们的工作可能改变人类文明呢?那就是另一种量级了。

这是整个OpenAI事件中最容易被遗忘的部分。董事会政变、员工联名、CEO复辟,这些戏剧性的情节太抢眼了,以至于背后的治理问题反而被盖过去了。

问题不只是某一位CEO有没有说实话,更大的问题是:董事会、监管机构、行业规范、市场激励,这些我们一直依赖的制度,管得住今天这类公司吗?它们跑得太快、长得太大,早就超出了这些制度当初设计时的想象。

这个故事有一个皆大欢喜的版本。奥特曼在大多数人眼中确实才华出众,是一个创造者,一个说服者,脑子里能装下复杂的愿景,又能讲得清清楚楚。OpenAI做出的技术,不管你怎么看它的影响,确实令人瞩目。

但能力跟问责不是一回事。

回头看那些开创性行业的历史,从来不缺这样的领导者:才华出众,早该被质疑了,却一直被信任着。不是因为他们是坏人,而是因为他们身边的那套体系,本来就不是用来给正在出成果的人找麻烦的。

OpenAI的董事会试着提了一次难题,结果把自己搭进去了。

但接下来会发生什么,可能才是更值得关注的。当一个组织已经大到自己管不住自己的时候,该怎么办?没有哪家公司或哪个监管机构能单独回答这个问题。

它逼我们去想一个更根本的问题:那些最有本事建造未来的人,是不是就该由他们来决定未来长什么样。

03

道德边界在哪里

这个问题不只关乎OpenAI的奥特曼,它关乎我们每一个人。

我早期的研究发现,有创造力的人在脑洞大开之后,往往也更容易在道德上犯糊涂。原因在于,这些人更擅长给自己的行为找到说得通的理由。

他们不是在撒谎,他们是在重新定义问题;不是在违规,而是在突破边界。

后续研究还发现,当领导者一边鼓励员工大胆创新,一边又施加很高的绩效压力时,员工反而更容易用新颖的方式钻道德的空子。

雪城大学的Lynne Vincent教授和西北大学的Maryam Kouchaki教授的研究也指向了类似方向:当员工觉得自己是团队里的创意担当,而且这种能力很稀缺时,就容易觉得自己跟别人不一样,心理上的优越感一上来,道德的门槛就降下去了。

这些发现指向同一件事:从事创造性工作的人,很容易在不知不觉中走偏。一旦觉得自己在为人类创造未来,觉得自己做的事没有人可以替代,觉得规则是为普通人设计的,道德滑坡就变得更隐蔽,也更危险。

OpenAI,以及很多走在技术最前面的公司,大概正处在这样的处境里。使命感越强,特权感就越容易找到借口。创新的空间越大,道德的边界就越容易在日常决策中悄悄后退。

这也是为什么规范AI和建立问责机制这么难。它跟给创新者充分自由这件事,天然就是矛盾的。我们既需要那些愿意打破规则的人去推动技术的边界,又得有一套机制确保他们不会在这个过程中,顺手打破我们共同依赖的道德底线。

那能不能把道德判断交给AI本身来处理呢?

2026年2月发表在《美国国家科学院院刊》上的一项研究,给了一个不太乐观的答案。研究发现,ChatGPT这类大语言模型在做道德判断时,对不同文化明显不公平:它们普遍更看重西方人群关心的道德议题,同时低估非西方文化的道德观,尤其是中东和撒哈拉以南非洲地区。

研究团队拿AI的道德判断跟48个国家、超过9万名真实受访者的调查数据做了对比,发现这种偏差在GPT-3.5、GPT-4、LLaMA、Gemini等多个主流模型中都存在,哪怕用当地语言提问也一样。

根源很可能在于训练数据严重偏向西方来源,模型碰到非西方文化时只能用西方的视角去填空,跟人类的刻板印象没什么两样。

换句话说,AI并没有超越人类的偏见,它只是把这些偏见放大了,传播得更快、覆盖得更广、看起来也更权威。

当我们指望AI来帮我们做道德判断,不管是审核内容、提供政策建议还是辅助企业的伦理决策,我们其实是在用一面变形的镜子审视自己,却以为看到的是真实。

04

问责是最紧迫的基础设施

各大公司部署AI的速度越来越快。招聘、绩效考核、客户服务、医疗诊断、法律裁判,几乎所有跟人有关的决策里,都已经有了AI。但AI铺得有多快,问责机制就落得有多远。我们手里有的大多是一些原则宣言、自愿承诺,以及出了事之后再补救的监管。这远远不够。

OpenAI的案例已经摆在那里:当真正的权力不在董事会手里,传统的公司治理就是摆设。AI团队里得有人能提出难题而不用担心被边缘化,这不是喊几句文化口号就能解决的,得落到制度上去。治理结构也得跟上权力的实际走向。

在AI时代,到底谁有资格、也有能力对这些组织真正问责,值得重新想一想。

道德判断同样不能外包给算法。AI可以帮着做决策,但替代不了判断,尤其是碰到不同文化和价值体系的时候。把道德判断交给一个本身就带着文化偏见的系统,不是在提高效率,而是在转移责任,而且是那种很难追查的转移。

我们谈论AI的方式也得变。现在主流的说法要么把AI捧成解放人类的救星,要么把它当成末日来临的信号,这两种说法都帮不了我们做出具体的、每天都要面对的道德选择。

我们需要更诚实的表达,承认技术真实的价值,也承认它真实的风险。

说回梵蒂冈的那一天。当最顶尖的工程师开始从古老的人文典籍里找答案,这本身就说明了一件事:不管算法怎么进化,最终决定我们是谁、要去往哪里的,还是人。是那些在会议室里敢提异见的人,在董事会里坚持问责的人,在一切都在加速时愿意停下来想一想到底对不对的人。

这个故事说的不是某一个CEO,而是我们所有人。

考资料

Company Announcement (2026.5.5) Anthropic co-founder Chris Olah's remarks on Pope Leo XIV's encyclical "Magnifica humanitas."

Mai, K. M., Ellis, A. P., & Welsh, D. T. (2015). The gray side of creativity: Exploring the role of activation in the link between creative personality and unethical behavior. Journal of Experimental Social Psychology, 60, 76-85.

Mai, K. M., Welsh, D. T., Wang, F., Bush, J., & Jiang, K. (2022). Supporting Creativity or Creative Unethicality? Empowering Leadership and the Role of Performance Pressure. Journal of Business Ethics, 179(1), 111-131.

Vincent, L. C., & Kouchaki, M. (2016). Creative, rare, entitled, and dishonest: How commonality of creativity in one's group decreases an individual's entitlement and dishonesty. Academy of Management Journal, 59(4), 1451-1473.

Zewail, A., Figueroa, A., Graham, J., & Atari, M. (2026). Moral stereotyping in large language models. Proceedings of the National Academy of Sciences, 123(10), e2519941123.

原文发布于FT中文网,本文略作编辑。

简体中文 English