OpenAI和Meta在开源与封闭

Details: Category: 人工智能

OpenAI的封闭策略引起了争议

OpenAI和Meta在开源与封闭方面的不同策略。虽然OpenAI在技术上保持领先，但越来越封闭，而Meta通过开源赢得了不少赞誉。Meta的开源举措成为整个AI圈的希望?

两家公司的路线和策略不同，但都希望在AI发展中获得商业利益。Meta选择开源，通过开源项目LLaMA赢得了行业的认可和支持。Meta的开源策略对大模型开源社区的发展起到了重要推动作用。与OpenAI拒绝Open他们的算法、路线、论文相反，Meta选择Open到底。

此前震惊业内的大模型LLaMA，大获好评的LLaMA 2，以及正在研发的LLaMA 3，都是开源的。它们成为很多AI公司研究、学习甚至抄袭的对象。通过开源这一手段，Meta在某种程度上打破了大模型的垄断，成为OpenAI和谷歌双雄相争之外的第三股力量。

事实上，Meta过去开源了它研发的几乎所有基础设施，比如用于Web和APP开发框架的React，以及机器学习框架PyTorch，而ChatGPT就是基于PyTorch开发的，OpenAI也运行在PyTorch上。按照Meta首席科学家杨立昆的话说，除谷歌外，全世界都运行在PyTorch上，因为谷歌有自己的系统。

OpenAI向左，Meta往右，两家原本没有太多交集的公司，正走出截然不同的路。

OpenAI，走向封闭:

2013年，有一家叫DeepMind的AI公司，同时引起了谷歌和Facebook（当时还没更名为Meta）的注意。当时这家公司刚崭露头角，嗅觉敏锐的谷歌和Facebook都想收购它。最终，谷歌在竞购中胜出，2014年1月将DeepMind收入囊中。

谷歌收购DeepMind时，有两个人心里很不是滋味。一个是扎克伯格，他当时已经意识到AI的巨大前景；另一个是马斯克，他不想AI被谷歌这样的大公司控制。于是，扎克伯格决定自己做，他花重金从纽约大学请来了计算机科学领域的权威人物杨立昆，启动FAIR项目，在Facebook成立了AI实验室。马斯克则和奥尔特曼成立了OpenAI，用来对抗谷歌。从当时的情形来看，扎克伯格是为了自己的公司，马斯克是为了全人类。马斯克认为，由大公司控制的少量AI系统很不安全，唯一的办法是让尽可能多的人都拥有AI。所以OpenAI一开始就定位开源，是一个非营利性的机构。马斯克当时说：“我们希望有一种类似于Linux版本的AI，不受任何个人或公司的控制。” 一个为私，一个为公，两家公司一开始就选了不同的路。

马斯克提到的Linux，是一款免费开源的操作系统。在互联网早期，计算机刚开始普及时，可用的操作系统不多，要么源代码被软件厂商严格保密，要么收取很高昂的费用。一个欧洲大学生开发出Linux操作系统的雏形，然后免费对外公开了自己的代码。

由于开源，全球程序员都加入进来改进代码，最终创造了Linux操作系统，且使用完全免费。这大大加速了计算机的普及。我们今天熟知的安卓系统，就是基于Linux内核，全球大部分手机都跑在这个系统上。马斯克的想法很简单，AI时代也需要有这样一个开源开放的操作系统，市场不能让巨头独占。

OpenAI的启动资金来源于一批科技大佬捐赠，它一开始的确是按开源的路径走的，2019年发布的GPT-2，就是一个开源大模型。但也是在GPT-2发布之后，OpenAI逐渐走向封闭。它随后成立营利性子公司，接受了微软的数十亿美元投资。在那之后，2020年发布的GPT-3，2022年升级的GPT-3.5，以及2023年3月发布的GPT-4，都是闭源模型，一开始OpenAI还公布论文，到后来连模型具体参数都不再公布。而从整个大模型行业的竞争格局来看，“OpenAI-微软”“DeepMind-谷歌”的双巨头组合格局正式形成。

马斯克对此非常不满。他说，OpenAI设立时是一家开源公司，现在变成了一个闭源、受微软控制的逐利公司。这根本不是他想要的。

这期间Meta没闲着。除了折腾元宇宙，Meta的AI团队一直在研究大语言模型，并发布了一些开源项目。大家各做各的，互不干涉。但一向好强的扎克伯格不会袖手旁观。Meta秘密研发的LLaMA大模型，已经箭在弦上。

Meta才是全村的希望？

2023年2月，ChatGPT发布之后3个月，LLaMA的第一个版本开源，一开始这个模型只能用作研究。7月，升级之后的LLaMA 2支持免费商用。Meta把模型训练数据、训练方法、数据标注等大量细节都公布了，起始代码全部开源。LLaMA 2性能非常突出，超过了所有的开源大模型。有人发现，其最大参数的版本比GPT-3参数量小，但效果更好。

之前，国内团队研发大模型，只能从零到一不断试错，一旦有个点被卡住了，即便从技术角度来说并不是太难，但靠自己可能也需要花一两年时间才能解决，需要亲自踩很多坑。现在Meta直接把它的经验和数据拿出来，在思路和方法上给了行业非常重要的指引。这也是为什么国内一下子突然涌现出200多个大模型。王小川的百川智能在公司成立仅两个月就发布了一款大模型，其实就是借鉴了LLaMA。李开复的零一万物推出的大模型，也是使用LLaMA的开源模型架构。

LLaMA开源对OpenAI最直观的影响，是有一堆中国公司跳出来“吊打”GPT。在他们的口径中，已经在多项指标上超过了GPT模型，虽然很多榜单都是刷出来的。更深层次的影响在于，大模型开源社区的力量快速壮大，全球的程序员都能为开源做贡献。他们开发出各种开源数据集，迭代出更多新模型，缩小与闭源大模型的差距。所以谷歌的工程师说，谷歌没有护城河，OpenAI也没有。

回顾Meta的发展，其实它一直都有开源的传统。早在2016年，Meta团队就开发并开源了深度学习框架PyTorch，它和谷歌的TensorFlow成为深度学习领域的两大主流框架。跟OpenAI现在才开始秘密推进芯片制造项目不同，Meta在三年前就设计了自研AI推理芯片，并采用了开源架构。在语言翻译方面它推出了很多开源模型，两年前发布的NLLB模型是维基百科的翻译供应商之一，2023年发布的SeamlessM4T可以翻译近百种语言，同时它还发布了全球最大的开放多模态翻译数据集。

反观OpenAI，它依然在技术上保持领先，但拒绝开放。同时它试图阻挡竞争对手，以保持自己的先发优势。人工智能公司开放传神（OpenCSG）创始人、CEO陈冉认为，开源的市场空间远比闭源大，但未来一定是开源和闭源两条路同时走，“OpenAI开源不开源其实不重要了。”

开源闭源，谁对谁错？

OpenAI既没有那么自私，Meta也不像网友鼓吹的那样高尚，区别只在于路线和策略。

若论对整个AI行业的贡献，OpenAI毫无疑问是最大的。毕竟，这一轮AI浪潮是由ChatGPT掀起的。它点燃了一把火，加速了大模型的普及。事实上，前两年大模型开源社区基本是围着GPT-3在转。OpenAI不像谷歌、Meta那些巨头拥有雄厚的资金积累，早年大佬捐赠的资金早花得差不多了，没钱是做不了研发的，总不能用爱发电。所以OpenAI抱了微软的大腿，奥尔特曼想尽办法为OpenAI赚钱。

Meta将技术开源，也不是只为他人做嫁衣。开源是一种策略，能吸引更多开发人员免费帮它迭代技术、修复漏洞，正所谓众人拾柴火焰高，但最核心的技术还是掌握在Meta手里，该打击对手的时候它不会手软。就像谷歌，它旗下的安卓是开源系统，但国内手机厂商做自己的系统还是会有很多限制。

再往深了看，闭源的OpenAI和开源的Meta，从根本上对AI的价值判断有分歧。如果将AI比作未来世界的核武器，OpenAI认为它很危险，得谨慎，不能滥用。Meta则认为，核武器不能只掌握在少数几个玩家手里，应该开放研究。

基于“防止AI取代人类”的愿景，行业里又延伸出两大派别。一派认为大量独立的AI系统比由大公司控制的少量AI系统更安全，AI的研究应该开源开放；另一派认为应该封闭研究，这可以减轻安全风险，防止不法分子滥用获得的代码。

OpenAI属于后者。支持它的人认为开源策略加大了风险。Meta将开源视为最优策略，AI必须是开源的，只有让更多人参与其中，最终开发出的系统才会更安全。

所以，OpenAI和Meta有不同的信念。OpenAI将AGI视为终极目标，并且相信自己将会第一个实现它；Meta将开放平台视为最好的路径，试图制定开源标准。当然，它们都希望在这个过程里拿到应得的商业利益。

文章来源: “OpenAI向左，Meta往右”，作者：黎明

AI LincWe!

AI LincWe! 人工智能, 学习AI的基本概念、原理和应用，了解AI的发展趋势，亲自动手实践。对AI感兴趣，不论新手小白、背景、经验和水平如何，在这里可以找到适合的内容和资源。

OpenAI和Meta在开源与封闭

学习文章

AI LincWe!

文章精选

AI沟通的语言 Prompt

相关链接