Mark Collier:开源人工智能定义之声
开源促进会 (OSI) 正在开展一个博客系列,介绍一些积极参与开源人工智能定义 (OSAID) 共同设计过程的人士。共同设计方法允许将不同的观点整合到一个公正、有凝聚力且可行的标准中。来自重要且广泛的利益相关者的支持和贡献对于开源流程至关重要,并且已被证明可以揭示各种问题、快速交付成果并获得社区的认同。
本系列收录了帮助塑造和正在塑造该定义的志愿者们的声音。
认识 Mark Collier

您的开源和人工智能相关背景是什么?
我的职业生涯大部分时间都在开源领域工作,超过 20 年,我发现开源是经济机会的最大驱动力之一,如果不是最大的话。它创造了新的市场,并让世界各地的人们不仅可以使用技术,还可以影响技术的发展方向。我启动了 OpenStack 项目,然后是 OpenStack 基金会,以及后来的 开放基础设施基金会。我们的基金会成员来自 180 多个国家,我亲眼目睹了开源是如何成为推动创新的最有效方式。您可以从世界各地的人们那里获得众包的想法,而不仅仅局限于一家公司或一个国家。在云计算/边缘计算时代的基础设施方面,我们当然已经看到了这一点。人工智能是下一代浪潮,人们正在投入数万亿美元来构建基础设施,包括物理基础设施和围绕它编写的软件。这是拥抱开源作为创新之路的又一个机会。
开源推动了新技术的快速采用,并为世界上更多的人提供了影响技术和从中获得经济利益的机会。我希望看到这种模式在人工智能的下一个时代重演。
是什么促使您加入这个共同设计过程来定义开源人工智能?
我担心在这个下一个巨大的技术浪潮中,可能不会有可信的开源替代方案来对抗大型专有厂商。如果我们只能从一两个国家的两三家大型厂商那里获得最先进的人工智能,这对人类来说将是一件坏事。正如我们不希望只看到一家云提供商或一家软件供应商一样,我们不希望在人工智能领域出现任何形式的垄断或寡头垄断;这真的会减缓创新。我想参与这个共同设计过程,因为将开源的概念应用于人工智能实际上并非易事。我们可以沿用开源软件背后的原则和自由,例如不受限制地使用它的自由以及为不同用例修改它的能力,但人工智能系统不仅仅是软件。关于数据是否需要根据开源友好的许可发布和公开才能被视为开源人工智能,已经引发了一场全面的辩论。这只是我想贡献的众多考虑因素之一。
我们有一个非常令人印象深刻的团队,他们拥有各种不同的背景和观点。我想参与这个过程,不是因为我有答案,而是因为我有一些见解,我可以向其他人学习。我们需要就此达成共识,因为如果我们不这样做,开源在人工智能时代的意义将会被淡化,甚至可能完全丧失,这将影响到所有开源和所有技术。
您能否描述一下您参与这个过程的体验?您最享受的是什么?您面临的一些挑战是什么?
这个过程最初是一个邮件列表,后来演变成一个在线讨论论坛。虽然对我来说一直跟进并不容易,但 OSI 的工作人员在总结主题并将关键主题置顶方面做得非常出色。论坛和媒体上都在快速进行讨论。似乎几乎每天都有新模型发布,而所谓开源模型的标准正在引起很多噪音。对于任何人来说,跟上步伐都是一个挑战,但总的来说,我认为这是一个好的过程。
您认为人工智能为什么应该开源?
一项技术对于经济的未来越重要,一项技术对我们日常生活的影响越大,它就越有必要是开源的。出于经济和参与的原因,也出于安全的原因。我们已经一次又一次地看到,透明和开放孕育更好的安全性。对于像人工智能这样更神秘和复杂的技术,开源提供了透明度,帮助我们理解技术正在做出的决策。许多大型厂商一直在游说加强监管,使开源人工智能更加困难,我认为这清楚地表明了利益冲突。
有一些立法,如果获得通过,将对不仅是开源人工智能,而且是整个开源构成真正的危险。如果最先进的人工智能不符合开源的标准定义,我们既有真正的机会,也有权力被有意识地集中的真正风险。开源人工智能继续与专有模型并驾齐驱,这让我感到乐观。
您个人对开源人工智能的定义是否在此过程中发生了变化?在参与共同设计过程时,您遇到了哪些新的视角或想法?
即使经历了这一年多的过程,我个人对开源人工智能的定义也并非一成不变。事情变化如此之快,我认为我们需要小心,不要让完美成为优秀的敌人。时间至关重要,因为主流媒体和科技媒体都在报道那些在价值数十亿美元的硬件上训练的模型,声称是开源的,但实际上并非如此。我变得更愿意在不完美的定义上妥协,以便我们能够更快地达成共识。
您认为一旦有了明确的开源人工智能定义,主要好处是什么?
人们喜爱开源的所有原因本质上与人们非常想在他们的人工智能上贴上开源标签的原因相同;信任、透明度、他们可以修改它并在其基础上建立业务,并且许可证不会被更改。一旦我们最终确定并批准该定义,我们就可以开始在实践中广泛使用它。这将再次为市场带来一些清晰度。如果我们要挑战一项被标记为开源人工智能的技术,我们需要能够指出一些非常清晰和有据可查的东西。致力于大型人工智能工具和工作负载的大公司的法务部门想知道他们的许可证不会被撤销。如果该定义坚持人们对开源的关键自由的期望,它将导致更快的普及。
您认为参与开源人工智能的社区下一步应该怎么做?
我认为来自 OSI 的 Stefano 在尝试参加会议巡回演讲以分享和收集反馈方面做得非常出色,而虚拟参与该过程仍然是保持其包容性的关键。我认为下一步是在媒体中提高对该定义的认识并进行市场测试。从那里开始就是一个迭代过程。
如何参与
OSAID 共同设计过程向所有对协作感兴趣的人开放。 有多种参与方式