NTIA 与民间团体探讨人工智能开放基础模型问题,听取公共利益领域开放性的益处

最近的美国人工智能行政命令指示多个联邦机构采取行动。 这包括指示国家电信和信息管理局 (NTIA*) 讨论与双重用途基础模型相关的益处、风险和政策选择,这些模型是功能强大的模型,可以进行微调并用于多种目的,并且模型权重广泛可用。

NTIA 流程的中心是意见征询,征求公众对广泛提供模型权重和其他模型组件如何在更广泛的经济、社区、个人和国家安全方面产生益处或风险的反馈。

NTIA 还在去年 12 月启动了一系列倾听会议。 鉴于 OSI 在定义开放源代码人工智能项目中的关键努力,我们很荣幸能够参与由民主与技术中心 (CDT) 为民间社会组织举办的最新倾听会议。 我们与其他在公共利益领域工作的非营利组织一起,在与 NTIA 工作人员进行的慷慨的两个小时的会议中分享了意见、疑虑和鼓励。

讨论的核心围绕开放模型与封闭模型展开。 多个组织回顾了 90 年代关于开放源代码的斗争的历史视角。 会议期间各组织权衡的要点简短列表

  • 开放模型代表边际风险。 需要进行更多研究,以了解不可接受的风险在哪里,而不仅仅是产生负面情景——对于开放和封闭模型都是如此。
  • 鼓励不要监管新兴技术本身,而是专注于解决不良行为者和不良行为。
  • 了解开放模型对研究的好处,特别是为隐私、安全和偏见问题提供透明度和问责制。
  • 考虑通过保持模型开放以及作为创新中已确立的因素来实现公平的经济利益。
  • 完成 OSI 的开放源代码人工智能定义并澄清术语将极大地帮助政策讨论。

NTIA 工作人员表示有兴趣了解我们可以从开放源代码软件社区多年来与联邦政府合作的经验中吸取哪些教训。 (OSI 期望在其对 NTIA 意见征询的正式回复中谈到这一点)。

OSI 执行董事斯特凡诺·马富利在会议上发表评论时提供了 OSI 的观点

开放源代码促进会是一个 501(c)(3) 非营利组织,正在推动全球多方利益相关者的讨论,以找到开放源代码人工智能的明确定义。 25 年多来,我们一直在维护开放源代码软件的定义,为开放源代码生态系统中的所有参与者(包括美国联邦机构)提供稳定的指路明灯。

国防部、商务部、管理和预算办公室、医疗补助/医疗保险服务中心和其他机构都是依赖 OSI 维护的标准开放源代码定义来制定其 IT 政策的机构示例。

开放源代码定义已证明,当您消除学习、使用、共享和改进软件系统的障碍时,会产生巨大的社会效益。 大量证据表明,赋予用户对其技术选择的自主权、控制权和自主权,会产生一个基于无需许可的创新的生态系统。 最近的研究估计,如果不存在开放源代码软件,公司将不得不花费相当于 8.8 万亿美元的资金来替换它。 这一切都基于开放源代码软件的明确定义以及开放源代码促进会维护的已批准许可证列表。

人工智能领域也需要且应该有同样明确的术语定义。 我们注意到“开放源代码”一词在指代人工智能系统和机器学习模型时的各种用法,这些系统的服务条款具有广泛的义务和限制。

我们发现公开可用的人工智能系统,其具有完整的实施细节、代码和数据分发,没有任何义务,以及其他仅提供有限的实施细节、没有数据、对用于训练模型的数据的描述非常有限的系统……所有这些通常都称为“开放源代码”。

值得注意的是,开放源代码许可证是一种颠覆知识产权系统的方式:已批准的许可证授予用户权利,而不是剥夺用户的权利。 在考虑模型权重的分发条款时(模型权重基本上是事实),我们应该首先旨在消除知识产权制度。

我们非常关注我们在 Llama2 等流行模型中看到的“经济利益捕获”许可条款。 这些使用条款旨在创建一个仅有利于一个经济行为者(如原始分发者)的网络。

不确定性会打破创新周期。 这种术语的不明确性对消费者、科学家、开发人员或监管机构都没有帮助。 我们计划在 2024 年 10 月底之前交付可用的开放源代码人工智能定义。 定义工作重点是确定对人工智能系统进行修改的首选形式:相当于软件程序的“源代码”。 这种首选形式将成为赋予用户对人工智能技术相同程度自主权的基础。

* NTIA 隶属于美国商务部,是行政部门机构,根据法律主要负责就电信和信息政策问题向总统提供建议。

接下来:我们可以从开放源代码软件与联邦政府合作的经验中吸取什么教训?