OSI 回应 NTIA 关于广泛可用的 AI 模型
开源促进会 (OSI) 很高兴分享其对美国国家电信和信息管理局 (NTIA) 关于具有广泛可用模型权重的双重用途基础人工智能模型的意见征询请求的正式回应。 这项公开征集旨在征求公众意见,了解广泛提供模型权重和其他模型组件如何在更广泛的经济、社区、个人和国家安全方面产生益处或风险。 下面,我们呈上我们信函的全文。
在我们的回应中,OSI 探讨了开放模型的总体社会效益,借鉴了开源软件开发模型的广泛采用和成就。 我们强调了明确定义术语和大约 25 年前发起的开源定义所发挥的关键作用,这对于该模型的成功至关重要。 此外,我们敦促 NTIA 考虑正在进行的努力,包括目前在 OSI 的指导下,由不同利益相关者参与的定义开源人工智能项目。
与此倡议并行,OSI 最近与 Mozilla 基金会、民主与技术中心 (CDT) 以及其他各种民间社会组织合作,共同签署了一封致商务部部长吉娜·雷蒙多 (Gina Raimondo) 的联合信函。 这封信函倡导人工智能的透明度和开放性,突显其社会效益。
今年 2 月,OSI 与其他公共利益非营利组织一起分享了意见、担忧和鼓励,参加了与 NTIA 工作人员举行的与 NTIA 工作人员的倾听会议,这是 2 月发布并在 2024 年 3 月 27 日结束的 RFC 的前奏。
通过这些协调一致的努力,OSI 仍然致力于营造协作环境,以促进人工智能领域的透明度、可访问性和负责任的创新,从而造福社会。 我们热切期待在这个关键领域进行进一步的对话和进展。
2024 年 3 月 27 日
Bertram Lee 先生
国家电信和信息管理局 (NTIA)
美国商务部
宪法大道西北 1401 号
华盛顿特区 20230
主题:[ docket number 240216-0052 ] 具有广泛可用模型权重的双重用途基础人工智能模型
尊敬的 Lee 先生:
开源促进会 (“OSI”) 感谢有机会就上述事项提供我们的观点。 作为1开源定义的管理者,OSI 为开源软件奠定了基础,开源软件是一种全球公共产品,在经济中发挥着至关重要的作用,并且是我们今天使用的大多数技术的基础。 作为开源政策和原则的领导者,OSI 帮助构建一个所有人都可以享受开源软件的自由和机会的世界,并支持机构和个人共同努力创建实践社区,使健康的开源生态系统蓬勃发展。 OSI 是 1998 年成立的加利福尼亚州公共福利 501(c)(3) 组织,其最重要的活动之一是为了社区的利益维护开源定义2。
OSI 对 NTIA 将利益相关者聚集在一起,以了解开源软件经验的教训,并形成公认的、统一的开源定义,从而创建一个价值估计为 8.8 万亿美元的生态系统3,这一工作感到鼓舞。 正如下文更详细地提供的,联邦政策制定者必须尽可能地鼓励开源人工智能模型,并与像 OSI 这样的组织合作,OSI 正努力创建统一的、公认的开源人工智能定义。
开源的力量
开源为软件用户提供了自主权和个人能动性,从而实现了一种软件开发方法,可以利用分布式同行评审和流程透明化的力量。 开源的承诺是更高的质量、更好的可靠性、更大的灵活性、更低的成本以及专有锁定的终结。
开源软件在联邦政府和每个关键基础设施部门中得到广泛使用。 “联邦政府认识到开源软件的巨大优势,开源软件能够以惊人的速度进行软件开发,并促进重大的创新和协作。”4 在过去的二十年中,权威的指导和教育资源已被提供给各机构,用于开源软件的使用、管理和益处。5
此外,开源软件具有直接的经济和社会效益。 开源软件使公司能够开发、测试和部署服务,从而证实市场需求和经济可行性。 此外,它降低了这些服务中数据库等基本应用程序的成本(Hoffmann、Nagle 和 Zhou 发现,如果不存在 OSS,公司在软件上的支出将需要比目前多 3.5 倍)。6 通过利用开源,公司可以加速其发展并专注于创新。 我们社会和经济的许多基本服务和技术都由开源软件驱动,例如,互联网。7
开源定义已证明,当消除学习、使用、共享和改进软件系统的障碍时,会产生巨大的社会效益。 开源定义的核心标准 – 自由再发布; 源代码; 衍生作品; 作者源代码的完整性; 不歧视个人或群体; 不歧视努力领域; 许可证的分发; 许可证不得特定于产品; 许可证不得限制其他软件; 许可证必须是技术中立的 – 这些标准赋予了用户对其技术选择的自主权、控制权和自主性,以及基于无需许可的创新的动态生态系统。
欧盟委员会最近发布的一项研究估计,2018 年位于欧盟的公司在开源软件上投资了约 10 亿欧元,这对欧洲经济产生了 650 亿至 950 亿欧元的积极影响。8
在过去的三十年中,开源软件的成功和效力一直依赖于公认的统一的开源软件定义以及开源促进会维护的批准许可证列表。9
OSI 认为,这种“开放”类比与开源人工智能作为具有巨大公共利益潜力的新兴技术领域高度相关。
区分开源定义
OSI 批准的许可证商标和计划创建了一个信任中心,开发人员、用户、公司和政府可以在此基础上组织开源软件的合作。 然而,人们普遍认为,26 年前起草并由 OSI 维护的开源定义并未涵盖人工智能系统的新时代。
人工智能模型不仅仅是代码; 它们在海量数据集上进行训练,部署在复杂的计算基础设施上,并通过各种接口和模式进行访问。 对于传统软件,人们编写的代码、使用的编译器、生成的二进制文件以及它们拥有的许可证之间存在非常明确的界限。 然而,对于人工智能模型,许多组件共同影响系统的功能,包括算法、代码、硬件以及用于训练和测试的数据集。 修改源代码的概念(在开源定义中很重要)变得模糊不清。 例如,关键问题是训练数据集、模型权重或其他关键要素应被视为独立的还是共同的,作为已训练模型/权重的源代码。10
人工智能(特别是其体现的模型)包含各种技术,每种技术都是所有模型的至关重要的要素。11
这一挑战并不新鲜。 美国国防部在其关于使用开源软件的指南中区分了开放系统和开放标准,虽然“与开源软件不同,但它们是互补的,可以很好地协同工作”12
开放标准使使用者更容易(稍后)采用开源软件
程序,因为开放标准的使用者不会被锁定在特定的
实现中。 相反,谨慎使用开放标准的使用者可以轻松
切换到不同的实现,包括 OSS 实现。 … 开放
标准也使 OSS 开发人员更容易创建他们的项目,因为
标准本身有助于开发人员了解该做什么。 创建任何接口都是一项
工作,而拥有预定义的标准有助于大大减少这项工作。OSS 实现可以帮助创建和保持开放标准的开放性。 OSS
实现可以由任何人读取和修改; 这样的实现可以
快速成为一个工作参考模型(“示例实现”或
“可执行规范”),演示该规范的含义
(澄清规范)并演示如何实际实现它。
也许更重要的是,通过强制要求存在其他人可以
详细检查的实现,从而产生更好的规范,这些规范更有可能被使用。OSS 实现可以帮助快速增加开放标准的采用/使用。
OSS 程序通常可以简单地下载并试用,这使得
人们更容易试用并鼓励广泛使用。 这也给
专有实现带来了限制价格的压力,而这种较低的专有软件价格也鼓励了标准的使用。
专有软件价格也鼓励了标准的使用。几乎没有例外,成功的软件开放标准都有 OSS
实现。13
迈向“开源人工智能”的统一愿景
考虑到这些重要的区分要素,去年夏天,OSI 启动了一个多方利益相关者的流程,以定义人工智能系统的特征,这些特征可以被自信且普遍地理解为“开源”。
这项合作利用了经济合作与发展组织 (OECD) 采用的最新人工智能系统定义,该定义已成为 NIST 的“人工智能风险管理框架”14 以及欧盟人工智能法案的基础:15
人工智能系统是一种基于机器的系统,出于明确或隐含的目标,
根据其接收的输入,推断如何生成输出,例如预测、
内容、建议或可能影响物理或虚拟
环境的决策。 不同的人工智能系统在其自主性和
部署后的适应性方面有所不同。16
自去年夏天宣布以来,OSI 一直公开征集论文并举办公开网络研讨会,以便收集来自社区的想法,描述人工智能领域的精确问题领域,并收集解决方案建议。17 2023 年,在欧洲、非洲和美国各地进行了 6 次以上的社区评审,与开源人工智能定义的初稿同时进行。18 今年,OSI 协调了工作组来分析各种基础模型,发布了该定义的另外三个草案,举办了双周公共市政厅会议进行审查,并继续从包括以下各方在内的广泛利益相关者那里获得反馈
- 系统创建者(制作将通过开源许可证进行研究、使用、修改或共享的人工智能系统和/或组件;
- 许可证创建者(编写或编辑将应用于人工智能系统或组件的开源许可证; 包括合规性;
- 监管机构(编写或编辑管理许可证和系统的规则(例如,政府政策制定者);
- 被许可方(寻求研究、使用、修改或共享开源人工智能系统(例如,人工智能工程师、健康研究人员、教育研究人员);
- 最终用户(消费系统输出,但不寻求研究、使用、修改或共享系统(例如,使用聊天机器人撰写报告的学生、创作图像的艺术家);
- 主体(受到系统输出上游或下游影响,而没有有意与其交互; 包括该群体的倡导者(例如,贷款被拒的人或内容创作者)。
什么是开源人工智能?
开源人工智能是指根据以下条款向公众提供的人工智能系统,这些条款授予以下自由:
- 出于任何目的使用该系统,无需请求许可。
- 研究系统的工作原理并检查其组件。
- 出于任何目的修改系统,包括更改其输出。
- 共享系统供他人使用,无论是否进行修改,出于任何目的。
行使这些自由的前提条件是能够访问对系统进行修改的首选形式。19
OSI 预计将总结并报告面对面和在线会议的结果,并预计该草案将获得至少 5 名代表的支持,这些代表来自每个利益相关者群体,并在 10 月下旬正式宣布结果。
为了解决定义维护和审查这一新的开源人工智能定义的规则的需求,OSI 董事会20 批准成立一个新的委员会,以监督开源人工智能定义的制定,批准 1.0 版本,并制定维护定义的规则。
迄今为止,根据这些努力得出的一些初步观察结果
- 正如上文所述,人们普遍认识到,为软件创建的开源定义并未完全涵盖开源人工智能的新时代。 这不仅仅是一个软件问题,也不能通过在新的人工智能开源定义领域应用完全相同的术语来解决。 开源人工智能定义将从确保人工智能系统用户保留其自主权和个人能动性的核心动机开始。
- 在实际可行的最大程度上,开源人工智能不应在范围上受到限制,允许用户出于任何目的采用该技术。 开源定义的一个关键教训和根本成功之处在于,使用领域限制剥夺了软件创建者以影响社会积极成果的方式利用工具的能力。
- 回顾过去 20 到 30 年关于开放社区及其取得的进展中哪些方面进展顺利,哪些方面没有进展顺利的经验教训,重要的是要理解开放性并不自动意味着道德、正确或公正。 隐私问题和开发开放系统时的安全性等其他因素也发挥作用,并且在人工智能模型的每个要素中——以及当组合成一个系统时——开放与安全或潜在有害之间始终存在持续的张力。
- 开源人工智能系统降低了大型科技公司以外的利益相关者塑造人工智能未来的门槛,使更多的人工智能服务能够由需求各异的不同社区构建和为之服务,而大型公司可能并不总是能满足这些需求。
- 同样,开源人工智能系统使监管机构和民间社会更容易评估人工智能系统是否符合保护公民权利、隐私、消费者和工人的法律。 它们提高了人工智能使用方面的透明度、教育、测试和信任度,使研究人员和记者能够审计和撰写关于人工智能系统对社会影响的文章。
- 开源人工智能系统通过加速对人工智能系统能力、风险和危害的理解,促进安全和保障,这通过独立研究、协作和知识共享来实现。
- 开源人工智能系统通过降低来自更多不同社区的创新者、初创企业和小企业构建和使用人工智能的门槛来促进经济增长。 开放模型还有助于加速科学研究,因为它们可以更便宜、更易于微调,并支持可重复的研究。
OSI 期待与 NTIA 合作,因为 NTIA 正在考虑对本 RFI 的意见,并随时准备参与关于本主题或“具有广泛可用模型权重的双重用途基础人工智能模型”一般主题的任何后续讨论。 如上所述,联邦政策制定者必须尽可能地鼓励开源人工智能模型,并与像 OSI 和其他正在努力创建统一的、公认的开源人工智能定义的组织合作。
此致,
开源促进会
如需更多信息,请联系我们
- 执行董事 Stefano Maffulli
- 美国政策主管 Deb Bryant
- 开源定义见 https://open-source.org.cn/osd。 ↩︎
- OSI 是一家公共慈善机构,没有实益所有人,也没有公司控制人,但有 80 多个致力于开源的民间社会附属机构。 我们在美国加利福尼亚州注册成立,但拥有全球会员资格和使命,代表公众促进和捍卫开源软件,并在其全球社区内搭建桥梁。 ↩︎
- Hoffmann, Manuel 和 Nagle, Frank 和 Zhou, Yanuo,《开源软件的价值》(2024 年 1 月 1 日)。 哈佛商学院战略部门工作论文第 24-038 号,可在 SSRN 上获取:https://ssrn.com/abstract=4693148 或 http://dx.doi.org/10.2139/ssrn.4693148 ↩︎
- 国家网络总监办公室、总统行政办公室、网络安全和基础设施安全局、国土安全部、国家科学基金会、国防高级研究计划局以及管理和预算办公室、总统行政办公室,“关于开源软件安全的信息请求:长期重点领域和优先事项”,2023 年 8 月 10 日,见:https://www.federalregister.gov/documents/2023/08/10/2023-17239/request-for-information-on-open-source-software-security-areas-of-long-term-focus-and-prioritization。 ↩︎
- 最早和最全面的此类指南是“DoD 开源软件常见问题解答”,DoD CIO 办公室,日期为 2021-10-28,见
https://dodcio.defense.gov/open-source-software-faq/#frequently-asked-questions-regarding-opensource-software-oss-and-the-department-of-defense-dod。 另请参阅,一般而言,美国数字服务,“数字服务剧本”(2014 年),其中鼓励联邦 IT 采用“默认开放”政策,见:https://playbook.cio.gov/。 ↩︎ - “开源软件的价值”,工作论文 24-038,哈佛商业评论,2024 年 1 月,见:https://www.hbs.edu/ris/Publication%20Files/24-038_51f8444f-502c-4139-8bf2-56eb4b65c58a.pdf。 ↩︎
- BIND 是互联网上最常用的 DNS 服务器软件。 请参阅 https://www.isc.org/bind/。 请参阅 Chinmayi Sharma,“数字公地的悲剧”,北卡罗来纳法律评论,2022 年 10 月,见:https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4245266 ↩︎
- 新闻稿,“委员会发布关于开源对欧洲经济影响的研究”,2021 年 9 月 6 日,见:https://digital-strategy.ec.europa.eu/en/news/commission-publishes-study-impact-open-source-european-economy。 ↩︎
- 完整列表请参阅 https://open-source.org.cn/licenses。 ↩︎
- OSI 参与了“哥伦比亚大学关于‘开放性和人工智能’的会议”,这是最近由 Mozilla 和哥伦比亚大学全球政治研究所赞助的人工智能 (AI) 领域 40 多位专家和利益相关者的一次聚会。 请参阅 https://blog.mozilla.org/en/mozilla/ai/introducing-columbia-convening-openness-and-ai/。 技术解读(以及配套的政策解读)即将发布,其中探讨了这些及相关问题。 ↩︎
- 请参阅 NIST,“人工智能:概述”,网址为 https://www.nist.gov/artificial-intelligence。 ↩︎
- 美国国防部首席信息官办公室,“DoD 开源软件常见问题解答”,见:https://dodcio.defense.gov/open-source-software-faq/ ↩︎
- 同上。 请参阅“问:开源软件如何与开放系统/开放标准协同工作?”,见:https://dodcio.defense.gov/open-source-software-faq/#q-how-does-open-source-software-work-with-open-systemsopen-standards。 ↩︎
- 见:https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-1.pdf。 2023 年 1 月(改编自:OECD 关于人工智能的建议:2019;ISO/IEC 22989:2022)”。 ↩︎
- “OECD 更新人工智能定义‘以告知欧盟的人工智能法案’”,Euractive.com,2023 年 11 月 9 日(更新:2023 年 11 月 14 日),见
https://www.euractiv.com/section/artificial-intelligence/news/oecd-updates-definition-of-artificial-intelligence-to-inform-eus-ai-act/。 ↩︎ - “OECD 理事会关于人工智能的建议
https://legalinstruments.oecd.org/en/instruments/OECD-LEGAL-0449。 ↩︎ - 相关活动的时间顺序可以在以下网址查看
https://open-source.org.cn/deepdive#see_all_we_achieved_in_2023。 ↩︎ - 开源人工智能定义 – 草案 v. 0.0.6
https://open-source.org.cn/deepdive/drafts/the-open-source-ai-definition-draft-v-0-0-6 ↩︎ - 最新草案始终可以在 opensource.org/deepdive/drafts 上找到 ↩︎
- OSI 由成员选举产生的董事会管理,董事会是负责该组织的最终权力机构。 有关 OSI 董事会和治理的更多信息,请访问:https://open-source.org.cn/board。 ↩︎