2024-10-27
董事会成员 贾斯汀·科拉尼诺, 卡洛·皮亚纳, 特蕾西·海因茨, 盖尔·布隆代尔, 帕梅拉·切斯泰克, 蒂埃里·卡雷兹, 安妮-玛丽·斯科特, 赛义德·乔杜里, 克里斯·安尼兹奇克。
会议在北卡罗来纳州罗利市亲自举行。
嘉宾 斯特凡诺·马富利
缺席 卡塔琳娜·马拉凯, 乔什·伯库斯
法定人数 在美国太平洋时间凌晨 05:32 达到。
卡洛欢迎各位参加自 COVID 疫情以来的首次董事会线下会议,感谢董事会成员、执行董事和工作人员的宝贵合作,并祝愿即将上任的主席任期圆满成功。
卡洛动议批准上个月的会议纪要。克里斯附议。所有其他成员批准。
开源人工智能定义决议
鉴于;包括人工智能开发者、部署者、研究人员、用户和主体在内的全球多方利益相关者流程,最终向开源促进会 (OSI) 董事会提交了预期交付成果,以制定开源人工智能定义
- 开源人工智能定义的文本。
- 来自 人工智能开发者、部署者、研究人员、用户和主体的支持。
- 多方利益相关者社区内的反对和异议。
- 一份描述为达成开源人工智能定义而采取的流程的报告。
鉴于;作为 OSI 验证和测试拟议的开源人工智能定义的一部分,社区成员评估了已知符合该定义的系统是否提供了使用、学习、修改和共享所需的自由。
现在,因此决议如下;开源促进会董事会通过本决议,批准 2024 年 10 月 27 日发布的开源人工智能定义 1.0 版本。
开源人工智能定义
1.0 版本
序言
为什么我们需要开源人工智能 (AI)
开源已经证明,在消除学习、使用、共享和改进软件系统的障碍后,每个人都将获得巨大的好处。这些好处是使用符合开源定义的许可证的结果。对于人工智能,社会至少需要与开源相同的基本自由,以使人工智能开发者、部署者和最终用户能够享受相同的益处:自主性、透明度、无摩擦的重用和协作改进。
什么是开源人工智能
当我们提到“系统”时,我们既广泛地谈论一个功能齐全的结构,也谈论其离散的结构元素。要被认为是开源的,无论是应用于系统、模型、权重和参数,还是其他结构元素,要求都是相同的。
开源人工智能是指根据条款并以授予以下自由[1]的方式提供的 AI 系统
- 为任何目的使用该系统,且无需请求许可。
- 学习系统的工作原理并检查其组件。
- 为任何目的修改系统,包括更改其输出。
- 共享系统供他人使用,无论是否进行修改,用于任何目的。
这些自由既适用于功能齐全的系统,也适用于系统的离散元素。行使这些自由的前提是能够访问对系统进行修改的首选形式。
机器学习系统的修改首选形式
对机器学习系统进行修改的首选形式必须包括以下所有要素
数据信息:关于用于训练系统的数据的足够详细的信息,以便技术人员可以构建基本等效的系统。数据信息应根据 OSI 批准的条款提供。
特别是,这必须包括:(1) 用于训练的所有数据的完整描述,包括(如果使用)不可共享的数据,披露数据的来源、范围和特征、数据的获取和选择方式、标注程序以及数据处理和过滤方法;(2) 所有公开可用的训练数据及其获取地点的列表;以及 (3) 所有可从第三方获得的训练数据及其获取地点的列表,包括付费获取。
代码:用于训练和运行系统的完整源代码。代码应代表数据如何处理和过滤以及如何进行训练的完整规范。代码应根据 OSI 批准的许可证提供。
例如,如果使用,这必须包括用于处理和过滤数据的代码、用于训练的代码(包括使用的参数和设置)、验证和测试、支持库(如分词器和超参数搜索代码)、推理代码和模型架构。
参数:模型参数,例如权重或其他配置设置。参数应根据 OSI 批准的条款提供。
例如,这可能包括来自训练关键中间阶段的检查点以及最终的优化器状态。
应用于这些要素以及它们的任何组合的许可或其他条款可能包含要求任何修改版本都以与原始版本相同的条款发布的条件。
开源模型和开源权重
对于机器学习系统,
- 人工智能模型由模型架构、模型参数(包括权重)和用于运行模型的推理代码组成。
- 人工智能权重是覆盖模型架构以从给定输入产生输出的一组学习参数。
对机器学习系统进行修改的首选形式也适用于这些单独的组件。“开源模型”和“开源权重”必须包括用于导出这些参数的数据信息和代码。
开源人工智能定义不要求采用特定的法律机制来确保模型参数对所有人免费可用。它们可能是天生免费的,或者可能需要许可证或其他法律文书来确保它们的自由。我们预计随着时间的推移,一旦法律系统有更多机会处理开源人工智能系统,这一点将变得更加清晰。
定义
人工智能系统[2]:人工智能系统是一种基于机器的系统,出于明确或隐含的目标,它从接收到的输入中推断出如何生成诸如预测、内容、建议或决策等可以影响物理或虚拟环境的输出。不同的人工智能系统在部署后的自主性和适应性水平上有所不同。
机器学习[3]:是一组技术,使机器能够提高其性能,并且通常通过暴露于训练数据(可以帮助识别模式和规律,而不是通过来自人类的明确指令)以自动化方式生成模型。使用机器学习技术改进系统性能的过程称为“训练”。
这些自由源自自由软件定义。 ↩︎
经济合作与发展组织 (OECD) 人工智能理事会建议 OECD/LEGAL/0449,2024 ↩︎
关于经修订的 OECD 人工智能系统定义的解释性备忘录,OECD 人工智能论文,第 8 号,OECD Publishing,巴黎
卡洛动议通过采纳开源人工智能定义的决议。特蕾西附议。所有其他成员批准。
董事会正式向斯特凡诺和梅尔为达成这一重要里程碑所做的工作表示感谢。
会议于美国太平洋时间凌晨 06:37 正式休会。