开源人工智能定义 – 每周更新 4 月 15 日
刚刚结束繁忙的一周,以下是需要了解的两个主要里程碑。
定义 v.0.0.7 已发布!
- 访问定义 此处,以及相关讨论 此处
- 更新日志
- 采纳了对 草案 v.0.0.6 的评论以及 工作组 分析的结果
- 在四项自由中删除了对“公众”的引用,对象(用户)为隐含
- 在文本“行使这些自由的先决条件是能够访问首选形式以对系统进行修改”之后,删除了对 ML 系统的引用
- 分离了“清单”,并使其特定于 ML 系统,基于模型开放框架
- 以高度通用的术语描述了访问模型参数的条件
- 有人提出了一个关于清单使训练数据成为可选的担忧,这可能会破坏修改人工智能系统的自由。 这与我们之前的辩论相呼应,并且很可能将继续就访问训练数据进行辩论。
- 讨论了澄清许可条款以确保符合开源原则的必要性,建议更改为“在满足开源原则的条款下可用”。
- 提议将开源定义本身视为清单,并建议在规定法律文件的具体要求之前采取谨慎的方法。
- 一条关于定义的评论(而非论坛)澄清说,需要确定开源人工智能定义中概述的自由应授予部署者还是最终用户,考虑到不同的访问级别以及对开放性的影响
工作组的结果已发布!
- 四个不同的工作组与四个不同的人工智能系统(Llama-2、Pythia、Bloom 和 OpenCV)相关联,一直在审查法律文件,并将它们与之前关于开源人工智能定义的 0.0.6 清单进行比较
- 目标是了解这些文件与清单中描述的组件的对齐程度。
- 点击此处查看更新后的清单
- 更改可以描述如下
- 为模型参数(包括权重)添加了法律框架。该框架建议,如果模型参数可受版权保护,则可以作为代码共享
将来自 v.0.0.6 的五个 (5) 个数据透明度组件添加到“文档”类别下的清单中,以及法律框架