开源人工智能定义 1.0

我们已经发布了该定义的第一个稳定版本。

开源人工智能是如何定义的?

开源定义是判断法律文件是否授予软件 四项自由 的实用指南,遵循 GNU 宣言的原则。从 GNU 宣言到 开源定义 的撰写,经历了二十多年。对于人工智能,我们不能等待数十年才能产生一份新文件。开源促进会于 2022 年开始协调全球流程,以增强集体知识并确定导致广泛采用的开源人工智能定义 (OSAID) 的原则。

OSI 汇集了全球专家,建立了一套共同的原则,可以为人工智能从业者重建无需许可、务实且简化的协作,类似于开源定义为软件生态系统所做的那样。这项工作的成果是 开源人工智能定义 1.0 版本

该文档将用于验证人工智能系统是否为开源人工智能。验证过程将类似于评估现有软件许可证:社区主导、开放和公开。

流程

董事会要求在 2024 年罗利市的面对面会议上,制定一个获得利益相关者支持的开源人工智能定义,这些利益相关者包括人工智能部署者、人工智能最终用户和主体(受人工智能决策影响的人),提供人工智能系统的正面示例,植根于当前实践,并为相关方提供参考。

与多方利益相关者合作

开源促进会 (OSI) 守护开源定义已超过 25 年,并且拥有完善的许可证开发、修订和咨询流程。这种权威地位得到了许多组织领导者的认可,他们同意共同设计一个适合人工智能和机器学习的新定义。

这些领导者以个人身份参与了共同设计过程,其雇主(如数字公共产品联盟、Mozilla 基金会、开放知识基金会、国家民主捐赠基金会、技术与公民生活中心、美国代码、维基媒体基金会、知识共享、Linux 基金会、MLCommons、EleutherAI、Open Future、GitHub、微软、谷歌、DataStax、亚马逊、Meta、Hugging Face、GIZ FAIR Forward – AI for All、OpenLLM France、巴黎理工学院、英特尔、Apache 软件基金会、三星和联合国国际电信联盟 (ITU))的直接参与程度各不相同。

共同设计流程

共同设计,也称为参与式或以人为中心的设计,是一套创造性方法,用于通过共享知识和权力来解决公共问题。共同设计方法解决了在多元化社区内达成一致定义的挑战(Costanza-Chock,2020:Escobar,2018:Creative Reaction Lab,2018:Friedman 等人,2019)。正如麻省理工学院技术评论关于该项目的文章中所指出的那样,“[t]开源社区是一个大帐篷……涵盖了从黑客行动主义者到财富 500 强公司的所有内容……考虑到如此多的竞争利益,找到一个让每个人都满意,同时确保最大的公司参与其中的解决方案并非易事。”(Gent,2024)。共同设计方法使我们能够将这些不同的观点整合为一个公正、有凝聚力且可行的标准。来自如此重要和广泛人群的支持也造成了一种需要管理的张力,即在足够迅速地交付可操作的输出与花时间广泛咨询以了解重大问题并获得社区支持之间取得平衡。

共同设计过程的第一步是确定开源人工智能所需的自由。经过各种线上和线下活动以及 讨论,包括在世界各地举办的五个研讨会,社区采用了软件的四项自由,现在已适用于人工智能系统。

下一步是成立四个工作组,初步分析四个人工智能系统。为了实现更好的代表性,特别关注了多样性、公平性和包容性。超过 50% 的工作组参与者是有色人种,30% 是黑人,75% 出生在美国境外,25% 是女性、跨性别者和非二元性别者。

这些工作组讨论并投票决定了哪些人工智能系统组件应满足人工智能的四项自由。我们采用的组件在 Linux 基金会开发的 模型开放框架 中进行了描述。

投票汇编是基于每个组件的平均总票数 (μ) 进行的。获得超过 2μ 票数的组件被标记为必需,介于 1.5μ 和 2μ 之间的组件被标记为可能必需。获得介于 0.5μ 和 μ 之间的组件被标记为可能非必需,而少于 0.5μ 的组件被标记为非必需。

工作组评估了每个组件的法律框架和法律文件。最后,每个工作组发布了一份建议报告。最终结果是 OSAID,其中包含一个全面的定义清单,共包含 17 个组件。正在组建更多工作组,以评估其他人工智能系统与该定义的对齐程度。

OSAID multi-stakeholder co-design process: from component list to a definition checklist

OSAID 多方利益相关者共同设计流程:从组件列表到定义清单

开源人工智能定义流程

我们已经发布了第一个稳定版本

RC1

  • 十月初发布
  • 草案已完成所有部分
  • 草案获得了 6 个利益相关者群体中每个群体至少 2 名代表的支持

稳定版本

  • 夏季/初秋期间面对面和在线会议的成果
  • 该文档获得了每个利益相关者群体至少 5 名代表的认可
  • 十月下旬宣布

查看 2023 年项目活动

2024 年 2 月

志愿者招募
+ 活动反馈和修订

FOSDEM 演讲 (布鲁塞尔)

双周虚拟公开市政厅会议。

草案 0.0.5

三月

虚拟系统审查会议开始

草案 0.0.6

四月

虚拟系统审查会议继续

北美开源峰会研讨会

自由软件法律和许可活动研讨会

草案 0.0.7

五月

虚拟系统审查会议结束

PyCon 研讨会 (匹兹堡)

草案 0.0.8

六月

反馈为 OSI 面对面利益相关者会议的内容提供信息

OW2 演讲 (巴黎)

欧洲开源博览会演讲 (马德里)

RC 1

七月

OSPOs for Good 小组会议 (纽约)


OSCA 社区网络研讨会 (虚拟)

八月

AI_dev 演讲 (香港)

开源大会演讲 (北京)

0.0.9

九月

深度学习 Indaba 演讲 (达喀尔)

印度 FOSS 演讲 (班加罗尔)

欧洲开源峰会演讲 (维也纳)

Nerdearla 演讲 (布宜诺斯艾利斯)

候选版本 1

十月

OSAI 数据研讨会 (巴黎)

OCX 演讲 (美因茨)

所有事物开源稳定版本演示 (罗利)

发布稳定版本

进行中

稳定版本并非终点

我们需要定义维护和审查该定义的规则。 OSI 董事会批准成立一个新的委员会,以监督开源人工智能定义的制定,批准稳定版本并制定定义维护规则。

谁参与了这个过程?

🛠️ 系统创建者

创建人工智能系统和/或组件,这些系统和/或组件将通过开源许可证进行研究、使用、修改或共享。

📃 许可证创建者

编写或编辑将应用于人工智能系统或组件的开源许可证;包括合规性。

🏛️ 监管机构

编写或编辑管理许可证和系统的规则(例如,政府政策制定者)。

🎓 许可证持有者

寻求研究、使用、修改或共享开源人工智能系统(例如,人工智能工程师、健康研究人员、教育研究人员)

⌨️ 最终用户

使用系统输出,但不寻求研究、使用、修改或共享系统(例如,学生使用聊天机器人撰写报告,艺术家创作图像)

🙇 主体

在无意交互的情况下,受系统输出的上游或下游影响;包括该群体的倡导者(例如,贷款被拒的人或内容创作者)。

治理

该项目的治理由 OSI 董事会 提供。 OSI 董事会成员在商业、法律和开源软件开发方面拥有专业知识,并在各种商业、公共部门和非营利组织拥有经验。项目负责人每月向董事会提交正式的进度报告,包括成就、预算更新和后续步骤,作为例行董事会事务的一部分,以征求意见和指导。此外,重要会议和里程碑的非正式更新会根据需要通过电子邮件发送给董事会。有关现任董事会的详细信息,包括每位董事的简介,请访问 此处

如何参与

OSAID 共同设计流程对所有对 协作 感兴趣的人开放。有许多参与方式

  • 加入 工作组:成为评估各种模型是否符合 OSAID 的团队的一员。
  • 加入 论坛:支持和评论文档,记录您对新主题和现有主题的批准或疑虑。
  • 关注 每周回顾:订阅我们的新闻通讯和博客以保持最新状态。
  • 观看 市政厅会议录像,以了解有关流程的更多信息。
  • 参加 研讨会和预定的会议:在世界各地的面对面活动中与 OSI 和其他参与者会面。
  • 认可开源人工智能定义:将您的组织添加到 OSAID 支持者列表中。


先前的工作

2023 年深度探索人工智能网络研讨会系列

来自法律、学术界、企业、非政府组织和开源软件社区的演讲者举办了网络研讨会,讨论我们在人工智能系统的使用和开发中面临的紧迫问题和潜在解决方案。

所有事物开源 – 2023 年深度探索人工智能

经过两次社区审查和对评论的初步处理后,我们发布了新的草案版本。 基础是一个序言,解释“为什么是开源人工智能”,然后是正式定义的开始。

2022 年深度探索人工智能播客

我们发布了一系列 6 个播客,邀请该领域的专家讨论开源人工智能的各个方面。

2022 年小组讨论

商业、社会、法律、学术界的四位专家进一步剖析了人工智能系统带来的问题。

深度探索人工智能:2023 年报告更新

通过汇集各个领域的专家,OSI 积极为开源人工智能的讨论做出贡献,为开放、透明和协作原则继续支撑尖端技术发展、造福整个社会的未来奠定基础。

深度探索人工智能:2022 年报告

人工智能系统开源意味着什么?

本报告总结了上述讨论,并强调了我们从人工智能给开源运动带来的挑战和机遇中学到的内容。

Deep Dive Report 2022

由以下机构支持

Alfred P. Sloan Foundation

没有赞助商和数千名个人会员的支持,OSI 的努力将无法实现。 成为赞助商立即加入我们!