开源人工智能定义 – 草案 v. 0.0.5

版本 0.0.5

查看最新草案

Note: This document is made of three parts: A preamble, stating the intentions of this document; the Definition of Open Source AI itself; and a checklist to evaluate licenses.

This document follows the definition of AI system adopted by the Organization for Economic and Co-operation Development (OECD)

An AI system is a machine-based system that, for explicit or implicit objectives, infers, from the input it receives, how to generate outputs such as predictions, content, recommendations, or decisions that can influence physical or virtual environments. Different AI systems vary in their levels of autonomy and adaptiveness after deployment.

More information about definitions of AI systems on OSI’s blog.

序言

为什么我们需要开源人工智能 (AI)

开源已经证明,当你消除学习、使用、分享和改进软件系统的障碍时,每个人都会获得巨大的好处。这些好处是使用符合开源定义的许可的结果。这些好处可以概括为自主性、透明度和协作改进。

每个人在人工智能领域都需要这些好处。我们需要基本的自由,以使用户能够构建和部署可靠和透明的人工智能系统。

超出范围的问题

开源人工智能定义没有说明如何开发和部署符合道德、值得信赖或负责任的人工智能系统,尽管它并不阻止这样做。我们支持讨论负责任的人工智能系统的开发、部署和使用,包括通过适当的政府监管,作为一个独立的对话。

什么是开源人工智能

要成为开源,人工智能系统需要根据法律条款提供,这些条款授予以下自由:

  • 使用 该系统用于任何目的,无需请求许可。
  • 研究 系统如何工作并检查其组件。
  • 修改 该系统用于任何目的,包括更改其输出。
  • 分享 该系统供他人使用,无论是否进行修改,用于任何目的。

此表正在制定中。有关更多详细信息,请参见 幻灯片 7

组件使用所必需研究所必需修改所必需分享所必需
代码 用于解析和处理数据的所有代码,包括
– 数据预处理代码
– 训练代码
– 用于执行基准测试推断的代码
– 验证代码
– 推断代码
– 评估代码
– 系统中的其他库或代码工件,例如分词器和超参数搜索代码(如果使用)。
数据 所有数据集,包括
– 训练数据集
– 测试数据集
– 验证数据集
– 基准测试数据集
– 数据卡
– 评估指标和结果
– 所有其他数据文档
模型 所有模型元素,包括
– 模型架构
– 模型参数(包括权重)
– 模型卡
– 样本模型输出
其他 任何其他产生或使用的文档或工具,包括
– 详尽的研究论文
– 使用文档
– 技术报告
– 支持工具

查看最新草案