什么是开源人工智能?

遵循开源软件背后的相同理念,
开源人工智能是指根据以下条款提供的系统,这些条款授予用户以下自由:

为任何目的使用该系统,且
无需请求许可。

研究系统的工作原理,并
了解其结果是如何产生的。

为任何目的修改系统,
包括更改其输出。

分享系统供他人使用,无论是否
进行修改,用于任何目的。

行使这些自由的前提条件是能够访问
对系统进行修改的首选形式,以及使用它的方法。

开源人工智能的益处

透明度和安全性

开源人工智能提供审计系统和减轻偏见所需的基本信息,确保数据来源的可追溯性和透明度,并加速人工智能安全研究。

竞争与多元化

开源人工智能使更多模型可用,由于竞争加剧而刺激创新和质量,并通过为更多利益相关者提供基础技术访问权限来解决人工智能单一文化问题。

多样化的应用

开源人工智能为开发者提供开发特定情境、本地化应用的关键资源,这些应用代表文化和语言多样性,并允许模型与不同的价值体系保持一致。
OSAID Paris Workshop

阅读白皮书

开源促进会和开放未来组织已朝着解决这一挑战迈出了重要一步,发布了这份白皮书。该文件是在巴黎于 2024 年 10 月举行的为期两天的充满活力的研讨会上获得的见解所丰富的一个全球共同设计过程的成果。

阅读白皮书

为什么开源人工智能需要定义?

开源前沿

当应用于人工智能组件时,传统的开源代码和许可证观点不足以保证使用、研究、分享和修改系统的自由。

告知监管机构

欧洲、美国和其他地区的政府法规已经开始实施。社区需要达成共识,以教育政策制定者。

打击“开源漂绿”

公司将人工智能系统称为“开源”,即使它们的许可证包含违反公认的开源原则和自由的限制。

谁在支持开源人工智能定义

查看所有背书者

总体流程

20+

支持组织

100+

支持个人

50+

共同设计者

13

审查的系统

共同设计过程中的代表性

27

国籍

42%

有色人种

33%

全球南方

31%

女性、跨性别和非二元性别

共同设计

2023 - 2024

2023 年,我们启动了共同设计流程,在全球范围内举办了多次线上和线下活动



研究

2022 - 2023

我们与来自各个领域的人工智能专家一起制作了播客专题讨论网络研讨会

背书

2024 - 2025

                                   从 2024 年末到 2025 年,OSI 正在收集来自各个个人和组织的背书,包括 Mozilla、Suse、Eleuther AI、Ai2、Eclipse Foundation 和 OpenInfra Foundation 等众多组织。

哪些人工智能系统符合 OSAID 1.0?

作为 OSAID 验证和测试的一部分,志愿者检查了该定义是否可以用于评估人工智能系统是否提供了预期的自由。通过验证阶段的模型列表包括:Pythia (Eleuther AI)、OLMo (AI2)、Amber 和 CrystalCoder (LLM360) 以及 T5 (Google)。还有几个其他模型经过分析,如果它们更改许可证/法律条款,可能会通过:BLOOM (BigScience)、Starcoder2 (BigCode)、Falcon (TII)。已被分析且未通过的模型,因为它们缺乏所需组件和/或其法律协议与开源原则不兼容:Llama2 (Meta)、Grok (X/Twitter)、Phi-2 (Microsoft)、Mixtral (Mistral)。这些结果应被视为定义过程的一部分,一个学习时刻,它们不是任何形式的认证。OSI 将继续仅验证法律文件,而不会验证或审查单个 AI 系统,正如它不验证或审查软件项目一样。

Co-design process

OSAID 共同设计过程对所有对协作感兴趣的人开放。

如何参与

有很多种参与方式

开源人工智能定义治理

开源人工智能定义的治理由OSI 董事会提供。OSI 董事会成员在商业、法律和开源软件开发方面拥有专业知识,并在各种商业、公共部门和非营利组织中拥有经验。包括成就、预算更新和后续步骤在内的正式进度报告由项目负责人每月提供,作为例行董事会事务的一部分,以征求意见和指导。此外,重要会议和里程碑的非正式更新会根据需要通过电子邮件提供给董事会。

个人背书者

“LLM360 认为 OSI 的开源人工智能定义是一个有意义、合理且全面的标准,将在整个社区产生积极影响。该定义阐明了围绕开源人工智能的独特挑战,包括传播代码、数据和可访问性要求的期望。该定义推动了开源生态系统,并符合 LLM360 的社区拥有人工智能的使命。我们的团队很高兴并兴奋地全力支持 OSI 在推进开源人工智能定义方面所做的努力。”

Hector Zhengzhong Liu,LLM360

“鉴于数据限制,提出适当的开源定义具有挑战性,但我很高兴看到 OSI v1.0 定义至少要求数据处理(模型质量的主要驱动因素)的完整代码是开源的。细节决定成败,所以我相信一旦我们有人们尝试将此定义应用于其模型的具体示例,我们将有更多话要说。”

Percy Liang,斯坦福大学基础模型研究中心主任

“促进开放生态系统是我们英特尔方法的重要组成部分。人工智能的开放方法可以促进社区内更广泛的协作,推动创新并增强透明度。我们赞赏 OSI 努力扩展其定义以涵盖人工智能模型和数据集。OSI 创建的定义的第一个修订版可以帮助行业继续发展和迭代。”

Arun Gupta,英特尔开放生态系统副总裁兼总经理

“我们欢迎 OSI 对定义开源人工智能这一复杂过程的管理。数字公共产品联盟秘书处将在此基础性工作的基础上,更新 DPG 标准,因为它与作为 DPG 类别的人工智能相关。”

Liv Marte Kristiansen Nordhaug,数字公共产品联盟首席执行官

“透明度是 EleutherAI 非营利使命的核心。开源人工智能定义是朝着在人工智能领域推广开源原则的益处迈出的必要一步。我们认为,该定义支持独立机器学习研究人员的需求,并促进最大的人工智能开发者之间的更大透明度。”

Aviya Skowron,Eleuther AI 政策与伦理主管

“Common Crawl Foundation 完全支持开源人工智能定义,认为这是为开放和透明的人工智能开发设定明确标准的关键一步。该定义将有助于确保人工智能负责任地发展,保持对所有人的开放和可访问性。”

Thom Vaughan,Common Crawl Foundation 首席技术专家

“透明度是 EleutherAI 非营利使命的核心。开源人工智能定义是朝着在人工智能领域推广开源原则的益处迈出的必要一步。我们认为,该定义支持独立机器学习研究人员的需求,并促进最大的人工智能开发者之间的更大透明度。”

Stella Biderman,人工智能和自然语言处理研究员,EleutherAI

“SUSE 赞赏开源促进会及其开源人工智能定义所取得的进展。这些努力最终形成了一个非常全面的定义,这对于快速发展的人工智能领域以及开源在其中的作用非常重要。我们赞扬 OSI 为达成该定义而采用的流程以及对开源方法论的坚持。清晰度和共识推动协作,我们相信该定义将推动开源人工智能向前发展。”

Alan Clark,SUSE 首席技术官办公室

“我赞同!我们需要共同的词汇来定义什么是开放,什么不是开放。这是一个坚实的框架,不会给那些轻率地声称提供开源人工智能的人开空头支票(即使他们非常希望被认定为开源人工智能),反之,该框架对在构成人工智能系统的各个组件上引入开源梯度的举措持开放态度,并认可在开放所有或某些组件方面的努力。毕竟,“人工智能”是软件的衍生品,包括数据、代码和工件。没有理由将衍生系统归类为“开源”的基本定义,与此同时,人工智能系统在从人类那里捕获智能方面变得如此强大,以至于我们需要限定其开放程度。向所有参与制作如此重要作品的人致敬。”

Yann Lechelle,:probabl. 联合创始人兼首席执行官

“您和 OSI 团队一直在推动的这项工作非常重要,我坚信时间变得至关重要。不可避免地,它需要发展,但尽快盖章很重要。我们必须在人工智能模型的背景下定义开源的含义,以便保留在开源软件许可证中创造如此多价值的无需许可的创新方面。该定义既务实又具有挑战性,并且是快速发展领域中迈出的出色第一步。”

Mark Collier,OpenStack Foundation 首席运营官

“共同设计过程让我亲眼目睹了世界各地的人们对什么是开源人工智能的思考过程。所有人都不可能就该定义达成一致。但这真是一个美好的开始,我认为每个人都会同意,公开讨论、研讨会、市政厅会议、后续调查、电子邮件都非常有效和“民主” :-)”

Victor Lu,独立顾问

“Software Heritage 致力于保存和提供软件源代码中嵌入的宝贵人类知识。我们认为,在这一庞大存储库上训练的人工智能系统应免费提供给所有人,并尽可能减少限制。”
“使用在 Software Heritage 数据上训练的符合 OSAID 标准的人工智能系统的用户将充分了解它们的构建方式。通过为 OSAID 背书,我们的目标是促进人工智能行业的透明度和可重复性。我们参与并积极塑造了 OSAID 1.0,并期待在未来版本的合作中,随着从开放数据集开发人工智能系统的实践不断发展。”

Stefano Zacchiroli,Software Heritage 联合创始人兼 CSO

“Open Source Group Japan 赞扬 OSI 在驾驭定义开源人工智能的复杂过程中的领导作用,我们完全支持开源人工智能定义 (OSAID) 作为开放和透明人工智能系统的关键标准。人工智能领域正在快速发展,对清晰一致的开源人工智能定义的需求从未如此迫切。OSI 的 OSAID 标志着朝着协作和开放成为人工智能开发规范的未来迈出了关键一步。我们预计这将推动创新、透明度和人工智能系统的道德开发。”

Shuji Sado,Open Source Group Japan 主席

“开源生成式人工智能模型是该领域进步的关键之一。通过使开发者和研究人员社区能够以负责任的方式协作和发展这些模型,我们可以极大地受益于广泛的应用。”

Oscar Mullin,MercadoLibre 云服务、数据和人工智能技术副总裁

由以下机构支持

brand_start brand_start brand_start brand_start

如果没有我们的赞助商和数千名个人会员的支持,OSI 的努力将不可能实现。
成为赞助商立即加入我们!