AI_dev 巴黎亮点
6月19日至20日,Linux 基金会主办了AI_dev:开源 GenAI 和机器学习峰会欧洲站 2024。本次活动汇聚了探索开源生成式人工智能和机器学习复杂世界的开发者。本次活动的核心信念是开源驱动人工智能创新。请在下方查看 AI_dev 巴黎的一些亮点,以及它们如何与 OSI 在开源人工智能定义方面的工作保持一致。
主题演讲:欢迎及开幕致辞
LF AI & Data 基金会执行董事 Ibrahim Haddad 概述了开源人工智能面临的主要挑战,其中包括
- 对人工智能的开放性缺乏共识
- 非软件资产上使用了开源软件许可证
- 各种限制,包括使用可接受使用策略
- 对人工智能模型背景下的许可证及其含义缺乏理解
- 模型组件发布不完整
为了应对其中一些挑战,Haddad 介绍了模型开放性框架 (MOF),并在会议上宣布正式启动模型开放性工具 (MOT)。
模型开放性框架介绍:在令人困惑的生成式人工智能领域实现完整性和开放性
Anni Lai、Matt White 和 Cailean Osborne 深入探讨了模型开放性框架,这是一个用于评估和分类机器学习模型完整性和开放性的综合系统。该框架评估了模型开发生命周期的哪些组件被公开,以及在什么许可证下发布,从而确保客观评估。Pytorch 基金会执行董事兼 MOF 白皮书的作者 Matt White 演示了模型开放性工具,该工具根据 3 个类别评估每个模型:开放科学(I 类)、开放工具(II 类)和开放模型(III 类)。

开源人工智能困境:为开源人工智能制定明确的定义
LF AI & Data 基金会创始人 Ofer Hermoni 继续探讨了模型开放性框架,并解释了该框架及其组件列表如何作为 OSI 开源人工智能定义 (OSAID) 的基础。OSAID 根据开源的四项基本自由评估每个组件
- 使用该系统用于任何目的,且无需请求许可
- 研究系统如何工作并检查其组件
- 修改系统用于任何目的,包括更改其输出
- 分享该系统供他人使用,无论是否进行修改,用于任何目的
通过数字公共产品实现人工智能民主化
来自数字公共产品联盟 (DPGA) 的 Lea Gimpel 和 Daniel Brumund 强调了通过数字公共产品(包括开源软件、开放人工智能模型、开放数据、开放标准和开放内容)实现人工智能民主化的重要性。Lea 强调,虽然开放数据是可取的,但并非必要条件。她支持 OSI 的开源人工智能定义,因为它有助于 DPGA 应对围绕数据共享的法律不确定性,并扩大了可以被认可、推广并作为数字公共产品提供的潜在解决方案范围,从而为积极影响人们的生活提供更多机会。
结论
本次会议清楚地表明,制定一项维护开源基本自由的标准开源人工智能定义,对于解决人工智能和机器学习开发及民主化中的一些关键挑战至关重要。OSI 感谢 Linux 基金会在实现这一目标方面的合作,以及其承诺举办另一次成功的活动,以促进这些重要的讨论。