开源人工智能定义 – 3月4日每周更新
每周总结论坛上有趣的讨论主题。
工作组的结果已出炉
分析了 OpenCV 和 Bloom 的工作组已完成工作,投票结果已公布。
我们现在有了四个工作组(Llama2、Pythia、Bloom、OpenCV)的结果及其提出的建议的完整概述。
访问我们的电子表格,查看已汇总投票的完整概述。这是协同设计过程中的一个重要里程碑。
关于访问训练数据的讨论仍在继续
这场对话仍在继续,并提出了一个新问题:当原始数据集因保护隐私而无法访问时,开放性会是什么样子?
- “保护隐私”在定义上与开源相矛盾。此外,我们必须考虑到开源人工智能可能并非总是适合在所有环境中使用
- 关于OSI在提及缺乏可用于训练和微调模型的高质量数据集方面的作用,以及如果我们认为在修改人工智能系统时原始训练数据是不必要的,之前的问题仍然没有得到解答。OSI是否应该在最终定义中提及这一点?
经合组织对“人工智能系统”的定义是否过于宽泛?
核心问题:如何精确定义“人工智能系统”,以避免漏洞并确保在开源标准下的全面覆盖?
“人工智能系统”可能会在开源许可中制造漏洞,可能允许发布者规避某些标准。
虽然,定义“人工智能系统”有助于明确构成开源人工智能的要素,需要概述必要的组件,例如共享训练代码和模型参数,同时承认需要在模型架构等方面做进一步的工作。
如果您尚未看到,我们的第四次全体会议已于2024年2月23日举行。访问此处查看录音,此处查看幻灯片。
新的全体会议已安排在本周举行。