面向大众(或女性)的元数据

今年七月,我很荣幸被任命为SILS 访问学者,SILS 是信息与图书馆科学学院,隶属于北卡罗来纳大学教堂山分校。 信息与图书馆科学界和开源社区拥有许多共同的热情,特别是相信知识共享是重要且有益的工作。而且我越来越看到这两个社区拥有共同的命运……

今年二月,我了解了一位伟人的历史,弗雷德·基尔古尔博士。 基尔古尔博士在学习和知识共享方面充满好奇心、勇气和奉献精神。 他在建立和捍卫图书馆共享书籍和书籍信息的权利方面的开创性工作,使得 WorldCat 联机编目系统成为发现和访问全球图书馆资源的有效索引。截至 2007 年 5 月,该系统创建于 1971 年,包含超过 10 亿条记录,引用了 360 多种语言的物理和数字项目。是什么使其发挥作用? 标准,以及对信息共享的根本承诺。

当政治家们争论海平面是否正在上升,以及这种上升是否是人为活动造成的时,

最近我观察到,我们输入计算机的数据越多——无论是海滩上的个人照片、日历信息、地址列表、商业材料、研究论文、商业计划等等——我们就越依赖良好的记忆力或 Google 来为我们找到它。然而,尽管 Google 拥有强大的搜索能力,尽管我们自己的大脑拥有强大的能力,但 TB 级的数据正在变成浪费的资产,因为在最初生成数据时,从未考虑过信息或图书馆科学的概念。

这是一个我非常幸运的例子:摄影。 我有一个佳能 EOS 数码相机系统,前段时间我不得不决定在亚洲(澳大利亚、中国和日本)的旅行中应该携带哪些镜头。 虽然我事先没有想到,但我的相机一直在用镜头类型、光圈、快门速度、ISO 速度等注释我的数字图像,如果我能从嵌入的 EXIF 数据中解码这些信息就好了。 使用 Phil Harvey 出色的 ExifTool 和一些 Perl 黑客技术(为此我受到了赞誉),我能够解密未公开的数据格式,并了解我在 3000 多张数字照片历史记录中最常使用哪些镜头以及使用什么光圈。 结果:一种选择最佳镜头的方法,以获得有限的镜头背包。

但越来越多的数据在生成时没有标签,而这种标签的缺乏使得进行智能聚合和选择性搜索变得困难或不可能。 Folksonomies 和 taxonomies 已经成为有力的工具,但在正确的人手中,太多的数据在创建时没有考虑或科学地考虑如何在更长的时间内维护或重新利用这些数据。

我们需要更加认真地对待元数据定义和工作流程。 幸运的是,开源工具使奖励元数据创建者一个接受和可接受的工作流程变得容易得多。 我的意思是,开源桌面可以桌面促进元数据标记。 与数据库接口的开源工具可以将元数据传递到数据库和从数据库传递元数据。 编辑器(甚至 2d 绘画2d 插画3d 编辑器)可以成为元数据工作流程的一部分。 因此,开源可以实现信息和图书馆科学家可以帮助定义的标准。

我脑海中回响着艾伦·科普兰的 平凡人的号角 的独奏小号声,既孤独又充满希望,但现在也无处不在(由于网络电视的采用),我设想在未来,一些有创造力的人将会使元数据像科普兰的作曲一样具有定义性、共鸣性、普遍性和无处不在。 我唯一的希望是,他们在信息和图书馆科学方面的天赋能像科普兰在现代音乐方面的天赋一样伟大。