元宇宙基石:Web3.0与分布式存储
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1.1 早期人类存储信息的载体

人类的出现可追溯至300万年或400万年之前,相对于约137亿年前宇宙的诞生,渺小的人类文明只占据了非常短暂的一瞬。但就是在这短暂的时间里,真正被记载下来流传至今的也只有几千年而已。如今的考古学家只能费尽周折地从出土的文物、化石、琥珀等历史的残留物中去寻找那段消失的记忆,拼凑出人类绚烂文明的起源。

但是那段历史依然是残缺的,在很大程度上是人们想象出来的,有些历史我们可能永远无法得知。或许当未来科技高度发达时,我们才能够进一步将历史还原,但消失的历史依然是人类的遗憾。这不能责怪我们的祖先,因为他们也在努力寻找适合记载信息的媒介。而正是因为存储方式的不断演进,前人的经验得以传承,后人在前人的基础之上继续创新和优化,人类文明才得以进步。

在远古社会,人们交换思想、交流经验大多通过口耳相传,靠本能和记忆行事。但是生物记忆的能力毕竟有限,正如我们学生时代老师经常说的那句“好记性不如烂笔头”。古人虽然没有烂笔头和纸张,但是并不影响他们就地取材,通过其他方式来记载信息。

绳子是个好东西,可以捆绑猎物、固定物品,通过打结还能够记录信息。某个古人外出打猎,收获了1只羊、5个果子,就可以打1个大结外加5个小结来记录今天的收获。还有一些怀旧的古人,通过结绳的方式来记录值得纪念的日子,比如,《易九家言》就有记载:“事大,大结其绳;事小,小结其绳;之多少,随物众寡。”于是,这些大大小小的绳结就成了帮助古人回忆的线索。

到这里就有人会疑惑不解了,用绳结来计数还可以理解,用绳结记事则显得有些不靠谱。毕竟年代久远的事件,仅从一个绳结去回忆起当天发生的具体情况,还是非常困难的。尤其是人在一生中会经历那么多的大小事件,难免会出现遗忘的情况。

出现问题、解决问题,是人类社会持续进步的正向循环。既然单一的绳结无法存储复杂的信息,那么就通过将不同材质的绳子、不同的结绳方式及涂抹不同的颜色相结合的方式来记录、存储信息。每一种绳结都代表着一个词语,通过不同的组合来记录不同的信息。当时,这可以说是一种非常先进的信息记载方式,或者说更像一种语言系统。

不过结绳毕竟是一件非常烦琐的手工劳动,尤其是在需要记录大量信息的时候。同时,绳子易损耗。潮湿的天气、虫子啃食等都会对绳子造成破坏,记载的信息也容易丢失。因为本质上存在着缺陷,结绳记事的方式也逐渐被刻在墙壁上、石头上、动物骨甲上的象形文字所取代,后者在表达的丰富性上也强于前者。

说起甲骨文,不得不让人想起全球最大的企业级软件公司之一,即甲骨文(Oracle)公司。Oracle的英文原译是预言家,后来Oracle公司为了贴近中国的历史文化,将中文名定为中国古代占卜记事所使用的“甲骨文”。Oracle公司通过商用关系型数据库系统打开市场,当前世界上大部分头部公司都采用了Oracle技术,包括企业数据存储、应用软件开发等。同样是存储信息和数据,Oracle公司将中文名定为“甲骨文”可以说非常贴切。

甲骨文主要用于占卜,很少记载历史事件。在甲骨文未出土之前,西方部分学者还曾质疑中国的商朝是否真的存在。当然,对于中国夏、商、周三代的古代文献记载有很多,这是实实在在存在过的历史。只是夏朝及更远的历史,由于没有文字体系和历史实物,后人难以还原那段历史文化,实属遗憾。否则,中国古代的神话故事或许会更加丰富多彩。

不过,好在竹简书很快取代了甲骨文登上了历史舞台,中国语言体系的不断丰富也让竹简成为中国悠久历史文化的承载体。从殷商一直到魏晋,千余年的历史文化得以传承。《论语》《易经》《孙子兵法》等诸多文献都是世界闻名的文化瑰宝,反观同时期欧洲书写载体的发展比中国晚了近千年。中国魏晋南北朝时期,欧洲人书写《圣经》仍在用羊皮,而此时的中国已经开始使用纸张了。在工业革命还未到来的时期,生产力主要源自人力劳动且人人皆是劳动力,供需关系决定了人力劳动相对廉价。因而在记录信息的过程中,信息的承载体要比劳动力更珍贵。纸张相对于羊皮来说,成本更加低廉。

造纸术是中国四大发明之一,起源于西汉时期,由东汉时期的蔡伦进行了改良。西汉时期的麻制纤维纸由于质地粗糙,制作成本较高,也就没有得到普及。但蔡伦将树皮、麻头、粗布及渔网等被弃用的材料作为原料,经过挫、捣、炒、烘等工艺将其制造成纸。这种纸的原料成本低,制作也相对简单,纸的普及度逐渐提高了。又经过后人的不断改善,纸慢慢发展成为至今仍被沿用的信息载体。

纵观整个人类信息存储载体的演化,绳子(结绳记事)、甲骨文、动物皮、竹简书、纸张等,人类一直在寻找更便捷、经济和安全的载体,来传承前人的精神思想和时代记忆。安全和便捷似乎总是相互矛盾,正如纸张方便书写且成本低廉,但是纸张因为材质的原因也容易损坏。雕刻在甲骨或者竹简上的文字可以保存的时间更长,但其书写相对麻烦且成本较高。因此在历史发展的过程中,人类通过多种载体相结合的方式来记载信息,比如重要事件的少部分信息通过相对烦琐但安全的方式存储,而一般的大量信息则通过便捷的方式存储。这一方式可以说贯穿了整个人类文明,时至今日,即使是在互联网时代,人们也会通过古老的雕刻方式来记载信息。

随着信息载体的不断演化,留下的历史文献及其他各种信息也越积越多。如何相对快速地找到自己想要的信息,成为人类发展的新需求。在古代没有互联网及其搜索功能,人们想要查阅资料需要到当地的书店或者有藏书的地主豪绅家去买或者借阅。但是,通过这种方式寻找资料存在很大的局限性,因为对方的书并没有那么多。能不能找到自己想要的资料,大多依靠运气。或者先打听哪里有自己想要的书籍,这样成功率会更大一些。

面对这种情况,世界各地的政府或者掌权者发挥了很好的作用,其将散落在各地的书籍、文献进行备份和收集,形成了规模浩大、内容齐全的图书馆。根据考古学的发掘,最早的图书馆是美索不达米亚平原的亚述巴尼拔图书馆。其是亚述最后一位国王巴尼拔创建于自己的宫殿之中的泥版图书馆,在时间上它要比埃及著名的亚历山大图书馆早400多年。中国也有不少历史悠久的图书馆,只不过那时并没有图书馆一词,而是某某府、某某殿、某某院。

图书馆的工作一般涉及收集、整理、典藏和服务4个部分。不过类似亚述巴尼拔图书馆这样由国王建立在自己宫殿的图书馆,其服务的人群只局限于王室,普通民众很难享受这样的服务。但随着民主意识的觉醒,后来图书馆逐渐向民众开放,普罗大众也能够有机会接触到祖先们留下的文献、书籍了。

即使是古代的图书馆,各种藏书少说也有几万册。如何从海量的藏书中快速找到自己想要的资料就成了当时人们亟须解决的痛点,毕竟一本本寻找绝对是一件令人抓狂的事情。小小的索引卡在这里发挥了巨大的作用。

建立索引卡的最初目的是整理动植物和矿物的信息,但是随后就被借用来构建图书馆图书的目录结构。卡片记录和笔记本记录有个很大的区别:卡片可以更自由地根据实际情况,进行补充和信息的修正。但是如果写在笔记本中,那么可扩展性和便捷性就会差很多。比如,图书馆中新增了一本书,那就增加一张卡片,或者其中某本书的位置调整了,那就销毁原来的卡片重新替换一张即可。

不过,由于不同的图书馆拥有不同的索引卡编制规则,有的根据作者姓名,有的根据书名,这造成了一些问题:如果在某个图书馆习惯了该检索方式的读者来到另一家图书馆,就会变得非常不习惯。

1873年,麦尔威·杜威(Melvil Dewey)在阿默斯特学院学习期间,提出了“杜威十进制图书分类法”,通过按图书主要涉及的领域来将其进行分类。比如,数学类的图书归为一类,历史类的图书归为一类,等等。每个类别都有一段编号,通过不断细分产生的独一无二的编号与图书在图书馆中的位置相匹配。当然图书的书脊上也会粘贴同样的编号,这样读者就可以通过索引卡上的编号准确地找到图书。

这种方式对于已经习惯了互联网的我们来说,再熟悉不过了,这正是互联网用户通过网址找到相应网站的方式,每个网址(编码)都对应着一个网页(图书)。

杜威在1874年从阿默斯特学院毕业后,直接进入该学院的图书馆担任助手一职,并通过自己的分类法为这家图书馆进行图书管理。杜威的一生都投身于图书馆事业,他的分类法也逐渐成为全球图书馆索引卡的编制标准,影响深远。

图书馆检索方式的不断演进和细化,让人们能够更便捷、高效地找到自己想要的图书。后来,随着互联网的兴起,图书馆的检索方式也被放到了网上,谷歌、百度等搜索引擎就是这样的产物。