你听说过「互联网档案馆」吗?

654 阅读5分钟

【回复“1024”,送你一个特别推送】

互联网档案馆?不知道有多少人听说过「互联网档案馆」呢?又有多少人知道互联网档案馆存在的意义呢?

其实互联网档案馆(The Internet Archive),从 1996 年就成立了,功能就是:定期收录并永久保存全球网站上可以抓取的信息。

互联网档案馆是由 Alexa 创始人布鲁斯特 · 卡利创办,是一个公益性质的计划,它的中文名可以叫「互联网档案馆」,也可以叫「网站时光倒流机器」。

对于不同的网站,「互联网档案馆」收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被 “备份” 一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。 用户可以通过「互联网档案馆」的 “Take Me Back” 对网站的发展与历史资料进行研究。

互联网档案馆收录计划都包括哪些内容呢?其中有六大模块,分别为:电子书,网页,视频,音频,软件,教育资料 。你们知道吗?迄至 2012 年 10 月,其信息储量达到 10 PB。网路爬虫抓取了超过 1500 亿的网页。

电子书

专门收集公共领域的书籍和文档,任何人都可以在上面免费的下载,堪称互联网上最好的公共领域图书搜索引擎。截至 2013 年 7 月,档案馆共收集了 440 万本书,每月的下载量超过 1500 万。 截至 2008 年 11 月,档案馆共有 100 万个网络文本,总大小高达 0.5PB,涵盖了原始照相图像、裁剪和歪斜的图像、PDF 文件和原始 OCR 数据。

网页

上面我们也提到了,网页的收藏,可以说是:「网站时光机」。是互联网档案馆最重要的服务之一。时光机允许人们去搜索和访问其网页存档,即使你自己曾经建立过网站,现在已经不复存在,如何被它收录了,在上面也可以找到你网站的痕迹。可以说,这叫:雁过留声,人过留名

比如:我之前有两个自己的独立博客,一个是 loonggg.com ,一个是 godcoder.me ,而 loonggg.com 这个独立博客已经好久不用了,已经不复存在了,但是我在互联网档案馆里搜了一下,它曾经在 2016 年的时候,有过两次保存我博客的内容。如下:

点击上面保存的两次日期,就可以看到你博客上的内容了。是不是很厉害?这就是价值和意义。

音频和视频

音频它主要收集的是音乐和有声书籍,而视频主要收集的是动画片和电影。你可以尝试着去上面搜一搜一些很难找的动画片和视频,看看有没有被收录,还能不能找到?

软件和教育资料

软件就是收录软件,教育资料就是一些大学的公开课程,有视频和文字资料等。

通过上面的简单介绍,是不是感觉互联网档案馆是个怀旧的好去处?

今天之所以介绍和提到互联网档案馆,是因为最近他们又有了一项新动作。

网站总监 MarkGraham 表示,互联网档案馆收录的内容不断的增长,其中包括超过四百万本书籍和 3390 亿个网页。但是最近该网站又推出了 Commodore 64 模拟器,理论上里面的每个软件(包括几款经典游戏)都经过了广泛的测试,可以像往年一样正常工作。

如果你想加载一个喜欢的 Commodore 64 程序,只需在互联网档案馆的库中查找并点击,即可瞬间穿越时光,重温 Commodore 64 上的 10500 个程序。当然,这个数字在将来还会继续的增加。

我们简单截图,看一下:

上面随便一个游戏,你点击进去,就都可以玩了。是不是一个怀旧的好去处呢?

地址:https://archive.org/details/softwarelibrary_c64

科普:

Commodore 64,也称为 C64、CBM 64 或在瑞典被称作 VIC-64,是由 Commodore(康懋达国际)公司于 1982 年 1 月推出的 8 位家用电脑。Commodore 64 也是吉尼斯世界记录上销量最高的单一电脑型号。Commodore 64 因其 64 千字节(65,536 字节)的存储器命名,是一段个人计算机历史的见证。完整的机器带有 1541 单软盘驱动器,一个 C2N 盒式磁带机,一个键盘和 7 张软件盘。

互联网档案馆的地址,传送门:

https://archive.org/

赶紧去查查,你的东西有没有被收录吧?去查之前,记得转发我的文章,并给我点个赞哦!

另外,明天推文的时候,公布 4 天前活动的中奖名单,趁着 24 点还未到来截止,想要中奖的,赶紧去集赞,去参与吧!文章地址:

搞事情,必须搞事情,相信我,不看你会后悔的

- 长按识别关注 -

技术,职场,产品,思维

行业观察