[书稿]第一章1.1 信息的网络化指数

杨子之邻人亡羊,既率其党,又请杨子之竖追之。杨子曰:“嘻!亡一羊何追者之众?”邻人曰:“多歧路。”既反,问:“获羊乎?”曰:“亡之矣。”曰:“奚亡之?”曰:“歧路之中又有歧焉。吾不知所之,所以反也。”杨子戚然变容,不言者移时,不笑者竟日。   1.1  信息的网络化指数 亲爱的读者,你是否有过这样的经历:兴冲冲地打开电脑,准备查找某个资料,开始时目标非常明确,在上网浏览的进程中,发现其他一些让你感兴趣的网页标题,不管这些信息是不是你真正所需要的,你毫不犹豫的点击进去,因为轻轻按一下鼠标左键是如此的简单而富有成就感。接着,链接里面套链接,文字本身暗藏链接,你像一个失去自控能力的旅客,在一列超速火车上一站穿过一站,在某些站点停留一小会儿,跨进另一列车,又向下一个不熟悉的站点挺进。几小时酣畅淋漓的上网之后,问:你在什么地方?不知道。你得到了你想要的信息了吗?不太清楚。你对某一问题有深一步的了解了吗?还要再研究。 事实上,我们大部分的网上搜索是低效或无效的。你可以找到需要的信息,但要花费相对较多的精力,在上百万条的搜索结果中精挑细选。运气差的时候,你在大量的网站间穿梭,几十分钟甚至几个小时后仍一无所获。很多情况下,我们不是在网上搜索,而是在网上漂流(Online Drift)。我们甚至不如希腊神话中的奥德修斯,他虽然在海上漂流十年,但有着明确的目标,那就是回家。长期的无目的漂流会成为一种习惯,我们耽溺于网络,网络慢慢地退化为人们打发时间的一种手段。 本章的开始引用了《列子·说符》里的一篇寓言,大意是这样的:杨朱的邻居丢了一只羊,一大群人帮忙寻找。杨朱很诧异,追一只羊需要这么多人吗?邻居回答:岔路太多。最后羊还是没有找到。杨朱问原因,别人回答说:岔路中又有岔路,不知道羊走了哪一条,因此不知道该选哪条路追,就回来了。杨朱神情黯然,几天不说话。 由这则寓言可以引申出很多的道理。在很多情况下,可选择的范围太广反而是一件麻烦事。我们从同一起点出发,会沿着不同的路走向不同的终点。博尔赫斯是阿根廷文化巨擘,他来到这个世界的惟一目的就是为我们证明了人类的思想能够有多么高远。如果人生真的像博尔赫斯描绘地那样,是一座交叉小径的花园,那么在日益复杂的网络世界里,我们能否做出准确的选择,避免在网络中迷失,高效地获取所需的信息? 信息(Information)是一个非常宽泛的概念,在学术界尚没有统一的定义。夜色中银座步行街上人流攒动,热带雨林里的蝴蝶扇动轻盈的翅膀,非洲大草原上的秃鹫盘桓寻找残羹,宇宙中鹿林彗星永不停息的运动都在向我们传达着某些信息。从信息来源上看,信息可以分为人类信息、自然信息、宇宙信息。我们更多地关注于人类自身活动所产生的信息。 近代科学技术的突飞猛进,产生了大量新兴学科,技术的更新周期不断缩短。近三十年产生的信息量占到了人类信息总量的90%。应运而生的网络为信息的检索提供了便捷的途径。文盲的概念由传统的不能阅读和书写转变为不会使用网络。在一个讲求效率的竞争环境中,成功的决定因素之一不再是掌握信息量的多少,而是获取有效信息的快慢。因此,花费少量的时间学习如何高效的情报搜索,是一个理性人应做的选择,是一个低投入、高产出的过程。 经常使用网络的人们往往会陷入一个误区,那就是:我所需要的信息网上都能搜的到。之所以会有这种错觉是因为我们有着许多轻松的搜索经历:用电子地图(Electronic Map)查找住所附近的打折店,去淘宝网浏览最新款的耐克鞋,到百度搜索当下热门的音乐,或者干脆去百度知道寻找现成的解答。 但是,搜索远远不是那么简单。以上所举的例子只是一些低要求的一次搜索,对于专业化的、学术性的搜索和某些特殊要求的搜索则会显得有些力不从心。很多网络信息的真实性也非常值得我们怀疑,这些内容将在本章后面的几个小节给予讨论。 庞大的网络承载着大量的信息,各类搜索引擎所能检索到的只是网络信息中很少的一部分。即使是大名鼎鼎的谷歌搜索引擎所能搜索的信息量也达不到50%。大部分信息没有被纳入搜索引擎的检索范围。当然,很多信息根本就没有实现网络化,在这里,我们将引入一个概念:信息的网络化指数(Index of Networked Information) 它是指你所需要的信息中,已经通过各种形式网络化的信息所占比重: 举例来说,你是一名历史学教授,准备研究东汉时期的礼制,你所需要的信息零散的分布在各个历史典籍中。你可以使用专业数据库进行简单地搜索,以明确哪些文献包含所要内容。在这些文献中,有的已实现网络化,可以足不出户,轻松的点击鼠标查看,有的还沉睡在图书馆古籍阅览室某个僻静的角落,与灰尘做伴。又比如说,上海在2010年举办世博会,你是一个爱刨根问底的少年,想知道中国最早什么时候参加了世博会,一百二十年前巴黎世博会上华美的中国展馆(Pavilion)是谁捐资修建的,展会之后下落如何,对未知领域的强烈探索冲动促使你打开百度,希望找到答案,然而搜索的结果会让你很失望。我们可以想象,几乎所有与之相关的线索分布在清政府官员的公函中、早期涉外华商的家庭书信中,这些资料是极少被网络化的,也就是说,网络化指数极低。 聪明的读者也许会问:我又不知道那些相关信息到底有多少,怎么能计算出对应的网络化指数呢?本书之所以提出这一概念,目的仅仅是要你意识到搜索引擎的局限性,理性的对待网络搜索。你会发现,在一些特殊要求的搜索面前,传统的信息载体,比如书籍、报纸、信函、实物会告诉我们更多有趣的故事,他们的历史价值不会消失。   <————未完待续————> 声明:本文仅供读者交流使用,严禁任何未经作者授权的商业用途。

Begin typing your search term above and press enter to search. Press ESC to cancel.