|
会不会是这个理由,所以到目前为止,不论是古腾堡计画还是百万书模式,纸书数字元化推动最力的还是学术界呢?……
亚马逊网络书店终于在十月廿三日,正式推出传闻已久的「看内页」增强版,新功能的名称叫做「查内文」(Search Inside the Book)。你只要打上想找的关键词,任何书如果包含那个字,不论是出现在书名、简介、分类或内文的任何地方,就可以找出来,甚至还可以标示是出现在哪本书的哪一页的哪一行的第几字。
现在已经有一百余家出版社,授权十二万本书,开放供读者做全内文检索。半个多月来,一般的反应可以用一句话总结,就是:除出版业和作者以外,人人叫好。尤其是网络的重度使用者。
著名的网络杂志「联机」(Wired),就针对亚马逊的新功能发表了一篇内幕报导,把这件事放到网络发展的历史背景上来谈,认为这是完成「人类所有知识的集合」,极重要的一步。
因为即使过去这十几年来,全球信息网的发展如此神速,网络号称什么都有,什么都找得到,但是人类的知识成就仍然有极重要的一块,与网络无缘。当然,你一定猜得到,那就是书的世界了。
根据二○○一年的研究,美国有百分之七十一的大学学生,以网际网络为研究工具的第一选择。未来这种情况只会加剧而不会缓和,甚至即使是现在,对许多人而言如果某项知识在网络上找不到,差不多就等于是不存在了。而书呢?对,大部分书都不在网上。这个窘境使得网络反而变成窄化我们知识视野的元凶。
对许多网络狂热者而言,网络就是道路,就是真理,而这个真理竟然没有包括书,没有把记录人类五千年智能结晶的东西容纳进来,这真是太让人无法忍受了。
改变这种局面的企图,始于一九七一年的古腾堡计画。那是伊利诺大学推动的文学与经典内文建置计画,三十二年来,透过义务工作的模式,已经累积了一万种书目可供全文直接下载。接下来还有「百万书」计画,由卡耐基美隆大学等单位,合作推动纸本书的数字化,百万书的目标是完成一座一百万种纸书内容的数字仓库。
「百万书」的方法比古腾堡计画更有效率,他们直接请各大图书馆借出馆藏无版权图书,海运送至印度扫描校对(因为工钱便宜),扫完以后,原书归还,原档上线。预计到年底,上线书目会达十万种,然后在二○○五年完成百万书的目标。
这个计画和亚马逊的新功能,简直是如出一辙,都用实体书扫描,都用光学辨识软件转换为文字文件,都公开在网络上,都可以全文检索。两者的不同是,百万书的目的是为了保留人类知识,建立数字图书馆。亚马逊则坚决否认他们的新功能跟数字图书馆有任何关联,老板贝佐兹故作市侩地说,我们只想如何多卖(实体)书而已。
贝佐兹当然不是谦虚,也不是客套,他很明白他手上的「查内文」功能,距离数字图书馆只差一步而已。如果亚马逊不坚守这一步决不逾越,出版社大概不可能放心授权(虽然所有工作都是亚马逊做的,但是源头若无授权,线上就不会有内容可供检索)。
现在美国出版业分为两派,一派以威利出版社(John Wiley)为首,全力配合,另一派以企鹅集团为首,静观其变。亚马逊则不断敲边鼓,一下说读者反应非常热烈,一下又说有提供查内文服务的书目,比没有提供的,销售成长率高出了百分之九。
提供检索的书销售率成长,算得上是加入服务的诱因吗?这其实是个诡异的不归路。你不参加,别人的书就卖得比你好,你一参加,大家却只是回归原点,又在相同的起跑点上竞争而已。
因此威利出版社的全力配合实在是有先见之明。如果数字化是书的终极命运,那就来看看,到底哪些类型的书数字化以后,对实体书的影响最严重吧。早配合,可以早一点享受亚马逊的销售情报,早一
|