[转帖]如何下载阅读高等学校中英文图书网上的民国书和古籍
闲闲书话 肖毛 在弱水月年兄的帖子里知道了“高等学校中英文图书网”,对那里的民国书很有兴趣。但那些图书的格式是djvu的,于是开始寻找各种djvu软件及其使用方法。这里,先转贴一篇文章: 作者: oliver197411 发布日期: 2006-7-18 网上读书园地(www.readfree.net) 【原创】菜鸟教程:手把手教你下载、合并djvu书籍 “高等学校中英文图书数字化国际合作计划”网站上有不少好书,古籍和民国和一些现代书籍(比如中华书局的书,某些大学的超星镜像上一本都没有,这里却很多,而且很全。中华书局的二十四史,清史稿这里都有。这里有很多清人的文集,都是刻本,是比较难找的。还有全套的台湾影印本《文渊阁四库全书》,原本扫描,非常清晰!还有民国非常有名的全套万有文库、丛书集成初编、二编以及民国丛书等等,好书实在太多!)这些书籍一般都是可以观看,并且下载的!因为你到图书馆中去查古籍和民国图书往往很麻烦的,不如自己制作,永远拥有!!我以前很难找到的民国中小学教科书,这里有一大堆! 下面介绍我自己摸索的下载和制作djvu的方法。 第一步,点击下面链接下载djvu插件并安装 http://www.cadal.zju.edu.cn/doc/DjVuWebBrowserPlugin.exe 第二步,登陆高级检索界面 http://www.cadal.zju.edu.cn/AdvancedSearchIndex.action 当然你也可以登陆简易检索界面(http://www.cadal.zju.edu.cn/Index.action),但是推荐登陆高级检索界面,功能更强大。 在搜索栏目里输入作者“张舜徽”,好家伙,出来一大堆书。 你可以点击右边的“详细信息”,了解此书是否是你需要的。 现在我以下载《清人文集别录·上册》一书为例,详细说明批量下载与制作方法。 需要用到的软件: FlashGet:下载软件 djvueditor_V6.01_XiaoSD:DjVu :djvu文件合并工具 第三步,寻找图书的真实下载地址 点击“清人文集别录·上册 ” 出现界面如下 我们需要找到图书的真实下载地址。 点击IE浏览器的查看——源文件 找到以“http://210.32.137.91/”开头的如下地址(其实“http://210.32.137.91/”永远不会改变,任何一本此网站上的书的真实地址都以这个地址开头!) 新建一个txt文档,将“http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760”(不包括左右双引号)复制到其中。 我们还要给这个地址加上通用的后缀“/ptiff/(*).djvu”(不包括左右双引号),这样图书的真实地址最终变成了http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760/ptiff/(*).djvu 第四步,探测图书的页数 在图书页码浏览输入框,随意输入一个极大的数值,比如7777,点“GO”。 本书当然没有7777页,就会在输入框里显示最后一页的页码,这样就可以知道这本书有多少页了,也就解决了批量下载的文件数量问题。 由下图可知本书共有344页 第五步,启动FlashGet的成批下载功能下载这本书。 启动FlashGet,在“任务”栏里选择“添加成批任务”,将上面录入在新建文本文件里的图书真实地址复制上去,同时在下面的“例如”中,填入从1到344(344为本书的页数,这个数字随着图书不同而变化。),通配符长度为8(通配符长度,每一本图书都一样,这个永远不变)。 点“确定”,批量下载设置完成。 选择一个保存地址,点击“确定”,下载开始。速度快的时候,下载300多页的书大概只需要一二分钟的时间。 第六步,合并成单个djvu文件。 转到你保存的地址看看,下载下来的书,都是按顺序编号的单个文件。现在你已经可以直接双击单个文件,启动IE浏览器直接逐页浏览了。但是非常不方便,这就需要我们把这么多djvu文件合并成一个djvu文件。 安装并启动djvueditor_V6.01_XiaoSD。界面如下。 点击“文件”——“打开文件”按钮,找到刚才下载保存的文件目录,选中第一页,按“打开”。 文件打开后如下图。 点击“编辑”,选“插入在页面之后”。 除了第一页之外,剩下的都选择,然后点击“打开”。 左面会显示所有文件的缩略图。 仔细观察,发现其中最后一页误排到第二页了。解决的办法是选中错误的页码,按“剪切”。 然后将它粘贴到当前最后一页的后面。 点击“保存”按钮,所有的文件将合并到你下载的00000001.djvu中,将它改名为“清人文集别录·上册.djvu”,其他原来下载的文件都可以删除了。 第七步,阅读制作好的djvu文件。 直接双击你制作好的“清人文集别录·上册.djvu”,系统将启动IE浏览器来观看,可以自己随心所欲的设置放大和缩小。 就这么简单! ---------- 转贴完毕。现在开始说我的使用体会。 想阅读和制作djvu格式的图书,需要下载几个软件: 1.浏览插件:http://www.cadal.zju.edu.cn/doc/DjVuWebBrowserPlugin.exe(利用它可以在IE里面观看djvu格式的图书,但每次只能显示一页) 2.djvu文件合并工具:DjVuSolo3.1-noncom,全名为DjVu Solo 3.1 (non-commercial version),约2.1兆,英文版,下载链接我忘记了,可以在网上搜。前面提到的合并工具djvueditor_V6.01_XiaoSD,我下载之后并不好用。 我试验过几种软件,只有DjVuSolo3.1可用。使用方法如下:先打开安装后的主程序,随便打开一页下载好的djvu图书,然后点击Edit菜单,点击Append Page(s)选项,把某本图书目录里面的文件全部选定,打开。最后一步,点击File菜单,点击Save as选项,会弹出一个窗口,点击Bundled,点击OK,随便取个书名,所有文件便可以合并为一个djvu格式的图书。 3.浏览器:WinDjView 0.3.5,484k,一个文件,不用安装,英文版,下载链接我忘记了,可以在网上搜。 尽管DjVu Solo 3.1也带浏览功能,但这个软件如果将每页书转化为图片文件,需要四五兆。如果用WinDjView 0.3.5转化,每张图片不到2兆,非常省空间。 另外,如果用迅雷成批下载Djvu图书,通配符长度不能为8,因为迅雷默认的是5。这时需要把http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760/ptiff/(*).djvu,改写成http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760/ptiff/(000000*).djvu(中间应该有几个0,请自己试验,我家里没有装迅雷,这个试验是在别人的电脑里做的,反正当时成功了。 还有,并非该网的所有图书链接都是以http://210.32.137.91/开头的,还有别的网站,这在查源文件时可以发现。 探测图书的页数,不必用采取上面提供的笨方法,你可以直接在网上点击“末页”,不久就会有显示。 目前,我已经下载合并的djvu图书如下: 傅东华译《奥德赛》,六册,万有文库本 叶圣陶《稻草人》(比如今通行的各种本子多出几十篇,建国后似乎从未重印过,我不明白,建国后为何不印《稻草人》全本),民国本 鲁彦译《给海兰的童话》,民国本 鲁彦译《显克微支小说集》,民国本 法朗士《友人之书》,民国本 雷马克《战后》(《西线无战事》续集,夏衍译),民国本 《陀螺》《冥土旅行》《空大鼓》《点滴》等周作人著作 如有时间,把这些书一页页转化为JPG,就可以校对为文本文件了,可我最缺的就是时间:( |