这些年下来不知不觉也攒了有几百本书,一直苦于没有很好的办法管理,每次要找书都要翻很久。前几年试过用excel表整理,所有信息都要手动录入太麻烦显然无法持久,后面买的书也就没有整理了。市面上也有一些读书软件可以扫描录入,但很多都功能冗余,闭源收费,无法方便地导出数据,而且平台单一,数据不完善,无法自定义,都感觉不甚满意。还有一些开源软件,但不是国外的数据库国内书籍几乎没法用,就是已经停止维护。最理想的流程是能够直接扫描书籍的条形码然后通过ISBN自动获取书籍元信息,自己能够掌控流程。
最后发现还是calibre最适合,只需要一点app配合和设置。虽然也一直在用calibre,不过都是当成电子书管理器,但是仔细研究之后发现calibre确实不愧为最强图书管理软件之名!
基本思想
用calibre管理纸质书其实和管理电子书没有太多区别,只是主要使用calibre的“使用ISBN号添加书籍”的功能,导入之后就是一个没有电子书文件的条目。这样只需要一个app能够批量扫描书籍条形码获取ISBN即可,这样的app市面上很多,也有很多开源选择,我用的是BinaryEye,在设置中开启连续扫描即可。
主要步骤
- 用扫码软件批量扫码。注意检查是否为13位ISBN号,有时可能识别错,在一堆书里找出识别错的那本很麻烦。
- 将ISBN导入到calibre
- 获取图书信息
- 建立虚拟书库
使用calibre管理纸质书的优点
- 开源免费
- 功能完善,有丰富的插件库。而且calibre使用python开发,自己写点插件也比较简单
- 通过ISBN能够获取到最准确的书籍信息。实际上比导入电子书还方便
- 可以自定义数据
- 能够一站管理所有实体书和电子书
- 能够通过WEB搜索管理
优化使用体验
插件
calibre真正强大在于丰富的插件库,要流畅的管理纸质书还需要配合几个插件
- 豆瓣插件,最主要的一个插件,能够应对大多数中文书籍。豆瓣反爬很严格,几十本还能用,太多了就要验证,导入cookie也没用。解决方法是用代理,因为改插件太麻烦而且免费代理质量很差,所以我自己的解决方案是直接用小飞机代理豆瓣域名,批量爬个几十本就换个ip,基本也够用了。
- Goodreads插件,直接在calibre插件商店搜索即可,类似于豆瓣的英文书网站。主要是有些英文原版书和台版漫画,豆瓣没有收录,这个网站基本都有,中文书也有但是很不规范有些信息是英语的,尤其是台版漫画,calibre自带的几个数据源都不好用,这个都能解决。
虚拟书库
因为电子书和纸质书在一个书库中管理,为了能方便管理,还可以使用calibre的虚拟书库功能,“通过ISBN添加书籍”时可以设置一个标签,比如“纸质书”,然后创建一个根据这个标签设置的虚拟书库即可。当然也可以直接用两个书库分开管理。
自定义项目
书籍多了之后自然不可能都存放在一个地方,还可以在calibre的“管理栏目”中添加自定义的数据项,比如添加一个书架的项目。
数据清洗
就算通过插件获取了书籍元信息也不能说,因为可能很不标准,尤其是标签有很多冗杂。所以还需要清洗一遍,这方面过于琐碎,过段时间再单独整理。
结果
断断续续用了一两周的时间摸索流程,又花了几天时间专门扫描录入,总共录入了800本书,大部分时间用在了搬书上面,如果只是单纯扫描大概几小时就足够了,导入calibre之后再慢慢刮削即可。