hello,大家好,这里是marklin,今天给大家分享一个calibre的基础教程,我之前用视频的方式分享过许多关于calibre的教程,比较全的放在B站里面,大家可以自行查阅,有基础的操作教程,也有一些进阶的插件等应用,链接如下:
浪迹天涯的咖啡的个人空间-浪迹天涯的咖啡个人主页-哔哩哔哩视频
但是很多网友留言说关于电子书的目录问题比较头疼,虽然在视频当中有提到过,但是要找起来确实比较麻烦,特地花点时间做一篇文字版的教程:
一级目录很简单,calibre只需要设置一个结构检测的正则表达式语法即可👇:
//*[re:test(., "^\\s*[第卷][0123456789一二三四五六七八九十零〇百千两]*[章回幕部节集卷].*", "i")]
calibre,下载链接:https://calibre-ebook.com/download
一个可以使用正则表达式查找替换的编辑器(代码编辑器即可),例如vscode(https://code.visualstudio.com/download),notepad++(https://notepad-plus-plus.org/downloads/)
一个包含多级目录的txt文档,我这里拿《盘龙》做演示,地址(https://www.alipan.com/s/mTVhgANeeRy)。
在calibre中,电子书文件是以html的文件格式来管理的,它可以识别Markdown格式的多级标题,也就意味着我们在txt文档中增加#、##等多级目录后,再传入到calibre中,转换成我们需要的epub或者是azw3格式即可。
第一步:查看txt原文
要先快速查看以下txt文档,查找其中出现的例如第*卷、第*章、第*集的字眼,找到大致的规律,这样才好做替换。如果你的电子书非常混乱,我建议你可以直接换一个,不值得花太多时间处理一个非常垃圾的电子书。
我有收集很多电子书下载网站,可以看下合集👇:
第二步:替换
首先你要下载好上述说的编辑器,这里以vscode为例,选中txt文件,右键用vscode打开,第一次打开的时候,或许是乱码,不要着急,大概率是因为编码的问题,右下角找到编码所在的位置,点击后软件可以自动识别该文档的编码,点击切换即可。

文件打开之后,输入:Ctrl+h,打开查找替换功能,切换到正则表达式查找模式,见下图:

如果是一级目录,在查找位置输入:
^第(.*)集
^第(.*)回
...
根据自己文本内容切换
(.*)是匹配第跟卷之间的所有字符,这样就能保证查找到所有的符合要求的目录。
替换位置输入:
# 第$1集
# 第$1回
...
根据自己文本内容切换
#是markdown语法,一级目录的意思,效果跟h1一样,$1也是通配符,可以自行增加数字。
如果是二级目录,在查找位置输入的是一样的,只是切换成二级目录的文本,例如^第(.*)卷,在替换位置输入的是## 第$1卷。
用两个## 表示二级目录。
这里有个小tips,在替换的时候,先替换下级目录,如果有两级目录,先替换第二级目录,替换完成后再替换一级目录,避免出现混乱。
这样文本替换工作就完成了。
你应该得到了这样的效果:

第三步:转换格式
打开calibre,导入替换好标题的txt文档,选中书籍,转换书籍,选择目录标签,XPTH部分选择合适的标签(h1\h2)即可。

等待转换成功,打开指定的格式,这里是epub格式,即可完成多级目录的生成,效果如图:

好嘞,以上就是通过calibre实现txt文本的目录生成教程,所有需要的软件和资源都提供给大家,大家可以自行尝试,有任何问题,可以给我留言,我会尽力解答,谢谢。
另外,我自己花了点时间建了一个博客网站,欢迎大家来踩。目前正在完善中,内容较少,请见谅。
www.marklin.life
再次感谢。