为了便于wiki建设,必须拥有所有电子版小说,但网络上只能搜到一部分。在求助无果后,我开始自己使用OCR技术制作电子版,这个过程极其艰难,竖版日文的OCR比一般文字更难,且容易出现各种问题。
在试用了包括ABBYY在内的几十种OCR软件后,我发现这些软件都或多或少存在瑕疵。github上的很多方案都是基于Py的,我不会用,折腾许久只能放弃。
最后,我听说在线大模型比本地准确率高很多,于是一个一个开始测试。最后发现只有gemini最新的2.5pro可以达到接近100%准确率,但只能用一阵子就要等一整天,再往后甚至要得等三天,而且谷歌禁止中国用户开会员。所以在勉强OCR几十页后,我不得不放弃gemini(2.5flash错误率很高,疑似随着2.5pro上线而故意降低了智力)
在几个主流大模型都无法达到要求后,我不得不回到了早期试过的谷歌翻译识图模式(日文翻译为日文),这时已经别无他法,只能用这个。惊喜的是,该模式也能达到接近100%的准确率,只是不能像ai那样根据要求调整格式。另外,谷歌翻译会把假名小子也识别到,需要手动删除。
总之,现在《恶之女:红之前奏曲》约260页的内容我已经完全转化为电子版小说,没有精力将所有格式都做得很精美,主要是为了配合快速检索大量文本的软件使用。
小说在wiki群里。
在试用了包括ABBYY在内的几十种OCR软件后,我发现这些软件都或多或少存在瑕疵。github上的很多方案都是基于Py的,我不会用,折腾许久只能放弃。
最后,我听说在线大模型比本地准确率高很多,于是一个一个开始测试。最后发现只有gemini最新的2.5pro可以达到接近100%准确率,但只能用一阵子就要等一整天,再往后甚至要得等三天,而且谷歌禁止中国用户开会员。所以在勉强OCR几十页后,我不得不放弃gemini(2.5flash错误率很高,疑似随着2.5pro上线而故意降低了智力)
在几个主流大模型都无法达到要求后,我不得不回到了早期试过的谷歌翻译识图模式(日文翻译为日文),这时已经别无他法,只能用这个。惊喜的是,该模式也能达到接近100%的准确率,只是不能像ai那样根据要求调整格式。另外,谷歌翻译会把假名小子也识别到,需要手动删除。
总之,现在《恶之女:红之前奏曲》约260页的内容我已经完全转化为电子版小说,没有精力将所有格式都做得很精美,主要是为了配合快速检索大量文本的软件使用。
小说在wiki群里。