【资源】《恶之女：红之前奏曲》日文OCR完毕

为了便于wiki建设，必须拥有所有电子版小说，但网络上只能搜到一部分。在求助无果后，我开始自己使用OCR技术制作电子版，这个过程极其艰难，竖版日文的OCR比一般文字更难，且容易出现各种问题。
在试用了包括ABBYY在内的几十种OCR软件后，我发现这些软件都或多或少存在瑕疵。github上的很多方案都是基于Py的，我不会用，折腾许久只能放弃。
最后，我听说在线大模型比本地准确率高很多，于是一个一个开始测试。最后发现只有gemini最新的2.5pro可以达到接近100％准确率，但只能用一阵子就要等一整天，再往后甚至要得等三天，而且谷歌禁止中国用户开会员。所以在勉强OCR几十页后，我不得不放弃gemini（2.5flash错误率很高，疑似随着2.5pro上线而故意降低了智力）
在几个主流大模型都无法达到要求后，我不得不回到了早期试过的谷歌翻译识图模式（日文翻译为日文），这时已经别无他法，只能用这个。惊喜的是，该模式也能达到接近100％的准确率，只是不能像ai那样根据要求调整格式。另外，谷歌翻译会把假名小子也识别到，需要手动删除。
总之，现在《恶之女：红之前奏曲》约260页的内容我已经完全转化为电子版小说，没有精力将所有格式都做得很精美，主要是为了配合快速检索大量文本的软件使用。
小说在wiki群里。

总算完成一本了，记得七大罪系列今年要出电子版，那八本小说就没必要OCR。加上本来已有原罪两本、黄绿两本、《亡命徒与停柩门》，英文wiki里也收录了工具书的日文，这样一来现在就剩蓝之序曲了。

不感兴趣

开通SVIP免广告

辛苦了

太伟大了

求问wiki群是？

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

8回复贴，共1页

<<返回mothy吧

分享到:

日	一	二	三	四	五	六