我正在做一个数据库来存储我的电子书收藏。
他们中的大多数人在本书的文本中都有ISBN。
如何访问此内容?
是否有任何源代码或DLL来做到这一点?如何从CHM或PDF文件的电子书中读取ISBN
3
A
回答
4
我为电子书库应用程序做过。首先,您需要从chm或pdf文件中提取文本。有很多公用事业\图书馆来做到这一点。 CodeProject上的article关于如何从CHM文件中提取内容。对于我使用pdftotext实用程序的PDF文件。 当您从电子书中获取纯文本时,使用regular expression解析它以查找ISBN10/13代码。
2
从CHM和PDF文件中提取文本是第一步。接下来你可以找到一个regular expression的ISBN号码。
相关问题
- 1. 从pdf读取证书
- 2. 如何从doc或pdf文件中读取特定页面。
- 3. 电子书阅读器的XML文件
- 4. 阅读pdf电子书的内容和相应的拆分pdf文件
- 5. 如何从CHM文件获取TopicIDs?
- 6. 如何从Clutter outlook文件夹中读取电子邮件C#
- 7. 如何从.NET中的X509证书中提取电子邮件?
- 8. iTextSharp - 从pdf中读取证书
- 9. 如何从iPhone中的文档目录中读取pdf文件?
- 10. 如何从CHM文件中提取hhp文件
- 11. 使用Java从PDF文件中提取大纲(或书签)
- 12. 如何在android中读取pdf文件?
- 13. 从保存的电子邮件附件中读取kml文件
- 14. 如何使用PHP读取PDF书签?
- 15. 如何从PKCS7.p7b证书文件中读取证书文件usind openssl?
- 16. 如何从java中的波斯语pdf文件中读取
- 17. 如何从回复中获取/读取电子邮件ID
- 18. 从文本文件中读取值,转发电子邮件
- 19. 从pdf文件中读取超链接
- 20. 从S3 Bucket中读取PDF文件
- 21. 从Android中读取PDF文件
- 22. 如何在Android中读取PDF文件以及如何读取android中pdf文件中的索引?
- 23. 读取文件从电脑
- 24. 如何使用Google Book API从ISBN获取图书封面?
- 25. 如何将图书的ISBN 13转换为ISBN 10
- 26. 如何从原始文件夹读取pdf文件?
- 27. 如何从另一个CHM帮助文件中打开CHM帮助文件
- 28. 从Outlook子文件夹读取电子邮件
- 29. 如何从Android中的电影文件中读取每个帧?
- 30. 从文件中读取内容并发送电子邮件