1
我在Python中使用pdfminer包将PDF转换为HTML,但它将撇号转换为特殊字符。例如:Python pdfminer pdf2html:撇号转换为特殊字符
‘This is a text between apostrophes’
应该是:
'This is a text between apostrophes'
有什么办法,以特殊字符转换回撇号或更改编码或东西吗?我不太熟悉字符编码。也许我可以选择转换为HTML的编码?
你可以显示你用来阅读PDF的代码吗?你能指定你正在使用的Python版本(“pdfminer”的API在2.x和3.x之间改变了)吗? – Schmuddi