我正在使用python的Pypandoc模块。我使用的转换代码是:如何修改从docx转换为HTML时由pandoc输出的HTML?
html = pypandoc.convert(
tmp_loc,
'html5',
extra_args=['--extract-media=']
)
此代码的docx转换成存储在“HTML”,并在同一时间的HTML由名字image01提取从DOCX图像并存储到媒体库.JPG。在HTML中的IMG SRC是:
<img src="/media/image01.jpg" />
现在我想要做的是改变形象的名字,那就是image01.jpg到更方便的名字。我可以轻松更改存储库中图像的名称。但是,如何更新pypandoc输出的HTML中的img src标签?
谢谢
谢谢。我用美丽的汤来修改HTML。有效。 –
@ ArunabhGhosh太棒了!然后随时接受并upvote答案:) – mb21