我试图从https网站(Salesforce)生成网页的PDF。 我到目前为止尝试过使用simple_salesforce,它返回一个sessionID(cookie)无济于事。创建需要使用pdfkit登录的https网页的PDF
from simple_salesforce import Salesforce
import pdfkit
sf = Salesforce(username='my username'
,password='my password'
,security_token= 'my API security token')
path_wkthmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf=bytes(path_wkthmltopdf, 'utf8'))
options1 = {
'page-size': None,
'margin-top': None,
'margin-right': None,
'margin-bottom': None,
'margin-left': None,
'encoding': None,
'custom-header' : None,
'cookie': sf.session_id,
'no-outline': None
}
pdfkit.from_url('https://thiess.my.salesforce.com/0069000000IZH71','out.pdf',
configuration=config, options=options1)
任何人都知道将cookie参数传递到pdfkit的最佳方式是什么?
脚本中有一些拼写错误,但在修复它们之后,这个东西起作用了,但只是有点。显然,从request.get调用生成的html格式扭曲了网页的布局,因此虽然内容在那里,但外观却完全不同。你知道任何其他格式能更好地保持页面的外观吗? –
然后,您应该使用相同的方法,但使用BeautifulSoup。 –
美丽的汤将链接返回到图像,当传递给pdfkit时,会遇到同样的问题,pdfkit不会自己处理验证过程。 –