现在我正在维基百科上工作。在很多文章中,我注意到一些URL,例如,https://www.google.com/search?q=%26%E0%B8%89%E0%B8%B1%E0%B8%99,很长。该示例网址可以替换为“https://www.google.com/search?q=%26ฉัน”(ฉัน是泰语),它更短,更干净。但是,当我使用urllib.unquote函数来解码URL时,它甚至会解码%26,并因此得到“https://www.google.com/search?q= &ฉัน”。正如你可能已经注意到的,这个URL是无用的;它没有形成有效的链接。只解码网址非ASCII字符
因此,我想知道如何获得解码链接,而它是有效的。我认为只解码非ASCII字符会得到有效的URL。这是对的吗?以及如何做到这一点?
谢谢:)