我有一个原始的HTML文件看起来像这样(的内容可能随时改变,我们都知道,这是一个有效的HTML文件):突出显示文本programmaticly
<HTML>
<BODY>
<h1>Hello World</h1>
<p>
This is my paragraph
</p>
<div>
another text
</div>
</BODY>
</HTML>
现在,我想突出显示此HTML文件中的一些文本部分。 假设我想突出显示文字:“世界这是我的另一段”。
预期输出:
<HTML>
<BODY>
<h1>Hello <mark>World</mark></h1>
<p>
<mark>This is my paragraph</mark>
</p>
<div>
<mark>another</mark> text
</div>
</BODY>
</HTML>
您有:
- 原始的HTML文件(如上所示)
- ,你肯定知道出现内一个句子HTML的文本版本。请注意,这个句子可以放在多个HTML节点中(如上例所示,父节点:h1,p和div)。
- 一个用于自动执行突出显示过程的python脚本脚本文件。
虽然那个正则表达式是开始寻找解决方案的好地方。但是,一旦我进入一个场景,文本与多个父母分离,我就陷入了困境。更重要的是,可以在单词之间放置另一个元素(例如,img)。
寻找提示,在哪里可以找到解决方案?
你的问题是** **尚不清楚,如果A)你想要我们写程序对你来说,这是**过于宽泛**(通常是令人难以接受的,甚至足够窄时不要太因为SO不是代码编写服务); B)请求我们为您找到一个这样做的库,这是一个异地资源的请求,这是** off-topic:资源请求**;或C)调试代码的请求,即** off-topic:无MCVE **,除非您提供调试[help/on-topic]中的问题所需的所有内容,包括[MCVE],但您已提供尽管说过你曾尝试过,但没有任何代码。 – Makyen