18910140161

使用Python将HTML中的标题替换为粗体-堆栈溢出

顺晟科技

2022-10-18 12:35:47

147

我有一些像这样的HTML文本:

'<H1 LANG="es-ES" CLASS="western" STYLE="text-indent: -0.5cm; line-height: 100%"><FONT FACE="Arial, sans-serif"><FONT SIZE=3>some_text_here</FONT></FONT></H1>'

较大的HTML文本中。我想自动识别所有这样的标题,并将其更改为简单的粗体文本:

'<B LANG="es-ES" CLASS="western" STYLE="text-indent: -0.5cm; line-height: 100%"><FONT FACE="Arial, sans-serif"><FONT SIZE=3>some_text_here</FONT></FONT></B>'

使用正则表达式并不是最好的,因为有时标题开始和结束在不同的行上。


顺晟科技:

您可以使用BeautifulSoup,但一种简单的方法是使用以下形式的re.sub()

   html_content = re.sub("<H\d", "<B", html_content)
   html_content = re.sub("<\/H\d>", "</B>", html_content)
  • TAG:
相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航