2013年10月4日 星期五 晴

昨天在网上爬电子书的时候,发现要用到unescape。搜了半天,有两个现成的库可以调用,我最后选的是方法一,如下:

  • 方法一
from xml.sax.saxutils import unescape
def handleContent(text):
return unescape(text, {'"':'"'})
  • 方法二
import HTMLParser
def handleContent(text):
return HTMLParser.HTMLParser().unescape(text)

Python 2.x是这样的,Python3.x的写法不一样。