2013年10月4日 星期五 晴
昨天在网上爬电子书的时候,发现要用到unescape。搜了半天,有两个现成的库可以调用,我最后选的是方法一,如下:
- 方法一
from xml.sax.saxutils import unescape
def handleContent(text):
return unescape(text, {'"':'"'})
- 方法二
import HTMLParser
def handleContent(text):
return HTMLParser.HTMLParser().unescape(text)
Python 2.x是这样的,Python3.x的写法不一样。
...