Python的编码问题

Python的Unicode类可以使用UTF-8编码。
在使用Beautiful Soap对html进行解析的时候,发现用他的string函数返回的字符串怎么处理都会报错。很郁闷。

后来一跟踪,发现居然是使用他自己派生的类,而不是Unicode类。而他对Unicode类的encode函数进行了重写,先decode再encode,导致错误。所以在从BeautifulSoap拿到string的时候一定先Unicode()一下,如下:
unicode(soap.html.head.title.string)

感谢您关注我的个人博客!
为了您的更好的阅读和留言,建议您注册用户,这样您可以获得更大的权限,以及更方便的留言。
注册只需要一分钟的时间。但是您需要提供您的邮箱。注册后,密码会自动发到您的邮箱,请在第一次登录时修改。
我承诺不会将您的Email泄露给他人,或者发送垃圾邮件。

用户登录

我的微博

feedsky
抓虾
google reader
my yahoo
newsgator
bloglines
鲜果
哪吒
有道
QQ邮箱
九点
帮看