[WP 7.5] WebBrowser 簡體中文亂碼問題
使用WebBrowser瀏覽網頁時,有時候會有需要截取網站的內容
在部分的簡體中文網站,當瀏覽後透過WebClient或者HttpWebRequest的方式
以UTF8編碼來進行原始碼截取
查看一下他們的原始碼
以土豆網為例
<!DOCTYPE html>
<html>
<head>
<meta charset="gbk"/>
<title>土豆网_每个人都是生活的导演_在线视频观看,原创视频上传,海量视频搜索</title>
當有設定<meta charset="gbk">時
採用Encoding.UTF8會解碼不出來導致一些亂碼情況發生
這時候
可以到codeplex去下載這個專案
他提供GB2312的編碼方式來協助解決問題
可以將GB2312Encoding.cs 和 gb2312.bin這兩個檔案複製到自己的專案上
再將gb2312.bin建置動作改為Embedded Resource(內嵌資源)
在自己的專案中可以使用GB2312.GB2312Encoding
GB2312.GB2312Encoding Encoding = new GB2312.GB2312Encoding();
即可解決亂碼問題
但是繁體中文網站拿到的原始碼就可能怪怪的