[WP 7.5] WebBrowser 簡體中文亂碼問題

[WP 7.5] WebBrowser 簡體中文亂碼問題

使用WebBrowser瀏覽網頁時,有時候會有需要截取網站的內容

在部分的簡體中文網站,當瀏覽後透過WebClient或者HttpWebRequest的方式

以UTF8編碼來進行原始碼截取

會出現亂碼的情況,eq:土豆網掏寶網等。

查看一下他們的原始碼

以土豆網為例


<!DOCTYPE html>
<html>
<head>
<meta charset="gbk"/>
<title>土豆网_每个人都是生活的导演_在线视频观看,原创视频上传,海量视频搜索</title>

當有設定<meta charset="gbk">時

採用Encoding.UTF8會解碼不出來導致一些亂碼情況發生

 

這時候

可以到codeplex去下載這個專案

他提供GB2312的編碼方式來協助解決問題

可以將GB2312Encoding.cs 和 gb2312.bin這兩個檔案複製到自己的專案上

再將gb2312.bin建置動作改為Embedded Resource(內嵌資源)

在自己的專案中可以使用GB2312.GB2312Encoding


GB2312.GB2312Encoding Encoding = new GB2312.GB2312Encoding();

即可解決亂碼問題

但是繁體中文網站拿到的原始碼就可能怪怪的