html decode in java
這個問題是從爬文抓下來的html資料,有一些特殊的html編碼,
為了將這些編碼轉成人看得懂的文字,而找特別去找Java是否能夠將Html編碼成中文字,如〜→〜
先從網路找,online的html decode工具。
http://www.opinionatedgeek.com/dotnet/tools/htmlencode/decode.aspx
接著再用google查html decode java
就找到
接著去使用他的函式,
import org.apache.commons.lang.StringEscapeUtils;
StringEscapeUtils.unescapeHtml(htmlDecodeString);