讀取網頁原始碼1 (Python)

讀取網頁原始碼1 (Python)

參考來源
需先安裝pywin32 才可import win32com.client

需抓跟自己python 同版本的,我用的是2.5

以下為code

 

 


import win32com.client
from time import sleep

ie = win32com.client.Dispatch("InternetExplorer.Application")
ie.Visible = 0
ie.Navigate('http://class.ruten.com.tw/category/sub00.php?c=0022000200150004')

while True:
    state = ie.ReadyState
    if state == 4:
        break
        sleep(1)

print ie.Document.body.innerHTML

 


如有錯誤 歡迎指正