W I D M
載人家的資料庫
處女座 張國斌
Crawler
的用途
讓電腦
去別人的網站裡 快速的 載資料
為甚麼要有
Crawler
拿到資料 的方法
産學合作
自已想要的不一定是
以 都各有優缺
數量限制 産學合作
資料準確
以 都各有優缺
容易 得 整理好
甚至有可能是 幕資料
那 Crawler 呢?
它 可以
完 自由
找到害網站
2
1 3 4 5
找出有資料的 網頁的url 清單
有資料的載 網頁
從網頁中出 資料
想幹嘛 就幹嘛
使用 方法
如何得到 url 清單
流水號id 標題頁
流水號id 例子
http://okgo.tw/butyview.html?id=1
標題頁 例子
http://www.mobile01.com/wayp ointlist.php?list=1&c=3&s=desc
&pid=0&p=1
標題頁 清單:
流水號 頁碼
一頁 按鈕
示範時間
要傳參數才能看到 想要的網頁
以 是一些困難
才能看到要登入 資料的網頁
Javascript
放參數
放參數~~
示範時間
登入後才看到的網頁
1. 登入
2. 把cookies儲存 來
3. 存 需要 載的網頁
示範時間
Javascript
我意思是 …
現在要介紹一個 萬能的方法
瀏覽器
點擊動作
等待頁面loading 之類的都可以
瀏覽器例子
示範時間
解析
從HTML裡 出資料
解析 例子
示範時間
Proudly made
by Kpboy.
With from NCU.
S o u r c e C o d e