• 検索結果がありません。

lecture WIDM Lab Tutorial 2016 Web Intelligence and Data Mining Laboratory crawler

N/A
N/A
Protected

Academic year: 2018

シェア "lecture WIDM Lab Tutorial 2016 Web Intelligence and Data Mining Laboratory crawler"

Copied!
28
0
0

読み込み中.... (全文を見る)

全文

(1)

W I D M

載人家的資料庫

(2)

處女座 張國斌

(3)

Crawler

的用途

讓電腦

去別人的網站裡 快速的 載資料

(4)

為甚麼要有

Crawler

(5)

拿到資料 的方法

産學合作

(6)

自已想要的不一定是

以 都各有優缺

數量限制 産學合作

(7)

資料準確

以 都各有優缺

容易 得 整理好

甚至有可能是 幕資料

(8)

Crawler 呢?

(9)

它 可以

完 自由

(10)

找到害網站

2

1 3 4 5

找出有資料的 網頁的url 清單

有資料的 網頁

從網頁中 資料

想幹嘛 就幹嘛

使用 方法

(11)

如何得到 url 清單

流水號id 標題頁

(12)

流水號id 例子

http://okgo.tw/butyview.html?id=1

(13)

標題頁 例子

http://www.mobile01.com/wayp ointlist.php?list=1&c=3&s=desc

&pid=0&p=1

標題頁 清單:

流水號 頁碼

一頁 按鈕

(14)

示範時間

(15)

要傳參數才能看到 想要的網頁

以 是一些困難

才能看到要登入 資料的網頁

Javascript

(16)

放參數

(17)

放參數~~

(18)

示範時間

(19)

登入後才看到的網頁

1. 登入

2. 把cookies儲存 來

3. 存 需要 載的網頁

(20)

示範時間

(21)

Javascript

我意思是

現在要介紹一個 萬能的方法

(22)

瀏覽器

點擊動作

等待頁面loading 之類的都可以

(23)

瀏覽器例子

(24)

示範時間

(25)

解析

從HTML裡 出資料

(26)

解析 例子

(27)

示範時間

(28)

Proudly made

by Kpboy.

With from NCU.

S o u r c e C o d e

参照

関連したドキュメント

フロートの中に電極 と水銀が納められてい る。通常時(上記イメー ジ図の上側のように垂 直に近い状態)では、水

第二の,当該職員の雇用および勤務条件が十分に保障されること,に関わって

Q7 

[r]

また、手話では正確に表現できない「波の音」、 「船の音」、 「市電の音」、 「朝市で騒ぐ 音」、 「ハリストス正教会」、

[r]

3R・適正処理の促進と「持続可能な資源利用」の推進 自然豊かで多様な生きものと 共生できる都市環境の継承 快適な大気環境、良質な土壌と 水循環の確保 環 境 施 策 の 横 断 的 ・ 総

3R・適正処理の促進と「持続可能な資源利用」の推進 自然豊かで多様な生きものと 共生できる都市環境の継承 快適な大気環境、良質な土壌と 水循環の確保 環 境 施 策 の 横 断 的 ・ 総