創新育成中心-【大數據系列-爬爬爬】

活動日期: 2020/07/26(日)

時間:0930-1230  認證時數:0小時 

地點:政大研總3樓簡報室


承辦單位:育成中心

聯絡人:張副理 0229393091分機67080

E-mail:iehnccu@gmail.com

簡介/

講座姓名:陳有祥

講座現職:漢宏國際物流有限公司資訊總監

FUN 暑假-充電學程式,大數據系列-爬爬爬

大數據時代,要進行數據分析,首先要有數據源,而學習爬蟲,可以讓我們獲取更多的數據源,並且這些數據源可以按我們的目的進行採集,去掉很多無關數據。

在進行大數據分析或者進行數據挖掘的時候,數據源可以從某些提供數據統計的網站獲得,也可以從某些文獻或內部資料中獲得,但是這些獲得數據的方式,有時很難滿足我們對數據的需求,而手動從網際網路中去尋找這些數據,則耗費的精力過大。此時就可以利用爬蟲技術,自動地從網際網路中獲取我們感興趣的數據內容,並將這些數據內容爬取回來,作為我們的數據源,從而進行更深層次的數據分析,並獲得更多有價值的信息。

課程需攜帶設備:請自備筆電及需要有自己熟習的開發環境 (PYTHON) 講師:漢宏國際物流有限公司資訊總監陳有祥

課程簡介:
7月26日(日)
09:30-10:30-Level 1:輕鬆爬 (爬蟲基本結構&簡單實例)
10:30-12:30-Level 2:爬蟲框架Scrapy

PS:此課程建議需要有Python基礎能力,沒有基礎的同學可以先報名本中心開設的【充電學程式,入門體驗工作坊】,報名網址: https://bit.ly/3fMwHfR

報名資訊/

報名資格: 學生

招收名額:15人

本學期缺席超過1次(含)以上者不得報名此活動


報名期間:2020/06/18(四)~2020/07/24(五)