Month: July 2015

July 31, 2015 / / a crawler a day

R crawler學員大家好: 工作忙碌之餘,是否想學習股神巴菲特或大鱷索羅斯的投資神技呢? 不過隨著大神們不斷改變持股,書中情報不免成為過期的參考標的,既然對投資有興趣,何不寫支爬蟲爬回第一手資料來分析研究? 目標網站: http://www.ibillionaire.me/billionaires/ 目標爬取資料(基礎題): 任選一個你想學習的大神投資人,爬下Portfolio(投資組合)。 爬完最新一季的,記得按下旁邊的齒輪圖案,爬下過去的歷史資料。 目標爬取資料(進階題): 將游標移動到圓餅圖上不同顏色的區塊,股票所屬的產業與股號才會依序顯示,並非一次全部顯示。 爬下圓餅圖的產業、比例、股號與回報率。本題稍難,屬於re的應用題。 學習技術: GET re…

Read the Post20150731 A CRAWLER A DAY:投資資料爬蟲 -> 分析 -> 策略實戰

July 30, 2015 / / a crawler a day

物價的波動有時候會反應在股價上,在股價發生改變前,物價早已改變。在2013年的春天,記憶體的價格在二月開始瘋狂上揚,隨即與記憶體相關的個股在三月開始飆漲,有觀察到此現象的強者們,紛紛都因此賺了一筆。而amozon上各商品的物價變化就是一個不錯的觀察目標,因為價格變化十分即時,藉此便可掌握先機! 目標網址:http://www.amazon.com/ 目標資料: 各家廠牌RAM的價格 自己找一個有興趣的商品來玩玩吧~~ 學習技巧: GET 貢獻網址: https://github.com/datasci-info/ACrawlerADay  (請大家將解法貢獻至此)

Read the Post20150729 A CRAWLER A DAY:amazon 商品價格與名稱

July 29, 2015 / / archlinux 各種雷
July 29, 2015 / / a crawler a day

想必不少人都是看YAHOO新聞長大的。不過,其實YAHOO本身是沒有能力自己製作新聞,都是到處轉載的。這讓人懷疑,YAHOO是否會偏好某些媒體呢?不同新聞性質是否偏好也會不同?這似乎可以好好來觀察觀察。 目標網址:https://tw.news.yahoo.com/ 目標資料: YAHOO的新聞來源。 不同性質的新聞,其來源分布情形。 學習技巧: Xpath CSS GET 貢獻網址: https://github.com/datasci-info/ACrawlerADay  (請大家將解法貢獻至此)

Read the Post20150728 A CRAWLER A DAY:YAHOO新聞大多是用抄的

July 29, 2015 / / archlinux 各種雷

解法: http://news.softpedia.com/news/How-to-Activate-Wireless-on-Arch-Linux-359094.shtml

Read the PostArch Linux 在 Gnome 桌面 Wifi icon 不見問題

July 27, 2015 / / a crawler a day
July 27, 2015 / / courses