Learning by Hacking Posts

July 6, 2015 / / a crawler a day

在大家的心目中,大家會 「相信」 樂透是有規律的?還是沒有規律的呢? 有時候,規律這種東西也很妙,只有在你相信有的時候,才會去尋找 … 即使,最後發現找不到,也算是 「 尋找後,發現沒有!」 但是,一旦你相信 「沒有」 的時候,通常是連驗證都不會去驗證的唷! 目標網站:http://www.nfd.com.tw/lottery/49-year/49-2015.htm 爬取資料: 樂透的歷史資料? 深入思考:…

Read the Post20150706 A Crawler A Day:樂透歷史資料抓取與回測

July 5, 2015 / / a crawler a day

想當年宅男們在Alltogether版闖盪,往往發現適合自己的女生時,已經為時已晚,對方可能已經收到了幾百封信,甚至有些女孩子太完美了,在宅宅看到文章之前,文章早已經因為響應太過踴躍,而被作者刪除。 這時,掌握女孩PO文的時間,可能將會是成功的關鍵之一。 所以,進擊吧~~~宅男~~~HACK 出PTT Alltogether版的女生PO文時間! 目標網站:https://www.ptt.cc/bbs/AllTogether/index.html 學習 or 複習爬技術: CurlSSL config GET 貢獻網址:https://github.com/datasci-info/ACrawlerADay  (請將大家的解法貢獻至此)  

Read the Post20150705 A CRAWLER A DAY:PTT Alltogether版的女生PO文時間

July 4, 2015 / / a crawler a day
June 29, 2015 / / courses
June 29, 2015 / / Crawler 102

一般來說,我們都希望站在資訊不對稱的一端 …

以個人來說,你是否會想知道,最近的近三個月之中,有哪些朋友,常在你的 Facebook 上按讚與留言的呢?想要偷偷的知道一下,到底有哪些朋友在關注自己呢?

(當個自己的小小徵信社)

或是,你是否曾經使用 Facebook API 來抓取一些朋友或粉絲團的資料,想要抓取大量資料,但卻苦於 token 每兩個小時就會 expired 一次,無法自動更新呢?(覺得每次抓資料前,都要去 Graph Explorer 剪下貼上一次,很麻煩!)

Read the Post 站在資訊不對稱的一端 …

June 24, 2015 / / a crawler a day

為了讓上過木刻思開的爬蟲課的學員們 (目前開過 Python & R 的課),能有更多練習的機會。 我們特別企劃了一個爬蟲的練習活動:A Crawler A Day http://data-sci.info/a-crawler-a-day/ (將於 7/4 的課程說明會,與蟲友小聚時正式上線,每天都會有一到新題目在網站上公告!) 讓大家可以在學習之餘,也能有更多練習和玩耍的機會!…

Read the PostA Crawler A Day 爬蟲寫作練習

June 24, 2015 / / courses
June 24, 2015 / / courses

報名網址: http://agilearning.kktix.cc/events/rcrawler 粉絲團網址: https://www.facebook.com/datasci.info  

Read the PostR Crawler 101