Learning by Hacking Posts

April 2, 2016 / / RCrawler101

最近被人資要求提供過去三個月每天的行程,這讓我有點困擾,花了頗多時間去回想,畢竟我總是四處漂泊不定啊~~~

為了讓我之後不要再為這種小事煩惱,我用R寫了一個小爬蟲來記錄自己的行蹤。

Read the Post 自動記錄自己的行蹤

February 19, 2016 / / Git101

Github現在可以直接將local端的檔案以拖曳的方式上傳檔案了,真是越來越方便了。拖曳之後,也可以直接在網頁介面上進行commit。 直接拖曳檔案到repository。 2. 自動跑出commit的畫面。 3. commit 完就結束了。 真的是超簡單啊~~~~ But!!! 如果這個respository被很多人修改的時候,似乎就有點怪怪的了~ 嘗試讓兩人同時改一個檔案並且上傳,後來上傳者居然不會引發conflict,還直接蓋過之前的檔案! 舉例: 兩人同時更改text.txt並且上傳同一repository。其中一人的commit的進度較舊,上傳之後自動蓋過原檔案。 雖然可以拖曳上傳,還可以commit,自動記錄歷史紀錄,但是居然不會產生conflict,這對版本控制來說,將會是一大隱憂。所以,建議還是乖乖add–>commit–>push,乖乖解conflict吧!   順便工商服務一下,木刻思的git…

Read the PostGithub 也可以拖曳上傳檔案了

January 17, 2016 / / courses

感謝我們的工作人員–呂奕,給了一篇文章介紹爬蟲用的新套件, 轉貼網址:http://leoluyi.logdown.com/posts/432582-xmlview-package 在寫爬蟲的過程中,常需要針對取得的 html 檢查內容,並用 XPath 或 CSS selector 擷取所需要的資料區塊。但在使用 IDE 撰寫腳本時,要做到這些事必須要把 html 的文本內容 print…

Read the Post在 RStudio 檢視 xml/html 的工具:xmlview Package

January 12, 2016 / / Git101

千呼萬喚始出來!木刻思歷經了多少風雨,才隆重推出Git 101課程,勢必要讓大家3天成為Git高手! 想要好好學GIt的話,就不要猶豫了,趕快報名吧! 課程報名: http://datasci.kktix.cc/events/git101-201603 如果你還是想多瞭解一點課程內容,歡迎到課程說明會聽聽看喔~ 課程說明會: http://datasci.kktix.cc/events/gitinfo-201601

Read the PostGit 101課程

January 12, 2016 / / courses

在Mac上安裝Git幾乎可以說比windows還簡單數倍,幾個簡單的步驟就完成了,按照以下作法,瞬間就完成了~~~ 在應用程式搜尋terminal,並且打開。 打開終端機後輸入git,按下enter 接著,Mac會告訴你沒有git,所以要按下『安裝』 然後,『同意』許可協議 最後,就完成啦~~ 之後,就可以在terminal上執行各種git指令囉~~~簡直簡單到爆炸!

Read the Post在Mac安裝Git超簡單~~~

November 21, 2015 / / courses
October 24, 2015 / / courses

感謝我們的工作人員–仲昇,給了一篇文章解釋HTTP Method 轉貼網址:http://mikuweb.blogspot.tw/2015/10/http-methodgetpost4method.html HTTP協定中定義了多種不同的method,瀏覽器或是其他程式再進行HTTP連線時,會使用這些method來進行連線並取得回復。 這些method到底有甚麼差別呢? 這裡列舉常見的六種HTTP Method分別是head,get,post,delete,put,patch。 其實還有很多其他得Method,為甚麼要特別提到這六種呢?因為這六種跟網頁的資料有非常大的關係。 先從最常見的get和post說起吧。 一個剛接觸網頁的人或是早期用PHP寫網頁的人常常混用get和post,因為兩者的功能基本上是相同的,而且以前主流是使用網址的Query String和不同的URL來區分功能(比如上傳和搜尋),但是現在愈來愈多網頁用API導向,也就是一個URL負責一個「業務」,對於上傳和瀏覽分別用不同的Method來處理。 舉例來說,我們現在有一個可以留言的留言板,我們通常會使用get來取得現在的留言,而要新增新的留言時,我們會post到這個位置(有點像是問服務生今天的菜單,然後跟同一個服務生點餐)。一些比較早期的網頁則可能混用get和post,把瀏覽留言和新增留言放在不同網址(有點像把領錢和存錢規劃在不同櫃台辦理)。 所以我們現在知道,不同的Method就是對同一件事情做不同的操作。 再來舉服務生點餐的例子, 假設現在我們要點餐,我們必須先知道菜單是甚麼(get),…

Read the Post常見的HTTP Method的不同性質分析:Get,Post和其他4種Method的差別

October 23, 2015 / / courses

感謝Adrian幫忙解題,藉由Adrian在Forum的回答,解開許多人可能還沒搞懂的lambda與map之謎…… 有相同疑問的朋友,可以看看以下連結的回覆喔~~~ GENERATOR, ITEARTOR, MAP 的寫法

Read the Postlambda & map

October 22, 2015 / / PyCrawler 101

雖然網路上免費的課程很多,可是八成以上都是英文的,用英文去學自己不會的東西,這個困難度我曾親身體會,如果可以負擔得起,買一些中文參考書輔助學習會更有效。 所以關於學員問到有沒有Python跟爬蟲的參考書,我就自己看過跟使用中的參考書作為答覆。 一般來說,外商如歐萊禮的書都蠻貴的,但有一定的專業深度。台灣自己人寫的書較便宜,不過就比較偏入門指引。 請依照個人能力與荷包做評估。 中文參考書: R: R錦囊妙計,歐萊禮 (在資策會我看的是這本,對R新兵非常有幫助) Python Python程式設計入門,博碩 (我自己也是這行的新兵,所以最常看這本,我覺得目前最常用最好用就是這本了) Python錦囊妙計第三版,歐萊禮 (我前輩推薦這本,但內容講很多Python 3跟不少進階用法,建議有些程度再來看可能才會覺得實用) Crawler…

Read the PostR / Python / Crawler各種參考書