偶爾更新的網誌|brian@connie-brian.com

R語言

主頁/R語言

【R】Ubuntu + R+RSelenium 使用phantomjs

By |2019-11-14T11:00:01+08:009 月 26th, 2019|R語言|

網頁自動化流程使用R來完成。 有些動態網站無法直接使用rvest 或是  httr 的方式爬取資料。是需要透過點選一些項目之後,才有辦法在網站上呈現內容的情況下,就需要使用 RSelenium 的package 在Windows和ubuntu server的環境下架設方式有些許不同 在Windows下 [...]

【R】getURL 若無指定encoding 會出現亂碼的問題

By |2019-09-06T15:42:43+08:009 月 6th, 2019|R語言|

最近發現的一個奇怪的問題。 從osboxorg下載的VM檔,嘗試使用 getURL下載資料,但不指定encoding時,抓中文網頁,竟然會出現亂碼。 已經知道他會預設使用 ISO-8859-1的編碼,但是為什麼不使用 UTF-8呢? 文件裡的說明 .encoding an integer [...]

【R語言】參考資料、網站資料

By |2019-07-14T22:24:44+08:007 月 14th, 2019|R語言|

看了一下,這裡R語言的資源真是相當的多。中文的部份。 但是感覺在台灣還是沒這麼風行。 R語言在資料科學的領域,方面似乎都可以有相當完整應用。 下面參考資料要慢慢學習了 https://bookdown.org 網站上的書籍大全 按更新日期排序 https://bookdown.org/home/archive/ 按作者排序 https://bookdown.org/home/authors/ 《R語言教程》,北京大學李東風老師作品 http://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html [...]

【R語言】RStudio Cheat Sheets 常用函數資料表

By |2019-07-12T09:43:04+08:007 月 12th, 2019|R語言|

https://www.rstudio.com/resources/cheatsheets/ 一個官方已經整理好的資料表,包含了大部份常用的 package 裡常用的資料,簡介。 透過這些簡介應該可以更快速找到自已要的功能,再去尋找相關的說明文件更深入的了解 最近有在看一些。 Data Transformation Cheat Sheet R [...]

【R語言】最近為了用Regex 正規化 找到了一個套件 RVerbalExpressions

By |2019-06-02T23:32:30+08:006 月 2nd, 2019|R語言|

學習正規化 https://verbalexpressions.github.io/ 一個比較簡單不用記法的套件 R的套件看起來是最近的時候才釋出的。原本好像是用在JS上比較多。 最多星級的是在 JS上,看起來有一萬多個星 https://github.com/VerbalExpressions/JSVerbalExpressions R的部份有一百多 https://github.com/VerbalExpressions/RVerbalExpressions 基本上看他語法可以大概知道要怎麼做,不過初次使用還是要試一下才知道 [...]