【R】Ubuntu + R+RSelenium 使用phantomjs
網頁自動化流程使用R來完成。 有些動態網站無法直接使用rvest 或是 httr 的方式爬取資料。是需要透過點選一些項目之後,才有辦法在網站上呈現內容的情況下,就需要使用 RSelenium 的package 在Windows和ubuntu server的環境下架設方式有些許不同 在Windows下 [...]
網頁自動化流程使用R來完成。 有些動態網站無法直接使用rvest 或是 httr 的方式爬取資料。是需要透過點選一些項目之後,才有辦法在網站上呈現內容的情況下,就需要使用 RSelenium 的package 在Windows和ubuntu server的環境下架設方式有些許不同 在Windows下 [...]
最近發現的一個奇怪的問題。 從osboxorg下載的VM檔,嘗試使用 getURL下載資料,但不指定encoding時,抓中文網頁,竟然會出現亂碼。 已經知道他會預設使用 ISO-8859-1的編碼,但是為什麼不使用 UTF-8呢? 文件裡的說明 .encoding an integer [...]
儘量記錄下來所有的操作步驟.以後可以當筆記使用 1.下載 ubuntu server 19.04版本的 vmdk檔案 在osboxes網站下載所需要的vmdk檔案 Ubuntu Server 19.04 [...]
利用 unique的方式。若所有數字都長樣的話,unique之後長度會等於1。 即可馬上比較出來是否多個數字是一樣的
要先建立一個 template.docx 檔。 設定好邊界之後。再用以下的語法套入範本的 template.docx。 這樣輸出之後,就會依照範本檔出來的邊界。 [...]
看了一下,這裡R語言的資源真是相當的多。中文的部份。 但是感覺在台灣還是沒這麼風行。 R語言在資料科學的領域,方面似乎都可以有相當完整應用。 下面參考資料要慢慢學習了 https://bookdown.org 網站上的書籍大全 按更新日期排序 https://bookdown.org/home/archive/ 按作者排序 https://bookdown.org/home/authors/ 《R語言教程》,北京大學李東風老師作品 http://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html [...]
https://www.rstudio.com/resources/cheatsheets/ 一個官方已經整理好的資料表,包含了大部份常用的 package 裡常用的資料,簡介。 透過這些簡介應該可以更快速找到自已要的功能,再去尋找相關的說明文件更深入的了解 最近有在看一些。 Data Transformation Cheat Sheet R [...]
原本的 R 版本為 R version 3.5.4 不過因為系統更新的關系 就被更新到 R version [...]
學習正規化 https://verbalexpressions.github.io/ 一個比較簡單不用記法的套件 R的套件看起來是最近的時候才釋出的。原本好像是用在JS上比較多。 最多星級的是在 JS上,看起來有一萬多個星 https://github.com/VerbalExpressions/JSVerbalExpressions R的部份有一百多 https://github.com/VerbalExpressions/RVerbalExpressions 基本上看他語法可以大概知道要怎麼做,不過初次使用還是要試一下才知道 [...]
有寫了一些code。 想抓一些資料在excel整理一下。看會不會比較有幫助。 看可以比價尿布之類的