偶爾更新的網誌|brian@connie-brian.com

R

主頁/Tag: R

【R】Ubuntu + R+RSelenium 使用phantomjs

By |2019-11-14T11:00:01+08:009 月 26th, 2019|R語言|

網頁自動化流程使用R來完成。 有些動態網站無法直接使用rvest 或是  httr 的方式爬取資料。是需要透過點選一些項目之後,才有辦法在網站上呈現內容的情況下,就需要使用 RSelenium 的package 在Windows和ubuntu server的環境下架設方式有些許不同 在Windows下 [...]

【R】getURL 若無指定encoding 會出現亂碼的問題

By |2019-09-06T15:42:43+08:009 月 6th, 2019|R語言|

最近發現的一個奇怪的問題。 從osboxorg下載的VM檔,嘗試使用 getURL下載資料,但不指定encoding時,抓中文網頁,竟然會出現亂碼。 已經知道他會預設使用 ISO-8859-1的編碼,但是為什麼不使用 UTF-8呢? 文件裡的說明 .encoding an integer [...]