筆者寄語:批量讀取目前看到有以下幾種方法:xlsx包、RODBC包、批量轉(zhuǎn)化成csv后讀入。本章來自博客:http://www.cnblogs.com/weibaar/p/4506144.html
在上面的嘗試已經(jīng)發(fā)現(xiàn),xlsx本身就是這個復(fù)雜問題的最根本原因。與之相反,R對csv等文本格式支持的很好,而且有fread這個神器,要處理一定量級的數(shù)據(jù),還是得把xlsx轉(zhuǎn)化為csv格式。
以此為思路,在參考了兩個資料后,我成功改寫了一段VBA,可以選中需要的xlsx,然后在其目錄下新建csv文件夾,把xlsx批量轉(zhuǎn)化為csv格式。
代碼如下:
Sub getCSV()
'這是網(wǎng)上看到的xlsx批量轉(zhuǎn)化,而改寫的一個xlsx批量轉(zhuǎn)化csv格式
'1)批量轉(zhuǎn)化csv參考:http://club./thread-1036776-2-1.html
'2)創(chuàng)建文件夾參考:http://jingyan.baidu.com/article/f54ae2fcdc79bc1e92b8491f.html
'這里設(shè)置屏幕不動,警告忽略
Application.DisplayAlerts = False
Application.ScreenUpdating = False
Dim data As Workbook
'這里用GetOpenFilename彈出一個多選窗口,選中我們要轉(zhuǎn)化成csv的xlsx文件,
file = Application.GetOpenFilename(MultiSelect:=True)
'用LBound和UBound
For i = LBound(file) To UBound(file)
Workbooks.Open Filename:=file(i)
Set data = ActiveWorkbook
Path = data.Path
'這里設(shè)置要保存在目錄下面的csv文件夾里,之后可以自己調(diào)
'參考了里面的第一種方法
On Error Resume Next
VBA.MkDir (Path & "\csv")
With data
.SaveAs Path & "\csv\" & Replace(data.Name, ".xlsx", ".csv"), xlCSV
.Close True
End With
Next i
'彈出對話框表示轉(zhuǎn)化已完成,這時去相應(yīng)地方的csv里查看即可
MsgBox "已轉(zhuǎn)換了" & (i-1) & "個文檔"
Application.ScreenUpdating = True
Application.DisplayAlerts = True
End Sub
操作很簡單:
把代碼復(fù)制進excel的vba編輯器里,然后運行g(shù)etcsv這個宏,會跳出一個窗口,要求選擇你要轉(zhuǎn)化的xlsx文件。(可多選)
選中以后,等一段時間,再回到xlsx文件下,會多一個csv文件夾,里面就是我們要導(dǎo)入R的文本文件了。
這個方法的好處是:
1、操作簡單,直接依托于excel的VBA操作,不用配置java環(huán)境,之后溝通成本/換電腦成本小
2、特別適用于有一定數(shù)據(jù)量,但是數(shù)據(jù)格式整齊的文件,譬如從某數(shù)據(jù)端讀入的數(shù)據(jù)。用fread還可以控制讀取的行(skip=NNN),代碼寫入整潔方便。就算有一些異行數(shù)據(jù),也可以事先用VBA進行操作,簡單方便。
——————————————————————————————————————————————
讀入R數(shù)據(jù)庫可以用lappy來讀?。?/strong>
#lapply讀取法
filenames <- list.files("C:/Users/a.csv", pattern = ".csv",full.names = TRUE) #變成list格式
#沒有full.names = TRUE,都會出現(xiàn)cannot open file: No such file or directory
name=function(x) {
read.csv(x,header=T)
}
datalist <- lapply(filenames,name) #filenames執(zhí)行name函數(shù)
——————————————————————————————————————————————
其中需要強調(diào)一點WPS excel怎么加載宏
1、WPS excel本身是沒有宏功能的,需要自己加載;
2、加載一個.exe,安裝好了,即可。
就需要下載一個“wps的vba模塊”,這個模塊下載鏈接:
鏈接:http://pan.baidu.com/s/1bnvoigJ

加載好這一個就行了,

然后就是簡單輸入,就可以調(diào)用宏了。

參考:http://office.jb51.net/wps/4961.html
|