http://www./anquan/wlgf/2014/0525/10454.html 在已經(jīng)成功安裝Flume的基礎(chǔ)上,本文將總結(jié)使用Flume進(jìn)行數(shù)據(jù)的實(shí)時(shí)收集處理,具體步驟如下: 第一步 ,在$FLUME_HOME/conf目錄下,編寫Flume的配置文件,命名為flume_first_conf, 具體內(nèi)容如下: #agent1表示代理名稱 agent1.sources=source1 agent1.sinks=sink1 agent1.channels=channel1 #Spooling Directory是監(jiān)控指定文件夾中新文件的變化,一旦新文件出現(xiàn),第二步 ,編寫Shell腳本,執(zhí)行Flume任務(wù) vi flume1.sh
#!/bin/sh
flume-ng agent -n agent1 -c conf -f /home/yujianxin/flume/apache-flume-1.4.0-bin/conf/flume_first_conf
-Dflume.root.logger=DEBUG,console >./flume1.log 2>&1 & 讓日志收集任務(wù)以后臺(tái)進(jìn)程運(yùn)行,且將運(yùn)行日志重定向到 ./flume1.log 保存。 驗(yàn)證 通過命令行查看新啟的進(jìn)程
不斷往Flume監(jiān)控的目錄/home/yujianxin/hmbbs1 下放置文件
查看./flume.log運(yùn)行日志,截部分關(guān)鍵圖如下
查看 成功上傳到HDFS中的文件
OK!使用Flume自動(dòng)監(jiān)控指定目錄下文件的變化,自動(dòng)處理,上傳到HDFS。比以前自己寫Shell腳本方便、快捷、高效多了,哈哈 |
|