Kurt && Hadoop && Spark

5月 17 週日 201510:06
Github帳號

辦了一個Github帳號未來會把code都放在那
https://github.com/kurthung1224

linux端安裝

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(25)

個人分類：

▲top

5月 03 週日 201522:14
no space left on device

當初我在安裝CentOS時硬碟使用的是default的8GB 結果在做個Big Data專題時把inode給塞爆
造成不系統沒辦法再創建檔案紀錄一下解決過程
df -i

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(130)

個人分類：

▲top

4月 22 週三 201514:44
[Logstash] Failed to open: xxx Permission denied

今天再用logstash把資料pass給Elasticsearch的時候發現當讀的檔案到一定的數量後就會出現此Error
一開始以為是logstash或elasticsearch的bug 最後才發現是系統設定的允許開啟的檔案數的問題
ulimit -n
可以看到目前系統允許可開啟的檔案數量 default顯示1024

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(45)

個人分類：Logstash

▲top

這問題會出現在使用logstash讀入同樣檔名的file時出現但從elasticsearch裡卻完全沒看到我們的資料
使用debug mode只看到logstash不斷的出現
_discover_file_glob: /var/log/test/: glob is: ["/var/log/test/test.json"] {:level=>:debug, :file=>"filewatch/watch.rb", :line=>"117"}

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(55)

個人分類：Logstash

▲top

4月 07 週二 201520:46
Spark shell--Word count --MapReduce練習

使用Spark前最好先學Scala 不然很多程式碼都看不懂雖然他也支援JAVA和Python 但原生的code仍是使用Scala

首先我在spark目錄下建立一個123.txt
內容是

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(329)

個人分類：

▲top

3月 31 週二 201500:08
java.net.ConnectException: Call From master01/192.168.70.101 to master01:10020

今天使用mahout時出現以下exception
java.net.ConnectException: Call From master01/192.168.70.101 to master01:10020

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(15)

個人分類：Hadoop

▲top

3月 17 週二 201519:54
Mahout 1.0編譯(解決 java.lang.IncompatibleClassChangeError) + Clustering + Collaborative Filtering 測試

目前最新的是0.9版但是官方0.9的版本超舊還是用hadoop 1.x編譯的所以當我們在呼叫mahout的Lib時會有以下error

所以一定要重新下載source code自行編譯不要用官方提供的版本...

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(114)

個人分類：Mahout

▲top

3月 17 週二 201517:01
Hadoop 2.6.0 編譯及啟動問題 "Unable to loadnative-hadoop library for your platform"

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
裝了Hadoop 2.6.0後一直會出現這個Warning 本來以為可以忽略但是Sqoop在啟動的時候會有問題所以還是要想辦法解決
因為Apache提供的原生Hadoop bin檔是32bit 我的CentOS是64bit 所以lib會有問題
網路上試了幾種辦法都沒用只好重新compile一版64bit的Hadoop 2.6.0

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(476)

個人分類：Hadoop

▲top

3月 13 週五 201514:04
Spark安裝

去Spark官網下載要的版本 http://spark.apache.org/downloads.html

目前最新是1.2.1

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(316)

個人分類：Spark

▲top

10月 01 週三 201410:51
Hortonworks Hadoop

無意間發現Hortonworks公司有出了一款Hadoop的Sandbox 可以搭配一些Virtual Machine來玩
這在上班時沒有Hadoop機台可以玩的時候偷玩還滿方便的
可以到這邊下載
http://hortonworks.com/products//hortonworks-sandbox/#install

(繼續閱讀...)

kurthung1224 發表在痞客邦留言(0) 人氣(735)

個人分類：

▲top

Kurt && Hadoop && Spark

https://github.com/kurthung1224

Github帳號

no space left on device

[Logstash] Failed to open: xxx Permission denied

Logstash問題: _discover_file_glob: /var/log/test/: glob is: ["/var/log/test/test.json"] {:level=>:debug, :file=>"filewatch/watch.rb", :line=>"117"}

Spark shell--Word count --MapReduce練習

java.net.ConnectException: Call From master01/192.168.70.101 to master01:10020

Mahout 1.0編譯(解決 java.lang.IncompatibleClassChangeError) + Clustering + Collaborative Filtering 測試

Hadoop 2.6.0 編譯及啟動問題 "Unable to loadnative-hadoop library for your platform"

Spark安裝

Hortonworks Hadoop

個人資訊

熱門文章

文章分類

Hadoop (6)

最新文章

動態訂閱

文章精選

文章搜尋

誰來我家

參觀人氣