辦了一個Github帳號 未來會把code都放在那

https://github.com/kurthung1224

 

linux端安裝

yum install git-core

使用指令

git clone xxxx.git

來sync往需要的code

 

 

Demo1是這學期修課的作業 由http://untroubled.org/spam/ 這網站下載2010~2015/4的垃圾郵件來做分析

1. 由Logstash抽取資料到ElasticSearch的語法

2. Top 100的垃圾郵件IP來源

3. 使用Kibana拉出相關的dashboard

4. 萃取出5種垃圾郵件的特徵

5. 使用Mahout或Spark做k-means運算 我是使用Spark

文章標籤
全站熱搜
創作者介紹
創作者 kurthung1224 的頭像
kurthung1224

Kurt && Hadoop && Spark

kurthung1224 發表在 痞客邦 留言(0) 人氣(25)