hive, MySQL, sqoop, R wrap up 및 참조 url
1. hive설치 및 mysql설치 및 연동
mysql 및 hive 설치는 이전포스터에 있다. 가장 삽질많이한곳.
이틀동안 막다른 곳에 있다가 결국 instance 새로 생성하고 차례대로해서 처음부터 다시하면서 성공함..
hive with mysql 설치 (가장 깔끔하게 잘설명되어있는곳.)
http://sidcode.tistory.com/217
hive, mysql 환경설정
http://o-m-i.tistory.com/148
[1004jonghee]Hive 메타스토어(MySQL) 구축
http://1004jonghee.tistory.com/14
2. sqoop 설치
http://rainmaker0303.tistory.com/entry/Apache-Sqoop-%EC%84%A4%EC%B9%98
http://rainmaker0303.tistory.com/entry/Hive-to-MysqlSqoop-%EC%97%B0%EB%8F%99
sqoop명령어
http://hochul.net/blog/datacollector_apache_sqoop_from_rdbms2/
3. hive명령어
Hive QL : http://hortonworks.com/blog/hive-cheat-sheet-for-sql-users/
hive built-in function, hive-aggregate-functions :
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-DateFunctions
http://docs.treasuredata.com/articles/hive-aggregate-functions
그래프 그리는 용도로 사용하였다. 그래프만 그리기에는 다른 기능들이 많아서 아쉬웠지만 mapreduce를 하기위해 또 모듈을 찾을 여유가 없었다.
-R dataframe만들기
dataset <- data.frame( update = data[1], watt = sample( c(NA,1:(nrow(data)-1)))
-dataframe row크기 구하기
nrow(data)
-R 그래프 함수 : plot(), barplot()
barplot(성적$국어, main="성적그래프", xlab="학번", ylab="점수", border="red", col="green", density=coldens, names.arg=xname)
http://blog.naver.com/janetlee624/220046513708
http://blog.naver.com/easternsun/220191904466
-그 외 명령어
data(result1)
str(result1)
#처음 6개만 보여줌
head(result1)