일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 데이터 엔지니어링
- R 배우기
- 데이터 구조
- r
- 데이터 엔지니어
- 데이터 사이언티스트
- data science
- Data Scientist
- 빅데이터
- data engineer
- R 설치
- Python
- 데이터 사이언스
- 파이썬
- Today
- Total
목록빅데이터 (3)
To be a Data Scientist
R 데이터 구조 R은 벡터, 요인, 행렬, 데이터 프레임, 리스트라는 데이터 구조를 지니고 있다. 벡터(Vector) : 1차원으로 구성된 데이터 형태로, 동일한 타입의 데이터로만 구성되어야 한다. 행렬 : 2차원 배열이며, 원소는 모두 동일한 유형의 데이터로 구성되어야 한다. matrix() 함수를 이용해 행렬을 생성할 수 있다. matrix(data, nrow=a, ncol=b, byrow=TRUE/FALSE, dimnames=list(row_name, col_name) ** nrow와 ncol은 행렬의 행과 열의 수를 나타낸다. **byrow는 데이터를 행 단위로 구성할지, 열 단위로 구성할지 결정하는 역할을 한다(TRUE : 행 단위/ FALSE : 열 단위). 기본적으로 FALSE로 셋팅되어 있..
무척이나 덥던 올 여름은 지나갔지만, 데이터 사이언티스트(Data scientist)에 대한 열기는 아직 뜨겁다. 이미 많은 회사들이 데이터 사이언티스트들로 인해 엄청난 수익을 올렸고, 지금은 더 많은 회사들이 이들을 고용하기 위해서 노력하고 있다. 하지만, 데이터 사이언티스트 고용은 커녕 찾는 것 조차 만만치 않아 일부에서는 이들을 전설의 동물, 유니콘이 아니냐는 소문이 떠돌고 있다. 데이터 사이언티스트, 그들은 진짜 유니콘인가? 앞선 포스팅에서 데이터 사이언스를 하기 위한 필요한 스킬들을 정리했었다. 다시 간단히 요약하자면, 수학과 통계는 물론, 컴퓨터 공학에 대한 지식도 튼튼해야 한다. 거기에 자신만이 분야 전문성을 바탕으로 리서치와 소프트웨어 엔지니어링, 머신러닝까지 할 수 있는 능력을 겸비해야 ..
"10년 뒤 가장 섹시한 직업은 통계학자 일 것입니다" -Hal Varian 2009년에 구글의 수석 경제학자 Hal Varian은 이렇게 예측했었다. 당시엔 누구도 그의 말이 이토록 맞으리라곤 생각하지 못했었다. 다만 지금과 작은 차이점이 있다면, 이제 우리는 그들을 통계학자라고 부르기보단 Data Scientist라고 부른다는 점이다. NYU는 Data Science를 "엄청난 양의 데이터를 자동화된 도구를 이용하여 분석하고, 정보를 도출해내는 것"이라 정의하였다. Data Scientist 는 Data Science를 하는 사람을 뜻한다. 즉, 데이터 속에서 의미있는 정보를 도출해낼 수 있는 능력을 갖춘 사람이다. 이런 엄청난 양의 데이터를 처리해 유의미한 결론을 이끌어내기 위해서는 기존의 데이터 ..