Arugument 44

GRE 2015. 11. 5. 09:06

In this argument, the speaker concludes that Forsyhe citizens have adopted healthier lifestyles. To justify this conclusion the seaker cites a recent survey of Forsythe citizens suggesting that their eating habits now conform more closely to government nutritional recommendations than they did ten years ago. The speaker also points out that sales of kiran, a substance known to reduce choleterol, have increased fourfold, while sales of sulia, which few of Forsythe's healthiest citizens eat regularly, have been declining. This argument is unpersuasive for several reasons.


First, the surbey must be shown to be reliable before Ican accept any conclusions based upon it. Specifically, the responses must be accurate, and the respondents must be statiscally significant in number and representative of the overall Forsthe  citizenry in terms 

Posted by MIDDLE
,

시계열분석

Data Science/R 2015. 9. 25. 09:47

참조 

TimeSeriesAnalysis.pdf

시계열 분석


시계열 데이터느 시간에서 순차적으로 관측한 값들의 집합


그럼, Q.Discretize 하는 방법

-1) Continuous time series 로 샘플링

-1) 특정 기간 동안의 값들을 합치기


특징

- Time periods 는 equal length

- missing values 가없다.


Q. Missing Value가 있으면 어떻게 처리?

- Expectation-maximization 방법으로 처리 (Missing Value를 모형을 통해 예측)

- 이부 데이터만 Missing 한경우 가능하다.


시계열 데이터는 2가지로 나뉜다.



               랜덤요소  (Arima, Arch 모형등)

시계열 데이터


트랜드 패턴 ( 다양한 통계 모형 적용)

                          시즈널 패턴 (ACF, Fourier 방법 적용)

               패턴요소  주기 패턴   (ACF, Fourier 방법 적용)

                      기타 통계적 패턴 ( 데이터 마이닝 기법 적용: 의사결정 나무,SVM등)




사용영역

기술적

- 시계열 사이 관계 분석

- 프로세스 관리/표현 방법

- 예측


영역

- 경제학; 비즈니스 계획; 수요계획

- 재고 및 생산관리

- 산업 프로세스 관리 및 최적화

  센서 시그널 분석을 통한 지능화 모니터링


시계열 데이터 분석 접근 방법 2가지

자체 추정방법

장정 : 최소의 데이터로 빨리,쉽게 분석 주로 Short-term 예측에 이용 다른 분석의 초기분석으로 이용

단점 : Long-term 예측에 어려움 외부요소 고려하지 못함


원인 결과 방법

장점 : 많은 정보 이용 Mid-term 예측 가능

단점 : 복잡한 과정 필요



Self-Prjecting의 Classical 방법 PDF 참조

자기 산관계수를 통해서 통계적으로 알수 있음 항상, 가능하면 비주올 plot을 하는것이 좋다.

1차 트랜드가 아니라 다른차수 트랜드 이면? (일반적 트랜드를 어떻게 해결?)

여러가지 Smothing 방법이 있다.


자기상관계수 : X,Y의 선형적 관계의 정도

  자체 시계열 데이터내에서 얼마나 선형적 연관성이 있는가 

  lag k의 의미? zt와 k 만큼 shift시킨 zt-k 사이의 연관성



Global Temperature 데이터의 Autocorrelation  Function(ACF)

1. Original signal Xt : 빨리 








'Data Science > R' 카테고리의 다른 글

R 도움말 & 함수 확인  (0) 2015.09.10
R공부 Example 3회차  (0) 2015.09.08
R 공부 1회차 Example  (0) 2015.08.31
Posted by MIDDLE
,


오픈스택 구석구석 파헤치기.pdf



출처는 어디인지 까먹음...

Posted by MIDDLE
,