안녕하십니까. 인하대학교 스마트시티공학과 석사 1차 박진형입니다. 전공 이외의 분야이다 보니 데이터를 분석하는 데에 있어 막히게 되어 질문을 하게 되었습니다. 제가 하고싶은 것은, 저의 엑셀 데이터에있는'Qsol'과'temp'의 두가지 변수를 사용하여, 'Troom'값을 예측 하는 Rule을 축출 하고자 합니다. ex. ('n'시에 Qsol과 temp의 값이 'a','b'이니 이 상황에서의 Troom 값은 'c'이다. 를 표현하는 것입니다).
그러기 위해 우선 시계열 데이터 이다 보니 LSTM,ANN등 여러가지 방안에 대해서 접근을 하고 학습을 시켜 보았지만, 그래프상에서 보여주는 Prediction과test의 값을 비교 하는 것이 제가 할 수 있는 최대한 이였습니다. (만약여기서 어떠한 매커니즘을 통하여 이러한 Prediction 값이 나왔는지 파악 할 수 있어도 좋을 것 같습니다.) 그래서 직관적으로 파악하기 쉬운 DecisionTree 와 Random Forest를 이용하여 다음과 같이 간략한 tree를 진행하였습니다. 하지만 저는 여기서 시간에 대한 정보도 포함하여 시간 순으로 차례대로 진행하고 싶은데, 여기서는 시간에 대한 데이터를 하나의 변수로 보지 않고 무작위로 선정한것 같아. 잘 이해가 가질 않습니다.
(csv파일은 첨부가 안된다고 하여 데이터를 엑셀파일로 첨부하였습니다.) // 제가 공부한 코드가 첨부를 할 수가 없다고 하여. 따로 저의 개인 블로그에 파일을 첨부하였습니다. (공부-machine Learning) https://blog.naver.com/jinhyeong1021
|