[파이콘] 김민중 - 데이터 분석 사례(지하철역 환기실 공조기 고장 감지)

2019. 8. 17. 14:10IT/파이썬

 

김민중 - 데이터 분석 사례(지하철역 환기실 공조기 고장 감지)

국가수리과학연구소에 재직중이며 다양한 산업분야의 수학적 문제 해결 지원 업무를 하고 있습니다.

 

https://www.pycon.kr/program/talk-detail?id=85

 

----

 

국가수리과학연구소에서일하고 있으며, 수학을 전공한 이학박사(학률론).

실제 기업체나 공공기관의 산업문제를 발굴하고 해결지원 업무 진행.

국가기관이라 무료로 지원하는데, 이번에 하나의 사례를 소개

(참고로 현재 육아유직중인데 6월에 딸이 탄생!)

 

----

 

왜 파이썬인가?

 

파이콘 참석이 올해 처음. 발표를 결심하게 된 이유.

전공이 수학자인데 전공 생태계가 많이 변하고 있음.

파이썬 데이터 분석 툴을 이용해 수학적 문제 해결,

산업문제 해결에 많이 사용하는데 이런 트랜드를 소개하려는 목적.

 

기업에 있는 데이터를 할 때 R을 먼저 했는데,

패키지가 잘 짜여있지만 업무 특성상 한계에 부팆칠때가 있음.

또한 유저한테도 익숙치 않아 파이썬으로 전향

 

우선 직관적인 코드 문법이 맘에 들었고, 공부하기도 쉬워.

그리고 다양한 유저층도 있어.

애러나 궁금한 것들을 바로 검색 가능.

그리고 검증된 패키지도 많아. (사이킥런, 케라스 등등.)

 

----

 

목차

 

어떤 문제를 해결하였는지 소개. 공동으로 조사하여 얻은 실적.

 

 

 

-----

 

배경

 

지하철에는 다양한 설비가 있는데,

이런 것들을 자동화하기 위해 SAMBA를 자체개발하여 운영하고 있음.

이를 고도화하는 것이 문제! 

센싱 데이터를 이용해서 설비 고장을 예측하는 기능이 부재.

들어오는 센싱값이 유효한지 검증하지 않아 해당 문제를 의뢰받음.

 

공조기(송풍기) 이상 상황 감지 알고리즘을 문제로 잡음.

모든 설비에 대한 이상감지는 무리이고, 고장이 많은 한 장비를 타겟. 그래서 공조기가 선택.

 

참고로 공조기란 승강장 내외부 공기를 순환시키는 장비.

 

 

 

공조기 v벨트는 공조기의 주요 부품으로 모토의 회전력을 환풍기로 전달하는 역할.

마찰력을 높이기 위해 v자 모양이라 v벨트라고 함.

 

----

 

데이터

 

공조기 모테에서 전류 데이터를 수집. 이는 회전력과 밀접한 관계.

0.5초 단위로 전류값을 수집, 그리고 얼마인지 value를 표시.

 

 

데이터를 가지고 그래프를 그리면 띄엄띄엄 나오는데, 보통 꺼져있다가 특정 기간으로 확 뛰는 방식으로 작동함.

정지상태에서 구동시 전류값이 크게 뜀.

 

 

-----

 

문제정의

 

공조기 v벨트의 탈락 및 슬립 감지, 그리고 주요 부품의 이상 감지(교체 시기 감지) 2가지로 설정.

 

----

 

추진 실적

 

 

v벨트 탈락 및 슬립

- 효율이 떨어지고 전력에 영향을 미침. 그래서 한줄 씩 제거하면서 데이터를 수집

 

시뮬레이션

- 0은 전부 장착, 1은 1줄이 탈락된 상태

- 있고 없고의 차이 확인 가능

- 이런 상황을 감지하는 알고리즘을 개발

 

----

 

제시된 해결 방법

 

우선 시계열 데이터 중에서 전원이 켜지는 시점을 기준으로 자름.

최대 전류값의 1/2을 넘는 시점을 기준으로 임시 저장.

위 구간에서 index가 1을 넘는 시점을 추출

그래서 그 시점을 기준으로 데이터를 수집.

 

-----

 

v벨트 탈락 감지 모델

 

시계열 기법을 활용한 작동시점을 기준으로 1차원 데이터로 분할.

그런데 문제가 있어. 실험 데이터로 v벨트를 하나씩 제거하면서 테스트해봐야 하는데,

모든 지하철의 v벨트를 다 자를 순 없다.

 

 

가우시안 분포를 활용한 이상 데이터 검출 모델을 적용.

비정상 데이터가 존재하지 않은 경우 이상 감지.

 

------

 

다른 과제

 

그래서 데이터 수집이 용이한 것으로 변경. 공조기 모테 주요 부품의 이상 감지 

교체하기 전에는 상태가 가장 나쁘고 교체후 가장 좋은 상태라고 가정.

 

 

----

 

부품이상 one stop 모델

 

공조기 작동 시점 기준 전류 데이터 분할

이건 유니버셜하게 적용 가능.

 

우선 전과 똑같이 전류 데이터 분할.

교체 날짜 기준으로 이전과 이후를 자동으로 라벨링을 추가.

자동으로 달린 라벨을 통해 분류 모델 생성.

공조기에 종속되지 않은 알고리즘을 구현.

 

 

다양한 공조기와 테스트.

v벨트와 베어링에 대해 실시.

정확도는 거의 80~99%로 만족할 수준으로 나옴.

참고로 정확도*은 모델을 슬림하게 짠 것.

 

 

 

----

 

질문사항

 

시계열 데이터의 기간?

-> 교체전 3개월, 교체후 3개월 총 6개월분

 

결측치나 이상치 데이터 처리방법?

-> 해당 데이터는 삭제 후 진행

 

훈련 데이터 기간설정

-> 6개월치 데이터를 가지고 훈련하였는데 일자보다는 6개월 기간만 채워지면 훈련