2019. 8. 17. 16:29ㆍIT/파이썬
고득녕
"IPv6 Network의 이해" 공동 저자 SK브로드밴드 NMC에서 백본 네트워크 운용 개인 프로필 및 강의 이력 : https://sites.google.com/site/nackji80/
네트워크 관리자는 라우터와 스위치로부터 수 많은 중요한 상태 정보를 얻고 해당 정보를 분석하여 네트워크 관리를 하곤 합니다.
그런데 엔터프라이즈급 네트워크에서는 라우터와 스위치의 수가 적게는 수백대에서 많게는 수십만대가 됩니다. 따라서 네트워크 운용자가 일일이 라우터/스위치에 접속을 하여 상태 정보를 얻고 해당 정보를 가공하는 것은 굉장히 비효율적입니다.
실제 대형 ISP 네트워크 운용자가 파이썬 프로그램을 활용하여 IP 장비들로부터 자동으로 데이터를 수집/가공/분석하여 네트워크를 관리하는 사례들을 소개합니다.
다음과 같은 내용들이 발표 내용에 포함이 될 예정입니다.
Cisco/Juniper/Nokia/Huawei 라우터들의 장비 접속 방법 및 Data 수집 방법 라우터들로부터 수집하는 상태 정보들과 해당 정보들의 의미 실제 대형 ISP에서의 적용 사례 및 효과 소개
https://www.pycon.kr/program/talk-detail?id=78
인터넷 네전파 카페 활동하고 있어.
다양한 사례를 소개하면 좋지 않을까 해서 나옴.
---
소개
IPv6 네트워크의 이해의 공동 저자. SK 브로드밴트 백복 IP 운용 3년차.
pythonista 2년차.
작년부터 파이썬에 너무 푹 빠져서 책 개정을 못 했음.
회사 생활은 10년이 넘었지만 운영은 3년 정도 밖에.
운영에 너무나 비휼적인 프로세스가 너무 많았음.
어떻게 개선할 수있을까 고민하다보니 파이썬에 관심이 감.
"Pythonista 2년자" 가장 중요.
원래는 운영자임.
본 발표에서는 엄청난 파이썬 스킬이나 인사이트를 주는 것이 아님,
나 같은 초보자도 업무에 파이썬을 적용했다는 용기를 주는 것이 목적
----
목차
어떻게 데이터를 모으는지 부터, 프로그램 개발 소개.
대략 10개 정도 개발했는데 대단한거 하찬은거 2개 소개 예정.
----
개요
2~3년 전부터 빅데이터 관심이 많아짐.
현업에서도 업무 프로세스 개선에 독려하고 있어.
본사에서 여러 프로젝트를 진행하고 있어.
제가 한것은 빅데이터 분석 시스템의 파수꾼.
회사에서 정식으로 수집한 데이터를 운영자한테 결과를 루팅하는 시스템.
서버는 불용 처리 것을하나 얻음.
OS는 sentos, 파이썬은 3.6, 에디터는 VS. 그래서 0원.
한푼도 들지 않고 개발환경을 구축.
파이썬 2버전에서 3.6으로 변환하는데 애먺음.
MS에 대해 자세히 말함.
보통 파이참을 많이씀. 그런데 단점이 하나 있음.
장비는 서버실, 개발은 자리에서 할 텐데, 원격으로 동기화해야하는데
파이참은 그 기능이 유료임.
그러다 VS에디터를 써보라고 함. 써보니 써드파티를 막 설치할 수 있어 편리하게 사용 가능.
그 써드파티에서 동기화 기능이 무료로 제공되는 것도 있어.
----
엔터프라이즈 네트워크
엑세스 네트워크 의 트래픽을 전달하는 것이 디스트리뷰션 네트워크.
엑세스는 수십만대 정도됨. 백본은 안정선이 중요해서 비싼 것을 사용함.
강사가 바로 백번 운영자.
---
파수꾼 프로세스
데이터 수집 -> 진행 -> 결과 전달
3단계로 진행.
----
논디벨로퍼의 규칙
초보자의 사례를 보고 용기를 내고 파이썬을 적용하는 것이 강의 목표.
한가지 당부 말씀.
현업에 종사자라면 이해하겠지만, 우리나라 ip 네트워크는 굉장히 보수적이다.
서비스 지연이 1초만 발생하더라고 그 담당자는 엄청 갈굼당함.
여담으로 수능에 실패, 짝사랑에 치여도 자살을 생각하지 않았는데,
ip운영 하다보니 자살 생각이 나...
우리나라 ip네트워크는 운영자의 실수를 절대로 용납하지 않음.
2가지 당부.
1. confidue 명령을 절대 하지 말것!
2. show명령어도 시간을 충분히 줄 것!
회사에서는 기계를 혼내지 않음. 프로그램 개발할 때는 최대한 보수적으로.
----
2장.
데이터 수집
---
라우터로부터 데이터를 수집
이벤트가 발생할 때, 혹은 지속적으로 데이터를 수집.
파수꾼의 경우 NonRealTime 방식을 사용.
주기적으로 장비 접속(SSH) 후 상태 정보 수집.
참고로 RealTime을 가져오면 문제가 될 여지가 있어.
----
원격지의 라우터 데이터 수집
telent : telnetlib(보안에 약하여 콘솔 접속에만 사용)
ssh : Paramiko
파라미코 라이브러리를 쓰면서 지금까지 문제 없음.
다만, 주의사항이 하나 있어.
SSH 채널에 대한 2가지 종류
exec_commend()는 하나의 명령어만 보낼 수 있어.
invoke_shell()는 명령어를 여러개 보내도 됨.
문제는 라우터별로 지원하는 명령어가 다름
----
SSH의 샘플 - EXEC
홈페이지에 있는 예시.
스택오버플로우에 가면 노키아 라우터에서는 해당 명령어가 작동하지 않아 생기는 문제가 종종 올라옴.
그러면 다른 라이브러리로 감.
그래서 노키아에 문의. 파이썬에 친화적이지 않아고.
노키아에서 답변. 사실 작동하는데 다른 함수를 사용해야 함.
그래서 받은게 invoke_shell()의 예시.
---
3장.
결과 출력
----
운영자한테 데이터를 알려주는 방법은 2가지.
원할 때마다, 아니면 주기적으로 발송.
당연히 주기적으로 발송하는 것이 쉽다.
그러면 어떻게 쏠까?
왼쪽은 매 30분 마다 전수조사한 결과를 발송한 메일
오른쪽은 하루에 2번씩 설정을 조사하여 변경시 메일 발송
쏘는 코드는 smiplib를 사용.
---
4장.
프로그램 소개
------
가입자망 장비의 단중화 현황 파악
서로 교차하여 구성. 당연히 이렇게 해야 안정성.
그런데 갑자기 아무도 모르게 단중화로 바뀌는 문제가 생김.
단중화는 굉장한 리스크를 동반.
바로 이중화로 조치해야 하는데 만만치 않은 일.
수만대의 가입자망 장비들의 단중화 여부를 수동으로 파악하는 것은 불가능.
파수꾼은 조회를 통해 단중화인지, 이중화인지 파악.
BGP/라우터 테이블에서 Access Router의 Loopback 주소를 조회.
빽본 네트워크는 보통 IGP로 수정. 가입자망 네트워크는 EGP로 구성.
수십만대라 잘못하면 엄청 버벅댈 수 있어.
여기서 192.0.2.1을 조회.
그럼 어디서 조회할까? 중간 단에서 조회한다.
첫번째 단에서는 베스트 루트는 1개씩만 나옴.
두번째 단에서는 서로 연결되어 있어 정상인 경우 2개씩 나옴. 단중화면 1개로 보임
세번째 단에서는 베스트 패스가 여러개라 우선순위에 따라 1개씩만 나옴.
이런 방식으로 수십만대 라우터를 조회
----
트레픽 제거 방법
라우터 A,B 2개가 있음.
그때 트래픽을 하나 빼야 할 때. 셧다움을 하거나 권한을 제거 혹은 설정 변경을 함.
여기서는 세번째 방법을 함.
셧다운을 하면 트레픽이 빠짐.
2번은 패시브를 설정했는데 운영자가 실수로 서버실에서 엉뚱한 장비를 뺄 수 있어.
A운영자가 설정을 제각각 했다고 하면 특이사항이 없어.
3~4년 흘러 새 담당자가 왔는데 트래픽이 올라.
증성을 하고 세팅을 다시 하는 순간, 모든 테레픽이 한 쪽으로 감. 유실이 발생.
이런 일이 종종 일어나.
코드 설정을 완벽히 이해하는데 수시로 바뀌다 보니 트래픽 관리가 안됨.
트래픽 변동 내역을 주기적으로 파악 필요
----
전수조사
보든 설정을 뽑아서 운영자를 모아서 회의
그래서 필수만 남기고 지우기.
---
마무리
아이피엔지니어 자동화 시스템을 하다보니 워크밸런스가 좋아짐
지식의 깊이가 깊어지는 것을 느낌.
결과대로 안나오는 것이 당연. 가끔 가다 내가 예측한 것과 다른 결과가 나올 때 있음.
내 지식이 틀렸다는 것, 패러다임이 바뀌는 순간이 나옴.
'IT > 파이썬' 카테고리의 다른 글
[파이콘] 최규민 - 추천시스템, 이제는 돈이 되어야 한다. (0) | 2019.08.18 |
---|---|
[파이콘] 테스트에 걸리는 시간을 *92%* 줄이기 (0) | 2019.08.17 |
[파이콘] 박종현 - 하나의 Django 코드로 여러 사이트 운영하기 (0) | 2019.08.17 |
[파이콘] 김민중 - 데이터 분석 사례(지하철역 환기실 공조기 고장 감지) (3) | 2019.08.17 |
[파이콘] 키노트 - 캐롤 나슬룬드 윌링 (0) | 2019.08.17 |