[DEVIEW 2017] 머신러닝으로 CS대응하기


질답에대한 데이터가 많이 쌓여있음.

챗봇같이 자동 답변되는 시스템을 만들자.

대부분의 문의가 한정된 주제안에서 이루어짐. 답변도 비슷.

클리시피케이션으로 해보자.

CS 담당자에게 20+의 클래스를 받음. 약 70프로 커버할 정도.

프리프로세싱 - 벡터라이즈 - 모델 - 프리딕션

프리프로세싱

  • 라벨링
  • 맞춤법
  • 메타정보 …

Swivel - 구글의 워드투벡터 라이브러리

나이브 베이즈를 했을 때 59퍼

딥러닝에 취해 그냥 했더니 최대 65퍼

데이터를 더 깎아보니 68퍼 정도…

왜그러지?

질문만 보고 답변을 하나로 특정 지을 수 없음 - 즉, 풀수가 없는 문제를 풀고 있었다.

lesson을 얻음

베이스라인의 중요성 데이터를 꼼꼼히 문제의 본질

문제 재정의 - 장애 CS

장애시에 엄청난 CS요청 - 장애 대처는 CS팀이 정확히 똑같은 대답을 함.

어노말리 디텍션

수많은 데이터 속에서 비정상을 찾는것.

autoencoder - 라벨이 필요 없음. 구현이 간단. 실사용 예제가 있음.

few-shot learning

몇개의 샘플 만으로 구별해보자.

autoencoder - zero-shot learning

KNN -> 미분가능 KNN(matching network)

매칭네트웤 - 사용하기 쉽다.

매칭네트웤 -> TCML

성능이 조금 더 향상되서 오픈소스를 만들었다.

실적용

CS 자동 분류

탑3클래지파이어로 예샹답변 제공하려고 함.




© 2017. by isme2n

Powered by aiden