[DEVIEW 2017] 머신러닝으로 CS대응하기
질답에대한 데이터가 많이 쌓여있음.
챗봇같이 자동 답변되는 시스템을 만들자.
대부분의 문의가 한정된 주제안에서 이루어짐. 답변도 비슷.
클리시피케이션으로 해보자.
CS 담당자에게 20+의 클래스를 받음. 약 70프로 커버할 정도.
프리프로세싱
- 벡터라이즈 - 모델 - 프리딕션
프리프로세싱
- 라벨링
- 맞춤법
- 메타정보 …
Swivel - 구글의 워드투벡터 라이브러리
나이브 베이즈를 했을 때 59퍼
딥러닝에 취해 그냥 했더니 최대 65퍼
데이터를 더 깎아보니 68퍼 정도…
왜그러지?
질문만 보고 답변을 하나로 특정 지을 수 없음 - 즉, 풀수가 없는 문제를 풀고 있었다.
lesson을 얻음
베이스라인의 중요성 데이터를 꼼꼼히 문제의 본질
문제 재정의 - 장애 CS
장애시에 엄청난 CS요청 - 장애 대처는 CS팀이 정확히 똑같은 대답을 함.
어노말리 디텍션
수많은 데이터 속에서 비정상을 찾는것.
autoencoder - 라벨이 필요 없음. 구현이 간단. 실사용 예제가 있음.
few-shot learning
몇개의 샘플 만으로 구별해보자.
autoencoder - zero-shot learning
KNN -> 미분가능 KNN(matching network)
매칭네트웤 - 사용하기 쉽다.
매칭네트웤 -> TCML
성능이 조금 더 향상되서 오픈소스를 만들었다.
실적용
CS 자동 분류
탑3클래지파이어로 예샹답변 제공하려고 함.
2023년 새해에는 성장하고 함께하고 싶다면?
Pre A 단계 이상의 스타트업 C 레벨들이 모여서 커뮤니티를 만들었습니다. 같이 스터디하고 친해질 일잘러를 찾습니다.