머신러닝
챗봇 서비스를 운영하다보면 사용자로부터 다양한 유형의 발화가 들어오고, 이 발화는 크게 2 가지로 구분됩니다. 첫 번째 유형은 숏-헤드 유형으로 많은 사용자로부터 높은 빈도로 유입되는 주요 발화들이 있습니다. 두 번째 유형은 롱-테일 유형으로 낮은 빈도로 유입되는 다양한 발화가 있습니다.
좋은 봇 서비스를 만들기 위해서는 두 가지 유형의 발화를 모두 커버할 수 있어야 합니다. 하지만 사용자가 롱-테일 유형의 질문까지 모두 블록으로 만들어 응대하기는 쉽지 않습니다.
그래서 챗봇 관리자센터에서는 인입 질문의 유형에 따라 패턴 매칭, 머신러닝, 지식+를 적절히 사용하여 쉽게 양질의 봇을 만드는 방식을 제공하고 있습니다.
이중 머신러닝은 숏-헤드 유형의 발화에 대해 보다 정확하게 응대할 수 있도록 도와주는 기능입니다.
챗봇에 유입되는 질의 유형 구분 (숏헤드 & 롱테일형 구분, edited by Kakao)
챗봇 관리자센터에서 제공하는 머신러닝을 사용하면, 적은 예상 발화문 입력으로 폭 넓은 사용자 의도 파악이 가능하다는 장점이 있습니다.
즉, 적은 발화를 학습해도 종전보다 더 똑똑한 봇을 만들 수 있게 되었습니다!
Definition.
사용자 발화는 크게 두 가지가 있으며, 아래와 같습니다.
- 패턴 발화: 패턴 매칭을 위한 발화로 입력된 예상 발화를 기준으로 어순 일치, 엔티티와 조사, 어미의 변형에 한정하여 동일한 패턴으로 간주하여 의도를 파악합니다.
- 머신러닝 발화: 기계가 의도를 파악하기 위해 학습에 사용될 발화입니다. 문장의 의미를 파악하기 때문에 패턴 발화보다 더 넓은 적용 범위를 가집니다.
또한, 머신러닝을 사용한 챗봇은 패턴 매칭만 사용하는 챗봇에 비해 훨씬 똑똑한데요. 아래 그림에서 보실 수 있듯이 머신러닝 발화와 패턴 발화를 같이 입력한 봇은 패턴 발화만 입력한 봇에 비해 사용자 발화에 대한 대응 범위가 넓어집니다.
머신러닝 유무에 따른 사용자 발화 대응 범위
이렇게 유용한 머신러닝을 사용하는 방법은 어렵지 않습니다! 자세한 사용법은 이후 튜토리얼의 주요 기능 사용법 중 '머신러닝 사용하기'에서 볼 수 있습니다.