해당 포스팅에서는 가볍게 챗봇을 만들기 위한 기초 지식 공부와 간단한 채팅 모델에 API서버를 연동한 웹사이트를 보이려고 한다.
조금더 진척이 되고 올리려고 했으나, 입대까지 얼마 남지 않아 급한마음에 그냥 올리게 되었다.
챗봇 개발을 위한 기본 지식 공부
1. Transformer의 기반이 되는 Attention
seq2seq + attention을 논문과 함께 간단하게 구현해 봤다.
attention의 개념 정도는 확실히 잡고 가는 게 맞다고 생각했다.
2. GPT계열의 기반이 되는 Transformer
attention is all you need.. 따로 리뷰를 하고 싶었지만 시간이 너무 부족했다.
이전에 구현을 해본 기억이 있긴 한데 다시 봐도 어려웠던 것 같다.
나중에 따로 리뷰를 작성하고 싶다.
3. KoGPT2-chatbot 코드와 구조를 분석했다.
처음에 KoGPT2로 이것저것 구현해 보고 있던 도중 발견한 프로젝트이다.
해당 프로젝트의 구현체를 보며 코드와 구조를 분석했다.
https://github.com/haven-jeon/KoGPT2-chatbot
4. (3)의 개발자가 참고했다고 언급한 논문을 리뷰했다.
목표지향적 대화를 위해 GPT2에 상태값을 input 필드에 텍스트를 입력하는 적은 비용의 방법으로 학습하여 타 방법들에 대하여 뒤지지 않는 성능에 낸 것에 대하여 설명하는 논문이었다.
우선 뭔가 했다 라고 말할 수 있는 유의미한 공부는 이 정도인 것 같다.
테스트3
3번 의 코드에 약간의 코드수정과 학습데이터 추가로 챗봇을 만들어 테스트 해봤다. 멀티턴 state를 사용하지 않기 때문에 대화가 이어지지는 않지만, 첫 포스팅이니 만큼 모델을 돌려본 것에 의의를 두었다.
이녀석,, 공손하게 기분나쁜 말투다.
서버 설정
웹서버와 간편하게 연결해보기 위하여 호스팅을 했다.
시간을 들여 로컬 서버를 구축하는 수고로움을 덜기 위해 코드를 colab에 올리고 ngrok를 이용하여 호스팅 했다.
프론트
일단 때깔이라도 좋아야 좀 의욕이 생길 것 같아서 적당히 이쁘게 프론트를 만들어봤다.
적당히 애니메이션만 조금 넣어서 귀엽게 만들었다.
번외
벌써 재밌을 것 같다.
'2. Development > 한국어 오픈도메인 챗봇' 카테고리의 다른 글
[한국어 오픈도메인 챗봇] 4. Chat GPT 간단 체험 (0) | 2023.03.28 |
---|---|
[한국어 오픈도메인 챗봇] 3. 카카오톡로그 기반 1:n 발화모델 개발 (0) | 2021.08.04 |
[한국어 오픈도메인 챗봇] 2. 카카오톡로그 데이터셋 활용과 가공 (0) | 2021.07.31 |
[한국어 오픈도메인 챗봇] 0. 사람같은 챗봇 만들기 (0) | 2021.06.29 |