스케치 단계의 포스팅 입니다.
일단. AI Dungeon와 비슷한 인공지능을 만들면서, 생성모델과 데이터에 대한 아이디어를 조금 얻어보려고 한다.
아래는 AI Dungeon 이라는 게임 웹사이트이다.
실험을 시작하기로 마음먹은 것은 아래 보고 마음먹었다.
학습은 아래의 텍스트 어드벤처 커뮤니티 웹사이트에서 학습을 시켜볼 생각이다.
학습을 위해 다음과 같은 느낌의 스토리 포멧을 이용하면 좋을 것 같다고 생각했다.
더 나아가서 실험할 것 중 하나로 여러가지 형식의 스토리 텍스트를
학습을 위한 전처리된 텍스트를 만들어 주기위해 원하는 포멧의 텍스트로 수정해주는 인공지능 모델을 만들수 있을ㄲ 생각중이다,
데이터셋 탐색
게임 스크립트이다.
https://www.kaggle.com/datasets/lizakonopelko/disco-elysium-dialogue-texts
왕좌의게임 스크립트이다. 이거 진짜 괜찮아 보인다. 학습에 잘먹힐 잘 짜여진 구성이다.
https://www.kaggle.com/datasets/albenft/game-of-thrones-script-all-seasons
파이널 판타지 스크립트이다.
https://www.kaggle.com/datasets/tylerhuxtable/final-fantasy-dialogue-scripts
릴레이 소설을 쓰는 사이트이다. 저작권정책에 따르면 어쩌면 몇몇 릴레이 소설을 데이터셋으로 이용해 볼 수도 있을 것 같다.
연구 대기열
https://arca.live/b/giantess2/25529526?p=1
'B급 개발물' 카테고리의 다른 글
CHATGPT를 이용한 간단한 대화형 MBTI성격검사 (실험) (0) | 2023.05.02 |
---|