분류 전체보기 (45) 썸네일형 리스트형 6. 첫번째 POC 개발 및 테스트 서론 본격적 개발을 앞두고 개념증명을 위한 프로토타입 개발을 해봤다.개념증명은 미니 프로젝트에 있어서 매우 중요하다.본격적으로 개발을 시작하기전 한계점이나, 포기사유(?), 혹은 숨은 가능성을 찾을 수 있기 때문이다.해당 테스트에서는 이 프로젝트가 재밌게 만들어 질 수 있는지 여지가 있는지에 초점을 둔다. 본론 첫번째 POC 모델의 실험 범위는 다음과 같다.1. 해당 모델이 여러 언어에 대하여 어색함 없이 답하는지. (RAG를 사용하지 않는 단기기억에 문제가 없는지)2. ARS 모델과 LLM과 TTS모델을 거치는데 Latency가 얼마나 걸리는지, 대화가 충분히 빠르게 잘 이루어지는지 (UX안정성)3. ARS, LLM, TTS 모두 다양한 언어처리에 문제가 없는지 (언어교육을 위한 발전가능성)4. 결과가.. 5. 대화 History와 Retrieval 정리 서론대화 맥락을 잘 유지하는 챗봇은 어떻게 만들까?LLM이 나오기전 전통적 챗봇들중에 일상대화에서 멀티턴을 제공하는 챗봇은 드물었다.하지만 LLM이 나온뒤로는 대화 History를 넣을시 자동으로 맥락에 맞추어 대답하는 챗봇을 만들기 쉬워졌다. 그래도 아직 만능은 아닌데, 그 이유는 다음과 같다.현재까지 나온 대부분의 LLM모델이 입출력값의 토큰수(길이)가 일정 갯수를 초과할 수 없다.그렇다면 매우매우 긴 대화 데이터를 history 맥락으로서 제공해야한다면, 입력토큰 수 제한에 막혀 대화맥락을 모두 고려해서 말할 수 없게 된다. 이를 해결하기 위한 다양한 방법들에 대해서 정리해봤다.본론History우선 chatbot이 대화맥락을 잘 유지하게 하기 위해서는 이전의 대화 데이터를 참고하여 대답 할 수 있.. 4. LLM 모델조사 서론LLM은 해당 프로젝트의 핵심적인 부분이라고 할 수 있다. 또한 성능에 가장 큰 영향을 미치는 파트이다.LLM은 그 용도에 따라 다양한 선택지의 모델들이 있으나, 역시 가장 쉽게 API형식으로 이용할 수 있고 LangChain과 같은 도구들과 어울려 사용하기 좋은 ChatGPT가 일단은 가장 편리하다는 시선으로 조사를 시작했다. 본론Considerations우선 LLM을 선택하기 위한 고려할점은 상당히 다양한편이다. 추론성능 : 단연 가장 중요한 포인트이다. 추론 성능은 대화 품질에 있어서 매우 민감한 부분이며, 다음 대화를 생성하기위해 여러가지 정보를 조합하고 분석할 수 있는 능력이 이와 관련되어있다. 필터 / 거부 : 컨텐츠 필터가 상당히 애매한 부분이다. 검열 수준이 너무 높으면 대화의 품.. 3. TTS 모델 조사 서론TTS는 메타휴먼 서비스에서 매우 중요하다.STT는 대화 품질면에서의 성능을 간접적으로 올려준다면, TTS는 결과의 품질만으로 사용자 경험을 매우 다르게 바꿔놓는다.어쩌면 버추얼 휴먼의 생명이라고도 할 수 있을정도로 중요하지 않나라고 생각한다.가볍게 왜 TTS가 중요한지와 TTS모델에 대한 조사를 해보도록 하겠다. 본론 TTS가 중요하다고 생각하는 이유조금 웃기긴 하지만, Mehrabian의 법칙에 따르면, 사람이 감정을 전달할 때 메시지의 세 가지 요소인 단어, 목소리 톤, 표정은 다른 사람이 그 사람을 얼마나 좋아하는지 기여한다고 한다. 구체적으로 호감도는 말의 내용 7%, 목소리 톤이 38%, 표정이 55%를 차지한다고 한다.TTS를 잘 선택하는 것은 어쩌면 해당 캐릭터 이미지를 향상 시키기에.. 2. STT 구현 고찰 및 모델 조사 서론메타휴먼의 귀가 되어줄 STT(Speech to Text) 처리를 어떻게 할지 어떤 모델을 사용할 지 생각해봤다.STT의 고려사항은 매우 여러가지 있다. 그런 부분에 대한 고려를 하며 모델을 테스트해본다. 본론Considerations일반적으로 STT라고 한다면 음성파일을 텍스트로 변환해주는 작업을 말한다.하지만 사람이랑 대화할때는 이런 방식은 괴리감이있다. 그런부분에서 고려할 사항을 간단하게 짚고 넘어갈 것이다. 1. 내가 언제나 불시에 말을 할 수 있고, 언제 말을 끝낼지를 정해놓지 않는다.즉 내가 말을 시작한 시점부터 녹음해야하며, 내가 말을 끝낸 부분에서 녹음을 끊고 변환해야한다.내가 어떤시점에서 말을 시작했고 끝냈는지 실시간으로 인지 가능해야한다.그러기 위해서는 몇가지 방법이 있는데, 1.1.. 1. 버추얼 휴먼 개발 프로젝트 서론버추얼 휴먼이 무엇인지 아세요?가상 인간, 디지털 휴먼, 메타 휴먼, 사이버 휴먼 등 다양한 명칭이 있는, 실존 인물이 아닌 소프트웨어로 만든 가상의 인간을 의미합니다.대 LLM시대 우리는 인간의 지식을 잘 이해하하고 응용할 수 있는 인공지능에 열광하고 있습니다.여기서 저는 인공지능을 이용해서 얼마나 더 인간처럼 사고하고 대화할 수 있게 만들 수 있을지 고민하고, 개발해 나가는 이야기를 써보려고 합니다. 본론아키텍처 스케치와 POC 단계 설정아직까지는 스케치 단계임으로 계속 바뀔 예정이고, 바뀌는 과정을 통해 보여줄 수 있는 것이 있을 것이라고 생각한다. 구현 수준을 3가지로 나누었다. 이는 아이디어 스케치 단계임으로 언제든 바뀔 수 있다.1차 : STT, GPT, TTS를 이용한 Multi Tur.. CHATGPT를 이용한 간단한 대화형 MBTI성격검사 (실험) 실험날짜 : 23-05-02 개요 요즘 같은 세상에 개발을 할 줄 아는데 gpt계열의 인공지능으로 뭐하나 만들지 않으면 손해다 싶어서 뭔가 하나 만들어보려고 이것저것 시도중에 대화형으로 mbti성격검사를 만들면 어떨까 생각이 들었다. 프로토타이핑 일단 챗봇이 mbti의 각 성질을 자연스럽게 파악할 수 있는 상황을 만들고 사용자는 ai와 롤플레잉을 벌인다. 그리고 그 롤플레잉한 대화를 바탕으로 mbit의 8개의 특징을 스코어링하고 왜 그렇게 분석했는지 까지 추출하여 제공하는 서비스를 생각해 봤다. 가능성 실험 우선 이전의 많은 논문들이 증명해 왔듯이 불가능할 것 이라고 보여지진 않는다. 하지만 구현(값싸게)할 수 있는 수준인지는 확인 해 볼 필요가 있어보이기도 하고, 성격을 판단한다는게 gpt류 api에서.. [논문 리뷰] Generative Agents: Interactive Simulacra of Human Behavior (작성중) 작성중입니다. Abstract 언어 모델을 이용하여 Agent를 설정된 집단과 환경에서 인간과 유사하게 행동할 수 있도록 하는 simulation을 구현한 연구에 대한 논문이다. Agent는 큰 언어모델(chatgpt)에 Agent의 경험을 기억할 수 있고, 그 기억을 높은 수준으로 반영하여 반응을 생성하며, 그 데이터들을 동적으로 행동을 계획하기 위해 불러올 수 있다. Keywords Human-AI Interaction Agents Generative AI Large language models Introduction 인공 사회를 만드는데는 “The Sims”(게임)에서 영감을 받아서 가상 환경을 설계했다. 환경에 던져진 Agent들은 과거의 경험과 괴리가 없도록 일관적으로 행동했고, 어떻게 어려운 .. 이전 1 2 3 4 5 6 다음