본문 바로가기

1. IDEA

2024 SKT Fellowship 6기 과제 설명 & 면접 후기

서론

뒤늦게 올리는 2024 SKT Fellowship 6기 면접 후기입니다.

사실 서류합도 했고 이정도면 당연히 붙지 않을까라고 생각했지만, 음... 아쉽게 면접에서 떨어졌습니다만..

좋은 경험이었다고 생각합니다.

 

본론

저희 팀 구성은 학부생 3학년, 학부생 4학년, 대학원생 2학년으로 이루어진 팀이고 3명다 학교가 달랐습니다.

준비는 3주정도 전부터 2일~3일에 한번씩 회의를 하며 자료조사 내용을 공유하며 프로젝트 제안서를 작성했습니다.

 

 

과제 설명

"저희가 진행한 과제는 RAG와 LLM 파인튜닝을 통한 Text2SQL 모델 성능 개선" 과제였습니다.

 

과제의 핵심을 요약하자면, 일반적인 Text2SQL은 LLM을 이용한 쿼리생성에 문제가 없지만 실무에 사용하는 대용량 DB(Hive 시스템)은 쿼리생성을 위해 LLM에 제공해야하는 데이터의 양이 너무 커서 제한 토큰수를 넘기거나, 생성 성능이 떨어지는 문제가 있습니다.

 

 

도식화하여 간단하게 이해를 돕자면 다음과 같습니다.

 

소규모 데이터베이스, 작게 설계된 Table이라면  위와 같은 설계가 가능합니다.

심지어 이러한 Text2SQL 시스템은 이미 오픈소스 모델도 많고 Spider나 Bird같은 유명한 벤치마크들도 존재합니다.

 

 

하지만 실무에서 쓰는 대규모 데이터베이스 시스템에서는 다음과 같이 매우 방대한 양의 데이터를 다루기에 데이터베이스에 대한 메타정보 전부를 넣어줄 수 없습니다.

 

그렇기 때문에 RAG를 이용해 필요한 정보만참고하여 SQL생성에 이용하는 시스템을 구축하는 과제입니다.

 

서류 합격

우리가 제안서로 제출한 PPT는 39페이지, 논문도 10개 넘게 레퍼런스 했다.

실제로 할수 있을 법한 성능을 높일 수 있는 기능과, 조금 도전적으로 성능을 높일수 있는 아키텍처을 섞어서 넣었다.
그리고 개발될 프로토타입 디자인 정도로 제안했고 문제없이 서류합격이 되었다.

 

서류 작성을 위한 과제에 대한 더 자세한 정보라던지, 혹은 우리가 가용할 수 있는 회사의 자원이라던지의 정보를 사무국에 메일로 문의 했을때 상당히 자세히 그리고 정성스럽게 알려주셔서 운영에 대해서 매우 만족스러웠다.

 

면접 탈락

면접을 위한 약간의 전략과 멘토단의 마음에 들기 위한 무기들을 준비해 갔다. 비밀이긴 한데, 별거 아니다.

면접 시간대를 보니 대충 어림잡아 3~4팀정도가 면접을 보게된 것 같았다.

 

발표용으로 새로 만든 PPT로 발표를 진행했으며,

기대 효과를 포함한 다른 부가적인 내용을 제외하고 제안할 아키텍처에 대해서만 발표했다. 

 

발표가 끝난후 몇가지 질문을 받았는데,

우리가 제안하는 모델 평가 방법에 대해서 추가적인 설명을 요구하는 것과,

각자 학교도 다르고 한데 시간을 많이 투자가 가능하느냐의 취지 인것 같은 말과 함께 각자에대한 짧은 소개를 부탁했다.

 

예상 질문에대한 대답을 전날 여러개 뽑아서 준비를 했는데, 생각보다 질문을 많이 하지는 않아서 조금 아쉽기도 했다.

 

기대를 많이 해서그런지 더 아쉬운것 같다.

 

결론

취업이나 연구실에 관련되 좋은 활동이라고 생각했고, 마침 현재 관심을 가지고 공부하고 있는 부분과도 맞는 부분이 있었기에 합격하지 못해서 많이 아쉽다. 다음에 공고가 나면 한번더 도전해볼 법 한것 같다.