URL : http://revenueai.learninglab.co.kr:40101/ Github : **https://github.com/rapport87/revenue**
<aside> 💡 요약
</aside>
Langchain과 크롤링을 조합하여 만든 LLM기반 어플리케이션 입니다. sitemap.xml이 없는 환경에서 정보를 가져오기 위해 별도의 모듈인 Beautifulsoup을 활용하여 크롤링을 하였습니다.
크롤링에 좀 더 익숙해 질 수 있었고, 크롤링 된 자료로 ChatGPT의 답변 수준이 어떻게 바뀌는지 차이점을 느낄 수 있었습니다.
<aside> 💡 개발 배경
</aside>
국세청에 세액 신고를 할 때마다 계산을 위한 자료를 찾는게 번거롭고 힘들어서 제작한 어플리케이션 입니다.
찾아보니 유사한 프로그램이 따로 존재 하지 않아 크롤링된 자료를 선행 학습 시켜 놓은 LLM 어플리케이션의 성능이 궁금하여 개발 해 보기로 하였습니다.
<aside> 💡 주요기능
</aside>
<aside> 💡 개발에서 얻은 의미
</aside>
LLM에 이용하기 위한 크롤링을 처음 해봤는데, 생각보다 데이터의 정제가 세밀하게 들어가야 한다는 점이 어려웠으나 기술 습득에 많은 도움이 됐습니다.
GPT3.5 와 GPT4 모델을 변경해서 써 본 결과, 질문에 대한 답변 능력이 모델에 따라 편차가 크다는것을 알 수 있었고, 원하는 답변을 얻기 위해 정보가 많을때의 프롬프트 작성 연습을 많이 해볼 수 있었습니다.
<aside> 💡 기술
</aside>