안녕하세요 Business Insight팀 갈렙입니다!
여러분, 여행 갈 때 숙소 선택 정말 어렵죠? 수많은 리뷰를 일일이 읽어보기도 벅차고, 이 숙소만의 특별한 매력을 바로 알기란 쉽지 않잖아요. 이럴 때, “어디가 좋을까?” 고민하다가 지쳐버리기도 하구요. 그런데, 만약 누군가가 중요한 리뷰만 쏙쏙 뽑아서 이 숙소의 진짜 매력과 꿀팁을 바로 보여준다면 어떨까요? 그래서 Business Insight팀은 Microsoft Azure OpenAI 모델을 사용해 생성형 AI로 리뷰를 분석하고, 숙소의 핵심 포인트와 꿀팁을 자동으로 추출하는 시스템을 만들었어요!
이제 사용자는 긴 리뷰를 헤매지 않아도, 숙소의 장점과 특장점을 한눈에 알 수 있답니다. 이걸 통해 숙소의 매력도를 한껏 높여서, 여러분이 더 쉽게
‘이거다!’ 싶은 숙소를 찾을 수 있게 도와드리려고 해요.
이번 글에서는 저희가 어떻게 데이터를 다루고, 모델을 개선해가며 이걸 가능하게 했는지 공유하려고 해요. 읽어보시고, “우리 회사가 이런 것도 한다니!”라고 자랑할 만한 기술이 됐으면 좋겠어요.
리뷰 데이터, 정말 깨끗할까요?
숙소를 선택할 때 가장 먼저 확인하는 건 무엇일까요? 아마도 숙소 사진을 보고, 위치를 확인하는 것이겠죠? 그런데 그 다음에는 자연스럽게 리뷰를 보게 됩니다. 다른 사람들이 남긴 리뷰를 보면 숙소의 실제 모습을 알 수 있을 것 같지만, 막상 읽어보면 몇 줄로는 부족한 느낌이 들 때가 많아요. 그래서 스크롤을 계속 내리게 되죠.
하지만 리뷰가 많아지면 너무 주관적이거나 중복된 내용이 많아져서 중요한 정보를 놓치게 됩니다. 그래서 우리가 하는 첫 번째 작업은, 이 리뷰 데이터를 깔끔하게 정리하는 거예요. 그런데 어떻게 이 많은 리뷰를 효율적으로 정리할 수 있을까요?