어느덧 2024년의 상반기가 훌쩍 지나갔습니다. 요즘IT는 “완전 럭키비키잖아!”를 외치며, 꽤 긍정적인 하루하루를 보낸 것 같은데요. 요즘IT 독자분들은 어떻게 보내셨나요? IT업계는 작년에 이어 올해도 역시 ‘AI’로 핫합니다. ChatGPT와 제미나이의 경쟁 구도도 점점 심화되고 있고요. 누가 더 멀티모달을 잘 사용하는지, 누가 더 인간과 자연스럽게 소통할 수 있는지 열띤 기술 경쟁이 벌어지고 있습니다. 기획과 디자인 분야에서도 AI 툴을 어떻게 잘 활용할 것인지에 대한 논의가 계속되고 있고요. 이번에 준비한 시리즈에서는 2024년 1월부터 6월까지 카테고리별로 조회수가 가장 높았던 ‘인기 콘텐츠 TOP 7’을 살펴보고자 합니다.
사용성이 뛰어난 디자인은 평소에는 잘 알아차리지 못하지만, 사용성이 떨어지는 유사한 서비스를 사용하다 보면 얼마나 편리했는지 깨닫게 됩니다. 대부분의 플랫폼 비즈니스가 유의미한 지표로 고려하는 MAU, 이탈률을 생각하면 왜 사용성을 중요하게 여기고 디자인을 개선하려고 하는지 알 수 있습니다. 사용성이 좋은 서비스는 쉽게 이탈하지 않을뿐더러 이탈하더라도 사용성 때문에 다시 돌아올 가능성이 높습니다. 그렇다면 사용성은 어떻게 테스트할 수 있을까요? 또 얼마나 많은 사용자를 대상으로 테스트해야 할까요? 오늘은 두 가지 물음 중 후자에 대해서 말씀드립니다.
챗GPT 메인 화면 하단을 보면 이런 메시지가 쓰여 있다. ‘ChatGPT는 실수를 할 수 있습니다. 중요한 정보를 확인하세요.’ 자세히 보지 않으면 쉽게 지나칠 만큼 작은 글씨로 쓰여있지만, 이는 사실 대규모 언어 모델을 사용할 때 가장 주의해야 하는 점이다. AI가 때로 사실이 아닌 정보를 그럴듯하게 꾸며내어 말하는 현상, LLM의 고질적인 문제인 할루시네이션 현상 때문이다. 따라서 AI의 답변이 사실인지 아닌지 확인하기 위해서는 근거나 출처를 직접 확인해 봐야 한다. 도구별, 상황별로 실행할 수 있는 여러 답변 검증 방법을 정리해 봤다.