제 744 호 딥시크의 보안 문제, 챗GPT의 대항마로서의 위기
과도한 개인정보 수집 등으로 논란이 되었던 중국 생성형 인공지능 ‘딥시크’가 국내 서비스를 잠정 중단했다. ‘딥시크’는 ‘챗GPT’와 같은 인공지능 모델로, 올해 1월 20일 중국에서 600만 달러가 안되는 자본으로 개발해 화제를 모았다. 그러나 개인정보 유출과 데이터 처리 불투명성 등의 문제로 당분간은 국내에서 ‘딥시크’를 사용하지 못할 전망이다. ‘딥시크’ 논란 정리와 함께 ‘챗GPT’와의 성능 비교 내용을 담아보았다.
딥시크 등장의 의미
올해 설 연휴, 주식 시장의 가장 큰 이슈는 ‘딥시크 쇼크’였다. 중국에서 개발한 이 ‘딥시크’의 등장으로 빅 테크 기업의 주가가 폭락을 했기 때문이다. 출시 이후 일주일 만에 미국 시가 총액 1위 기업이었던 엔비디아의 주가가 17% 급락하면서 미국 증시도 흔들렸다.
‘딥시크’의 등장이 파격적이었던 이유는 가성비가 큰 몫을 차지한다. 딥시크는 엔비디아 H800 칩 등 저사양이지만 저비용인 GPU를 병렬로 활용해 비용 대비 효율적인 인프라를 구축했다. 기존 AI 모델들이 고성능 반도체에 대한 의존도가 높아 고비용 투자가 요구됐던 것에 비해 ‘딥시크’는 타 모델 개발 비용의 10분의 1 수준인 약 80억을 사용했다는 것이다.
파격적으로 등장한 딥시크는 미국의 반도체 수출 제한이 중국의 자국 내 기술 자립과 혁신을 가속화하는 방향으로 이끌어 ‘딥시크’를 탄생시켰다. 중국에 가장 풍부한 것이 인적자원인데, 중국 박사 학위자의 약 60%는 이공계 분야이기에 혁신적인 AI 개발 성공할 수 있었다는 것인데, 수출 규제가 젊은 인재들의 창의성을 끄집어 냈다는 것이 사람들에게 놀라움을 주었다.
▲딥시크 모델 메인 화면 (출처: https://www.deepseek.com/)
개인정보 수집 논란
그러나 딥시크 쇼크는 이탈리아에서 개인정보 보호 문제로 세계 최초로 ‘딥시크’에 대한 차단 조치를 시행하면서 한국에서도 큰 논란이 일었다. ‘딥시크’에서 수집하는 데이터는 다른 AI 업체들과 큰 차이가 없다. 그러나 문제가 된 것은 키보드 입력 패턴을 추적한다는 점과 서버가 중국에 있다는 점이었다.
현재 다른 생성형 AI 서비스에는 개인정보 수집 및 활용을 거부하는 선택지인 ‘옵트아웃’을 제공하고 있지만 ‘딥시크’는 제공하지 않는다. 중국의 데이터보안법에 따르면 국가 기관이 요청할 경우 기업은 정보를 제공해야 한다는 규정이 있는데, 이는 언제든지 개인정보가 중국에 유출될 가능성을 배제할 수 없는 부분이다. 또, 인공지능 전문가들은 키 입력 패턴을 추적하는 것은 개인을 식별하는 데 이용될 수도 있다며 ‘딥시크’의 개인 정보 보호 부분에 의문을 제기하고 있다.
이에 지난 2월 5일에는 산업통상자원부, 외교부, 국방부가 ‘딥시크’ 이용을 한시적으로 차단했으며, 17일에는 개인정보보호 위원회에 따라 “딥시크의 국내 서비스가 잠정 중단됐다”라며 “개선, 보완이 이뤄진 후 서비스가 재개될 예정”이라고 밝혔다.
딥시크 VS 챗GPT
많은 대학생들이 이미 생성형 AI를 사용하고 있다. 그중 가장 많이 사용되는 AI는 단연, 챗GPT다. 심지어 86%나 챗GPT 사용 이후에 학습 효율이 상승했다고 응답한 설문 결과도 있다.
▲성균관대 재학생 대상, 챗 GPT 관련 설문 (사진: https://webzine.skku.edu/skku/campus/skk_comm/press.do?mode=view&articleNo=109265)
지금은 한시적으로 딥시크의 이용이 제한되어 있으나, 만약 정보 보안 관련 문제가 해결된다면 사용하게 될 수 있으니 우리에게 친숙한 챗GPT와 딥시크를 비교해 보았다.
먼저 공통점은 둘 다 대화형 ai로, 텍스트 기반 질문에 답변을 제공한다는 것, 콘텐츠 생성⦁질의응답⦁분석⦁코딩 등 다방면에 활용할 수 있다는 것, 다국어를 지원한다는 점 등이 있다. 차별점으로 가장 부각되는 것은 ‘사용료’이다. 챗GPT는 유료/무료 버전을 제공하지만, 딥시크는 ‘무료’ 버전만을 제공한다. (무료인 딥시크의 성능이 챗GPT의 유료 버전과 비슷하기 때문에 많은 이목을 끌었다.) 그리고 챗GPT는 답변의 추론 과정을 알 수 없는 반면, 딥시크는 추론 과정을 공개하기 때문에 프롬프트를 수정하기에 용이하다는 사용상의 차이점이 있으며 챗GPT 대비 모바일 환경에 최적화되어 있다는 특징이 있다. 즉 딥시크는 챗GPT 대비, 사용자의 편의성이 증가한 것이다.
딥시크, 챗GPT 보다 뛰어날까?
객관적으로 딥시크의 성능이 뛰어난 것은 사실이나, 딥시크는 챗GPT의 큰 장점이 되는 API(Application Programming Interface)를 활용할 수 없다. API는 서로 다른 소프트웨어 시스템이 서로 통신하고 데이터를 주고받을 수 있도록 도와주는 역할을 한다. API를 활용하면 반복적이고 시간이 많이 소요되는 작업을 자동화할 수 있고, 다양한 데이터 소스에서 데이터를 쉽게 수집하고 통합할 수 있어, 필요에 따라 기능을 확장하거나 변경하는 것이 용이해진다. 즉, 이러한 API를 활용할 수 없는 딥시크는 ‘확장성’ 측면에서 큰 결함을 가지게 되는 것이다.
그렇다면 딥시크는 왜 API를 활용할 수 없을까? 현재 딥시크는 API에 제한이 걸려있는 상태이다. 정책적, 기술적인 이유들도 있으나 제한이 걸린 가장 큰 이유는 계속해서 언급되는 ‘보안 문제’ 탓이다. 딥시크가 API를 활용하게 되면 데이터를 외부로 전송하게 되는데 그 과정에서 보안 취약점이 발생할 우려가 크기 때문이다.
관심이 집중되는 딥시크의 행보
사실 지금 당장, 딥시크와 챗GPT의 정확한 성능을 비교하기엔 어려움이 있다. 딥시크가 신생기업에서 나온 것이고, 세상에 발표된 지도 얼마 되지 않아서 정보 자체가 적기 때문이다. 게다가 지금은 정부 제한까지 걸려있는 상황이기에, 대략적인 큰 특징들만을 정리하여 챗GPT와 비교해 보았다. 딥시크가 뛰어난 성능에 무료 사용이라는 큰 이점으로 주목을 받았지만, 계속해서 보안 문제가 불거지고 있는 만큼 향후 딥시크가 개인정보 보호와 보안에 대한 우려를 해소하고, 관련 기관과의 협력을 통해 신뢰를 구축할 수 있을지 관심이 집중될 전망이다.
이윤진 기자, 오도연 기자