개인정보 AI 챗봇에 입력해도 괜찮을까? 보안 현실 점검

AI 챗봇에 주민등록번호를 입력한 적 있나요? 아니면 회사 기밀 자료를 붙여넣고 요약을 요청한 적은요? 지금 이 순간에도 전 세계 수억 명이 챗GPT, 제미나이, 퍼플렉시티를 쓰면서 알게 모르게 민감한 정보를 흘리고 있어요.
보안 전문 매체 사이버리즌(Cybereason)은 딱 한 줄로 정리했어요. “챗봇에 입력하는 모든 내용이 타인에게 노출될 수 있다고 가정하라.” 단순 경고가 아니라, 실제 소송으로 이어진 사례들에서 나온 교훈이에요.
핵심 요약
- LLM은 대화를 저장하지 않도록 설계됐지만, 실제 서비스들은 대화 이력과 맥락 데이터를 재사용하는 구조로 운영되고 있어요.
- 미국 의회에 상정된 GUARD 법안은 광고 타기팅, 행동 프로파일링, 제3자 데이터 판매 등 5가지 개인정보 침해 유형을 명시하며 규제를 구체화하고 있어요.
- 동탄성심병원 송시영 교수팀 연구에서 GPT-4는 의료 질문에 평균 4.8/5 정확도를 보였지만, 이는 AI가 의료 정보를 ‘처리’할 수 있다는 뜻이지 ‘안전하다’는 뜻이 아니에요.
- 로맨스형 챗봇, 음성 인식 기반 앱 등 특수 목적 챗봇은 일반 챗봇보다 개인정보 수집 위험이 훨씬 높아요.
지금 무슨 일이 벌어지고 있나요
기술적으로 설명하면 이래요. LLM 자체는 대화를 기억하지 않도록 설계됐어요. 그런데 실제 서비스는 달라요. 테크데일리 보도에 따르면, 대부분의 챗봇 서비스는 사용자 경험 개선을 이유로 대화 이력과 맥락 데이터를 저장하고 재사용해요. 그 데이터가 어디로 가는지는 또 다른 문제예요.
미국에서는 이 문제가 입법 단계로 들어갔어요. GUARD 법안이 의회에 상정되면서 AI 챗봇의 개인정보 처리 방식 논의가 본격화됐어요. 특히 미성년자 보호와 무단 데이터 공유 금지에 초점을 맞추고 있는데, 전문가들은 이 법안이 전 세계 AI 규제의 기준점이 될 수 있다고 봐요.
국내도 예외가 아니에요. 직장인들이 사내 이메일이나 사업계획서를 챗봇에 붙여넣고 요약을 요청하는 경우가 빈번한데, 이건 회사 기밀을 외부 서버에 올리는 것과 같은 행위예요.
실제로 어떤 정보가 위험한가
절대 입력하면 안 되는 7가지
애플경제 보안 가이드라인이 정리한 입력 금지 항목은 생각보다 구체적이에요.
- 비밀번호 — 새 비밀번호 생성 목적이라도 금지예요
- 금융정보 — 신용카드 번호, 은행 계좌, 투자 데이터
- 주민등록번호·사회보장번호 — 사기 피해 위험 최고 등급
- 기밀문서 — 주소, 계좌번호가 포함된 모든 문서
- 업무 정보 — 사내 이메일, 사업계획서, 발표 자료
- 의료 정보 — 건강보험 정보, 검사 결과, 진단 기록
- 타인의 개인정보 — 제3자 데이터 유출로 이어질 수 있어요
여기서 짚고 넘어갈 게 있어요. 의료 정보 항목이에요. 동탄성심병원 송시영 교수팀이 GPT-4 계열 모델의 무릎 인공관절 수술 관련 질문 정확도를 테스트한 결과, 평균 4.8/5 이상을 기록했어요. 퀄리티는 높아요. 그런데 정확하다는 건 입력한 내용을 ‘잘 처리한다’는 뜻이지, 그 데이터가 ‘안전하게 보관된다’는 뜻이 아니에요. 이 둘을 헷갈리는 경우가 많아요.
일반 챗봇보다 더 위험한 것들
NordVPN 사이버보안 어드바이저는 특히 로맨스형 챗봇과 음성 인식 기반 앱을 경고했어요. 로맨스 챗봇에는 개인 정보를 추출하도록 설계된 트래커가 내장된 경우가 많고, 음성 인식 챗봇은 통화 데이터를 분석해 신체적·정신적·인지적 상태까지 평가할 수 있어요. 일반 텍스트 입력과는 차원이 다른 위험이에요.
플랫폼별 리스크 비교
| 항목 | 범용 챗봇 (GPT, 제미나이) | 전문 의료 AI (Ada, Wysa) | 로맨스·소셜 챗봇 |
|---|---|---|---|
| 데이터 저장 | 서비스 정책에 따라 저장 | 의료 규정 준수 설계 | 고위험 (트래커 내장 사례) |
| 제3자 공유 | 플랫폼별 상이 | 제한적 (의료법 규제) | 빈번한 마케팅 활용 |
| 삭제 권한 | 제한적 | 상대적으로 명확 | 불투명 |
| 의료 정보 처리 | 높은 정확도, 낮은 안전성 | 규제 환경 내 처리 | 비권장 |
| 업무 기밀 적합성 | 금지 | 해당 없음 | 금지 |
| 사용자 통제권 | 중간 | 높음 | 낮음 |
범용 챗봇이 편리한 건 맞아요. 그런데 의료 정보라면 Ada나 Wysa처럼 의료법 규제 환경에서 운영되는 도구를 쓰는 게 적합해요. 목적에 맞는 도구를 고르는 것, 이게 핵심이에요.
범용 챗봇의 가장 큰 문제는 삭제예요. GUARD 법안 분석에 따르면, 대부분의 챗봇 플랫폼에서 사용자가 자신의 대화 이력을 직접 확인하거나 삭제하는 것 자체가 제한적이에요. 한 번 올라간 데이터는 내 통제 밖으로 나가는 셈이에요.
개인·기업이 지금 당장 해야 할 것
개인 사용자라면:
챗봇을 쓸 때 “이걸 공개 게시판에 올려도 되나?“라고 먼저 물어보세요. 대답이 ‘아니오’라면, 챗봇에도 입력하면 안 돼요. 음성 기반 AI 앱은 마이크 권한을 정말 필요한 순간에만 허용하고, 하루 연속 1시간 이상 챗봇을 쓰는 것도 자제하는 게 좋아요 — 정보 노출 위험뿐 아니라 의존도 문제도 생기거든요.
기업과 개발팀이라면:
상황이 더 심각해요. 임직원이 ChatGPT에 사업계획서를 붙여넣는 순간, 그 내용은 OpenAI 서버에 저장될 수 있어요. 많은 기업이 ChatGPT Enterprise나 Azure OpenAI 같은 기업용 플랜을 따로 쓰는 이유가 바로 이거예요 — 데이터를 모델 학습에 쓰지 않도록 계약상 보장받는 거예요. 무료·기본 플랜과 기업 플랜의 차이, 반드시 확인하세요.
결론: 편리함이 보안을 이겨선 안 돼요
핵심은 설계와 운영의 간극이에요. LLM은 안전하게 설계됐지만, 서비스 레이어에서 데이터가 쌓이고 공유돼요. 주민번호, 금융정보, 의료기록, 업무 기밀 — 이 네 가지는 어떤 이유로도 챗봇에 입력하지 마세요. 그리고 GUARD 법안과 각국 규제가 강화되는 건 시간문제예요. 앞으로 6~12개월 안에 기업용 AI 거버넌스 정책이 없는 회사는 규제 리스크에 직접 노출될 거예요.
챗봇에 무언가를 입력하기 전, 딱 한 번만 물어보세요. “이걸 모르는 사람이 봐도 괜찮나?” 이 질문 하나가 보안 사고를 막는 가장 단순하고 강력한 방법이에요.
참고 자료: 애플경제 - 챗봇에 절대 입력해선 안 될 내용들 / 테크데일리 - GUARD 법안 분석 / AI 챗봇 안전 사용 가이드
참고자료
- “챗봇에 절대 입력해선 안 될 내용들” < IT생활 < 디지털라이프 < 기사본문 - 애플경제
- 사생활 털어놓는 챗GPT, 개인정보 괜찮을까 – 바이라인네트워크
- 미 의회, 챗봇 안전 규제 본격 논의…GUARD 법안이 던진 개인정보 경고 < AI < AI&클라우드 < 큐레이션기사 - 테크데일리(TechDaily)
Photo by Markus Winkler on Unsplash


