아무 생각없이 ChatGPT에 파일 업로드 했죠?

저는 처음 그 말을 들었을 때 순간적으로 말문이 막혔습니다. 헬스장에서 가끔 마주치던 옆 자리 회사원이 물어봤거든요. "그냥 ChatGPT에 올리면 되는 거 아니에요?" 농담인가 싶어서 한 번 쳐다봤는데, 표정은 진지했습니다.

저도 그게 처음 들은 질문은 아니었어요. 지인한테도, 클라이언트한테도, 심지어 업계 선배한테서도 비슷한 말을 들은 적이 있었으니까요. 그런데 그날은 왠지 그냥 넘기기가 어렵더라고요. 아마 그 사람이 나쁜 의도로 한 말이 아니라는 걸 알았기 때문에 더 그랬던 것 같습니다. 악의가 아니라 진심으로 "왜 그렇게 오래 걸려요?"라는 뜻으로 한 말이었으니까요. 그게 오히려 더 서늘했습니다.

그 질문 안에는 두 가지 오해가 동시에 들어 있었습니다. 하나는 "AI가 내 일을 대신 잘 해줄 것"이라는 믿음, 그리고 또 하나는 "파일을 올리는 것 자체가 아무 문제 없다"는 전제였어요. 특히 두 번째가 저는 더 신경 쓰였습니다. 파일 하나를 AI 서비스에 업로드한다는 건, 그 안에 담긴 정보가 내 손을 떠난다는 뜻이기도 하거든요. 어떤 경로로, 얼마나 오래, 누가 볼 수 있는 상태로 저장되는지 확인도 안 한 채로요. 집 열쇠를 처음 본 사람한테 맡기면서 "뭐 어때요, 그냥 잠깐이잖아요"라고 하는 것과 크게 다르지 않은 셈입니다.

그 짧은 대화가 계속 머릿속에 남았습니다. 그래서 저는 실제로 주요 AI 서비스들의 약관을 직접 뒤져보기로 했습니다. 편하다고 느끼는 것과, 실제로 안전한 것은 다른 문제라는 걸 확인하고 싶었거든요.

나도 처음엔 '어차피 AI가 다 해주겠지' 했다

솔직히 말하면, 저도 그 탈의실 대화를 듣기 전까지는 별 생각 없이 올렸습니다. 클라이언트한테 받은 계약서 초안, 내부 회의 요약본, 심지어 급여 관련 스프레드시트 일부까지. "AI가 이 문맥을 이해하려면 전체 파일이 있어야 하니까"라는 논리로 스스로를 납득시키면서요. 파일을 올리는 데 걸리는 시간은 3초였고, 그때는 그게 전부인 줄 알았습니다.

문제는 한참 뒤에 왔습니다. 어느 날 밤 잠들기 전에 문득 이런 생각이 들었어요. "내가 오늘 올린 그 파일, 지금 어디 있지?" 저장이 되는 건지, 학습에 쓰이는 건지, 아니면 그냥 세션이 끝나면 사라지는 건지 — 사실 아무것도 몰랐습니다. 편하다고 느끼는 것과, 실제로 안전한 것은 다른 문제라는 말이 왜 머릿속에서 계속 맴돌았는지 그때야 알았습니다.

참고 소스에서 Juliette도 비슷한 맥락을 짚었습니다.

"I've been playing with AI since the fall, when it started stealing my job for real. I could either declare it evil and turn into one of those people who will never get a smartphone, or use it to my advantage."

출처 — AI를 무조건 거부하거나, 무조건 신뢰하거나. 그 사이 어딘가에 있어야 한다는 걸 저도 뒤늦게 체감했습니다. 저는 그 중간 지점을 찾기도 전에 이미 민감한 파일을 여러 번 올려버린 상태였고요.

더 불편한 건 따로 있었습니다. 나중에 확인해보니, 제가 올렸던 파일 중 하나에는 거래처 담당자 이름과 이메일이 포함되어 있었습니다. 제 정보가 아니라 다른 사람의 정보였던 거죠. 개인정보란 내 이름, 내 주민번호만을 뜻하지 않습니다. 업무상 수집된 제3자의 연락처나 계약 조건도 해당됩니다. 이걸 AI 플랫폼에 올렸을 때 어떤 법적 책임이 생기는지는 그때는 진지하게 생각해본 적이 없었습니다. 편의성이 판단력을 잠깐 마비시켰던 셈입니다. 약관을 직접 읽어보기 전까지는요.

"업로드하면 그 데이터는 어디로 가는 걸까?" — 직접 약관 파봤더니

약관을 읽겠다고 마음먹은 날, 솔직히 처음엔 대충 훑고 끝낼 생각이었습니다. 그런데 막상 OpenAI의 이용약관과 개인정보처리방침을 열어보니 생각보다 분량이 상당했고, 제가 그동안 막연하게 믿고 있던 것들과 실제 내용이 꽤 달랐습니다.

무료 플랜(ChatGPT Free)을 기준으로 보면, 사용자가 입력한 내용은 기본값으로 OpenAI의 모델 학습에 사용될 수 있습니다. 모델 학습이란 쉽게 말해 AI가 더 똑똑해지는 훈련 과정인데, 내가 입력한 텍스트가 그 재료로 쓰일 수 있다는 뜻입니다. 물론 설정에서 "내 콘텐츠를 학습에 사용하지 않기"를 직접 꺼둘 수 있습니다. 문제는 그 설정이 기본적으로 켜져 있다는 것, 그리고 대부분의 사람이 그 설정 자체가 있다는 걸 모른다는 것입니다. 저도 몰랐습니다.

반면 ChatGPT Team이나 Enterprise 플랜은 다릅니다. OpenAI 공식 문서에 따르면, 이 유료 구독 플랜에서는 사용자의 입력 데이터를 기본적으로 모델 학습에 사용하지 않습니다. 즉, 같은 ChatGPT처럼 보여도 어떤 플랜을 쓰느냐에 따라 내 데이터의 운명이 달라집니다. 무료로 편하게 쓰는 대신 내 입력값이 학습 재료가 될 수 있고, 돈을 내는 플랜은 그 위험을 줄여주는 구조입니다. 헬스장 무료 체험과 정식 회원권이 제공하는 락커룸 보안이 다른 것과 비슷한 맥락입니다.

한 가지 더 확인한 게 있습니다. OpenAI는 입력된 데이터를 최대 30일간 보관할 수 있다고 명시하고 있습니다. 안전 검토와 오남용 방지 목적이라고는 하지만, 제가 업무상 올린 계약서 초안이나 고객 연락처가 30일 동안 외부 서버에 저장된다는 건 실제로 꽤 묵직하게 느껴졌습니다. 국내 기준으로 보면 개인정보 보호법상 개인정보를 제3자에게 제공하거나 처리 위탁할 때는 정보 주체의 동의가 필요한데, 그 "제3자"가 해외 AI 기업일 경우 추가로 국외 이전 동의까지 받아야 합니다. 제가 아무 생각 없이 올렸던 파일 속 고객 이름과 이메일은 이 기준에서 보면 이미 적법 절차를 건너뛴 상태였습니다.

⚠️ 주의: 무료 플랜 기본 설정은 '학습 사용 허용'이 켜진 상태다. 설정을 끄지 않으면 내 입력값이 모델 학습 재료가 된다는 사실을 대부분의 사용자가 모른 채 쓰고 있다.

약관을 다 읽고 나서 든 생각은 "AI 플랫폼이 나쁘다"가 아니라 "나는 이 서비스의 작동 방식을 전혀 모른 채 쓰고 있었다"는 것이었습니다. 그리고 모른 채 쓴다는 건, 결과에 대한 책임도 온전히 모른 채 지고 있다는 뜻이기도 합니다.

AI가 틀려도 내가 책임진다 — 그게 진짜 문제였다

약관을 다 읽고 나서 처음 든 감정은 안도가 아니었습니다. 오히려 새로운 질문 하나가 머릿속에 자리를 잡았습니다. "그래서 AI가 틀렸을 때, 그 책임은 누구한테 가는 거지?"

ChatGPT든 Claude든, 지금의 AI는 기술적으로 "확률적으로 그럴듯한 다음 단어를 예측"하는 방식으로 텍스트를 생성합니다. 쉽게 말하면, AI는 정답을 알아서 쓰는 게 아니라 "이 맥락에서 이런 말이 나올 확률이 높다"는 판단으로 문장을 완성합니다. 그 확률이 대부분 맞지만, 틀릴 때도 꽤 자신 있게 틀립니다. 이걸 업계에서는 hallucination(환각)이라고 부르는데, 실제로는 AI가 없는 사실을 있는 것처럼 매끄럽게 서술하는 현상입니다.

저도 초반에 번역 결과물을 그냥 납품할 뻔한 적이 있습니다. 기술 문서 일부를 AI로 초벌 번역했는데, 출력된 문장이 너무 자연스러워서 그냥 넘길 뻔했습니다. 나중에 꼼꼼히 검토하다 보니, 원문에 없던 수치 하나가 번역본에 멀쩡히 끼어 있었습니다. AI가 비슷한 문서들에서 학습한 패턴으로 숫자를 "만들어 넣은" 것이었습니다. 만약 그 수치가 계약서나 의약품 설명서에 있었다면, 결과는 상상하기 싫습니다. 실제로 2023년 미국에서는 변호사가 ChatGPT가 생성한 판례를 검증 없이 법원에 제출했다가, 해당 판례가 존재하지 않는 허구였다는 사실이 밝혀져 법원으로부터 징계를 받은 사건이 있었습니다. AI가 틀렸지만, 법원 앞에 선 건 변호사였습니다.

이 사건이 보여주는 구조는 단순합니다. AI 플랫폼들의 이용약관에는 대부분 "출력 결과의 정확성을 보장하지 않으며, 사용 결과에 대한 책임은 사용자에게 있다"는 문구가 포함되어 있습니다. 번역, 회계, 법무, 의료 등 전문직일수록 이 조항이 치명적으로 작동합니다. 클라이언트에게 AI 결과물을 검증 없이 전달하면, 오류가 생겼을 때 "AI가 그렇게 썼는데요"라는 해명은 면책이 되지 않습니다. 직업적 판단을 위임받은 전문가가 검수를 생략했다는 사실 자체가 과실이 됩니다. 제가 번역가로 일하면서 체감하는 것도 이 지점입니다. AI 초벌이 아무리 그럴듯해도, 최종 파일에 제 이름이 붙는 순간 그 문서의 품질은 전적으로 제 책임입니다. AI는 실수해도 이름이 없고, 저는 실수하면 이름이 남습니다.

그러면 어떻게 쓰는 게 맞을까. 결국 도구를 쓰되 판단은 내가 해야 한다는 결론으로 돌아오게 됩니다. 그 판단을 어떤 방식으로 구조화하느냐가 실제로 차이를 만들었습니다.

그래서 나는 이렇게 쓴다 — 데이터를 지키면서 AI를 활용하는 방법

판단을 구조화한다는 게 처음엔 거창하게 들렸는데, 실제로 해보니 꽤 단순한 습관 하나에서 시작됐습니다. 파일을 열기 전에 딱 한 가지만 물어보는 겁니다. "이 파일에 이름, 금액, 계약 조건이 들어 있나?" 그 답에 따라 제가 쓰는 도구가 달라집니다.

구체적으로 세 가지 시나리오로 나눠서 씁니다.

공개해도 무방한 내용일 때입니다. 예를 들어 일반 기술 문서, 제품 설명서, 공개 블로그 초안 — 고유명사나 개인정보가 없고, 유출되더라도 실질적 피해가 없는 자료들입니다. 이런 경우엔 ChatGPT Plus나 Claude를 그냥 씁니다. 속도가 빠르고 결과물 품질도 충분합니다.
민감 정보가 일부 섞인 경우입니다. 클라이언트 이름, 단가, 내부 코드명처럼 지워도 문서 의미가 살아있는 정보는 올리기 전에 일괄 치환합니다. "A사", "B 프로젝트", "단가 X"처럼 바꾼 뒤 AI에 돌리고, 결과물에 다시 실제 정보를 복원하는 방식입니다. 번거롭지만 실제로 해보면 3분도 안 걸립니다.
절대 외부로 나가면 안 되는 파일입니다. 계약서 원본, 소송 관련 서류, 의료 기록처럼 유출 시 법적·계약적 문제가 생기는 것들입니다. 이 경우엔 인터넷에 연결되지 않고 내 컴퓨터 안에서만 돌아가는 로컬 모델(쉽게 말하면, 인터넷 없이 내 기기에서만 작동하는 AI)을 씁니다. Ollama라는 도구로 Mistral 같은 소형 모델을 로컬에서 실행하면 됩니다. 속도는 느리고 성능은 GPT-4보다 떨어지지만, 데이터가 내 컴퓨터 밖으로 한 번도 나가지 않는다는 게 핵심입니다.

이 분류 자체가 완벽한 건 아닙니다. 저도 가끔 "이게 두 번째야, 세 번째야?" 경계에서 멈칫합니다. 그럴 때 제가 쓰는 기준은 하나입니다. "이 파일이 내일 뉴스에 나와도 괜찮은가?" 조금이라도 망설여지면 세 번째 카테고리로 보냅니다. 귀찮음보다 해명이 더 피곤하니까요. 직접 이 방식으로 바꾼 뒤 체감한 건, AI를 덜 쓰게 된 게 아니라 오히려 더 편하게 쓰게 됐다는 겁니다. 어디에 올려도 되는지 매번 고민하지 않아도 되니까, 쓸 때 덜 찜찜합니다. 도구를 제대로 쓰려면 결국 그 도구가 어디서 멈춰야 하는지를 내가 먼저 알고 있어야 합니다. 그런데 많은 사람들이 이 경계를 설정하기 전에, 애초에 AI 자체에 대한 더 근본적인 불안을 갖고 있습니다 — "AI가 내 일을 빼앗아 가는 것 아닌가" 하는 것입니다. 저는 그 불안이 틀렸다고 생각하지 않습니다. 다만 진짜로 무서워해야 할 지점이 조금 다른 곳에 있다고 봅니다.

"AI가 내 일을 뺏는다"보다 더 무서운 건 따로 있다

"AI가 내 일을 뺏어간다"는 불안, 저도 한동안 꽤 진지하게 품고 있었습니다. 특히 번역이나 글쓰기처럼 언어를 다루는 일에 종사하는 사람들 사이에서는 이 불안이 거의 상수처럼 깔려 있죠. 그런데 막상 AI를 몇 달 써보면서 깨달은 건, 제 일자리를 위협하는 건 AI 모델 자체가 아니라는 거였습니다. 진짜 위협은 따로 있었습니다.

가장 무서운 건 '아무것도 확인하지 않고 올리는 사람'입니다. 정확히는 — AI가 뭔가를 잘못 처리하거나 내 데이터를 학습에 쓰더라도 그걸 인지조차 못하는 상태로 계속 쓰는 습관. 옥스퍼드 인터넷 연구소(Oxford Internet Institute)가 2024년에 발표한 보고서에 따르면, 직장인 중 AI 도구를 사용하는 응답자의 약 61%가 해당 서비스의 데이터 정책을 "읽어본 적 없다"고 답했습니다. 그냥 쓰고 있는 겁니다. 약관을 밥 먹듯 읽을 필요는 없지만, 내가 무엇을 어디에 넣고 있는지 정도는 알아야 한다는 게 제 생각입니다. 그게 없으면 AI가 틀린 결과를 내놔도, 내 파일이 어딘가에 남아 있어도, 알아차릴 방법이 없습니다.

🔥 포인트: AI가 내 일을 뺏는 게 아니라, AI를 쓰면서 생각을 멈추는 사람의 자리가 없어진다. 도구는 바뀌어도 그 도구를 어떻게 다루느냐는 여전히 사용자의 문제다.

그리고 여기서 한 가지 더 — AI가 정말로 대체하기 어려운 영역은, 사실 AI를 제대로 쓸 줄 아는 사람이 지키고 있습니다. 헬스장 탈의실에서 그 질문을 들었을 때 제가 멈췄던 이유가 바로 이겁니다. "그냥 올리면 되지 않나요?"라고 말한 분은 AI를 과대평가한 게 아니라, 그 뒤에서 일하는 사람의 판단과 책임을 과소평가한 겁니다. AI가 번역 초안을 뽑아주는 건 맞습니다. 그런데 그 초안이 맥락에 맞는지, 클라이언트의 스타일 가이드 — 문서마다 용어 선택, 어투, 포맷까지 세밀하게 규정해 놓은 기준서 — 와 일치하는지, 법적으로 문제없는 표현인지를 판단하는 건 여전히 사람의 몫입니다. 그 판단을 생략하는 순간, AI가 일을 뺏는 게 아니라 내가 스스로 일을 포기하는 구조가 됩니다.

결국 제가 도달한 결론은 이겁니다. AI 때문에 내 자리가 없어지는 게 아니라, AI를 쓰면서 생각을 멈추는 사람의 자리가 없어진다는 것. 도구는 바뀌어도 — 15년 전 구글 번역이 그랬고, 10년 전 DeepL이 그랬고, 지금 ChatGPT가 그러하듯 — 그 도구를 어떻게 다루느냐는 여전히 사용자의 문제입니다. 파일을 올리기 전에 한 번 더 생각하는 습관, 그게 생각보다 많은 것을 지켜줍니다.

솔직히 말하면, 저도 이 글을 쓰기 전까지 매번 확인하진 않았습니다. 파일 이름에 고객사 이름이 들어가 있어도, 계약서 초안이어도 — 그냥 복사해서 붙여넣기 했던 적이 있습니다. "설마 이 정도야" 하는 감각으로요.

그런데 헬스장에서 그 한 마디를 들은 뒤로, 저는 파일을 올리기 직전에 딱 세 가지만 확인하게 됐습니다.

이 내용에 사람 이름이나 회사명이 들어가 있나.
이게 외부에 공개됐을 때 내가 감당할 수 있나.
그리고 — 이게 틀렸을 때 내가 직접 검토할 준비가 됐나.

세 가지 다 "그렇다"면 올립니다. 하나라도 걸리면 잠깐 멈춥니다.

거창한 보안 프로세스가 아닙니다. 3초짜리 습관입니다. 그게 전부예요.

AI는 앞으로도 계속 좋아질 것이고, 약관도 바뀔 것이고, 더 편한 도구가 또 나올 겁니다. 하지만 올리기 전에 한 번 멈추는 사람과 그냥 올리는 사람의 차이는 도구가 아무리 바뀌어도 그대로 남는다고 저는 생각합니다. 당신은 파일을 올리기 전에 무엇을 확인하나요? 아직 없다면, 지금 딱 하나만 정해두는 것부터 시작해보면 좋겠습니다.

Q. ChatGPT에 파일을 올리면 그 데이터는 학습에 사용되나요?

A. 기본 설정에서는 대화 내용이 모델 개선에 활용될 수 있습니다. 다만 설정에서 '데이터 학습 비활성화'를 켜두면 학습 사용을 막을 수 있어요. 문제는 대부분의 사람이 이 설정을 확인하지 않은 채 파일을 올린다는 점입니다.

Q. 업무 파일을 AI에 올릴 때 법적으로 문제가 생길 수 있나요?

A. 제3자의 이름, 이메일, 계약 조건 등이 포함된 파일을 외부 서비스에 업로드하면 개인정보보호법상 문제가 될 수 있습니다. '내 정보가 아니니까 괜찮다'는 논리는 통하지 않아요. 업무상 수집한 타인의 정보도 보호 대상입니다.

Q. AI를 안전하게 쓰려면 어떤 습관이 필요한가요?

A. 파일을 올리기 전에 딱 세 가지만 확인하면 됩니다. 사람 이름이나 회사명이 들어 있는지, 외부에 공개됐을 때 감당할 수 있는지, 결과물이 틀렸을 때 직접 검토할 준비가 됐는지. 거창한 보안 프로세스가 아니라 3초짜리 습관입니다.