공부/AI-POT

AI-POT 2급 자격증 공부(생성형AI_원리_모델_한계)

hyos 2026. 6. 12. 01:09

ChatGPT는 어떻게 글을 쓸까? 생성형 AI 원리·종류·한계 완전 정리

ChatGPT에게 질문하면 사람처럼 술술 답하고, 미드저니에 한 줄 입력하면 멋진 그림이 뚝딱 나옵니다. 그런데 이 AI들은 정말 '창조'를 하는 걸까요? 가끔 엉뚱한 거짓말(환각)은 왜 할까요? 이 글에서는 생성형 AI의 작동 원리부터 LLM·이미지 모델 종류, 그리고 꼭 알아야 할 세 가지 한계까지 한 번에 정리합니다.


생성형 AI, '무에서 유'를 만드는 게 아니다

가장 먼저 바로잡아야 할 오해가 있습니다.

생성형 AI는 아무것도 없는 백지에서 새로운 걸 만들어내지 않습니다.

생성형 AI(Generative AI)는 기존 데이터를 학습해 새로운 콘텐츠를 창작하는 시스템입니다. 핵심은 '기존 데이터'에 있어요. 대량의 데이터를 분석해 패턴을 학습하고, 그 패턴을 바탕으로 새로운 결과물을 조합해내는 거죠. 텍스트는 물론 이미지·음악·영상까지 다양한 형태로요.

그래서 "AI가 학습 데이터와 완전히 무관한 독창적 지식을 스스로 창조한다"거나 "인간의 창의성을 완전히 대체한다"는 말은 틀린 설명입니다. 이 메커니즘을 정확히 이해해야 AI가 할 수 있는 일과 없는 일을 구분하고, 더 똑똑하게 명령을 내릴 수 있습니다.


생성형 AI는 어떻게 발전해왔나 (출시 순서)

시험에도 자주 나오고, 흐름을 이해하는 데도 중요한 게 바로 출시 순서입니다.

트랜스포머(2017) → BERT(2018) → GPT-3(2020) → ChatGPT(2022)

모든 것의 시작은 2017년 트랜스포머(Transformer) 입니다. 기존 RNN의 한계를 극복하기 위해 등장한 새로운 AI 구조였죠. 이 트랜스포머를 토대로 2018년 BERT가 나왔고, 2020년 GPT-3를 거쳐, 마침내 2022년 우리가 아는 ChatGPT가 세상에 등장합니다.

📌 헷갈리기 쉬운 포인트: BERT가 ChatGPT보다 먼저 나왔습니다.


생성형 AI의 두 갈래: 글을 쓰는 AI vs 그림을 그리는 AI

📝 텍스트를 만드는 LLM (거대 언어 모델)

LLM(Large Language Model) 은 이름 그대로 방대한 데이터셋으로 학습한 텍스트 기반 생성 AI입니다. 이 '방대한 데이터셋'이 LLM을 설명하는 핵심 키워드예요. 덕분에 사람과 대화하듯 자연스러운 응답이 가능합니다.

대표 주자: ChatGPT, 코파일럿(Copilot), 클로드(Claude), 제미나이(Gemini)

한 가지 중요한 사실. LLM은 데이터베이스에 접속해 정답을 꺼내오는 게 아닙니다. 학습한 패턴을 바탕으로 확률적으로 '다음에 올 단어(토큰)'를 예측하며 문장을 만들어냅니다. 바로 이 방식 때문에 뒤에서 설명할 환각 현상이 생기죠.

🎨 이미지를 만드는 모델: GAN과 확산 모델

이미지 생성 AI는 크게 두 방식이 있습니다.

방식 작동 원리
GAN 생성자판별자가 경쟁하며 점점 진짜 같은 이미지를 만듦
확산 모델(디퓨전) 이미지에 노이즈를 점점 추가했다가, 거꾸로 노이즈를 제거하며 선명한 이미지로 복원

확산 모델의 "노이즈를 걷어내며 흐릿한 화면이 선명해지는" 과정이 핵심입니다. 우리가 아는 대표 서비스들도 이 방식을 씁니다.

모델 기반
스테이블 디퓨전 디퓨전 모델
미드저니 디퓨전 모델
코파일럿 / DALL-E 3 트랜스포머 아키텍처

💡 재밌는 사실: DALL-E라는 이름은 초현실주의 화가 살바도르 달리와 픽사 로봇 영화 월-E에서 영감을 받아 지어졌습니다.


똑똑하지만 완벽하진 않다 — 생성형 AI의 3대 한계

생성형 AI를 제대로 활용하려면 한계를 아는 것이 더 중요합니다. 꼭 기억해야 할 세 가지예요.

1️⃣ 환각 (Hallucination) — 그럴듯한 거짓말

실제로 존재하지 않는 정보를 진짜처럼 꾸며내는 현상입니다. 학습 데이터의 한계, 프롬프트 맥락 오해, 확률적 생성 방식이 원인이죠.

  • 🧑‍⚖️ 가짜 판례 사건: 한 변호사가 ChatGPT가 만들어준 존재하지 않는 판례를 법원에 제출했다가 망신을 당했습니다.
  • 📄 갤럭티카 폐쇄: 메타가 만든 과학 논문 요약 AI '갤럭티카'는 그럴듯한 가짜 정보를 쏟아내 결국 공개 3일 만에 내려졌습니다.

2️⃣ 편향성 (Bias) — 한쪽으로 치우친 판단

특정 집단·생각·의견에 더 호의적이거나 부정적으로 반응해 치우친 결과를 내는 현상입니다. 특정 직업을 성별과 연결 짓거나, 인종·문화 고정관념을 반영하는 식이죠. 원인은 과거 데이터에 녹아 있는 사회·문화적 편견입니다.

  • 👔 아마존 채용 AI 사건: 과거 남성 중심의 이력서 데이터로 학습한 탓에, 여성 지원자에게 불리한 점수를 매겨 결국 폐기됐습니다.

3️⃣ 블랙박스 (Black Box) — 속을 알 수 없는 상자

AI가 어떤 결론을 내렸을 때, 그 판단 과정을 인간이 이해하거나 해석하기 어려운 현상입니다.

  • 설명 불가능: 왜 그런 답을 냈는지 알 수 없음
  • 예측 불가능: 같은 질문에도 다른 답이 나옴
  • 통제·디버깅 어려움

의료 진단, 자율주행, 대출 거절처럼 이유가 중요한 분야에서 특히 문제가 됩니다. "왜 대출이 거절됐죠?"에 AI가 답하지 못하면 곤란하니까요.

🔑 한 줄 구별법

  • 없는 정보를 지어냄 → 환각
  • 특정 집단을 차별 → 편향성
  • 판단 과정을 알 수 없음 → 블랙박스


한 걸음 더 — GPT vs BERT vs PaLM

조금 더 깊이 들어가면, 같은 트랜스포머 기반이라도 모델마다 성격이 다릅니다.

모델 읽는 방향 학습 방식 특징
GPT 단방향 → 다음에 올 단어 예측 글 생성에 강함
BERT 양방향 ↔ 문장 속 빈칸 맞추기 좌우 문맥을 모두 고려
PaLM 코딩·수학·논리 추론 특화 (구글)

"양방향으로 읽고 좌우 문맥을 고려하며, 일부 단어를 가린 뒤 맞히는 모델"이라면? 정답은 BERT입니다.

보너스: AI의 편향성, 이렇게 확인하세요

  • 반대되는 질문, 다양한 관점의 질문을 던져보기
  • '항상', '절대로' 같은 과장된 표현 경계하기
  • 출처 확인 + 좋은 점·나쁜 점을 모두 말하는지 균형 테스트
  • 가장 효과적인 방법: 같은 질문을 다양한 관점에서 여러 번 반복해 답변의 일관성을 관찰하기
    • 이때 이전 대화에 영향받지 않도록 새 채팅방을 자주 여는 것이 좋습니다.

마치며

정리하면 이렇습니다.

생성형 AI는 '학습한 데이터'를 바탕으로 콘텐츠를 만들 뿐, 무에서 유를 창조하지 않는다. 그래서 환각·편향·블랙박스라는 한계를 안고 있다.

이 원리를 이해하면 AI를 맹신하지도, 무작정 두려워하지도 않게 됩니다. AI는 강력한 도구지만, 그 결과물을 비판적으로 검증하는 것은 결국 사람의 몫이니까요.


📇 핵심만 빠르게 — 한 줄 암기 카드

  • 데이터 학습 → 새 콘텐츠 창작 (무에서 유 ❌) → 생성형 AI
  • 출시 순서: 트랜스포머(17) → BERT(18) → GPT-3(20) → ChatGPT(22)
  • 방대한 데이터 + 텍스트 → LLM (ChatGPT·코파일럿·클로드·제미나이)
  • 생성자 vs 판별자 → GAN / 노이즈 추가 후 제거 → 확산 모델
  • 디퓨전 기반: 스테이블디퓨전·미드저니 / 트랜스포머 기반: DALL-E 3
  • 살바도르 달리 + 월-E → DALL-E
  • 없는 정보 생성(가짜 판례·갤럭티카) → 환각
  • 특정 집단 치우침(아마존 채용) → 편향성
  • 판단 과정 불명(의료·자율주행·대출) → 블랙박스
  • 단방향 GPT / 양방향 빈칸 BERT / 코딩·수학 PaLM

이 글이 도움이 되셨다면 공감과 댓글 부탁드려요. AI 개념 정리 시리즈, 다음 편에서 계속됩니다! 🙌

#생성형AI #ChatGPT #LLM #환각 #편향성 #블랙박스 #디퓨전모델 #DALLE #AI자격증 #AIPOT