AI-POT 2급 자격증 공부(생성형AI_원리_모델_한계)
ChatGPT는 어떻게 글을 쓸까? 생성형 AI 원리·종류·한계 완전 정리
ChatGPT에게 질문하면 사람처럼 술술 답하고, 미드저니에 한 줄 입력하면 멋진 그림이 뚝딱 나옵니다. 그런데 이 AI들은 정말 '창조'를 하는 걸까요? 가끔 엉뚱한 거짓말(환각)은 왜 할까요? 이 글에서는 생성형 AI의 작동 원리부터 LLM·이미지 모델 종류, 그리고 꼭 알아야 할 세 가지 한계까지 한 번에 정리합니다.
생성형 AI, '무에서 유'를 만드는 게 아니다
가장 먼저 바로잡아야 할 오해가 있습니다.
생성형 AI는 아무것도 없는 백지에서 새로운 걸 만들어내지 않습니다.
생성형 AI(Generative AI)는 기존 데이터를 학습해 새로운 콘텐츠를 창작하는 시스템입니다. 핵심은 '기존 데이터'에 있어요. 대량의 데이터를 분석해 패턴을 학습하고, 그 패턴을 바탕으로 새로운 결과물을 조합해내는 거죠. 텍스트는 물론 이미지·음악·영상까지 다양한 형태로요.
그래서 "AI가 학습 데이터와 완전히 무관한 독창적 지식을 스스로 창조한다"거나 "인간의 창의성을 완전히 대체한다"는 말은 틀린 설명입니다. 이 메커니즘을 정확히 이해해야 AI가 할 수 있는 일과 없는 일을 구분하고, 더 똑똑하게 명령을 내릴 수 있습니다.
생성형 AI는 어떻게 발전해왔나 (출시 순서)
시험에도 자주 나오고, 흐름을 이해하는 데도 중요한 게 바로 출시 순서입니다.
트랜스포머(2017) → BERT(2018) → GPT-3(2020) → ChatGPT(2022)
모든 것의 시작은 2017년 트랜스포머(Transformer) 입니다. 기존 RNN의 한계를 극복하기 위해 등장한 새로운 AI 구조였죠. 이 트랜스포머를 토대로 2018년 BERT가 나왔고, 2020년 GPT-3를 거쳐, 마침내 2022년 우리가 아는 ChatGPT가 세상에 등장합니다.
📌 헷갈리기 쉬운 포인트: BERT가 ChatGPT보다 먼저 나왔습니다.
생성형 AI의 두 갈래: 글을 쓰는 AI vs 그림을 그리는 AI
📝 텍스트를 만드는 LLM (거대 언어 모델)
LLM(Large Language Model) 은 이름 그대로 방대한 데이터셋으로 학습한 텍스트 기반 생성 AI입니다. 이 '방대한 데이터셋'이 LLM을 설명하는 핵심 키워드예요. 덕분에 사람과 대화하듯 자연스러운 응답이 가능합니다.
대표 주자: ChatGPT, 코파일럿(Copilot), 클로드(Claude), 제미나이(Gemini)
한 가지 중요한 사실. LLM은 데이터베이스에 접속해 정답을 꺼내오는 게 아닙니다. 학습한 패턴을 바탕으로 확률적으로 '다음에 올 단어(토큰)'를 예측하며 문장을 만들어냅니다. 바로 이 방식 때문에 뒤에서 설명할 환각 현상이 생기죠.
🎨 이미지를 만드는 모델: GAN과 확산 모델
이미지 생성 AI는 크게 두 방식이 있습니다.
| 방식 | 작동 원리 |
|---|---|
| GAN | 생성자와 판별자가 경쟁하며 점점 진짜 같은 이미지를 만듦 |
| 확산 모델(디퓨전) | 이미지에 노이즈를 점점 추가했다가, 거꾸로 노이즈를 제거하며 선명한 이미지로 복원 |
확산 모델의 "노이즈를 걷어내며 흐릿한 화면이 선명해지는" 과정이 핵심입니다. 우리가 아는 대표 서비스들도 이 방식을 씁니다.
| 모델 | 기반 |
|---|---|
| 스테이블 디퓨전 | 디퓨전 모델 |
| 미드저니 | 디퓨전 모델 |
| 코파일럿 / DALL-E 3 | 트랜스포머 아키텍처 |
💡 재밌는 사실: DALL-E라는 이름은 초현실주의 화가 살바도르 달리와 픽사 로봇 영화 월-E에서 영감을 받아 지어졌습니다.
똑똑하지만 완벽하진 않다 — 생성형 AI의 3대 한계
생성형 AI를 제대로 활용하려면 한계를 아는 것이 더 중요합니다. 꼭 기억해야 할 세 가지예요.
1️⃣ 환각 (Hallucination) — 그럴듯한 거짓말
실제로 존재하지 않는 정보를 진짜처럼 꾸며내는 현상입니다. 학습 데이터의 한계, 프롬프트 맥락 오해, 확률적 생성 방식이 원인이죠.
- 🧑⚖️ 가짜 판례 사건: 한 변호사가 ChatGPT가 만들어준 존재하지 않는 판례를 법원에 제출했다가 망신을 당했습니다.
- 📄 갤럭티카 폐쇄: 메타가 만든 과학 논문 요약 AI '갤럭티카'는 그럴듯한 가짜 정보를 쏟아내 결국 공개 3일 만에 내려졌습니다.
2️⃣ 편향성 (Bias) — 한쪽으로 치우친 판단
특정 집단·생각·의견에 더 호의적이거나 부정적으로 반응해 치우친 결과를 내는 현상입니다. 특정 직업을 성별과 연결 짓거나, 인종·문화 고정관념을 반영하는 식이죠. 원인은 과거 데이터에 녹아 있는 사회·문화적 편견입니다.
- 👔 아마존 채용 AI 사건: 과거 남성 중심의 이력서 데이터로 학습한 탓에, 여성 지원자에게 불리한 점수를 매겨 결국 폐기됐습니다.
3️⃣ 블랙박스 (Black Box) — 속을 알 수 없는 상자
AI가 어떤 결론을 내렸을 때, 그 판단 과정을 인간이 이해하거나 해석하기 어려운 현상입니다.
- 설명 불가능: 왜 그런 답을 냈는지 알 수 없음
- 예측 불가능: 같은 질문에도 다른 답이 나옴
- 통제·디버깅 어려움
의료 진단, 자율주행, 대출 거절처럼 이유가 중요한 분야에서 특히 문제가 됩니다. "왜 대출이 거절됐죠?"에 AI가 답하지 못하면 곤란하니까요.
🔑 한 줄 구별법
- 없는 정보를 지어냄 → 환각
- 특정 집단을 차별 → 편향성
- 판단 과정을 알 수 없음 → 블랙박스
한 걸음 더 — GPT vs BERT vs PaLM
조금 더 깊이 들어가면, 같은 트랜스포머 기반이라도 모델마다 성격이 다릅니다.
| 모델 | 읽는 방향 | 학습 방식 | 특징 |
|---|---|---|---|
| GPT | 단방향 → | 다음에 올 단어 예측 | 글 생성에 강함 |
| BERT | 양방향 ↔ | 문장 속 빈칸 맞추기 | 좌우 문맥을 모두 고려 |
| PaLM | — | — | 코딩·수학·논리 추론 특화 (구글) |
"양방향으로 읽고 좌우 문맥을 고려하며, 일부 단어를 가린 뒤 맞히는 모델"이라면? 정답은 BERT입니다.
보너스: AI의 편향성, 이렇게 확인하세요
- 반대되는 질문, 다양한 관점의 질문을 던져보기
- '항상', '절대로' 같은 과장된 표현 경계하기
- 출처 확인 + 좋은 점·나쁜 점을 모두 말하는지 균형 테스트
- 가장 효과적인 방법: 같은 질문을 다양한 관점에서 여러 번 반복해 답변의 일관성을 관찰하기
- 이때 이전 대화에 영향받지 않도록 새 채팅방을 자주 여는 것이 좋습니다.
마치며
정리하면 이렇습니다.
생성형 AI는 '학습한 데이터'를 바탕으로 콘텐츠를 만들 뿐, 무에서 유를 창조하지 않는다. 그래서 환각·편향·블랙박스라는 한계를 안고 있다.
이 원리를 이해하면 AI를 맹신하지도, 무작정 두려워하지도 않게 됩니다. AI는 강력한 도구지만, 그 결과물을 비판적으로 검증하는 것은 결국 사람의 몫이니까요.
📇 핵심만 빠르게 — 한 줄 암기 카드
- 데이터 학습 → 새 콘텐츠 창작 (무에서 유 ❌) → 생성형 AI
- 출시 순서: 트랜스포머(17) → BERT(18) → GPT-3(20) → ChatGPT(22)
- 방대한 데이터 + 텍스트 → LLM (ChatGPT·코파일럿·클로드·제미나이)
- 생성자 vs 판별자 → GAN / 노이즈 추가 후 제거 → 확산 모델
- 디퓨전 기반: 스테이블디퓨전·미드저니 / 트랜스포머 기반: DALL-E 3
- 살바도르 달리 + 월-E → DALL-E
- 없는 정보 생성(가짜 판례·갤럭티카) → 환각
- 특정 집단 치우침(아마존 채용) → 편향성
- 판단 과정 불명(의료·자율주행·대출) → 블랙박스
- 단방향 GPT / 양방향 빈칸 BERT / 코딩·수학 PaLM
이 글이 도움이 되셨다면 공감과 댓글 부탁드려요. AI 개념 정리 시리즈, 다음 편에서 계속됩니다! 🙌
#생성형AI #ChatGPT #LLM #환각 #편향성 #블랙박스 #디퓨전모델 #DALLE #AI자격증 #AIPOT
'공부 > AI-POT' 카테고리의 다른 글
| AI-POT 2급 자격증 공부(트랜스포머_사전학습_토크나이저_임베딩) (0) | 2026.06.12 |
|---|---|
| AI-POT 2급 자격증 공부(생성형AI_필수요소_NLP_파라미터_공격) (0) | 2026.06.12 |
| AI-POT 2급 자격증 공부(인공지능 성능 평가) (0) | 2026.06.12 |
| AI-POT 2급 자격증 공부(인공지능 알고리즘 이해) (0) | 2026.06.12 |
| AI-POT 2급 자격증 공부(인공지능의 기원) (0) | 2026.06.04 |