LIGHT
공부/AI-POT 2026. 6. 13. 00:44

AI-POT 2급 자격증 공부(AI윤리원칙_투명성_설명가능성_블랙박스)

AI는 왜 그렇게 답했을까? AI 윤리 3원칙과 투명성·설명 가능성 완전 정리

AI가 내린 결정, 그런데 아무도 "왜?"를 설명하지 못한다면 어떨까요? 의료 진단이나 대출 심사라면 큰일이죠. 이것이 바로 블랙박스 문제입니다. 프롬프트 엔지니어라면 기술만큼이나 윤리를 알아야 해요. 이 글에서는 AI 윤리 3대 원칙부터, 헷갈리기 쉬운 투명성과 설명 가능성의 차이, 그리고 블랙박스 해결법까지 한 번에 정리합니다.


AI가 지켜야 할 세 가지 약속 — 윤리 3대 원칙

AI 윤리의 출발점은 세 가지 기본 원칙입니다. 이름과 의미를 짝지어 외워두세요.

원칙 한마디로
인간 존엄성의 원칙 인간의 권리·자유·개인정보를 침해하지 않기
사회 공공선 원칙 특정 집단이 아닌 모두에게 도움, 혜택을 골고루 (교육 포함)
기술의 합목적성 원칙 AI 본래의 긍정적 목적(반복 작업 해방·삶 개선)대로 쓰기

시험에선 상황을 주고 어떤 원칙인지 묻습니다.

🔑 환자 동의 없이 의료 데이터를 사용하는 상황? → 개인정보 침해이므로 인간 존엄성의 원칙이 최우선.
🔑 사회 공공선 원칙은 국가 안보 같은 극한 상황에선 일시적으로 제한될 수 있어요. (더 큰 공공선을 위한 예외)

참고로 대한민국엔 AI 윤리 10대 핵심 요건도 있는데, 각 항목이 인권 보장인지 프라이버시 보호인지 유추할 수 있는 수준으로 익혀두면 됩니다.


프롬프트 엔지니어의 윤리 체크리스트

프롬프트를 설계할 때, 엔지니어는 네 가지를 반드시 점검해야 합니다.

① 개인정보 침해 → ② 편향성 → ③ 유해 콘텐츠 → ④ 저작권 침해

이 네 가지를 먼저 확인한 다음에 결과물의 안정성을 따져야 해요.

⚠️ 중요: 순서가 역순이 되면 안 됩니다. 윤리 체크가 먼저, 안정성은 그다음입니다.

또한 설계·사용 전엔 목적 명확화 → 위험 요소 파악 → 결과물 모니터링 → 공유 시 윤리적 사용 명시 → 개선 사항 문서화의 흐름을 지키고, 내 프롬프트가 가질 위험 수준과 대응 방안을 늘 생각해야 합니다.


헷갈리지 마세요 — 투명성 vs 설명 가능성

이 둘은 시험 단골이자, 가장 많이 헷갈리는 개념입니다. 확실히 구분해볼게요.

개념 무엇인가
투명성(Transparency) AI의 작동 방식·의사결정 과정·데이터 사용을 모두 공개
설명 가능성(Explainability) 그 결과가 왜 나왔는지 근거를 설명하는 능력

쉽게 말하면, 투명성은 "어떤 데이터로 어떤 과정을 거쳤다"를 보여주는 것이고, 설명 가능성은 "왜 이 답을 골랐는지" 이유를 대는 거예요.

🔑 핵심 관계: 투명성(A)이 설명 가능성(B)의 기반입니다. (A → B)
⚠️ 함정: "모델 내부 알고리즘 개선 과정 공개"는 투명성 영역이라, 설명 가능성을 구현할 땐 우선순위가 가장 낮습니다.


속을 알 수 없는 상자 — 블랙박스 문제

블랙박스는 AI가 결과를 냈지만 아무도 그 이유를 설명할 수 없는 상태를 말합니다. 설명 가능성이 없으면 신뢰도 없겠죠. 그래서 이 문제를 풀기 위한 도구가 등장했습니다.

🔑 블랙박스 해결 = LIME(라임) + SHAP(샤프)

이 둘은 AI의 판단 근거를 분석해 설명 가능성을 확보해줍니다. 물론 투명성과 설명 가능성 사이의 균형을 잡는 것도 중요해요.


마치며

오늘 내용을 한 문장으로 정리하면 이렇습니다.

AI 윤리는 인간 존엄성·사회 공공선·기술 합목적성의 3원칙 위에 서 있고, 투명성(과정 공개)이 설명 가능성(이유 제시)의 기반이 되며, 블랙박스 문제는 LIME·SHAP으로 푼다.

기술이 강력해질수록 윤리의 무게도 커집니다. 프롬프트 엔지니어의 진짜 실력은, '할 수 있는가'를 넘어 '해도 되는가' 를 묻는 데서 완성됩니다.


📇 핵심만 빠르게 — 한 줄 암기 카드

  • 윤리 3원칙: 인간 존엄성(권리·정보)·사회 공공선(모두·골고루)·기술 합목적성(본래 목적)
  • 동의 없는 의료 데이터 → 인간 존엄성 / 공공선은 안보 시 일시 제한 가능
  • 윤리 체크리스트: 개인정보·편향성·유해 콘텐츠·저작권 (안정성보다 먼저! 역순 ❌)
  • 투명성 = 과정·데이터 공개 / 설명 가능성 = 왜 그 결과인지 근거
  • 투명성(A)이 설명 가능성(B)의 기반 (알고리즘 개선 공개 = 투명성·우선순위 최하)
  • 블랙박스(이유 설명 불가) 해결 = LIME · SHAP

이 글이 도움이 되셨다면 공감과 댓글 부탁드려요. AI 개념 정리 시리즈, 다음 편에서 계속됩니다! 🙌

h

hyos

IT · 스타트업 · 개인기록. 만들고, 실패하고, 기록합니다.

COMMENTS