ai_ml_basics_01무료

AI와 ML 입문

총 13개 셀 · 실습 0개

📘 AI와 ML 입문

학습 목표

AI, ML, 딥러닝의 개념과 세 가지 용어의 포함 관계를 설명할 수 있다.

지도 학습, 비지도 학습, 강화 학습의 차이를 구분하고 각각에 적합한 문제 유형을 예시로 들 수 있다.

머신러닝이 전통적인 규칙 기반 프로그래밍과 어떻게 다른지 설명할 수 있다.

이 강의의 전체 구성과 각 레슨의 주제를 개략적으로 파악할 수 있다.

예상 소요 시간: 약 40–60분

들어가며

컴퓨터가 처음 등장했을 때, 그것은 인간의 명령에 철저히 복종하는 도구였습니다. 프로그래머가 명시적인 규칙을 작성하면 컴퓨터는 그 규칙을 오차 없이 실행했습니다. 스팸 메일을 걸러내려면 "제목에 특정 단어가 포함되면 스팸으로 분류하라"는 조건문을 직접 입력해야 했고, 이미지에서 고양이를 인식하려면 고양이의 특징을 픽셀 수준의 규칙으로 번역해야 했습니다. 그러나 세상의 복잡성은 규칙으로 완전히 포착하기에 너무 방대합니다. 귀가 있고, 수염이 있고, 눈이 앞을 향한다는 기술만으로는 고양이 이미지를 완벽히 구분하는 규칙을 작성할 수 없습니다. 현실 세계의 예외와 변이는 어떤 규칙 집합도 감당하기 어려울 만큼 다양합니다. 머신러닝은 이 문제를 근본적으로 다른 방식으로 해결합니다. 규칙을 직접 작성하는 대신, 수많은 예시 데이터를 알고리즘에 제공하고 스스로 패턴을 발견하게 합니다. 학습의 주체가 인간에서 알고리즘으로 이동한 것입니다.

이 레슨은 코드나 수식 없이 진행됩니다. 이후 13개 레슨 전체에 걸쳐 코드로 구현하게 될 개념들의 뼈대를 먼저 언어로 정확히 세우는 것이 목표입니다. ChatGPT가 문장을 생성하는 원리, BERT가 문맥을 파악하는 방식, 이미지 분류 모델이 학습되는 과정 — 이 모든 현상의 토대에는 공통된 학습 원리가 있습니다. 이 레슨은 그 원리를 설명하는 지도를 먼저 펼쳐 보는 시간입니다.

이 레슨에서는 세 가지 핵심 주제를 순서대로 살펴봅니다. 첫째, AI·머신러닝·딥러닝 세 용어의 정의와 포함 관계를 정리합니다. 둘째, 머신러닝 문제를 분류하는 지도·비지도·강화 학습 세 패러다임을 구분하고, 각각이 실제 서비스에서 어떻게 활용되는지 확인합니다. 셋째, 1950년대 이후 AI 연구가 어떤 곡절을 거쳐 현재의 LLM 시대에 이르렀는지 역사적 흐름을 따라가며, 이 강의의 전체 지도를 확인합니다.

1. AI, 머신러닝, 딥러닝 — 세 개념의 관계

AI: 가장 넓은 범주

인공지능(Artificial Intelligence, AI) 은 "기계가 인간의 지적 능력을 모방하거나 수행하는 모든 기술"을 통칭하는 광의의 개념입니다. 이 정의는 의도적으로 넓게 설정되어 있습니다. 체스를 두는 알고리즘, 음성을 텍스트로 변환하는 시스템, 자율주행 차량의 경로 계획 모듈 — 이 모두가 AI의 범주에 속합니다.

AI라는 용어는 1956년 다트머스 회의에서 존 매카시(John McCarthy)를 비롯한 과학자들이 공식 사용하기 시작했습니다. 당시의 목표는 "학습의 모든 측면과 지능의 모든 특징을 기계로 구현하는 것"이었습니다. 그 야심은 오늘날에도 완전히 달성되지 않았지만, 그 과정에서 수많은 강력한 기술이 탄생했습니다.

머신러닝: AI를 구현하는 핵심 방법론

머신러닝(Machine Learning, ML) 은 AI를 구현하는 방법론 중 하나로, "경험(데이터)으로부터 자동으로 학습하여 성능을 개선하는 알고리즘"을 연구합니다. 1959년 아서 사무엘(Arthur Samuel)이 제시한 이 정의는 오늘날에도 유효합니다.

전통적인 프로그래밍과 머신러닝의 차이는 다음과 같이 요약할 수 있습니다. 전통적인 방식에서는 개발자가 입력 데이터와 규칙을 제공하면 컴퓨터가 출력을 계산합니다. 반면 머신러닝에서는 입력 데이터와 원하는 출력(정답)을 제공하면 컴퓨터가 스스로 규칙을 발견합니다. 규칙의 작성자가 인간에서 알고리즘으로 바뀐 것입니다.

이메일 스팸 필터를 예로 들어 보겠습니다. 규칙 기반 접근에서는 개발자가 "제목에 '무료'나 '당첨'이 포함되면 스팸"과 같은 조건을 직접 코드로 작성합니다. 그러나 스패머들은 이 규칙을 우회하는 새로운 문구를 사용하기 시작하고, 개발자는 또 새로운 규칙을 추가해야 하는 소모전이 반복됩니다. 머신러닝 기반의 스팸 필터는 수십만 건의 스팸·정상 이메일을 학습한 뒤, 단어 조합과 발신 패턴 등의 복합적인 특징에서 스스로 판단 기준을 도출합니다. 새로운 스팸 전술이 나타나면 추가 학습을 통해 적응할 수 있습니다.

딥러닝: 머신러닝의 강력한 하위 분야

딥러닝(Deep Learning) 은 머신러닝의 방법론 중 하나로, 인간 뇌의 신경망 구조에서 착안한 인공 신경망(Artificial Neural Network) 을 여러 층으로 깊게 쌓아 복잡한 패턴을 학습하는 기술입니다. "딥(Deep)"은 이 층의 깊이를 가리킵니다.

딥러닝은 2012년 ImageNet 이미지 분류 대회에서 기존 방식 대비 오류율을 절반 이하로 낮추며 세상의 주목을 받았습니다. 이후 이미지 인식, 자연어 처리, 음성 인식 등 거의 모든 인식 과제에서 기존의 한계를 빠르게 갱신했습니다. ChatGPT, Claude, Gemini와 같은 대형 언어 모델(LLM), 이미지를 생성하는 Stable Diffusion, 이미지와 텍스트를 함께 이해하는 CLIP — 이 모두가 딥러닝을 기반으로 합니다.

세 개념의 관계는 동심원으로 이해하면 명확합니다. AI라는 가장 넓은 원 안에 머신러닝이 있고, 머신러닝 안에 딥러닝이 위치합니다. 모든 딥러닝은 머신러닝이지만 모든 머신러닝이 딥러닝인 것은 아니며, 모든 머신러닝은 AI이지만 모든 AI가 머신러닝인 것은 아닙니다. 아래 그림은 이 관계를 시각적으로 나타냅니다.

2. 세 가지 학습 패러다임

머신러닝 문제는 학습에 사용하는 데이터의 형태와 풀고자 하는 문제의 성격에 따라 크게 세 가지 패러다임으로 구분됩니다.

지도 학습 (Supervised Learning)

지도 학습은 입력 데이터와 그에 대응하는 정답(레이블)이 쌍으로 제공되는 방식입니다. 모델은 이 쌍들을 통해 입력과 출력 사이의 관계를 학습합니다. 마치 학생이 문제와 해답을 함께 보며 풀이 방법을 익히는 과정과 유사합니다.

지도 학습은 두 가지 유형으로 세분됩니다. 분류(Classification) 는 입력이 어느 범주에 속하는지를 예측하는 과제입니다. 이메일이 스팸인지 여부를 판별하거나, 손글씨 이미지가 어떤 숫자를 나타내는지 인식하거나, 텍스트의 감정이 긍정인지 부정인지를 구분하는 것이 대표적인 예입니다. 회귀(Regression) 는 연속적인 수치를 예측하는 과제입니다. 주택의 면적·위치·연식 등을 바탕으로 매매가를 예측하거나, 기상 데이터를 토대로 내일의 기온을 예측하는 것이 이에 해당합니다.

이 강의에서 다루는 대부분의 실습 — 리뷰 텍스트로 별점을 분류하기, MNIST 손글씨 이미지 인식하기, 감정 분석 모델 구축하기 — 은 지도 학습 문제에 해당합니다.

비지도 학습 (Unsupervised Learning)

비지도 학습은 정답 레이블 없이 입력 데이터만으로 데이터의 내재된 구조와 패턴을 발견하는 방식입니다. 데이터에 레이블을 붙이는 작업은 인력과 시간이 필요하기 때문에, 실무에서는 레이블 없는 데이터가 훨씬 풍부합니다. 비지도 학습은 이 방대한 비레이블 데이터로부터 유용한 정보를 추출하는 방법론입니다.

대표적인 비지도 학습 과제는 군집화(Clustering) 와 차원 축소(Dimensionality Reduction) 입니다. 군집화는 유사한 특성을 지닌 데이터 포인트를 자동으로 그룹으로 묶습니다. 전자상거래 서비스에서 구매 패턴이 유사한 고객들을 하나의 집단으로 분류하여 맞춤형 추천을 제공하거나, 방대한 뉴스 기사를 주제별로 자동 분류하는 것이 그 예입니다. 차원 축소는 고차원 데이터에서 핵심 정보를 보존하면서 차원을 줄이는 기법으로, 데이터 시각화나 후속 학습의 효율을 높이는 데 활용됩니다.

강화 학습 (Reinforcement Learning)

강화 학습은 지도 학습·비지도 학습과는 근본적으로 다른 패러다임입니다. 에이전트(Agent) 가 환경(Environment) 과 상호작용하며, 행동에 대한 보상(Reward) 신호를 통해 최적의 행동 전략을 학습합니다. 사전에 정해진 정답 데이터 없이, 에이전트가 선택한 행동의 결과로 받는 보상이 학습의 신호가 됩니다.

게임 AI는 강화 학습의 가장 직관적인 예입니다. 구글 딥마인드의 AlphaGo는 스스로 수백만 번의 바둑 게임을 진행하며 승리를 최대화하는 전략을 습득했습니다. 로봇이 걷는 동작을 학습하거나, 자율주행 차량이 다양한 도로 환경에 적응하는 것도 강화 학습의 응용입니다. 최근에는 ChatGPT와 같은 대형 언어 모델이 인간의 선호도 피드백을 반영하여 더 유용한 답변을 생성하도록 조정하는 RLHF(Reinforcement Learning from Human Feedback) 기법에도 강화 학습의 원리가 적용됩니다.

아래 그림은 세 가지 학습 패러다임의 차이를 도식으로 정리합니다.

💡 실무에서 세 가지 패러다임은 어떻게 쓰이나

세 가지 학습 패러다임은 실제 AI 시스템에서 조합하여 사용됩니다.

패러다임 실무 사례 사용 이유
지도 학습 Gmail 스팸 필터, 쿠팡 상품 분류, 카카오 얼굴 인식 정답 레이블이 있는 명확한 분류·예측 과제
비지도 학습 유튜브 추천 군집화, 신용카드 이상 거래 탐지 레이블 없는 대규모 데이터에서 패턴 발견
강화 학습 ChatGPT RLHF 정렬, 구글 데이터센터 냉각 최적화 장기적 보상 최대화가 목표인 의사결정 과제

ChatGPT는 세 패러다임을 모두 거칩니다. 대규모 텍스트를 비지도 방식으로 사전학습한 뒤, 예제 답변으로 지도 파인튜닝하고, 마지막으로 인간 피드백을 보상 신호로 삼아 강화 학습(RLHF)으로 정렬합니다.

패러다임	실무 사례	사용 이유
지도 학습	Gmail 스팸 필터, 쿠팡 상품 분류, 카카오 얼굴 인식	정답 레이블이 있는 명확한 분류·예측 과제
비지도 학습	유튜브 추천 군집화, 신용카드 이상 거래 탐지	레이블 없는 대규모 데이터에서 패턴 발견
강화 학습	ChatGPT RLHF 정렬, 구글 데이터센터 냉각 최적화	장기적 보상 최대화가 목표인 의사결정 과제

3. 머신러닝의 역사: 어떻게 여기까지 왔는가

태동기: 1950~1970년대

인공지능 연구의 역사는 1950년 앨런 튜링(Alan Turing)이 발표한 논문 "Computing Machinery and Intelligence"에서 출발합니다. 그는 "기계가 생각할 수 있는가?"라는 질문을 제기하며 기계 지능의 가능성을 학문적으로 논의했습니다. 1956년 다트머스 회의에서 AI라는 분야가 공식 선언된 이후, 초기 연구자들은 논리적 추론과 문제 해결 능력을 명시적 규칙으로 구현하는 데 집중했습니다.

그러나 현실 세계의 복잡성은 규칙 기반 접근의 한계를 드러냈습니다. 정교하게 설계된 시스템도 조금만 다른 상황이 주어지면 쉽게 실패했습니다. 과대한 기대와 연이은 실망 속에 연구 투자가 급감하는 시기, 이른바 'AI 겨울(AI Winter)' 이 반복되었습니다.

통계 기반 학습의 부상: 1980~1990년대

1980년대에 들어서며 데이터에서 패턴을 통계적으로 학습하는 접근이 주목받기 시작했습니다. 서포트 벡터 머신(SVM), 의사결정 트리(Decision Tree), 랜덤 포레스트(Random Forest) 와 같은 알고리즘이 등장하여 텍스트 분류, 이미지 인식, 의료 진단 등 다양한 실용적 문제에서 성과를 거두었습니다. 규칙을 손수 작성하는 대신 통계적 방법으로 데이터에서 규칙을 유도하는 패러다임이 자리를 잡기 시작한 시기입니다.

인터넷과 데이터의 폭발: 2000년대

인터넷의 확산은 전례 없는 규모의 데이터를 생성했습니다. 검색 엔진의 랭킹 알고리즘, 이메일 스팸 필터, 전자상거래 추천 시스템, 신용 평가 모델 — 이 시기에 머신러닝은 학문 연구의 영역을 넘어 실생활 서비스에 적극 도입되기 시작했습니다. 학습에 사용할 수 있는 데이터의 양이 급증하면서, 더 복잡한 모델의 가능성도 함께 열렸습니다.

딥러닝의 혁명: 2010년대

2012년은 딥러닝 역사에서 하나의 전환점으로 기록됩니다. 제프리 힌튼(Geoffrey Hinton) 팀이 ImageNet 이미지 분류 대회에서 심층 합성곱 신경망(CNN)으로 오류율을 극적으로 낮추며 업계 전체의 주목을 받았습니다. 이후 딥러닝은 이미지 인식, 자연어 처리, 음성 인식 등 거의 모든 인식 과제에서 기존의 성능 한계를 빠르게 갱신했습니다. 2016년에는 AlphaGo가 세계 최고 바둑 기사를 꺾으며, 딥러닝과 강화 학습의 결합이 인간 전문가의 영역까지 도달할 수 있음을 전 세계에 증명했습니다.

생성형 AI의 시대: 2020년대

2017년 구글이 발표한 트랜스포머(Transformer) 아키텍처는 언어 처리의 새로운 지평을 열었습니다. "Attention Is All You Need"라는 제목의 이 논문에서 소개된 구조는 GPT, BERT 등 대형 언어 모델의 토대가 되었습니다. 2022년 말 공개된 ChatGPT는 대형 언어 모델이 일상 대화 수준의 언어 이해와 생성이 가능함을 대중에게 생생하게 보여주었습니다. 동시에 텍스트로 이미지를 생성하는 Stable Diffusion, 이미지와 텍스트를 함께 처리하는 멀티모달 모델들이 잇달아 등장하며, AI 기술은 전례 없는 속도로 사회 전반에 확산되고 있습니다.

4. 이 강의의 구성

이 강의는 머신러닝의 기초 개념에서 출발하여 현대 딥러닝 모델에 이르는 여정을 13개 레슨으로 구성합니다. 각 레슨은 앞선 레슨의 개념 위에 새로운 층을 더하는 방식으로 설계되어 있습니다.

레슨	제목	핵심 주제
01	AI와 ML 입문	AI·ML·딥러닝 개념, 학습 패러다임, 강의 전체 개요
02	코드셀 기초와 실습 환경 확인	파이랩 실습 환경 사용법, 라이브러리 설치 확인
03	데이터 준비	데이터 탐색, 훈련/테스트 분리, Bag of Words
04	다중 클래스 선형 모델 구조 이해하기	Wx+b 선형 모델, 소프트맥스, 가중치 역할
05	선형 모델 학습시키기	sklearn으로 분류 학습, 정확도·혼동 행렬, 가중치 해석
06	손실 함수와 경사 하강법	교차 엔트로피 손실, 그래디언트, 학습 최적화
07	신경망에서 트랜스포머까지	활성화 함수, RNN·CNN, 트랜스포머 개요
08	MNIST 딥러닝 프로젝트	PyTorch 신경망, MNIST 분류, 학습 루프
09	트랜스포머와 BERT 실습	Self-Attention 수식, BERT 파인튜닝
10	LLM과 ChatGPT 기초	대형 언어 모델, 프롬프트 엔지니어링
11	파인튜닝 심화 — PEFT와 LoRA	효율적 파인튜닝, LoRA 수식, SVD
12	RAG 입문 — 검색 증강 생성	검색 증강 생성, 임베딩, 코사인 유사도
13	멀티모달과 CLIP 입문	이미지-텍스트 모델, CLIP, Zero-shot 분류

강의는 크게 세 단계로 진행됩니다. 기초 단계(레슨 01–06)에서는 데이터 처리 방법, 선형 모델의 구조와 작동 원리, 그리고 모든 머신러닝 학습의 핵심인 손실 함수와 최적화를 다룹니다. 심화 단계(레슨 07–09)에서는 신경망의 발전 역사와 PyTorch 딥러닝 실습, 그리고 현대 자연어 처리의 근간인 트랜스포머·BERT 파인튜닝으로 확장합니다. 응용 단계(레슨 10–13)에서는 LLM·PEFT·RAG·멀티모달 등 현재 실무에서 가장 많이 활용되는 AI 기술들을 직접 구현해 봅니다.

레슨 01을 마친 뒤에는 02번 레슨에서 파이랩 실습 환경의 기본 사용법을 익힌 후, 03번 레슨부터 본격적인 데이터 실습을 시작합니다.

5. 이 강의를 마치면 할 수 있는 것

13개 레슨을 완주하면 다음과 같은 것들을 직접 코드로 구현할 수 있습니다.

구현 목표	핵심 기술	관련 레슨
Yelp 리뷰 5등급 감성 분류기	로지스틱 회귀, Bag of Words	L03–L06
MNIST 손글씨 인식 신경망	PyTorch MLP, 역전파	L07–L08
BERT 기반 감성 분석 모델 파인튜닝	트랜스포머, HuggingFace Trainer	L09
ChatGPT 프롬프트 설계 및 평가	LLM 원리, 프롬프트 엔지니어링	L10
LoRA로 경량 파인튜닝 구현	PEFT, 행렬 분해	L11
나만의 RAG 파이프라인 구축	임베딩, 벡터 검색, 생성	L12
CLIP으로 이미지-텍스트 매칭	멀티모달, 대조 학습	L13

단순히 API를 호출하는 수준이 아니라, "모델이 왜 이렇게 동작하는가"를 설명할 수 있는 수준을 목표로 합니다. 각 기술의 원리를 이해하면, 모델이 예상치 못한 동작을 할 때 원인을 파악하고 개선책을 떠올릴 수 있습니다.

💡 채용 공고에서 이 개념들이 보이기 시작합니다

이 강의를 마치면 채용 공고에서 자주 등장하는 다음 키워드들이 낯설지 않을 것입니다.

Fine-tuning RAG Embedding LLM Transformer LoRA PEFT Vector Search Multi-modal

AI 기능을 제품에 통합하는 역할(AI 엔지니어, LLM 통합 개발자, ML 엔지니어)을 목표로 한다면, 이 강의에서 다루는 개념들이 직접적인 출발점이 됩니다.

이 장을 마치며

이 장에서는 세 가지 핵심 내용을 다루었습니다. 첫째, AI·머신러닝·딥러닝 세 용어의 정의와 포함 관계를 정리했습니다. AI는 기계 지능을 다루는 가장 넓은 범주이며, 머신러닝은 그 안에서 데이터로부터 규칙을 학습하는 방법론이고, 딥러닝은 머신러닝의 하위 분야로 깊은 신경망 구조를 통해 복잡한 패턴을 학습합니다. 둘째, 머신러닝은 문제의 성격에 따라 지도·비지도·강화 학습 세 패러다임으로 구분됩니다. 지도 학습은 정답 레이블이 있는 데이터로 입출력 매핑을 학습하고, 비지도 학습은 레이블 없이 데이터의 내재 구조를 발견하며, 강화 학습은 환경과의 상호작용을 통해 최적 행동 전략을 학습합니다. 셋째, AI는 기대와 실망의 반복을 거쳐 왔지만, 딥러닝과 대규모 데이터·연산 자원의 결합이 지난 10여 년간 전례 없는 도약을 이끌었으며, 오늘날의 생성형 AI와 멀티모달 모델은 그 연장선 위에 있습니다.

다음 레슨(02번)에서는 파이랩 실습 환경의 기본 사용법을 익힙니다. 코드 셀을 실행하는 방법, 변수가 셀 간에 공유되는 방식, 주요 라이브러리가 정상적으로 설치되어 있는지 확인하는 절차를 다룹니다. 03번 레슨부터는 실제 데이터를 다루는 본격적인 실습이 시작됩니다.

체크포인트 질문

AI, 머신러닝, 딥러닝은 각각 어떻게 정의되며, 세 개념은 어떤 포함 관계를 이루고 있습니까?
규칙 기반 프로그래밍과 머신러닝은 문제를 해결하는 방식에서 어떻게 다릅니까?
지도 학습, 비지도 학습, 강화 학습은 각각 어떤 유형의 문제에 적합합니까? 각각의 실사용 예시를 하나씩 들어 설명하십시오.
딥러닝이 2012년 이후 급격히 주목받게 된 이유는 무엇입니까?
이 강의의 세 단계(기초·심화·응용)는 어떤 개념들로 구성되어 있습니까?

AI와 ML 입문

0/13 완료(0%)

로그인하면 진행률이 저장됩니다