성공지식백과 로고성공지식백과

AI 용어사전

헷갈리는 AI 용어를 한 페이지에서 찾고, 뜻과 쓰임까지 빠르게 이해할 수 있도록 정리한 성공지식백과의 AI 용어사전입니다.

전체 용어
111
입문
44
중급
52
고급
15

이 용어사전은 이렇게 보면 됩니다

GPT, RAG, 토큰, 파인튜닝처럼 AI 글에서 자주 보이지만 처음 보면 헷갈리기 쉬운 개념을 초보자 기준으로 다시 풀어 설명합니다. 각 항목은 정의만 적는 데서 끝내지 않고 왜 중요한지, 어디에서 쓰이는지, 같이 보면 좋은 개념이 무엇인지까지 연결합니다.

주로 다루는 범위

LLM, AI 에이전트, 프롬프트, 모델 학습, 벡터 검색, 배포 도구, 자동화 워크플로까지 실무에서 자주 마주치는 개념 위주로 정리합니다. glossary에서 개념을 익힌 뒤 가이드와 뉴스레터로 넘어가면 문맥을 훨씬 쉽게 따라갈 수 있습니다.

AGI (범용 인공지능)

중급

AGI(Artificial General Intelligence, 범용 인공지능)는 특정 작업 하나에만 특화되지 않고, 인간처럼 매우 다양한 지적 과제를 폭넓게 이해하고 해결할 수 있는 AI를 뜻합니다. 글쓰기, 코...

AI 거버넌스

중급

AI 거버넌스는 AI 기술의 개발·배포·사용 전 과정에 걸쳐 책임과 안전을 보장하기 위한 정책·규제·윤리 기준·제도적 체계입니다. 기술 발전 속도에 맞춰 사회적 피해를 예방하고 신뢰를 확보하는 것이 핵심 목표입니다....

AI 래퍼

입문

AI 래퍼(AI Wrapper)는 OpenAI, Anthropic 같은 AI 제공사의 API를 기반으로, 그 위에 자체 UI나 기능을 추가해 새로운 서비스로 제공하는 제품을 말합니다. 핵심 AI 기술은 직접 개발하지...

AI 안전 (AI Safety)

입문

AI 안전 (AI Safety)은 AI 시스템이 의도한 대로 안전하게 동작하도록 보장하는 연구 및 실천 분야입니다. 단순한 버그 수정을 넘어, AI가 강력해질수록 발생할 수 있는 의도치 않은 피해를 미리 방지하는 것...

AI 에이전트

입문

AI 에이전트(AI Agent)는 단순히 질문에 답하는 것을 넘어, 목표를 받아 스스로 계획을 세우고 필요한 도구를 사용하며 여러 단계의 작업을 수행하는 AI 시스템입니다. 핵심은 한 번의 응답으로 끝나지 않고, 중...

AI 정렬 (AI Alignment)

중급

AI 정렬 (AI Alignment)은 AI 시스템의 목표와 행동을 인간의 가치·의도·윤리에 일치시키는 연구 분야입니다. AI가 강력해질수록 의도치 않은 방향으로 행동할 위험이 커지기 때문에, 이를 사전에 방지하는...

AI 코파일럿

입문

AI 코파일럿은 사용자와 함께 작업하는 AI 보조 도구입니다. 항공기 부조종사(copilot)처럼, AI가 주도하는 것이 아니라 사람이 주도하고 AI가 옆에서 제안·보완·자동화를 담당하는 협업 모델입니다. AI 에이...

API

입문

API는 Application Programming Interface의 약자로, 프로그램과 프로그램이 서로 소통할 때 사용하는 규격화된 방법입니다. 하나의 소프트웨어가 다른 소프트웨어의 기능을 요청하고 그 결과를 받...

Anthropic

입문

Anthropic은 Claude AI 시리즈를 개발한 미국의 AI 안전 연구 기업입니다. 2021년 Dario Amodei, Daniela Amodei를 비롯한 OpenAI 출신 연구자들이 설립하였으며, AI 안전을...

CLI

입문

CLI는 Command Line Interface의 약자로, 텍스트 명령어를 직접 입력해 컴퓨터를 조작하는 인터페이스입니다. 마우스로 아이콘을 클릭하는 대신, 터미널 창에 ls, cd, npm install 같은 명...

CUDA

고급

CUDA(Compute Unified Device Architecture)는 NVIDIA가 개발한 GPU 병렬 컴퓨팅 플랫폼이자 프로그래밍 모델입니다. AI 모델 학습과 추론에 필요한 대규모 행렬 연산을 GPU의 수...

Chain-of-Thought (CoT)

중급

Chain-of-Thought(CoT, 사고의 사슬)는 AI 모델에게 최종 답을 바로 내놓는 대신, 문제를 해결하는 중간 과정을 단계별로 보여달라고 유도하는 프롬프팅 기법입니다. 복잡한 추론이 필요한 문제에서 정확도...

ChatGPT

입문

ChatGPT는 OpenAI가 2022년 11월 출시한 대화형 AI 서비스입니다. 출시 5일 만에 사용자 100만 명을 돌파하며 AI 대중화의 시발점이 되었습니다. 현재 최신 플래그십 모델인 GPT-4.5를 기반으로...

Claude Code

입문

Claude Code는 Anthropic이 개발한 터미널 기반 AI 코딩 에이전트입니다. CLI(명령줄 인터페이스)에서 실행하며, 코드베이스 분석·파일 수정·테스트 실행·Git 작업을 자율적으로 수행합니다. 내부적으...

Constitutional AI

고급

Constitutional AI는 Anthropic이 개발한 AI 정렬 방법론입니다. 국가 헌법처럼 AI가 따라야 할 원칙(헌법)을 사전에 정의하고, AI 스스로 그 원칙을 기준으로 자신의 응답을 평가하고 수정하는...

Cursor

입문

Cursor는 AI를 편집기 핵심에 통합한 AI 네이티브 코드 에디터입니다. VS Code를 기반으로 만들어져 기존 VS Code 확장 프로그램과 설정을 그대로 사용할 수 있으며, Claude Sonnet 4.6·G...

DALL-E

입문

DALL-E는 OpenAI가 개발한 텍스트-이미지 변환 AI 모델입니다. 화가 살바도르 달리(Dalí)와 픽사 캐릭터 WALL-E의 이름을 조합해 만든 명칭으로, 현재 DALL-E 3가 최신 버전이며 ChatGPT에...

Devin

중급

Devin은 Cognition AI가 개발한 자율 소프트웨어 엔지니어링 에이전트입니다. 요구사항을 입력하면 코드 작성, 버그 수정, 테스트 실행, 배포까지 소프트웨어 개발 전 과정을 자율적으로 수행합니다. Devin...

Docker

중급

Docker는 애플리케이션과 그 실행 환경을 컨테이너(Container)라는 단위로 패키징하고 실행하는 플랫폼입니다. 컨테이너는 OS를 공유하면서도 서로 격리된 환경에서 실행되어, "내 컴퓨터에서는 되는데 서버에서는...

Few-shot 러닝

중급

Few-shot 러닝(Few-shot Learning)은 AI에게 소수의 예시(보통 2~5개)를 프롬프트에 포함시켜, 해당 패턴을 따라 작업을 수행하도록 유도하는 기법입니다. 별도의 학습이나 파인튜닝 없이도, 프롬프...

GPT

입문

GPT는 Generative Pre-trained Transformer의 약자로, OpenAI가 개발한 대규모 언어 모델(LLM) 시리즈입니다. 이름에서 알 수 있듯 '대량의 텍스트로 사전 학습된(Pre-traine...

GPU

입문

GPU(Graphics Processing Unit, 그래픽 처리 장치)는 원래 3D 그래픽 렌더링을 위해 설계된 프로세서이지만, 오늘날 AI 모델 학습과 추론의 핵심 하드웨어로 자리 잡았습니다. 수천 개의 소형 코...

GitHub Copilot

입문

GitHub Copilot은 GitHub과 OpenAI가 공동 개발한 AI 코딩 어시스턴트입니다. VS Code, JetBrains IDE, Neovim 등 주요 개발 도구에 플러그인으로 설치해 코드 자동완성, 함수...

Hugging Face

중급

Hugging Face는 AI 모델과 데이터셋을 공유하는 허브 플랫폼이자 AI 커뮤니티입니다. 수십만 개의 오픈소스 모델을 무료로 내려받아 사용할 수 있으며, "AI계의 GitHub"이라고 불립니다. Hugging...

LLM (대규모 언어 모델)

입문

LLM(Large Language Model, 대규모 언어 모델)은 방대한 양의 텍스트 데이터를 학습한 인공지능 모델입니다. GPT-5.4, Claude, Gemini 등 현재 널리 쓰이는 AI 챗봇과 코딩 도우미가...

LangChain

중급

LangChain은 LLM 기반 애플리케이션을 구축하기 위한 오픈소스 프레임워크입니다. 여러 LLM 호출을 체인으로 연결하고, 외부 도구·데이터베이스와 통합하며, 에이전트를 구성하는 데 필요한 공통 컴포넌트를 제공합...

LangGraph

중급

LangGraph는 LangChain 팀이 개발한 에이전트 오케스트레이션 프레임워크입니다. LLM 에이전트의 동작 흐름을 방향성 비순환 그래프(DAG) 또는 순환 그래프로 정의해 복잡한 멀티스텝 작업을 구조적으로 관...

LoRA

고급

LoRA(Low-Rank Adaptation)는 AI 모델 전체를 재학습하지 않고, 소수의 추가 파라미터만 학습하는 경량 파인튜닝 기법입니다. 원본 모델 가중치는 고정한 채로 저차원 행렬 쌍을 삽입해 특정 작업에 특...

MCP (Model Context Protocol)

중급

MCP(Model Context Protocol)는 Anthropic이 2024년에 공개한 오픈 프로토콜입니다. AI 모델이 외부 도구, 데이터베이스, 파일 시스템, API 등에 표준화된 방식으로 연결할 수 있도록...

Midjourney

입문

Midjourney는 텍스트 프롬프트로 이미지를 생성하는 AI 서비스입니다. Discord 서버를 기본 인터페이스로 사용하며, 예술적이고 감각적인 스타일의 이미지 생성에 특히 강점을 보입니다. Midjourney가...

NotebookLM

입문

NotebookLM은 Google이 개발한 AI 기반 리서치 및 문서 분석 도구입니다. PDF, 구글 드라이브 문서, 웹 URL 등을 업로드하면 Gemini 3.1 Pro 모델이 문서 내용을 분석해 질의응답, 요약,...

Ollama

입문

Ollama는 로컬 컴퓨터에서 오픈소스 LLM을 손쉽게 실행할 수 있게 해주는 도구입니다. Llama 4, Mistral, Gemma 등 주요 오픈소스 모델을 명령어 한 줄로 내려받아 인터넷 연결 없이 실행할 수 있...

OpenAI

입문

OpenAI는 ChatGPT와 GPT 시리즈를 개발한 미국의 AI 기업입니다. 2015년 Sam Altman, Elon Musk 등이 비영리 목적으로 공동 설립하였으며, 이후 영리 법인으로 전환하였습니다. Sam A...

Perplexity

입문

Perplexity는 AI 기반 검색 엔진 서비스입니다. 기존 검색 엔진이 링크 목록을 나열하는 방식과 달리, 웹 검색 결과를 실시간으로 수집하고 AI가 이를 종합해 자연어 답변을 생성합니다. 답변마다 출처 링크를...

RAG (검색 증강 생성)

중급

RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 대형 언어 모델(LLM)이 응답을 생성할 때 외부 지식 베이스에서 관련 문서를 실시간으로 검색하여 컨텍스트로 사용하는 기술입니다....

RLHF (인간 피드백 강화학습)

고급

RLHF(Reinforcement Learning from Human Feedback, 인간 피드백 강화학습)는 사람의 선호도 평가를 바탕으로 AI 모델의 행동을 조정하는 학습 방법입니다. 사전 학습된 LLM이 유해...

SDK

입문

SDK는 Software Development Kit의 약자로, 특정 플랫폼이나 서비스를 위한 개발에 필요한 도구, 라이브러리, 문서, 코드 샘플을 하나로 묶어 제공하는 패키지입니다. 개발자가 처음부터 모든 것을 만...

SaaS

입문

SaaS(Software as a Service)는 소프트웨어를 사용자 기기에 직접 설치하지 않고, 인터넷 브라우저나 앱을 통해 구독 방식으로 사용하는 소프트웨어 제공 모델입니다. AI 도구 대부분이 SaaS 형태로...

Sora

입문

Sora는 OpenAI가 개발한 텍스트-영상(Text-to-Video) 생성 AI 모델입니다. 자연어 프롬프트를 입력하면 최대 수십 초 분량의 고품질 동영상을 생성하며, 영화적 카메라 워크와 사실적인 물리 표현이 특...

Stable Diffusion

중급

Stable Diffusion은 Stability AI가 개발한 오픈소스 이미지 생성 AI 모델입니다. 텍스트 프롬프트를 입력하면 그에 맞는 이미지를 생성하며, 모델 가중치가 공개되어 있어 로컬 PC에서 직접 실행할...

Supabase

중급

Supabase는 PostgreSQL 기반의 오픈소스 백엔드 플랫폼입니다. Firebase의 오픈소스 대안으로 알려져 있으며, 데이터베이스, 인증, 스토리지, 실시간 구독, 서버리스 함수를 통합 제공합니다. AI 앱...

TPU

중급

TPU(Tensor Processing Unit)는 Google이 딥러닝 행렬 연산에 특화하여 설계한 AI 전용 하드웨어 가속기입니다. 범용 AI 연산을 처리하는 NVIDIA GPU와 달리, 텐서(다차원 행렬) 연산...

Temperature

중급

Temperature(온도)는 LLM이 다음 토큰을 선택할 때의 무작위성을 조절하는 하이퍼파라미터입니다. 값이 0에 가까울수록 가장 확률 높은 토큰을 선택해 결정적(deterministic) 출력을 만들고, 1 이상...

Top-p (핵 샘플링)

중급

Top-p(핵 샘플링, Nucleus Sampling)는 LLM이 다음 토큰을 선택할 때 누적 확률이 p에 도달하는 상위 토큰 후보만 고려하는 샘플링 방법입니다. 예를 들어 top-p=0.9이면, 확률 합계가 90%...

Vercel

중급

Vercel은 프론트엔드 애플리케이션의 빌드, 배포, 호스팅을 자동화하는 클라우드 플랫폼입니다. Next.js를 직접 만든 회사로, GitHub 저장소와 연결하면 코드를 푸시할 때마다 자동으로 빌드하고 배포합니다....

Zero-shot 러닝

중급

Zero-shot 러닝(Zero-shot Learning)은 예시를 전혀 제공하지 않고 지시문만으로 AI가 작업을 수행하는 방식입니다. '이 리뷰의 감정을 분석해주세요'처럼 해야 할 일만 설명하면, 모델이 사전 학습...

n8n

중급

n8n은 노코드·로우코드 방식의 오픈소스 워크플로우 자동화 플랫폼입니다. 수백 개의 앱과 서비스를 연결해 자동화 파이프라인을 시각적으로 구성할 수 있으며, 셀프호스팅이 가능해 데이터를 외부로 보내지 않고 내부에서 처...

가드레일

중급

가드레일은 AI 시스템의 출력을 안전하고 허용 가능한 범위 내로 제한하는 보호 장치를 말합니다. 도로의 가드레일처럼 AI가 위험한 방향으로 벗어나지 않도록 경계를 설정하는 모든 기술적·정책적 수단을 포괄합니다. 가드...

구조화된 출력 (Structured Output)

중급

구조화된 출력(Structured Output)은 LLM이 자연어 텍스트 대신 JSON, XML 등 사전에 정의된 스키마 형식으로 응답을 생성하도록 강제하는 기능입니다. 애플리케이션이 AI 응답을 파싱 없이 바로 처...

그라운딩

중급

그라운딩(Grounding)은 AI의 응답을 학습 데이터에만 의존하지 않고, 실제 검색 결과나 제공된 문서 등 외부 사실 기반 데이터에 근거하게 만드는 기술입니다. 할루시네이션(잘못된 정보 생성)을 줄이고 응답의 신...

그래디언트 디센트

고급

그래디언트 디센트(Gradient Descent, 경사 하강법)는 손실 함수를 최소화하기 위해 가중치를 손실 함수의 기울기(그래디언트) 반대 방향으로 조금씩 이동시키는 최적화 알고리즘입니다. 딥러닝 모델 학습의 근본...

노코드/로우코드

입문

노코드/로우코드는 프로그래밍 코드를 거의 혹은 전혀 작성하지 않고 애플리케이션, 자동화 워크플로우, 웹사이트 등을 구축할 수 있는 개발 패러다임입니다. 노코드는 코딩이 전혀 필요 없고, 로우코드는 최소한의 코딩만으로...

데이터 레이블링

중급

데이터 레이블링(Data Labeling)은 AI 모델이 학습할 수 있도록 원시 데이터에 정답 태그(레이블)를 부여하는 작업입니다. 이미지에 '고양이'라고 표시하거나, 텍스트의 감성을 '긍정/부정'으로 분류하거나,...

도구 사용 (Tool Use)

중급

도구 사용(Tool Use)은 AI 모델이 웹 검색, 코드 실행, 파일 조작, 외부 API 호출 등 다양한 외부 도구를 직접 활용하는 능력입니다. Function Calling보다 넓은 개념으로, AI 에이전트가 복...

디퓨전 모델

중급

디퓨전 모델(Diffusion Model)은 이미지에 노이즈를 점진적으로 추가했다가, 그 과정을 역방향으로 학습해 순수한 노이즈에서 깨끗한 이미지를 생성하는 생성 모델입니다. Stable Diffusion과 DALL...

딥러닝

입문

딥러닝(Deep Learning)은 여러 층(layer)으로 구성된 인공 신경망을 사용해 데이터에서 복잡한 패턴을 자동으로 학습하는 기술입니다. 머신러닝의 하위 분야이며, 이미지 인식·음성 인식·자연어 처리 등 현대...

레드팀

중급

레드팀은 AI 시스템의 취약점과 안전 문제를 의도적으로 찾아내는 테스트 방법입니다. 군사·보안 분야에서 유래한 개념으로, 공격자(레드팀)의 관점에서 시스템을 적극적으로 시험하여 실제 배포 전에 위험을 발견합니다. A...

머신러닝

입문

머신러닝(Machine Learning)은 데이터에서 패턴을 자동으로 학습해 예측이나 의사결정을 수행하는 AI의 핵심 방법론입니다. 개발자가 규칙을 직접 프로그래밍하는 대신, 모델이 대량의 데이터를 분석해 스스로 규...

멀티모달

입문

멀티모달(Multimodal)은 텍스트, 이미지, 오디오, 영상 등 여러 형태(모달리티)의 데이터를 함께 이해하고 처리할 수 있는 AI의 능력을 뜻합니다. 기존 AI 모델이 텍스트 하나만 처리했다면, 멀티모달 AI는...

멀티에이전트 시스템

중급

멀티에이전트 시스템은 여러 AI 에이전트가 각자 역할을 분담하여 협업하는 구조입니다. 단일 에이전트가 모든 것을 처리하는 것보다 복잡한 작업을 효율적으로 수행할 수 있으며, 각 에이전트는 특정 도메인의 전문 역할을...

모델 평가

중급

모델 평가는 AI 모델의 성능을 정량적·정성적으로 측정하는 과정입니다. 모델 개발 중간, 배포 전, 배포 후 모니터링 단계에서 반복적으로 수행하여 모델이 의도대로 동작하는지 검증합니다. 주요 평가 방법으로는 벤치마크...

배치 처리 (Batch Processing)

중급

배치 처리(Batch Processing)는 여러 개의 AI API 요청을 개별적으로 즉시 처리하는 대신, 묶어서 한꺼번에 비동기적으로 처리하는 방식입니다. 실시간 응답이 필요하지 않은 대량 작업에서 API 비용을...

백프로파게이션

고급

백프로파게이션(Backpropagation, 역전파)은 신경망 학습의 핵심 알고리즘으로, 모델의 예측 오차를 출력층에서 입력층 방향으로 역방향 전파하여 각 가중치가 오차에 기여한 정도를 계산하고 조정하는 기법입니다....

벡터 데이터베이스

중급

벡터 데이터베이스(Vector Database)는 임베딩 벡터를 저장하고, 벡터 간 유사도를 기반으로 빠르게 검색할 수 있도록 설계된 특수한 데이터베이스입니다. 기존 관계형 DB가 정확한 키워드 매칭에 특화되어 있다...

벤치마크

입문

벤치마크(Benchmark)는 AI 모델의 성능을 표준화된 기준으로 측정하고 비교하기 위한 테스트 모음입니다. 서로 다른 모델을 동일한 기준에서 객관적으로 평가할 수 있어, AI 연구와 모델 선택의 핵심 기준이 됩니...

사전학습

중급

사전학습(Pre-training)은 레이블이 없는 대규모 데이터를 이용해 모델의 기초 언어 능력을 학습하는 첫 번째 단계입니다. 이 단계에서 모델은 인터넷 문서·책·코드 등 방대한 텍스트를 처리하며 언어의 구조, 문...

생성형 AI

입문

생성형 AI(Generative AI)는 텍스트·이미지·코드·음악·영상 등 새로운 콘텐츠를 만들어 내는 AI 시스템을 통칭합니다. 기존 AI가 주로 분류나 예측에 집중했다면, 생성형 AI는 창작 자체를 수행합니다....

손실 함수

고급

손실 함수(Loss Function, 비용 함수·Cost Function)는 모델의 예측값과 실제 정답 사이의 차이를 하나의 수치로 나타내는 함수입니다. 학습의 방향을 결정하는 나침반 역할을 하며, 이 값이 최소화되...

스트리밍

입문

스트리밍(Streaming)은 LLM이 응답 전체를 생성한 후 한 번에 전송하는 대신, 토큰이 생성되는 즉시 실시간으로 전송하는 방식입니다. ChatGPT에서 답변이 타이핑되듯 한 글자씩 나타나는 것이 바로 스트리밍...

시맨틱 검색

중급

시맨틱 검색(Semantic Search)은 단어의 정확한 일치가 아닌 의미(meaning)를 기반으로 관련 문서를 찾는 검색 방식입니다. 텍스트를 벡터(숫자 배열)로 변환하는 임베딩 모델과 벡터 유사도를 계산하는...

시스템 프롬프트

입문

시스템 프롬프트(System Prompt)는 AI 모델에게 대화가 시작되기 전에 미리 주입하는 숨겨진 지시문입니다. 역할, 규칙, 응답 방식, 말투, 금지 사항 등을 사전에 정의해 두면 이후 사용자와의 모든 대화에서...

신경망

입문

신경망(Neural Network)은 인간 뇌의 뉴런 연결 구조를 모방한 컴퓨팅 모델입니다. 입력층(input layer), 하나 이상의 은닉층(hidden layer), 출력층(output layer)으로 구성되며...

양자화

고급

양자화(Quantization)는 AI 모델의 가중치를 높은 정밀도(FP32, FP16)에서 낮은 정밀도(INT8, INT4)로 변환하여 메모리 사용량을 줄이고 추론 속도를 높이는 최적화 기법입니다. 70B 파라미터...

어텐션 메커니즘

고급

어텐션 메커니즘(Attention Mechanism)은 AI 모델이 입력 데이터의 모든 부분을 동일하게 처리하는 대신, 현재 작업에 가장 관련 있는 부분에 더 높은 가중치를 부여하여 집중하는 기술입니다. 트랜스포머...

에이전트 루프

중급

에이전트 루프는 AI 에이전트가 목표를 달성할 때까지 관찰(Observe)→생각(Think)→행동(Act)→관찰 과정을 반복하는 실행 구조입니다. 단일 응답으로 끝나는 일반 AI와 달리, 에이전트는 이 루프를 수십~...

에이전틱 AI

중급

에이전틱 AI(Agentic AI)는 AI가 단순히 질문에 답하는 것을 넘어, 스스로 계획을 세우고 도구를 사용하며 반복적으로 작업을 수행하는 새로운 AI 패러다임을 말합니다. '에이전트처럼 행동하는 AI'라는 의미...

에포크

중급

에포크(Epoch)는 전체 학습 데이터셋을 처음부터 끝까지 한 번 완전히 순회하는 학습 단위입니다. 예를 들어 100만 개의 학습 샘플이 있고 에포크를 10으로 설정하면, 모델은 모든 샘플을 10번 반복 학습합니다....

연합학습 (Federated Learning)

고급

연합학습 (Federated Learning)은 원시 데이터를 중앙 서버로 전송하지 않고, 각 기기나 기관에서 로컬로 모델을 학습시킨 뒤 모델 가중치(업데이트)만 중앙으로 전달하여 통합하는 분산 학습 방식입니다. G...

오버피팅

중급

오버피팅(Overfitting, 과적합)은 머신러닝 모델이 학습 데이터에 지나치게 맞춰져, 새로운 데이터(테스트셋)에서는 성능이 크게 떨어지는 현상입니다. 모델이 데이터의 실제 패턴이 아닌 노이즈와 이상값까지 외워버...

오케스트레이션

중급

오케스트레이션(Orchestration)은 여러 AI 에이전트, 도구, 서비스가 협력하여 하나의 목표를 달성할 수 있도록 전체 흐름을 조율하고 관리하는 개념입니다. 각 구성 요소가 언제, 어떤 순서로, 어떤 입력을...

오픈소스 AI

입문

오픈소스 AI는 모델의 가중치(파라미터)와 소스코드를 공개하여 누구나 무료로 사용·수정·배포할 수 있는 AI 모델을 말합니다. GPT-5.4(OpenAI), Claude Opus 4.6(Anthropic) 같은 클로...

온디바이스 AI

중급

온디바이스 AI(On-device AI)는 클라우드 서버에 데이터를 보내지 않고, 스마트폰·PC·IoT 기기 등 사용자의 기기에서 직접 AI 모델을 실행하는 방식입니다. 모든 처리가 기기 내부에서 이루어지므로 데이터...

워크플로우 자동화

입문

워크플로우 자동화는 반복적으로 수행하는 업무 절차를 소프트웨어가 자동으로 실행하도록 설계하는 것입니다. '트리거(조건) → 액션(실행)' 구조로 이루어지며, n8n, Make(구 Integromat), Zapier...

임베딩

중급

임베딩(Embedding)은 텍스트, 이미지 등의 데이터를 고정 길이의 숫자 벡터(숫자 배열)로 변환하는 기술입니다. 컴퓨터는 텍스트를 직접 이해할 수 없기 때문에, 의미를 보존하면서 수학적으로 처리할 수 있는 형태...

자연어 처리 (NLP)

입문

자연어 처리(NLP, Natural Language Processing)는 컴퓨터가 인간의 언어를 이해하고 생성하며 분석할 수 있도록 하는 AI 기술 분야입니다. 텍스트와 음성 모두를 다루며, 오늘날 대형 언어 모델...

전이학습

중급

전이학습(Transfer Learning)은 한 작업이나 도메인에서 학습된 모델의 지식을 다른 관련 작업에 재활용하는 기법입니다. 대규모 데이터로 사전학습된 모델을 출발점으로 삼아, 목표 작업에 맞게 추가 학습(파인...

증류

고급

증류(Knowledge Distillation)는 크고 성능 좋은 모델(teacher)이 생성한 출력을 학습 데이터로 삼아 작은 모델(student)을 훈련시키는 기법입니다. 대형 모델의 지식과 추론 패턴을 경량 모...

지식 그래프

중급

지식 그래프(Knowledge Graph)는 실세계의 개체(entity)들과 그 사이의 관계(relation)를 그래프 구조로 표현한 지식 체계입니다. 노드(점)가 개체를 나타내고, 엣지(선)가 개체 간의 관계를 나...

청킹

중급

청킹(Chunking)은 긴 문서를 LLM이 처리하기 적합한 작은 조각(chunk)으로 나누는 전처리 과정입니다. RAG(검색 증강 생성) 시스템에서 문서를 벡터 데이터베이스에 저장하기 전에 반드시 거쳐야 하는 핵심...

추론 (Inference)

입문

추론(Inference)은 학습이 완료된 AI 모델이 새로운 입력에 대해 결과를 생성하는 과정입니다. 모델을 '만드는' 과정이 학습(Training)이라면, 만들어진 모델을 '사용하는' 과정이 추론입니다. ChatG...

컨텍스트 압축

고급

컨텍스트 압축은 AI 모델에 전달하는 긴 컨텍스트(대화 기록, 문서, 코드 등)를 요약하거나 핵심 정보만 추출하여 토큰 수를 줄이는 기법입니다. 비용 절감과 처리 속도 향상이 주요 목적이며, 정보 손실 최소화가 핵심...

컨텍스트 엔지니어링

고급

컨텍스트 엔지니어링(Context Engineering)은 AI 모델에 전달하는 맥락 정보 전체를 체계적으로 설계하고 관리하는 기술입니다. 프롬프트 엔지니어링이 '질문 하나를 잘 쓰는 것'이라면, 컨텍스트 엔지니어링...

컨텍스트 윈도우

입문

컨텍스트 윈도우(Context Window)는 AI 언어 모델이 한 번에 처리할 수 있는 텍스트의 최대 크기를 의미합니다. 단위는 토큰(token)으로 측정하며, 모델은 이 범위 안에 있는 내용만 읽고 참조할 수 있...

컴퓨터 비전

입문

컴퓨터 비전(Computer Vision)은 AI가 이미지와 영상을 인식하고 분석하여 의미 있는 정보를 추출하는 기술 분야입니다. 사람이 눈으로 보고 이해하는 능력을 컴퓨터로 구현하는 것을 목표로 합니다. 컴퓨터 비...

코사인 유사도

고급

코사인 유사도(Cosine Similarity)는 두 벡터 사이의 각도(코사인 값)를 이용해 유사도를 측정하는 수학적 방법입니다. 결과값은 -1(완전 반대)부터 1(완전 동일)까지이며, AI에서는 주로 임베딩 벡터...

탈옥 (Jailbreak)

중급

탈옥 (Jailbreak)은 AI 모델의 안전 가드레일을 우회하여 정상적으로는 거부되어야 할 응답을 끌어내는 공격 기법입니다. 스마트폰 탈옥에서 따온 용어로, AI의 제한된 동작 범위를 벗어나게 만든다는 의미입니다....

토크나이저

중급

토크나이저(Tokenizer)는 텍스트를 LLM이 처리할 수 있는 최소 단위인 토큰(token)으로 분할하는 알고리즘입니다. 단어 전체가 하나의 토큰이 될 수도 있고, 단어 일부나 특수문자 하나가 토큰이 될 수도 있...

토큰

입문

토큰(Token)은 AI 언어 모델이 텍스트를 처리할 때 사용하는 최소 단위입니다. 단어 전체일 수도 있고, 단어의 일부(서브워드)이거나 개별 문자일 수도 있습니다. 모델은 입력 텍스트를 토큰으로 쪼갠 뒤 각 토큰을...

토큰 이코노미

중급

토큰 이코노미는 AI API 사용 비용의 핵심인 토큰 소비를 최적화하여 효율적으로 관리하는 전략 체계입니다. 대규모 AI 서비스를 운영할수록 토큰 비용이 전체 운영비의 큰 비중을 차지하기 때문에, 체계적인 토큰 관리...

트랜스포머

중급

트랜스포머(Transformer)는 2017년 구글 연구팀이 논문 "Attention Is All You Need"에서 발표한 딥러닝 아키텍처입니다. 기존 RNN·LSTM 계열 모델의 순차 처리 방식을 대체하여, 입...

파라미터

입문

파라미터(Parameter)는 AI 모델이 학습 과정에서 자동으로 조정하는 내부 수치입니다. 모델이 학습한 '지식'이 저장되는 곳이라고 할 수 있으며, 파라미터의 수가 곧 모델의 규모를 나타내는 지표가 됩니다. 파라...

파인튜닝

중급

파인튜닝(Fine-tuning)은 대규모 데이터로 사전 학습된 언어 모델을 특정 목적에 맞는 소규모 데이터로 추가 학습시키는 기술입니다. 사전 학습 단계에서 모델은 언어의 일반적인 패턴과 지식을 습득하고, 파인튜닝...

편향 (Bias)

입문

편향 (Bias)은 AI 모델이 학습 데이터에 내재된 불균형이나 편견을 그대로 흡수해 불공정하거나 왜곡된 결과를 생성하는 현상을 말합니다. 데이터에서 시작된 편향이 모델을 통해 증폭되어 실제 사용자에게 영향을 미칩니...

프롬프트 엔지니어링

입문

프롬프트 엔지니어링은 AI 모델에서 원하는 결과를 얻기 위해 입력 텍스트(프롬프트)를 체계적으로 설계하고 최적화하는 기술입니다. 단순히 질문을 던지는 것을 넘어, 맥락 제공 방식, 지시 구조, 예시 구성 등을 전략적...

프롬프트 인젝션

중급

프롬프트 인젝션(Prompt Injection)은 악의적인 사용자 입력이나 외부 데이터를 통해 AI의 시스템 프롬프트 지시사항을 무력화하거나 의도치 않은 동작을 유발하는 공격 기법입니다. SQL Injection의...

프롬프트 캐싱

고급

프롬프트 캐싱(Prompt Caching)은 동일한 시스템 프롬프트나 긴 컨텍스트가 반복될 때, 그 처리 결과를 임시로 저장해 두었다가 이후 요청에서 재사용하는 기술입니다. LLM 서비스 제공자가 서버 측에서 처리하...

프롬프트 템플릿

입문

프롬프트 템플릿은 변수 부분만 교체하여 반복적으로 재사용할 수 있도록 설계된 프롬프트 구조입니다. [주제], [대상 독자] 같은 플레이스홀더를 포함하여, 매번 처음부터 프롬프트를 작성하지 않아도 됩니다. 좋은 프롬프...

하네스

중급

하네스(Harness)는 AI 모델의 입력과 출력을 감싸서 제어하는 프레임워크 또는 구조입니다. 시스템 프롬프트 설정, 컨텍스트 관리, 출력 검증, 요청 라우팅 등을 체계적으로 구성해 모델을 일관된 방식으로 사용할...

할루시네이션

입문

할루시네이션(Hallucination)은 AI 언어 모델이 사실과 다른 정보를 마치 사실인 것처럼 자신감 있게 생성하는 현상입니다. 존재하지 않는 논문을 인용하거나, 잘못된 날짜·수치·인물 정보를 제시하거나, 없는...

함수 호출 (Function Calling)

중급

함수 호출(Function Calling)은 LLM이 텍스트를 생성하는 것에 그치지 않고, 미리 정의된 외부 함수나 API를 호출하도록 구조화된 출력을 생성하는 기능입니다. LLM은 어떤 함수를 어떤 인자로 호출할지...

합성 데이터

중급

합성 데이터는 실제 현실에서 수집한 것이 아니라 AI나 알고리즘이 인위적으로 생성한 학습용 데이터입니다. 실제 데이터의 통계적 특성과 패턴을 모방하여 만들어지며, 데이터 부족이나 개인정보 문제를 우회하는 현실적 대안...