구조화된 출력 (Structured Output)

중급

구조화된 출력 (Structured Output)는 AI 문맥에서 자주 등장하는 개념입니다. 이 페이지는 중급 난이도로 구조화된 출력 (Structured Output)의 뜻과 쓰임을 빠르게 이해할 수 있도록 정리한 AI 용어사전 항목입니다.

구조화된 출력 (Structured Output)를 처음 보는 독자도 헷갈리지 않도록 정의와 맥락를 한 페이지에 묶었습니다. 아래 설명을 먼저 읽고, 이어서 연결된 개념과 글까지 보면 이해가 훨씬 빨라집니다.

구조화된 출력(Structured Output)은 LLM이 자연어 텍스트 대신 JSON, XML 등 사전에 정의된 스키마 형식으로 응답을 생성하도록 강제하는 기능입니다. 애플리케이션이 AI 응답을 파싱 없이 바로 처리할 수 있게 해주는 필수 기능입니다.

Structured Output이 필요한 이유는 LLM 응답의 예측 불가능성 때문입니다. 프롬프트만으로 JSON을 요청하면 LLM이 마크다운 코드블록으로 감싸거나, 필드명을 임의로 바꾸거나, 빈 값 처리 방식이 달라지는 경우가 생깁니다. OpenAI의 Structured Outputs 기능과 Claude의 tool use 기반 구조화 응답은 JSON Schema를 보장하여 이 문제를 해결합니다.

실제 사용 사례로는 리뷰 감성 분석(긍정/부정/점수를 JSON으로), 이메일에서 일정 정보 추출(날짜, 장소, 참석자를 구조화된 형태로), 제품 설명 생성 후 DB 저장 등이 있습니다. Pydantic 모델이나 Zod 스키마를 정의하면 GPT 계열 모델과 Claude 모델 모두 해당 스키마를 준수한 응답을 반환합니다.

ℹ️쉽게 말하면

AI에게 자유롭게 작성하는 대신 정해진 서식지(양식)를 주고 그 안에만 채워 넣으라고 하는 것입니다. 결과물을 바로 데이터베이스에 넣을 수 있습니다.

구조화된 출력을 구현하는 방법은 플랫폼마다 차이가 있습니다. OpenAI API에서는 response_format 파라미터에 JSON Schema를 직접 전달하는 방식을 지원합니다. Claude API에서는 tool use(함수 호출) 메커니즘을 사용하여 원하는 스키마를 도구 입력 형식으로 정의하고, 모델이 해당 도구를 호출하는 형태로 구조화된 응답을 받습니다. 두 방식 모두 응답이 스키마를 벗어날 경우 오류를 반환하거나 재시도를 유도합니다.

Python에서 구조화된 출력을 가장 편리하게 사용하는 방법은 Pydantic 라이브러리와의 조합입니다. Pydantic 모델 클래스를 정의하면 자동으로 JSON Schema가 생성되고, AI 응답을 해당 모델로 파싱하면 타입 검증까지 자동으로 처리됩니다. instructor 라이브러리는 이 과정을 더욱 단순화하여 OpenAI, Anthropic, Gemini API 모두에서 동일한 방식으로 구조화된 출력을 받을 수 있도록 추상화 레이어를 제공합니다.

구조화된 출력의 일반적인 사용 패턴을 구체적으로 살펴보면 다음과 같습니다. 뉴스 기사에서 회사명, 날짜, 이벤트 유형을 추출하는 정보 추출 파이프라인에서는 추출 스키마를 미리 정의하고 대량의 기사를 일괄 처리합니다. 사용자 리뷰를 받아 별점, 감성, 주요 키워드, 개선 제안을 분리하는 분석 시스템에서는 각 필드에 타입과 설명을 지정하면 모델이 일관된 형식으로 분석 결과를 반환합니다. 이런 파이프라인은 구조화된 출력 없이 구현하면 응답 파싱 실패로 인한 버그가 자주 발생합니다.

구조화된 출력에는 몇 가지 한계도 있습니다. 스키마가 복잡해질수록 모델이 모든 필드를 채우기 위해 의미 없는 값을 생성하는 경우가 있습니다. 특히 선택 필드(optional field)에서 모델이 추측한 값을 넣는 할루시네이션 문제가 발생할 수 있습니다. 스키마를 너무 세밀하게 정의하면 모델의 창의적 응답 능력을 제한할 수 있으므로, 반드시 구조가 필요한 필드와 자연어가 적합한 필드를 구분하여 하이브리드로 설계하는 것이 좋습니다.

구조화된 출력은 AI 에이전트 시스템에서 특히 중요합니다. 에이전트가 여러 단계를 거쳐 작업을 수행할 때 각 단계의 출력이 다음 단계의 입력으로 연결됩니다. 이때 각 단계 출력이 구조화되어 있지 않으면 파이프라인 전체가 불안정해집니다. 결국 안정적인 AI 에이전트를 구축하려면 각 도구 호출과 중간 결과를 구조화된 출력으로 설계하는 것이 필수입니다.

구조화된 출력을 사용할 때 JSON Schema 설계도 중요합니다. 스키마에는 각 필드의 타입(string, number, boolean, array, object), 필수 여부(required), 설명(description)을 명확히 지정합니다. description 필드는 단순한 주석이 아니라 AI 모델에게 해당 필드에 어떤 값을 넣어야 하는지 안내하는 프롬프트 역할을 합니다. 예를 들어 감성 분석 스키마에서 sentiment 필드의 description을 '긍정이면 positive, 부정이면 negative, 중립이면 neutral을 반환'처럼 구체적으로 작성하면 일관된 결과를 얻을 수 있습니다.

구조화된 출력은 데이터 파이프라인과 AI를 연결하는 핵심 다리입니다. 기존 데이터베이스 시스템, REST API, 데이터 분석 도구들은 정해진 스키마의 데이터를 기대합니다. AI가 생성하는 비정형 텍스트를 이 시스템들에 바로 연결하려면 구조화된 출력이 필수입니다. 비정형 텍스트 데이터를 처리하는 LLM과 정형 데이터를 다루는 기존 시스템 사이에서 구조화된 출력은 두 세계를 연결하는 번역기 역할을 합니다.