추출 (Extraction)
"이 문서에서 이 항목들만 추출해줘"라고 정의하면, 해당 값만 깔끔한 JSON으로 반환합니다.
추출이 필요한 순간
- 매달 수십 장의 청구서에서 금액·날짜·거래처를 직접 옮겨 입력하고 있을 때
- 계약서마다 계약 기간, 당사자명, 조건을 손으로 정리하고 있을 때
- 이력서 더미에서 이름·연락처·경력을 수동으로 추출하고 있을 때
- 반복되는 문서 처리를 시스템에 자동화하고 싶을 때
파싱(Parsing)과 무엇이 다른가요?
| 추출 | 파싱 | |
|---|---|---|
| 목적 | 원하는 항목만 골라서 꺼내기 | 문서 전체를 정리된 데이터로 변환 |
| 출력 결과 | 지정한 항목만 담긴 JSON | 문서 전체 내용 (JSON · Markdown) |
| 사전 설정 필요 여부 | 있음 — 꺼낼 항목 목록 설정 필요 | 없음 — 바로 실행 가능 |
| 이런 분께 적합 | 특정 데이터 자동 추출이 목적 | 문서 변환·저장·검색이 목적 |
Playground에서 직접 해보기
⚠️ 추출은 항목 목록(스키마)을 먼저 설정해야 시작할 수 있습니다. 항목이 하나도 없으면 [추출 시작] 버튼이 활성화되지 않습니다. 아래 순서를 꼭 지켜주세요.
1단계 — 파일 업로드
좌측 메뉴에서 [Playground → 추출] 을 클릭한 뒤, 파일을 드래그하거나 [샘플 파일] 을 클릭합니다.
2단계 — 추출할 항목 설정 (필수)
꺼내고 싶은 정보의 목록을 만드는 단계입니다. 네 가지 방법 중 편한 것을 선택하세요.
방법 A — 직접 추가 (처음 사용하는 분께 권장)
꺼내고 싶은 항목을 직접 하나씩 입력합니다.
- 키 이름 — 결과에서 사용할 항목명 (예:
거래처명,총금액) - 키 설명 — 이 항목이 문서의 어디에 있는지 설명하면 정확도가 올라갑니다 (예:
세금계산서 상단에 표기된 공급받는 사업자 이름)
항목을 더 추가하려면 [+ 항목 추가] 버튼을 누르세요. 잘못 추가한 항목은 우측 상단 더보기 버튼에서 삭제를 선택해 삭제하거나 수정을 선택해 수정할 수 있습니다.
방법 B — AI 자동 추출
문서를 분석하여 추출 가능한 항목(스키마)을 AI가 자동으로 추천합니다.
- [AI 추출] 버튼을 클릭합니다.
- AI가 제안한 항목 목록이 나타납니다.
- 필요한 항목만 체크하고, 필요 없는 항목은 해제합니다.
- 항목 이름과 설명을 자유롭게 수정할 수 있습니다.
처음 사용한다면 AI 추천으로 시작하고, 이후 필요한 항목을 다듬어 보세요.
방법 C — 자연어로 요청
항목을 일일이 추가하지 않고, 말하듯이 입력한 후 추출 시작하면 한 번에 항목이 설정되어 결과가 제공됩니다.
입력 예시: "이 계약서에서 계약 당사자 이름, 계약 기간, 총 계약 금액을 가져와줘. 개인 주소 정보는 제외해."
방법 D — 스키마 파일 불러오기
이전에 저장해 둔 항목 목록(.json)이 있다면 바로 불러올 수 있습니다. 같은 양식의 문서를 반복 처리할 때 매우 유용합니다.
3단계 — 추출 시작
항목을 1개 이상 추가하면 [추출 시작] 버튼이 활성화됩니다. 버튼을 클릭하면 처리가 시작됩니다. 잠시 기다려 주세요.
🚫 항목이 없으면 버튼이 비활성화됩니다.
4단계 — 결과 확인 및 활용
추출이 완료되면 결과가 오른쪽 패널에 나타납니다.
{
"거래처명": "(주)홍길동상사",
"총금액": 1500000,
"발행일": "2026-03-12"
}
| 버튼 | 기능 |
|---|---|
| 복사 | json 결과를 클립보드에 복사합니다 |
| JSON 다운로드 | 결과를 파일로 저장합니다 |
| 스키마 가져오기 | 이미 저장된 항목 목록을 파일로 가져오기 합니다 |
| 스키마 내보내기 | 지금 설정한 항목 목록을 파일로 저장합니다 |
| 파일 재업로드 후 추출 | 항목은 유지한 채 다른 파일로 다시 추출합니다 |
| AI 추출 | 문서를 분석하여 추출 가능한 항목을 AI가 자동으로 추출합니다 |
자주 하는 실수
| 상황 | 해결 방법 |
|---|---|
| [추출 시작] 버튼이 눌리지 않아요 | 항목(스키마)을 먼저 1개 이상 추가해주세요 |
| 추출 결과 값이 비어 있어요 | 키 설명을 더 구체적으로 적거나, 문서에 해당 항목이 실제로 있는지 확인해주세요 |
| 결과가 부정확하게 나와요 | "문서의 어느 위치에 있는 값인지" 설명을 추가하면 정확도가 올라갑니다 |
| 같은 양식 문서를 또 처리해야 해요 | [스키마 내보내기]로 항목을 저장하고, 다음에 [스키마 가져오기]로 재사용하세요 |