Mistral OCR 4 공개 — 170개 언어·셀프호스팅·1,000페이지 $4의 의미

2026년 6월 23일 Mistral이 차세대 문서 인식 모델 Mistral OCR 4를 공개했습니다. 한국 개발자 커뮤니티에서도 긱뉴스 토픽으로 즉시 공유되었을 만큼 관심이 높습니다. 본 글은 Mistral 공식 발표 기준으로 핵심 기능과 벤치마크 수치를 정리하고, 한국 환경에 적용할 때 고려할 비용·보안 요소를 함께 다룹니다.

Mistral OCR 4 도입을 검토하는 문서 처리 워크플로 이미지
Photo by Anastassia Anufrieva on Unsplash

대상 환경: REST API 호출이 가능한 백엔드(Node.js 22, Python 3.12 등)와 셀프호스팅 검토 시 단일 컨테이너(Docker 24+) 운영 경험을 전제합니다. 가격·기능은 2026년 6월 23일 Mistral 공식 발표 기준입니다.

1. Mistral OCR 4 한눈에 보기

OCR 4는 페이지에서 텍스트만 뽑아내던 이전 세대와 달리, 각 블록에 바운딩 박스·블록 유형·신뢰도 점수를 함께 반환합니다. Mistral 공식 발표 기준으로 170개 언어, 10개 언어 그룹을 지원하며 단일 컨테이너에서 셀프호스팅이 가능합니다.

  • 모델 식별자: mistral-ocr-latest (모델 카드 기준)
  • 입력 포맷: PDF, DOC, PPT, OpenDocument
  • 출력 단위: 페이지별 블록 배열 + 마크다운 구조 텍스트
  • 제공 채널: Mistral Studio API, Amazon SageMaker, Microsoft Foundry, 셀프호스팅

2. 새로 추가된 구조화 출력

Mistral 공식 발표에 따르면 OCR 4는 페이지 안의 모든 블록에 다음 세 가지 메타데이터를 부여합니다. RAG 인덱싱과 사람-검수 워크플로 모두에서 유의미한 변화입니다.

2-1. 바운딩 박스

각 단락·표·수식 영역의 좌표가 반환되어 원문 페이지의 어느 위치에서 추출됐는지 정확히 추적할 수 있습니다. 인용 출처 하이라이트, 부분 마스킹, 사람 검수 화면 구성에 바로 활용할 수 있습니다.

2-2. 블록 유형 분류

블록은 다음 유형 중 하나로 라벨링됩니다. RAG 청크 분리 기준으로 그대로 쓸 수 있습니다.

  • text, title, list, table, image
  • equation, caption, code, references
  • aside_text, header, footer, signature

2-3. 신뢰도 점수

페이지별·단어별 confidence가 inline으로 제공됩니다. 임계값을 정해 자동 통과 / 사람 검수 분기를 만드는 휴먼-인더-루프 파이프라인 설계가 쉬워집니다.

3. 벤치마크 결과 정리

OCR 4 벤치마크 결과를 비교하는 데이터 분석 대시보드 이미지
Photo by Deng Xiang on Unsplash

Mistral이 공개한 결과는 공개 벤치마크와 자체 평가, 사람 선호도 세 갈래입니다. 공개 벤치마크는 채점 규칙의 한계가 있어 Mistral 공식 발표도 “방향성 지표”로 해석할 것을 권합니다.

  • OlmOCRBench 기준 85.20점 — 공개 OCR 벤치마크에서 1위(공식 발표).
  • OmniDocBench 기준 93.07점 — 다만 수식 표기·다단 레이아웃에서 채점 한계가 있다고 Mistral이 직접 명시.
  • Crawl Multilingual 평가 0.98 — Mistral 자체 다국어 평가에서 8개 언어 그룹 모두 1위.
  • 독립 어노테이터 선호 평균 72% 승률 — Mistral 공식 발표 기준 600개 이상 문서, 12개 이상 언어에서 경쟁 시스템과 블라인드 비교.

Mistral 공식 발표에 인용된 도입 사례 두 건도 한국 운영 환경 판단에 도움이 됩니다. Rogo의 AI 엔지니어 Aidan Donohue는 차트·도표 중심의 금융 QA 데이터셋에서 “비용 약 8배, 레이턴시 약 17배 절감”을 보고했고, Anaqua의 AI 엔지니어 Ivan Mihailov는 “기존 공급자 대비 페이지당 약 4배 빠른 처리”라고 평가했습니다.

4. 가격 구조 (USD 기준)

Mistral 공식 발표 가격은 다음과 같습니다. 환율·VAT·내부 청구 단위는 별도로 검토해야 합니다.

  • OCR API: Mistral 공식 가격 기준 1,000페이지당 $4
  • Batch API 할인: 동일 기준 50% 적용 시 1,000페이지당 $2
  • Document AI(스키마 출력 포함): 1,000페이지당 $5 (Mistral Studio 기준)

월간 50만 페이지를 가정하면 OCR API 단가는 약 $2,000, Batch API 적용 시 약 $1,000 수준입니다. 한국 기업의 내부 문서 디지털화처럼 대량 batch에 적합한 구간이라면 Batch API 가격이 의사결정의 출발점이 됩니다. Mistral 가격 정책은 변동될 수 있으므로 도입 전 Mistral 공식 가격 페이지 확인이 필요합니다.

5. 셀프호스팅과 데이터 주권

Mistral OCR 4 셀프호스팅 환경을 표현하는 데이터센터 서버 이미지
Photo by Taylor Vick on Unsplash

OCR 4가 한국 기업 입장에서 주목할 만한 차별점은 단일 컨테이너 셀프호스팅입니다. Mistral 공식 발표 기준 엔터프라이즈 고객 대상 자체 배포 옵션이 제공되며, 문서 데이터가 외부 API로 송신되지 않습니다.

국내 도입 검토 시 점검할 항목은 다음과 같습니다.

  • 개인정보보호법상 위탁 vs 자체 처리 구분 — 셀프호스팅은 위탁 부담을 줄임
  • 금융·의료 가이드라인(전자금융감독규정, 의료법 시행규칙 등) — 데이터 외부 반출 제한 조항 확인
  • GPU 운영 비용 — 단일 컨테이너지만 추론 처리량에 따라 GPU 클래스 결정 필요
  • 모델 가중치 라이선스 — 상업 사용 조건은 Mistral 공식 계약 확인 필요

6. 한국 개발자 관점의 적합 시나리오

Mistral 공식 발표가 권장하는 활용처와 한국 실무 맥락을 매핑하면 다음과 같이 정리할 수 있습니다.

  • RAG 인덱싱: 블록 단위·신뢰도가 함께 와서 시맨틱 청크 분리 로직이 단순해집니다.
  • 인보이스·세금계산서 처리: 표 블록 + 바운딩 박스 좌표로 항목별 필드 추출 자동화에 적합합니다.
  • 법무·컴플라이언스 문서: 서명·헤더·푸터를 별도 블록 유형으로 분리해 후처리가 쉬워집니다.
  • 다국어 사용자 매뉴얼: 한국어와 영어가 섞인 매뉴얼에서 OCR 4의 다국어 강점이 살아납니다.

다만 Mistral 공식 발표는 “OCR 4는 의사결정 모델이 아닙니다”라고 명시합니다. 의료 진단, 법률 판단, 고위험 금융 의사결정, 안전 중요 시스템, 실시간 저지연 처리, 비문서 입력(음성·영상) 같은 영역은 적용 대상에서 제외해야 합니다.

7. 도입 전 확인 체크리스트

국내 팀이 PoC를 시작하기 전 점검하면 좋은 항목을 정리했습니다.

  1. 실제 운영 문서 100~300건으로 자체 정확도·레이아웃 평가를 수행했는가 (공개 벤치마크 한계 보완)
  2. 한국어 + 영어 혼용 문서, 표·수식·서명 비중을 사전에 분류했는가
  3. 월간 페이지 수 추정치를 기준으로 API vs Batch API vs 셀프호스팅의 TCO를 비교했는가
  4. 개인정보·민감정보 비중에 따라 외부 API 송신 가능 여부를 법무·보안과 합의했는가
  5. 휴먼-인더-루프 임계값(예: confidence 0.85 미만 검수 큐 송부)을 설계했는가
  6. 실패 케이스 회귀 테스트셋을 운영 단계 이전에 고정했는가

OCR 4 모델 카드와 API 사양은 Mistral 공식 문서에서 확인할 수 있습니다. 변경 이력이 빠르게 누적되는 영역이므로 도입 시점의 모델 카드 버전을 함께 기록해 두는 것을 권장합니다.

관련 글

OCR 4 같은 AI 인프라 도입을 검토할 때 함께 참고할 만한 글들입니다.


📌 함께 보시면 좋은 글

※ 본 글은 AI(Claude)의 초안을 기반으로 편집자 검수를 거쳐 발행되었습니다. (한국 AI기본법 대응 고지)

이직·퇴사, 지금 움직여도 될지 헷갈리시나요?

막연히 불안한 건지, 정말 시점이 온 건지 판단이 어려울 때가 있습니다.

5분 체크리스트로 지금 상태를 먼저 정리해보세요.
결론을 대신 내리기보다, 스스로 판단할 기준을 잡는 데 도움을 드립니다.

무료 체크리스트 보기

아직 확신이 없다면, 지금이 ‘고민 단계’인지부터 먼저 점검해보세요