Vesuvius Challenge, 봉인된 헤르쿨라네움 두루마리를 처음 끝까지 읽다

본 글은 2026년 6월 25일 Vesuvius Challenge 팀이 scrollprize.org/firstscroll 에 공개한 “An entire Herculaneum scroll has been read for the first time” 발표를 한국 개발자 관점에서 정리한 기록입니다. AD 79년 베수비오 화산 폭발로 봉인된 PHerc. 1667 두루마리가 머신러닝과 X-ray 영상의 결합으로 2,000년 만에 처음 끝에서 끝까지 판독됐습니다.

Vesuvius Challenge가 디지털 언롤로 해독한 헤르쿨라네움 두루마리 개념 이미지
Photo by Taylor Flowe on Unsplash

참고 시점: 2026년 6월 25일(UTC) 발표 기준. 데이터·코드는 모두 Creative Commons 라이선스로 공개됐으며 본문 인용은 Vesuvius Challenge 공식 페이지와 preprint PDF를 1차 출처로 사용했습니다.

1. 무엇이 발표됐는가

Vesuvius Challenge 팀이 PHerc. 1667(커뮤니티 식별자 Scroll 4) 두루마리를 물리적으로 풀지 않은 채 디지털 언롤로 끝까지 읽었다고 공식 발표 했습니다. 헤르쿨라네움 두루마리가 단어·구절 단위가 아니라 연속된 본문으로 판독된 것은 이번이 처음입니다.

  • 발표일: 2026년 6월 25일(UTC), 출처 scrollprize.org 공식 페이지 기준
  • 대상: PHerc. 1667 — 약 1.4m 길이, 그리스어 22 컬럼의 철학 텍스트
  • 내용: 인간 본성·충동·도덕적 진보를 다룬 스토아 윤리학 논문, 최종 컬럼에 Aristocreon(Chrysippus의 조카) 언급으로 기원전 2세기 추정
  • preprint PDF·고해상도 이미지·재구성 데이터·학습 코드 전부 오픈 라이선스 공개 (출처 동일)

두루마리는 19세기와 1969년, 1980년대에 물리적으로 펴려는 시도가 이루어졌으나 외층이 파괴되고 약 8cm 두께의 내부 코어만 남았습니다. 이번 작업은 그 남은 부분을 X-ray 데이터 위에서 재구성해 22 컬럼 하단을 papyrologist 검증과 함께 옮겨 적었습니다.

2. 기술 스택: X-ray + 표면 복원 + ML

X-ray와 머신러닝으로 두루마리 잉크를 검출하는 연구실 이미지
Photo by Trnava University on Unsplash

핵심 파이프라인은 세 단계로 요약됩니다. 공식 페이지의 “How it was done” 섹션 기준입니다.

2-1. 고해상도 X-ray 마이크로토모그래피

프랑스 그르노블의 European Synchrotron Radiation Facility(ESRF)에 있는 BM18 빔라인을 사용해 phase-contrast X-ray 마이크로토모그래피로 두루마리를 스캔했다고 공식 페이지가 밝히고 있습니다. 종이 두께가 매우 얇고 층이 촘촘하게 감긴 구조라 일반 CT로는 분리가 어렵기 때문에 시너지가 가능한 빔라인이 필요했습니다.

2-2. 3D 표면 복원과 평탄화

스캔 결과는 단순한 2D 영상이 아니라 3D 볼륨 데이터입니다. 팀은 두루마리 내부에 감긴 한 장의 종이 표면을 추적(segmentation)하고, 그 굽은 면을 평면으로 펴는 unwrapping 단계를 수행했습니다. 이 단계가 “가상 언롤”의 본질이며 컴퓨터 그래픽스의 메시 처리와 가까운 영역입니다.

2-3. 잉크 검출용 ML 모델

탄화된 파피루스 위에 놓인 잉크는 밀도 차가 거의 없어 육안이나 단순 임계처리로는 구분되지 않습니다. 팀은 머신러닝 모델을 학습시켜 잉크 신호를 강조했고, 그 결과를 papyrologist가 다시 검증·옮겨 적었습니다. 즉 “ML이 1차 검출, 도메인 전문가가 최종 검증”이라는 협업 구조입니다.

3. PHerc. Paris 4와 PHerc. 139 — 두 가지 부수 마일스톤

이번 발표는 PHerc. 1667 한 개에 그치지 않습니다. 두 개의 두루마리에서 추가 진전이 함께 보고됐습니다.

  • PHerc. Paris 4 (Scroll 1): 더 높은 해상도 영상에서 잉크가 X-ray 데이터 자체에 직접 보이기 시작했고, 3D segmentation 결과가 2023 Grand Prize 판독과 1:1 일치해 결과 재현성을 독립적으로 확인했습니다. (출처: Vesuvius Challenge 공식 페이지)
  • PHerc. 139: 두루마리의 제목과 저자 식별에 성공해 Philodemus의 On Gods, Book 8 로 확인됐습니다. Epicurean 철학자의 작품으로, 본문 진입 전에 문헌 정체부터 알 수 있다는 점에서 학술적 가치가 큽니다.

세 두루마리에서 각각 “끝까지 판독”, “독립 검증”, “제목·저자 식별”이라는 서로 다른 측면의 진전이 동시에 보고됐다는 점이 이번 발표의 구조적 의미입니다.

4. 한국 개발자가 주목할 만한 지점

오픈 사이언스 기반 글로벌 커뮤니티 협업 이미지
Photo by Kaleidico on Unsplash

대규모 언어 모델 헤드라인이 가득한 시기에 이 사례는 ML이 어디에 가장 큰 가치를 만드는지에 대한 좋은 대조군입니다.

  1. 도메인 + ML 결합: 잉크 검출은 ML이 잘하지만, 그 결과를 그리스어 텍스트로 옮기는 일은 papyrologist의 영역입니다. 챗봇 데모와 달리 도메인 전문가가 워크플로의 마지막 단계에 명시적으로 배치돼 있습니다.
  2. 오픈 데이터·오픈 코드: 토모그래피 데이터·재구성 표면·전사문이 CC 라이선스, 학습 코드가 GitHub 공개입니다. 누구든 검증하고 재학습할 수 있어 결과 재현성이 외부에서 보장됩니다.
  3. 콘테스트 기반 인재 발굴: 공식 페이지의 “A victory for open, global science” 섹션에 따르면, 현 연구팀 다수가 2023 Vesuvius Challenge 콘테스트 참가자로 시작해 팀에 합류했습니다. Kaggle식 공개 경쟁이 정규 채용 파이프라인으로 작동한 사례입니다.

5. 데이터·코드 접근 경로

같은 워크플로를 자신의 프로젝트에 응용하고 싶다면 다음 경로가 1차 진입점입니다. 모두 공식 페이지에 명시된 URL입니다.

  • 발표 본문: scrollprize.org/firstscroll
  • preprint PDF: 공식 페이지 “Read the preprint” 링크에서 다운로드 가능
  • 데이터 카탈로그: scrollprize.org/data — 토모그래피 볼륨, 재구성 표면, 전사문 (CC 라이선스)
  • 학습·재구성 코드: 공식 페이지가 가리키는 GitHub 저장소

3D 볼륨 데이터는 용량이 크므로 일반 노트북 단일 GPU로는 풀 파이프라인 재현이 어렵습니다. 우선 표면이 이미 평탄화된 “unwrapped” 이미지부터 받아서 잉크 검출 모델 미세조정 실험을 시작하는 편이 현실적입니다.

6. 판단 가이드: 이번 사례에서 무엇을 가져갈 것인가

  • ML 도입 결정자라면: 도메인 전문가의 최종 검증을 워크플로에 명시적으로 포함했는지 점검합니다. 검증 단계가 빠지면 환각·오탐이 결과 자체를 무효화합니다.
  • 오픈소스 기여를 고민한다면: Vesuvius Challenge 같은 공개 도메인 프로젝트가 실제 채용 신호가 되는 구조를 참고할 수 있습니다. 코드 한 PR보다 검증 가능한 결과 1건이 더 강한 명함이 됩니다.
  • 컴퓨터 비전 학습자라면: 3D 볼륨에서 곡면 surface segmentation → unwrapping → 잉크 검출로 이어지는 파이프라인을 작은 데이터셋으로 단계별로 재현해보면 SAM·U-Net 류 모델의 한계점이 명확히 드러납니다.

7. 정리

2,000년 동안 봉인됐던 두루마리 한 권이 X-ray 영상과 머신러닝의 결합으로 처음 끝까지 읽혔습니다. 화려한 데모가 아니라 도메인 전문가·오픈 데이터·콘테스트 커뮤니티가 누적된 결과라는 점에서, 한국 개발자에게도 “ML이 가치를 만드는 모범 구조”의 좋은 사례로 남을 듯합니다. 데이터·코드가 모두 공개돼 있어 학습용 재현 실험에 진입 장벽이 낮은 것도 장점입니다.

관련 글

같은 “ML을 실제 문서·이미지 처리에 적용”하는 맥락에서 함께 읽을 만한 글을 모았습니다.


📌 함께 보시면 좋은 글

※ 본 글은 AI(Claude)의 초안을 기반으로 편집자 검수를 거쳐 발행되었습니다. (한국 AI기본법 대응 고지)

이직·퇴사, 지금 움직여도 될지 헷갈리시나요?

막연히 불안한 건지, 정말 시점이 온 건지 판단이 어려울 때가 있습니다.

5분 체크리스트로 지금 상태를 먼저 정리해보세요.
결론을 대신 내리기보다, 스스로 판단할 기준을 잡는 데 도움을 드립니다.

무료 체크리스트 보기

아직 확신이 없다면, 지금이 ‘고민 단계’인지부터 먼저 점검해보세요