고문헌을 읽는
차세대 AI OCR
플랫폼
한자, 고문헌, 현대 문서를 AI가 정밀하게 인식하고 구조화합니다. 탱고인사이트는 역사적 자료를 검색 가능한 디지털 지식 자산으로 전환합니다.
MooN AI OCR 기반 디지털 원문 구축 수행 실적
다양한 기록물 형태에 대한 구축 경험을 기반으로 자료 특성에 최적화된 AI OCR 구축 수행
※ 발행연도 1934~2025년까지 연도별 다양한 자료 구축
고문헌부터 현대 문서까지,
인식에서 활용까지
하나의 플랫폼에서
탱고인사이트(Tangoinsight)는 2022년 설립된 AI 기반 문서 데이터화 및 지식 프로세스 아웃소싱(KPO) 전문 기업입니다.
AI 학습 기반의 Data-Adaptive OCR을 핵심 기술로, 한자·옛한글·세로쓰기 등 기존 OCR이 실패하는 고문헌에서도 98.7%의 인식 정확도를 달성합니다. 국립도서관, 한국학연구원, 대학 역사학과 등 다수의 기관이 도입하여 5백만 페이지 이상을 처리했습니다.
미션: "모든 역사적 기록이 디지털 지식 자산으로" — 아날로그에 잠들어 있는 정보를 누구나 검색하고 활용할 수 있도록 합니다.
고문헌 특화 AI
일반 OCR이 포기하는 한자·옛한글·필사체를 98.7% 정확도로 인식. AI 학습으로 자료 특성에 스스로 적응합니다.
엔드투엔드 서비스
스캔 입력 → AI OCR → 전문가 검수 → 납품까지 단일 플랫폼에서 완결. 별도 솔루션 없이 바로 활용 가능합니다.
자기학습 엔진
처리할수록 더 정확해지는 Data-Adaptive OCR. 기관별 자료 특성에 맞춰 지속적으로 성능이 향상됩니다.
고문헌 특화 AI 기술
한자, 옛한글, 활자본까지 정확하게 인식하는 전문 OCR 기술. 인식부터 편집, 데이터 활용까지 하나의 플랫폼에서 해결합니다.
고문헌 특화 OCR
한자, 활자본까지 인식합니다. AI 학습 기반 Data-Adaptive OCR로 일반 OCR 대비 정확도 3배 향상. 옛한글·세로쓰기·인쇄체·필사체 모두 지원합니다.
인터랙티브 웹 편집
웹에서 바로 인식 결과를 수정하고, 원본 레이아웃을 유지한 PDF로 저장합니다. 별도 프로그램 설치 없이 브라우저에서 전문가 검수까지 완료할 수 있습니다.
스마트 데이터 추출
표와 이미지를 자동으로 분리하여 Excel·CSV로 변환합니다. 고문헌 속 수치·통계 데이터를 즉시 연구에 활용 가능한 형태로 구조화합니다.
AI 문서 대화
인식된 문서에 질문하고, 번역하고, 요약하는 AI 어시스턴트. 방대한 고문헌 자료에서 필요한 정보를 대화하듯 찾아냅니다.
보안 배포
On-Premise와 Cloud 모두 지원하는 유연한 배포 방식. 기밀성이 요구되는 기관 자료도 내부망에서 안전하게 처리합니다.
고속 대량 처리
페이지당 평균 2초 이내의 고속 처리 속도. 클라우드 분산 처리로 수십만 페이지의 아카이빙 프로젝트도 빠르게 완수합니다.
솔루션
문서 디지털화 전 과정을 지원하는 8가지 전문 솔루션
MooN Editor
- 텍스트 자동 교정·교열
- 자동 문단 정제
- 표·그림·메타데이터 구축/점검
- MooN파일 추출
MooN AI OCR
- AI 학습 기반 Data-Adaptive OCR 엔진
- 고문서·타자체·필기체 90%+ 인식률
- 자기학습으로 엔진 성능 자동 업데이트
- OCR PDF 및 데이터셋(JSON/XML) 생성
MooN AI Explorer
- Vision-Language Model(VLM) 기반
- 텍스트·이미지 멀티모달 AI 처리
- 이미지 인식·설명·질의응답
- 아카이브 관리 및 데이터 탐색
Tango PDF
- OCR 인식 후 목차 이미지 자동 연결
- TOC(목차) 입력 및 검수 기능
- TOC 적용된 북마크 PDF 생성
- 다중 목차 선택 및 단계 조정
Tango XML(JSON)
- XML 구조화 파일 변환
- 자동 XML Tagging 지원
- 의미기반 JSON 파일 변환
Tango Batch
- 결과물 XML·JSON·TXT 생성
- 표·이미지, 글자 이미지 추출
- Hidden Text PDF 생성
- 서지 정보 목록 추출 및 통계
Tango Image
- 자동 기울기보정 및 배경/외곽 삭제
- 컬러(JPEG)/회색(TIFF) 자동 선별
- 자동 센터링·중앙정렬 및 리사이즈
- 잡티 제거 및 단면자르기
Tango
Workflow
모든 솔루션을 연결하는 통합 워크플로우 관리 시스템
- 대량 이미지 기반 DB 구축 공정관리
- 상용 OCR(ABBYY) 및 MooN AI OCR 탑재
- 실시간 프로젝트 모니터링·리포팅
- 작업자 성과 및 정산 리포팅
AI 학습이 만든
압도적인 정확도
한자·옛한글·세로쓰기 등 기존 OCR이 실패하는 고문헌에서도 98.7%의 인식 정확도를 달성합니다. 사용할수록 특정 문서에 최적화되는 Data-Adaptive 학습 엔진이 핵심입니다.
문서 처리 프로세스
문서 수집
스캔, 사진, PDF 등 다양한 형태로 수집
AI 인식
Data-Adaptive OCR 엔진으로 고정밀 인식
데이터 정제
오류 검출 및 자동/수동 보정
구조화 출력
고객사 시스템에 맞는 형식으로 전달
도입 기관의 목소리
실제 사용자들의 생생한 경험을 들어보세요
조선시대 고문서 디지털화 작업이 80% 빠르게 완료되었습니다. 특히 한자 인식 정확도가 일반 OCR과는 비교할 수 없을 정도로 뛰어났습니다.
홍아름 교수
국립도서관 · 디지털 아카이브팀
세로쓰기 신문 자료를 검색 가능한 텍스트로 변환하는 프로젝트에서 96% 이상의 정확도를 달성했습니다. 연구 효율이 3배 향상되었어요.
이서연 교수
국내 주요 대학 · 역사학과
한의학 고전 데이터베이스 구축에 Tangoinsight를 활용했습니다. 웹 기반 편집 기능 덕분에 전문가 검수가 매우 편리했습니다.
박민준 연구원
한의학 연구소 · 연구원
더 많은 도입 사례가 계속 추가됩니다