OUTPUT FORMATS
필요한 작업에 맞춰 결과 파일을 선택하세요
같은 문서라도 복사, 정리, 검색, AI 처리, 표 분석처럼 목적에 따라 편한 파일 형식이 다릅니다.
TXT
TXT는 메모장처럼 어디서나 열 수 있는 기본 텍스트 파일입니다. 문서 안의 글자를 빠르게 복사하거나, 워드와 노션에 붙여넣어 다시 정리할 때 가장 단순하고 안정적입니다.
서식이 많이 필요하지 않고 본문 내용만 확인하면 되는 문서라면 TXT부터 선택하는 것을 권장합니다.
Markdown
Markdown은 제목, 문단, 목록 같은 구조를 텍스트로 표현하기 좋은 형식입니다. 노션, GitHub, 여러 문서 편집기에 붙여넣기 쉽고, 여러 문서를 한곳에 모아 정리할 때 유용합니다.
보고서 초안, 회의록 정리, 연구자료 정리처럼 사람이 다시 읽고 편집할 가능성이 큰 문서에 잘 맞습니다.
JSONL
JSONL은 한 줄에 하나의 데이터 조각을 담는 형식입니다. 검색 인덱스, RAG, AI 요약, 자동 분류처럼 프로그램이 문서를 다시 처리해야 할 때 쓰기 좋습니다.
일반 사용자가 직접 열어 읽기에는 TXT나 Markdown보다 복잡해 보일 수 있습니다. 대신 여러 문서를 데이터셋처럼 모아 처리할 때는 구조가 일정해서 자동화에 유리합니다.
CSV
CSV는 문서 안의 표를 엑셀이나 스프레드시트에서 열 수 있게 정리하는 파일입니다. 표가 많은 HWPX와 PDF 문서에서 더 안정적이며, 일부 HWP 문서는 원본 표 구조를 완전히 복원하지 못할 수 있습니다.
표 구조가 중요한 문서라면 상세 추출을 선택하고, 가능하면 HWPX 또는 텍스트가 포함된 PDF 파일을 사용하는 것을 권장합니다.