고전 텍스트 DB의 활용을 위한 텍스트 처리와 가공 방법 연구
- Alternative Title
- A Research on Text Processing and Transformation Methods for Utilizing Classical Text Databases
- Abstract
- 이 연구는 기존의 고전 텍스트 데이터베이스(DB)가 가진 디지털 이미지 중심의 서비스가 가지는 한계를 극복하고 전산적인 처리와 분석이 가능한 디지털 고전 텍스트중심의 데이터베이스를 구축하기 위한 다양한 이슈들을 논의하는 데 그 목적이 있다. 즉 디지털 원본 이미지, 디지털 원본 텍스트, 디지털 변환 텍스트, 디지털 주석 텍스트등과 같이 디지털 텍스트의 다양한 이 형태들을 종합적으로 구축하여 DB에 포함할 것을 제안하였다. 이를 위해 기존의 DB 현황에 대한 기초적이고 포괄적인 조사를 수행하고, 우선적으로 고전 활자본 소설 DB를 대상으로 구체적인 전처리 원칙과 세부 지침에 따라 디지털 변환, 주석 텍스트를 처리하는 과정에 대해서 논의하였다. 그 결과로 전산적 처리가 가능한, 신뢰할 수 있는 디지털 정본 및 다양한 이본 자료를 확보할 수 있음을 보였으며 이를 통해 디지털인문학의 성공적인 사례를 창출할 수 있다고 제안하였다.
This study aims to discuss various issues in overcoming the limitations of existing classical text databases (DB), which are primarily focused on digital images, by establishing a database centered on digital classical texts that can be computationally processed and analyzed. It proposes to comprehensively construct various forms of digital texts, such as digital original images, digital original texts, digital transformed texts, and digital annotated texts, to be included in the database. For this purpose, a basic and comprehensive investigation of the current state of existing DB was conducted. The study specifically targeted the classical printed novel DB to discuss the process of handling digital transformed and annotated texts according to specific preprocessing principles and detailed guidelines. As a result, it demonstrated that reliable digital originals and various versioned materials that are amenable to computational processing could be secured, suggesting that this could create successful examples in the field of digital humanities.
- Author(s)
- 김일환
- Issued Date
- 2025-02-01
- Type
- Article
- DOI
- 10.24185/SSWUHR.2025.02.51.1
- URI
- http://repository.sungshin.ac.kr/handle/2025.oak/7956
https://kiss.kstudy.com/Detail/Ar?key=4159180
- Publisher
- 성신여자대학교 인문과학연구소
- ISSN
- 2005-0933
-
Appears in Collections:
- 인문과학연구소 > 학술논문
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.