2601B:AI 기반 제발 원문 번역 및 데이터 편찬

Classics Wiki


1차 실습:XML을 활용한 AI번역 실험


2차 실습:XML 기반 콘텐츠 생성 실험


과제 목표

본 과제는 앞선 두 차례의 실습에서 익힌 XML 구조화와 AI를 활용한 콘텐츠 생성 방법을 바탕으로, 각자가 관심 있는 서화 작품의 제발을 직접 선정하여 XML 데이터를 설계하고, 이를 다양한 콘텐츠로 확장하는 과정입니다.

실습에서 주어진 텍스트와 구조를 따르는 것이 아니라, 원문의 성격과 자신의 활용 목적에 맞는 XML 설계를 스스로 결정합니다.

XML 구조화가 단순한 형식 작업이 아니라 해석과 기획의 과정임을 직접 체험하는 것이 이 과제의 핵심입니다.

  • 5/8 : 1단계 완성 후 공유
  • 5/15부터 2단계 수행

1단계: 대상 선정 및 데이터 편찬

① 작품 및 원문 선정

관심 있는 서화 작품의 제발 원문을 하나 선정합니다.

유명한 작품이 아니어도 좋습니다.

작품 정보(작가, 제작 연도, 소장처 등)도 함께 수집해 둡니다.

작품 소개 위키 문서 작성

[[파일: 파일명.jpg | right | 300px]]

== 작품/작가 ==
* 제목: 
* 작품 소개: 
* 화가: 
* 제발 저자: 
* 시대: 
* 소장처: 

==제발(題跋)==
===원문===



[[분류:AI 고전번역학]]
[[분류:AI 서화제발]]
[[분류:2601B]]
[[분류:2601B 과제]]

② XML 설계

원문의 내용과 활용 방향을 고려하여 XML 구조를 직접 설계합니다.

  • 최상위 요소는 <text_unit> : <text_unit id="">로 열고, 맨 아래에서 </text_unit>으로 닫아주어 '하나의 상위 요소'에 포함될 수 있게 합니다.
  • 원문은 <hanmun_text> : 제발 원문 전체는 <hanmun_text>로 열고, </hanmun_text>로 닫습니다.
  • 동양화 제발 xml 데이터 구조를 참고해주세요.

1차 실습과 2차 실습에서 사용한 <scene>, <appreciation> 같은 태그를 참고하되, 그대로 따를 필요는 없습니다.

선택한 원문에 어떤 의미 단위가 있는지, 어떤 정보를 태그로 분리해야 나중에 재사용하기 편할지를 스스로 판단하여 설계합니다.

설계한 태그 구조와 그 이유를 간단히 메모해 둡니다.

XML 위키 문서 작성

<?xml version="1.0" encoding="UTF-8"?>

[여기에 XML 데이터를 넣어주세요]

===오류 검사===

{{ValidateXml | xml=xml_문서명.xml}}

== XML 구조 ==


[[분류:AI 고전번역학]]
[[분류:AI 서화제발]]
[[분류:2601B]]
[[분류:2601B 과제]]

2단계: AI 번역 및 결과 검토

① XML 데이터를 활용한 AI 번역 및 검토

제발 원문의 XML 데이터를 토대로 AI(CCTI 프로그램)를 활용하여 번역 초안 및 용어사전 초안을 생성한 뒤 전문가적 시각으로 검토·수정합니다.

수정된 용어사전이 반영된 수정 번역을 확인합니다.

② 번역 결과 분석 및 검토

AI가 생성한 번역 초안과 용어사전의 수정 사항을 반영한 최종 번역을 비교 분석합니다.

단순히 어느 번역이 더 낫다는 결론을 내리는 것이 목적이 아니라, 무엇이 번역을 바꾸었는가를 추적하는 것이 핵심입니다. 구체적으로는 다음 세 가지를 확인합니다.

  • 연구자가 작성한 용어사전(해석)이 번역에 어떻게 반영되었는가
  • 연구자가 설계한 XML 구조가 번역의 방식과 흐름에 어떤 영향을 미쳤는가
  • 용어사전과 XML 구조를 제공했음에도 AI가 여전히 해결하지 못한 부분은 무엇인가

이 과정을 통해 AI 번역에서 데이터 설계와 연구자의 해석이 얼마나 결정적인 역할을 하는지를 직접 확인할 수 있습니다.

  1. 지난 실습에서 작성한 원문 XML, 번역 초안(A), 최종 번역(B)을 준비합니다.
  2. 아래 프롬프트의 원문 XML, [A], [B] 자리에 각자의 데이터를 붙여넣습니다.
  3. AI에게 분석을 요청하고 결과를 검토합니다.
    • AI가 지적한 차이 중 내가 의도한 것은 무엇이고, 의도하지 않은 것은 무엇인가?
    • AI가 “불확실하다”고 지적한 부분에 대해 나는 어떤 해석을 갖고 있는가?
    • XML 구조를 다시 설계한다면 어떻게 바꾸겠는가?

Prompt

아래는 동일한 한문 원문에 대한 두 가지 번역입니다.

[A]는 용어사전 없이 AI가 원문만 보고 번역한 초안입니다.
[B]는 연구자가 작성한 용어사전을 AI가 참조하여 번역한 결과입니다.

두 번역을 비교하여 다음 네 가지를 분석해주세요.

1. 핵심 어구 번역의 차이
   원문의 어떤 어구가 A와 B에서 다르게 번역되었는지 구체적으로 지적하고, 각각 어떤 해석에 근거한 것인지 설명해주세요.

2. 용어사전이 번역에 미친 영향
   B가 A보다 더 정확하거나 풍부해진 부분이 있다면 어디인지, 그것이 용어사전의 어떤 정보 덕분인지 설명해주세요.

3. XML 구조가 번역에 미친 영향
   원문을 어떻게 나누었는가(XML 태그 설계)가 A와 B의 번역 방식 차이에 영향을 주었다고 볼 수 있는 부분이 있나요?
   특정 태그로 분리된 부분이 번역에서 더 명확하게 처리되었거나, 반대로 태그 경계가 번역의 흐름을 끊은 경우가 있다면 지적해주세요.

4. 여전히 불확실하거나 해석이 갈릴 수 있는 부분
   A와 B 모두에서 해석이 불확실하거나 추가 검토가 필요한 부분이 있다면 지적해주세요.

# 원문 XML
(여기에 각자 작성한 XML 데이터를 넣어주세요.)

[A] 
(여기에 용어사전 없이 AI가 번역한 초안을 넣어주세요.)

[B] 
(여기에 용어사전을 참조하여 번역한 수정 결과를 넣어주세요.)

3단계: 큐레이션 콘텐츠 제작

편찬한 XML 데이터를 바탕으로 원하는 유형의 큐레이션 콘텐츠를 제작합니다.

아래 프롬프트를 참고하되, 자신의 작품 성격과 활용 목적에 맞는 유형을 선택하거나 새로운 유형을 시도해도 좋습니다.

같은 XML 데이터에서 서로 다른 목적의 콘텐츠가 나온다는 점, 그리고 그 차이를 만들어내는 것이 XML 구조 설계의 힘이라는 점을 염두에 두고 진행합니다.

4단계: 결과 정리 및 공유

작품 선정 이유, XML 설계 과정에서의 고민, 생성한 번역 및 큐레이션 콘텐츠 결과물 등을 정리하여 위키 문서로 게시합니다.

최종 페이지 구성

[[파일: ★파일명.jpg★ | right | 300px]]

== 작품/작가 ==
* 제목: 
* 작품 소개: 
* 화가: 
* 제발 저자: 
* 시대: 
* 소장처: 

==제발(題跋)==
===원문===
<font size=5>

</font>

===번역 초안===


===glossary review===
{|class="wikitable" 
! 작업 !! type !! hanmun !! korean !! scope !! definition !! sense_note
|-
| 
|}

===수정 번역===


==번역 비교==
=== AI 분석 ===
(AI 분석 결과)

=== 나의 번역 노트 ===
(AI 분석에 대한 본인의 의견 및 추가 해석)

== 큐레이션 콘텐츠 ==
* 유형:
* 활용 목적:
* 내용:

==참고자료==



[[분류:AI 고전번역학]]
[[분류:AI 서화제발]]
[[분류:2601B]]
[[분류:2601B 과제]]