OAK

로봇에서의 멀티모달 결합을 위한 표준 인지언어의 설계

Metadata Downloads
Abstract
멀티모달 상호작용 기술과 관련하여, 여러 채널을 통한 입력 정보의 인지 및 통합 결과를 동일한 형식으로 기술할 수 있는 표준 멀티모달 입력 기술 언어를 설계하였다.
본 논문에서는 로봇이 가진 다양한 입력 모달리티를 이용하여 사용자의 의도를 정확하게 파악하기 위한 멀티모달 인터페이스 개발을 위하여, 로봇의 다양한 입력 장치나 인지 모듈에서의 개별적인 인지 결과 기술 양식과 각 입력 정보를 통합한 멀티모달 인지 결과를 XML 기반으로 통일하여 사람과 로봇의 상호작용을 위한 멀티모달 입력 정보 기술언어인 ROMMA의 설계에 대하여 기술한다.
ROMMA는 RObot MultiModal Annatioan markup language의 약어로 W3C의 멀티모달 인터랙션 그룹에서 멀티모달 입력 정보 기술언어의 표준안으로 제정된 EMMA를 기본으로 로봇 인터페이스에 맞게 재구성한 것으로, 새로운 모달리티 및 로봇의 취할 수 있는 작업 영역 추가와 관련하여 확장성을 고려하여 설계하였으며 본 논문에서는 작업 영역과 관련하여 심부름을, 모달리티와 관련하여 감정 모달리티에 대한 확장 엘리먼트를 정의하였다. 또한 다양한 모달리티의 인지 결과 기술 양식을 통일하여 음성 인식, 제스처 인식, 감정 인식 등의 각 인지 모듈의 연구 개발이 멀티모달 통합 연구와 상호 독립적으로 이루어 질 수 있도록 한다.|We proposed ROMMA (RObot MultiModal Annotation markup language), a XML based modality input description language for human-robot multimodal interaction. The independency between various robot input modalities such as speech, touch gesture, emotion, face recognition and posture, and multimodal integration is very important in developing robot systems. ROMMA provides a unified way to describe the recognition results of different input modalities and the multimodal integration result. By adopting ROMMA, the modification, enhancement, and substitution of an input modality module does not require any change of the other recognition modules and the integration module.
ROMMA is developed from EMMA, which is recommended by W3C as a multimodal input annotation language for multimodal web interfaces, by extending to robot domain. ROMMA consists of two parts: the basic elements that define the ROMMA structure and the common recognition features of different input modalities, and the extended elements that define the specific features to each input modality and the specific task domain. ROMMA can easily extend for newly introduced modalities and task domains. In this paper, we explain how to extend ROMMA for an emotion recognition and the errand task.
Author(s)
민경현
Issued Date
2007
Awarded Date
2007-02
Type
Dissertation
URI
https://repository.sungshin.ac.kr/handle/2025.oak/3142
http://210.125.93.15/jsp/common/DcLoOrgPer.jsp?sItemId=000000002557
Affiliation
성신여자대학교 대학원
Department
일반대학원 전산학과
Advisor
홍기형
Table Of Contents
Ⅰ. 서론 1
Ⅱ. 관련 연구 3
2.1 멀티모달 인터페이스 3
2.1.1 기존 연구 4
2.1.2 로봇 인터페이스 5
2.2 EMMA 7
Ⅲ. ROMMA 소개 및 구조 9
3.1 소개 및 개념 9
3.2 설계 고려사항 12
3.3 기본 구조 13
3.3.1 ROMMA 기본 엘리먼트 14
3.3.2 ROMMA 기본 에트리뷰트 17
Ⅳ. 영역별 ROMMA 확장 19
4.1 심부름 영역 확장 엘리먼트 20
4.1.1 심부름 영역 확장-하위 엘리먼트 22
4.2 감정 영역 확장 엘리먼트 30
Ⅴ. ROMMA 기반 로봇 멀티모달 입력 통합 32
5.1 멀티모달 입력 컴포넌트 32
5.2 ROMMA 기반의 멀티모달 통합 35
Ⅵ. 결론 및 향후 과제 39

참고문헌
Degree
Master
Publisher
성신여자대학교 대학원
Appears in Collections:
컴퓨터학과 > 학위논문
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2007-04-25
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.