이 누리집은
대한민국 공식 전자정부 누리집입니다.
<모두의 말뭉치>
일부 기능 장애로 인하여 해당 신청이 불가능합니다.
최대한 빠르게 복구할 수 있도록 노력하겠습니다.
* 시스템 이용 장애 문의: 051-927-7111
과제 개요
‘대화 맥락 추론’ 과제는 입력으로 주어진 대화 내용을 바탕으로, 특정된 대상 발화로부터 다섯 가지의 추론문 유형인 ‘원인’, ‘후행 사건’, ‘전제 조건’, ‘내적 동기’, ‘감정 반응’ 중 하나에 상응하는 문장을 정확하게 추론하는 것을 목표로 한다. 이 과제를 통해 인공지능 모델이 대화의 문맥을 이해하는 능력과 여러 추론 후보 중에서 가장 적합한 추론을 선택하는 능력을 평가할 수 있으며, 평가 결과를 바탕으로 향후 모델의 대화 맥락 이해 및 적합한 대화문 생성 능력을 강화할 수 있다.
대화(대상 발화) | 유형 | 추론문 후보 |
화자1: 미스터트롯 콘서트 또 취소됐네 화자2: 코로나 때문에 콘서트 다 취소되서 그래 (...) 화자1: 미스터트롯 콘서트는 어른들 효도 콘서트나 다름없는데 할머니들 목 빠지시겠어 | 원인 | 추론1: 코로나로 콘서트가 연이어 취소되고 있다. 추론2: 코로나로 콘서트가 연이어 개최되고 있다. 추론3: 코로나로 뮤지컬이 연이어 취소되고 있다. |
과제 정의
이 과제는 인공지능 모델로 하여금 대화문, 대상 발화, 그리고 추론문의 유형을 종합적으로 고려하여 가장 적합한 추론문을 선택하도록 하는 것을 목표로 한다. 즉 모델은 주어진 세 가지 추론문 후보 중 대상 발화의 추론 유형에 가장 적합한 하나를 선택해야 한다. 과제마다 하나의 적절한 추론문과 두 개의 부적절한 추론문이 제시되며, 모델이 참고하는 추론문 유형은 ‘원인’, ‘후행 사건’, ‘전제 조건’, ‘내적 동기’, ‘감정 반응’ 다섯 가지이다. 다섯 가지 추론문 유형에 대한 정의는 다음과 같다.
유형 | 정의 |
원인(cause) | 대상 발화의 사건을 유발하는 사건 |
후행 사건(subsequent event) | 대상 발화 이후에 일어날 수 있는 사건 |
전제 조건(prerequisite) | 대상 발화의 사건을 가능하게 하는 상태 혹은 사건 |
내적 동기(motivation) | 대상 발화를 일으키는 ‘화자’의 감정이나 기본 욕구 |
감정 반응(emotional reaction) | 대상 발화 사건에 대해 ‘청자’가 보일 수 있는 감정 반응 |
데이터 세트의 구성
데이터 세트는 훈련(train), 검증(validation), 시험(test) 데이터로 분할하여 제공한다.
*시험 데이터 공개 계획 없음
| 훈련 | 검증 | 시험 |
자료 수 | 758 | 151 | 605 |
평가 지표: 정확도(Accuracy)
- 순위표 기준 정확도(Accuracy) 상위 5개 팀이 정성 평가 및 발표 평가 대상
- 순위표 점수 및 정성 평가, 발표 평가 결과를 합산하여 수상작 선정
기준 모델(베이스라인 모델)
블로섬(Bllossom) 기반 학습 모델로, 아래 주소에서 모델 및 과제 수행 코드 확인 가능
- [기준 모델] https://huggingface.co/MLP-KTLim/llama-3-Korean-Bllossom-8B
- [코드] https://github.com/teddysum/Korean_CCI_2024
대회 참가 규정
- 인공지능의 한국어 능력 평가에 관심 있는 누구나 팀을 구성하여 참가할 수 있다.
- 팀 구성원은 국립국어원 언어정보나눔터 회원이어야 한다. (회원 가입 바로 가기)
- 팀장은 팀원의 전자 우편 주소(회원 가입된 전자 우편 주소)를 입력하여 팀을 구성할 수 있으며,
모든 팀원이 참가 신청에 동의하면 팀 구성이 완료된다.
- 참가자는 접수 기간 중 여러 개의 팀에 참여할 수 있으며, 팀 구성 인원 제한은 없다. 다만, 접수 기
간 종료 후 정성 평가 대상이 되는 팀이 여러 개라면 참가자는 과제별 하나의 팀을 소속 팀으로 결정
하여야 한다.
- 참가 팀은 과제를 해결한 결과를 정해진 양식에 맞추어 제출한다(1일 5개까지 제출 가능).
- 라이선스에 문제가 없는 모델을 개발하여야 한다.
- 외부 API를 통해 호출하는 모델(OpenAI API 등)은 제출할 수 없다.
- 개발한 모델은 RTX 4090 24GB 1개에서 구동 가능하여야 한다.
- 외부에 공개된 데이터는 사용이 불가하며 과제 데이터(말뭉치)를 초거대언어모델(LLM) 등을 활용해 변형 및 증강하여 사용할 수 없다. 모델 입력을 위한 형식 및 형태 변형만이 허용된다.
- 순위표 기준 정성 평가 신청서를 제출한 상위 5개 팀을 정성 평가 및 발표 평가 대상자로 선정한다.
(해당 팀에게는 별도 안내 예정)
- 최종 수상자는 정량 평가, 정성 평가, 발표 평가를 종합하여 선정한다.
시스템 사용 방법
- 인공지능(AI)말평 → 알립니다 → 사용 안내 메뉴 내 동영상 참고
문의
- 진행 중 과제 → 대화 맥락 추론 클릭 → 문의(들어가기 후 작성 가능)