점검 중

<모두의 말뭉치>
일부 기능 장애로 인하여 해당 신청이 불가능합니다.

최대한 빠르게 복구할 수 있도록 노력하겠습니다.

* 시스템 이용 장애 문의: 051-927-7111

닫기
인공지능(AI)말평>진행 중인 과제>과제 개요

 

과제 개요

자연어 추론(Natural Language Inference)은 두 문장의 관계를 함의/중립/모순 중 하나로 분류한다. 국립국어원에서는 슈퍼글루(SuperGLUE)의 커미트먼트뱅크(CommitmentBank)를 참조하여, 2020년과 2021말뭉치 함의 분석 및 연구사업을 통해 확신성 추론 말뭉치를 구축하였다. 이 말뭉치는 일반적인 자연어 추론 말뭉치와는 달리, 화자의 인식에 비추어 맥락과 제시 문장 간 함의 관계를 정도성으로 판단한다. 데이터 세트는 제시 문장(prompt)에 대하여 주어진 맥락(context)을 고려하였을 때 화자가 확신하는 정도를 1~7 사이의 실수(float)로 표현하는 방식으로 구성되어 있다. 숫자가 1에 가까운 낮은 숫자일수록 제시된 문장에 대해 화자가 확신하는 정도가 낮고, 숫자가 7에 가까운 높은 숫자일수록 화자가 확신하는 정도가 높다고 해석한다.



항목

내용 

 

맥락(Context)

 17세기 영국 혁명에 대한 논쟁에서 순수 경제 결정론자들에 반대하여 청교도 정신(Puritanism)의 중요성에 대해 변함없이 주장했던 크리스토퍼 힐(Christoper Hill)이 마르크스주의자라는 사실을 깨닫는 사람은 많지 않다. 힐은 청교도 정신을 사람들이 믿었던 중요한 것으로 보았지, 계급 구조나 경제 운동 위에 있는 시시한 것에 불과하다고 보지 않았다. 

제시 문장(Prompt)

 청교도 정신은 계급 구조나 경제 운동 위에 있는 시시한 것에 불과하다. 

확신성 점수

 1.625 


과제 정의

 확신성 추론 과제는 국립국어원에서 2020년과 2021말뭉치 함의 분석 및 연구사업을 통해 구축한 추론_확신성 분석 말뭉치를 활용한다. 해당 데이터 세트의 확신성 점수는 1~7 사이의 실수로 표현되어 있다. 확신성 추론 과제는 입력(Context, Prompt)에 대해 실숫값을 예측하는 방식으로 정의되어 있다. 공개된 추론_확신성 분석 말뭉치에는 여러 명의 주석자(8~20)가 화자의 확신성을 평가한 결과가 모두 주석되어 있는데, 이 과제에서는 평균을 정답 점수로 간주한다. 참가자들은 평가 데이터 세트의 입력(context, prompt)을 기반으로 1~7 사이의 확신성 점수를 예측한다. 



분류

내용 

예시 

비고 

 

 

입력

 

 Context 

 "준플레이오프가 5전3선승제로 바뀐 2008년 이후 하위팀이 상위팀을 두 번이나 꺾고 한국시리즈에 오른 것은 두산이 처음이다. 두산은 마지막 우승이었던 지난 2001년에도 준플레이오프부터 시리즈를 시작해 한국시리즈 우승을 차지한 바가 있다. 두산은 마지막 우승 당시 한국시리즈 상대가 삼성이었음으로 기억하고 있을 것이다." 

 

 문자열 

Prompt

 "두산의 마지막 우승 당시의 한국시리즈 상대는 삼성이었다." 

문자열 

출력

확신성 점수 

6.375

실수

 (Float) 

평가

MSE 

 



데이터 세트의 구성

구분

훈련 

검증 

시험 

문장 수

1,448 

189 

180 

 

평가 지표: MSE 



기준 모델(베이스라인 모델): xml-roberta-base 기반 학습 모델

https://github.com/teddysum/korean_NLI_baseline

 





 

대회 참가 규정

- 인공지능의 한국어 능력 평가에 관심 있는 누구나 팀을 구성하여 참가할 수 있다.

- 팀 구성원은 국립국어원 언어정보나눔터 회원이어야 한다.

- 참가 팀은 과제를 해결한 결과를 정해진 양식에 맞추어 제출한다.

- 라이선스에 문제가 없는 모델을 개발하여야 한다.

- 외부 API를 통해 호출하는 모델(OpenAI API )은 제출할 수 없다.

- 모두의 말뭉치를 포함한 외부에 공개된 데이터는 사용이 가능하다(저작권 등 책임은 참가 팀에게 있음). 과제 데이터(말뭉치)를 초거대언어모델(LLM) 기반 자동 증강하여 사용할 수 있다.





시스템 사용 방법: 알립니다 사용 안내 참고 

문의: 진행 중 과제 → 문의