태극기 이 누리집은 대한민국 공식 전자정부 누리집입니다.

비밀번호 변경 안내

회원의 소중한 개인정보를 안전하게 보호하기 위해

비밀번호 변경을 알려드립니다

말뭉치 이미지

비밀번호를 변경하신 지 6개월(반기)이 지난 경우에
'비밀번호 변경'을 권고하고 있습니다.

"다음에 변경하기"버튼을 눌러 변경을 연기하시면 3개월 후
다시 안내해드립니다.
조금 불편하시더라도 지금 비밀번호를 변경해 주세요.

변경하기 다음에 변경하기

점검 중

<모두의 말뭉치>
일부 기능 장애로 인하여 해당 신청이 불가능합니다.

최대한 빠르게 복구할 수 있도록 노력하겠습니다.

* 시스템 이용 장애 문의: 051-927-7111

확인

인공지능(AI)말평>진행 중인 과제>과제 개요

확신성 추론

과제 목록 보기

과제 개요 자료 받기 순위표(리더보드) 공지 문의

참가 신청 제출 관리

과제 개요

자연어 추론(Natural Language Inference)은 두 문장의 관계를 함의/중립/모순 중 하나로 분류한다. 국립국어원에서는 슈퍼글루(SuperGLUE)의 커미트먼트뱅크(CommitmentBank)를 참조하여, 2020년과 2021년 ‘말뭉치 함의 분석 및 연구’ 사업을 통해 확신성 추론 말뭉치를 구축하였다. 이 말뭉치는 일반적인 자연어 추론 말뭉치와는 달리, 화자의 인식에 비추어 맥락과 제시 문장 간 함의 관계를 정도성으로 판단한다. 데이터 세트는 제시 문장(prompt)에 대하여 주어진 맥락(context)을 고려하였을 때 화자가 확신하는 정도를 1~7 사이의 실수(float)로 표현하는 방식으로 구성되어 있다. 숫자가 1에 가까운 낮은 숫자일수록 제시된 문장에 대해 화자가 확신하는 정도가 낮고, 숫자가 7에 가까운 높은 숫자일수록 화자가 확신하는 정도가 높다고 해석한다.

항목	내용
맥락(Context)	17세기 영국 혁명에 대한 논쟁에서 순수 경제 결정론자들에 반대하여 청교도 정신(Puritanism)의 중요성에 대해 변함없이 주장했던 크리스토퍼 힐(Christoper Hill)이 마르크스주의자라는 사실을 깨닫는 사람은 많지 않다. 힐은 청교도 정신을 사람들이 믿었던 중요한 것으로 보았지, 계급 구조나 경제 운동 위에 있는 시시한 것에 불과하다고 보지 않았다.
제시 문장(Prompt)	청교도 정신은 계급 구조나 경제 운동 위에 있는 시시한 것에 불과하다.
확신성 점수	1.625

과제 정의

확신성 추론 과제는 국립국어원에서 2020년과 2021년 ‘말뭉치 함의 분석 및 연구’ 사업을 통해 구축한 “추론_확신성 분석 말뭉치”를 활용한다. 해당 데이터 세트의 확신성 점수는 1~7 사이의 실수로 표현되어 있다. 확신성 추론 과제는 입력(Context, Prompt)에 대해 실숫값을 예측하는 방식으로 정의되어 있다. 공개된 ‘추론_확신성 분석 말뭉치’에는 여러 명의 주석자(8~20명)가 화자의 확신성을 평가한 결과가 모두 주석되어 있는데, 이 과제에서는 평균을 정답 점수로 간주한다. 참가자들은 평가 데이터 세트의 입력(context, prompt)을 기반으로 1~7 사이의 확신성 점수를 예측한다.

분류	내용	예시	비고
입력	Context	"준플레이오프가 5전3선승제로 바뀐 2008년 이후 하위팀이 상위팀을 두 번이나 꺾고 한국시리즈에 오른 것은 두산이 처음이다. 두산은 마지막 우승이었던 지난 2001년에도 준플레이오프부터 시리즈를 시작해 한국시리즈 우승을 차지한 바가 있다. 두산은 마지막 우승 당시 한국시리즈 상대가 삼성이었음으로 기억하고 있을 것이다."	문자열
입력	Prompt	"두산의 마지막 우승 당시의 한국시리즈 상대는 삼성이었다."	문자열
출력	확신성 점수	6.375	실수 (Float)
평가	MSE

데이터 세트의 구성

구분	훈련	검증	시험
문장 수	1,448	189	180

평가 지표: MSE

기준 모델(베이스라인 모델): xml-roberta-base 기반 학습 모델

- https://github.com/teddysum/korean_NLI_baseline

Filedata

대회 참가 규정

- 인공지능의 한국어 능력 평가에 관심 있는 누구나 팀을 구성하여 참가할 수 있다.

- 팀 구성원은 국립국어원 언어정보나눔터 회원이어야 한다.

- 참가 팀은 과제를 해결한 결과를 정해진 양식에 맞추어 제출한다.

- 라이선스에 문제가 없는 모델을 개발하여야 한다.

- 외부 API를 통해 호출하는 모델(OpenAI API 등)은 제출할 수 없다.

시스템 사용 방법: 알립니다 → 사용 안내 참고

문의: 진행 중 과제 → 문의