말뭉치(코퍼스, corpus)는 다양한 분야의 언어 자료를 모아 컴퓨터로 분석하고 처리할 수 있도록 입력한 자료로, 사전 편찬, 언어 교육, 언어 연구, 인공 지능 개발 등에 활용될 수 있습니다.
‘모두의 말뭉치’에서는 신문, 책, 일상 대화, 메신저 대화 자료, 웹 자료 등으로 구성된 다양한 원시 말뭉치와 형태, 어휘 의미, 구문, 개체명 등 여러 가지 정보를 부착한 분석 말뭉치를 제공하고 있습니다.
말뭉치에 대한 자세한 정보는 국립국어원 ‘당신의 말과 글, 소중한 언어 자원입니다.’에서 확인할 수 있습니다.