학계 소식
[세종계획]2001년 세종 말뭉치의 종류와 구축량
작성자 한말연구학회
등록일2002.08.21
조회수4798
www.sejong.or.kr

21세기 세종계획에서 구축된 세종 말뭉치의 종류와 구축량은 다음과 같습니다.

* 종류
....세종 원시 말뭉치
....세종 형태 분석 말뭉치
....세종 어휘 의미 분석 말뭉치
....세종 구문 분석 말뭉치(2002년도 3만 어절 구축)

* 세종 원시 말뭉치
....문어(구어 일부 포함) : 1억 4천7백만 어절
....구어 전사 : 205만 어절
....한영 병렬 : 180만 어절
....한일 병렬 : 18만 어절
....북한 및 해외 한국어 : 북한 : 410만 어절
..................................해외 : 125만 어절
....역사 자료 : 307만 어절

* 세종 형태 분석 말뭉치
....문어 : 550만 어절
....구어 : 5만 어절
....한영 병렬 : 5만 어절
....북한 및 해외 한국어 : 13만 어절
....역사 자료 : 20만 어절

* 세종 어휘 의미 분석 말뭉치
....문어 : 150만 어절

이상이 현재까지 21세기 세종계획에서 구축한 말뭉치 종류와 구축량입니다.

*안내*
세종 원시 말뭉치(문어,구어) 중에서 일부분만이 배포되고 있는 공개 자료입니다.
세종 원시 말뭉치(문어, 구어)의 대다수와 다른 세종 원시 말뭉치, 세종 형태 분석 말뭉치, 세종 어휘 의미 분석 말뭉치는 비공개 자료입니다.

국어 정보화 종합 처리실을 이용하면 비공개 자료를 사용할 수 있습니다. 자세한 것은 공지 사항을 참조하기 바랍니다.
×