KISTI 기계학습 데이터 공유·활용 서비스

KISTI에서 구축한 기계학습 데이터에 원하는 방식으로 자유롭게 접근하여처리/분석하고 연구 결과를 도출할 수 있도록 지원합니다.

JSON
국내 논문 전문 텍스트 데이터셋
국내 논문 PDF를 기계학습이 가능한 텍스트 형태로 구축

481,578

JSON
국내 논문 QA 데이터셋
기계가 과학기술 문헌을 읽고 이해하는 능력을 평가하기 위한 질의응답 데이터셋

279,143

JSON
국내 논문 문장 의미 태깅 데이터셋
논문 자동 요약 및 논문의 목적, 방법, 결과, 결론별 문서 분류를 위한 기계학습 데이터셋

155,740

JPG JSON
보고서 표/그림 데이터셋
국가R&D보고서로부터 추출한 표/그림 이미지 데이터셋과 설명 텍스트 데이터셋

3,546,095

JPG JSON
대전시 도로 영상 객체 인식 데이터셋 2020 위치정보
KISTI가 자체적으로 수집한 도로영상 비디오를 활용한 영상객체 인식용 학습데이터셋

49,218

XLS
기관식별 데이터
국내외에 기관들을 대상으로 유일한 번호를 부여한 기관 데이터

245,692