데이터셋

보고서 표/그림 데이터셋

이미지 Ver 1.1 관리자 2021.11.03

보고서 표/그림 데이터셋

개요
  • 국가R&D보고서로부터 추출한 표/그림 이미지 데이터셋과 설명 텍스트 데이터셋
  • 국가R&D보고서 본문에서 표/그림 이미지를 추출하고 표/그림을 설명하는 부분을 텍스트 데이터 형태로 추출하여 가공
DOI
10.23057/41
형식 JPG JSON
{
  "doc_id": "보고서ID",
  "title": { "ko": "국문 보고서명", "en": "영문 보고서명" },
  "authors": "과제책임자",
  "publisher": "주관연구기관명",
  "year": "발행연도",
  "abstract": { "ko": "국문 초록", "en": "영문 초록" },
  "keywords" : { "ko" : "한글키워드", "en" : "영문키워드"},
  "ref_entries" : {
    "entryid" : {
      "caption" : "표/그림 캡션 텍스트",
      "type" : "table/figure",
      "page_num": "표/그림 페이지",
      "page_seq": "표/그림 페이지 내 순번",
      "image": "표/그림 이미지(base64 인코딩)",
      "text": [ "설명 텍스트 1", "설명 텍스트 2", "설명 텍스트 3" ],
      "keywords": "핵심어휘"
    }
  } 
}
구축예시

데이터 정보

생산자 한국과학기술정보연구원 제공기관 한국과학기술정보연구원
건수 3,546,095건 발행년도 2021
라이선스 저작자표시-비영리 (데이터 이용동의) 저작권 보고서 표/그림 및 원문의 저작권은 해당 연구기관 및 연구책임자에게 있으며, 한국과학기술정보연구원은 기계학습 연구에 활용할 수 있도록 가공하여 제공합니다.
Cite as
한국과학기술정보연구원 (2021) : 보고서 표/그림 데이터셋. Version 1.1. 한국과학기술정보연구원. https://doi.org/10.23057/41.

데이터 이력

Version 1.1 2021-10-17, 10.23057/41 (JSON 내 Base64 인코딩 이미지 삽입)
Version 1 2021-09-08, 10.23057/35