데이터셋

국내 논문 문장 의미 태깅 데이터셋

텍스트 Ver 1 관리자 2021.10.21

국내 논문 문장 의미 태깅 데이터셋

개요
  • 논문 자동 요약 및 논문의 목적, 방법, 결과, 결론별 문서 분류를 위한 기계학습 데이터셋
  • 국내 논문 본문 내 문장이 의도하는 역할(연구 목적, 방법, 결과)을 구분하는 태그* 부착

* 문제정의, 가설설정, 기술정의, 대상데이터, 분석방법, 제안방법, 이론/모형, 성능/효과, 후속연구/제안 등

DOI
10.23057/36
형식 JSON
{
  "doc_id": "논문ID",
  "sentence": "문장 단위 텍스트",
  "tag": "문장 역할 태그",
  "keysentence": "태그별 대표 문장 여부(yes/no)"
}
구축예시

의미 구조 분류

문장 의미 세부 분류

문장 의미 설명

1. 연구 목적1-1. 문제 정의
  • 문제 정의는 “~을 해결하고자 한다.”와 같이 해결 대상을 표현하는 문장임.
  • 서론의 시작이나 끝 문단, 혹은 결론의 도입 문장 등에서 자주 출현함.

(예) 본 연구는 전공계열에 따른 치과진료행태와 치과진료에 영향을 미치는 융합적 요인에 대하여 알아보고자 하였다.

1-2. 가설 설정
  • 가설은 방법을 제안하기 위해 가정한 제약이나 현상 등을 표현한 문장임.
  • 일반적으로 문제 정의에서 설정된 문제를 현재 연구에서 확인하려는 구체적 대상을 열거 형태로 나열함.
  • 일부 연구를 사전에 전체적인 제한하는 내용이 포함될 수 있음

(예) 가설 1: 옴니채널브랜드 체험은 옴니채널브랜드 신뢰에 정(+)의 영향을 미칠 것이다.

1-3. 기술 정의
  • 기술적인 용어의 정의를 내리는 문장으로 대상 단어, 설명문, 상의어를 포함해야 함. 상의어가 일반적인 단어인 경우 생략될 수 있음.
  • 서론이나 관련연구 도입부에 자주 나타남.

(예) RNN은 주로 자연어, 음성신호와 같은 연속적인 데이터를 분석할 때 활용되는 딥 러닝 기법이다. 

2. 연구 방법2-1. 제안 방법
  • 서론 또는 연구 배경에서 다른 연구와 다른 특징적으로 제시한 문장임. 기존 연구를 변형하거나 다양한 연구들을 조합한 경우도 해당됨.
  • 방법 설명에서 전체 개요설명, 혹은 결론에서 제안방법 소개하는 문장이 대상임

(예) 본 논문에서는 코드 도용 방지를 위해서 메소드 생성 기법을 활용한 워터마킹을제안하였고 시스템을 구현하였다.

2-2. 대상 데이터
  • 연구의 주된 대상이 되는 데이터나 연구에서 제안한 모델이나 방법을 검증하는데 활용된 데이터를 대상으로 함. 데이터의 수집 방법이나 출처를 설명한 문장.
  • 논문의 본문 연구 내용 도입부나 실험 관련 절에 도입부에 나타남.

(예) 본 연구는 2018년 9월부터 12월 중순까지 임상치위생학실습과목에 참여하는 실습 대상자 즉, 실험 중재군33명과 Qraycam을 사용하여 구강보건교육을 실시하는 학생 33명을 연구대상으로 하였다.

2-3. 분석방법
  • 대상 데이터에 대해 논문의 연구 방법을 적용한 결과를 통계적으로 해석하거나 분석하기 위한 처리 방법을 정의한 문장. 제한적인 경우 수집한 대상데이터의 속성을 파악하기 위한 통계적 분석 등도 포함될 수 있음 (저자들이 제안한 방법의 일부로 전처리하는 것은 포함되지 않음)

(예) ADHD, 우울 불안 및 자살 위험성의 상관관계는 pearson’s상관계수로, 자살위험성에 영향을 미치는 요인은 Logistic regression을 활용하였다.

2-4. 이론/모형
  • 연구에서 설정한 주된 문제나 목표를 해결하기 위해 알려진 이론이나 다른 연구자의 결과를 활용하는 내용을 포괄하는 문장임. 부분적인 활용은 대상이 아니며, 주요한 문제를 해결하는데 기존의 방법을 그대로 활용하는 경우에 한정함.
  • 논문의 본문에 나타남.

(예) 본 연구에서는 다가구주택의 매매가격에 영향을 미치는 요인들에 대해 검증하고자 헤도닉가격모형을 활용하여 분석하였다.

3. 연구 결과3-1. 성능/효과
  • “연구결과 ~ 으로 나타났다.”로 설명하는 문장임. 실험 결과를 수치적으로 보여주는 내용이나, 그 결과를 해석한 결과가 포함될 수 있음.
  • 실험결과이나 결론에 제시된 문장을 선택함.

(예) 본 연구의 창의적 교수법은 주로 강의식 수업의 이론교과목에 적용된 것으로, 기존에는 방대한 학습 내용 전달과 국가시험 과목이라는 부담으로 다양한 방법들을 적용하지는 못하였으나, 2학년과 3학년에서 비판적 사고력이 향상되었다.

3-2. 후속연구/제안
  • 연구의 한계와 확장을 위한 설명문임
  • 연구결과 활용을 위한 제안, 제시하는 문장도 해당됨
  • 결론의 끝 문장이 주로 여기에 해당함.

(예) 차후 렌티큘러기법을 적용시킨 신호등이 도입될 경우 보행자의 무분별한 횡단을 막을 수 있고, 횡단보도 내에서 발생하는 인사사고를 감소시킬 수 있을 것이다.

데이터 정보

생산자 한국과학기술정보연구원 제공기관 한국과학기술정보연구원
건수 155,740 건 발행년도 2021
라이선스 저작자표시-비영리 (데이터 이용동의) 저작권 논문 원문의 저작권은 해당 학술지(학회)에 있으며, 한국과학기술정보연구원은 기계학습 연구에 활용할 수 있도록 가공하여 제공합니다.
Cite as
한국과학기술정보연구원 (2021) : 국내 논문 문장 의미 태깅 데이터셋 . Version 1.0. 한국과학기술정보연구원. https://doi.org/10.23057/36.

데이터 이력

Version 1 2021-09-08, 10.23057/36

데이터 탐색

데이터 파일 목록
파일설명
국내 논문 문장 의미 태깅 샘플 데이터셋
자료유형
JSON

데이터 탐색

파일설명
국내 논문 문장 의미 태깅 데이터셋
자료유형
JSON