데이터 조사 항목에 대한 설명 및 가이드라인

데이터 조사 항목에 대한 설명 및 가이드라인
0.0 0

#1

데이터 조사 항목과 항목별로 검토해야 되는 기준을 간단히 정리했습니다.
항목별 기준에 대한 자세한 정보는 아래 핸드북에 설명되었습니다.

개별 데이터셋에 따라 아래 항목을 기준으로 조사해 주시기 바랍니다. 궁금하거나 문의할 내용이 있으면 답글을 남겨주세요.

데이터 관리기관

  • 원본 데이터를 제공하고 있는 기관
  • 원본이 아닌 수집 데이터가 있을 경우 함께 기재

웹사이트

  • 해당 데이터를 제공하는 기관 홈페이지

데이터에 대한 설명

  • 조사 데이터에 대한 일반적 설명, 데이터 활용을 위한 특이사항을 서술형으로 기술

데이터에 대한 태그

  • 조사 데이터에 대한 주제어 또는 키워드
  • 태그는 빈칸이나 특수문자를 제외 (예: 데이터_조사_항목 (x), 데이터조사항목 (o))
  • 영어보다 한글을 가급적 사용

온라인에서 데이터 제공

  • 데이터를 온라인에서 제공하고 있는지 여부
  • 데이터 제공 URL 표기
  • 파일 형식이 아닌 웹페이지 형식으로 제공되는 경우도 포함

데이터 접근을 위한 계정 등록

  • 표기 방식: Yes 또는 No
  • 등록이 필요한 경우, 등록을 위한 URL 명시

기계가 읽을 수 있는 형식

  • 소프트웨어를 통해 파일을 처리할 수 있는 형식
  • hwp, xls는 기계가 읽을 수 있는 형식
  • 이미지 (jpg, png) 또는 스캔된 파일은 기계가 읽을 수 있는 형식으로 판단하지 않음

제공되는 데이터 유형

  • 파일 확장자를 표기
  • 표기 방식: csv, xls, xlsx, shp

데이터 다운로드 URL

  • 표기 방식: Yes 또는 No
  • 데이터를 다운로드할 수 있는 URL
  • 파일 형식의 데이터를 다운로드받을 수 있어야 됨

벌크형식 제공 여부

  • 표기 방식: Yes 또는 No
  • 제공할 땐 데이터 다운로드 URL 명시
  • 데이터가 여러 파일로 나눠져 있거나, 일부만 제공하는 경우 벌크로 판단하지 않음

데이터 유무료 여부

  • 유료 또는 무료로 답변
  • 이용약관 또는 지침이 설명된 웹페이지 URL 명시

라이선스 (URL)

데이터 최종 업데이트 날짜

  • 데이터가 업로드된 날짜
  • 표기 방식: 년-월-일 (예: 2017-12-31)

데이터 업데이트 여부

  • 데이터 업데이트 주기
  • 표기 방식: 아래 항목에서 선택
  • 비정기, 실시간, 일별, 주별, 월별, 분기별, 매년

식별 가능한 URL 제공 (Linked Data)

  • Linked Data 기술이 적용된 데이터셋
  • RDF 형식으로 표현된 데이터셋

공공데이터포털과 동일한 데이터 여부

  • 조사한 데이터셋이 공공데이터포털에 존재하지 않거나, 다른 버전인 경우
  • 표기 방식: Yes 또는 No
  • Yes: 일치, No: 불일치

세부 주제: 고속버스 데이터
세부주제 : 치안(범죄)
세부주제: 환경정보
세부 주제: 기업 현황
1. 대통령 선거
세부주제: 중소기업현황정보시스템
전자공시시스템
#2

#3

그러면 세부 주제안에도, 다양한 데이터셋이 있을 것 같습니다. 각각의 데이터셋에 대해서 위의 항목에 대한 내용이 추가 되어야 할 것 같은데요?


#4

세부주제를 다시 구분해야 되는지 모르겠지만, 데이터셋은 모두 명시해 주는 것이 필요하다고 생각되네요.