수색…


소개

'재현성'이란 다른 사람 (아마 미래에 있음)이 수행 한 단계를 반복하여 동일한 결과를 얻을 수 있음을 의미합니다. 재현 가능한 연구 과제보기를 참조하십시오.

비고

재현 가능한 결과를 만들려면 모든 변형 소스를 수정해야합니다. 예를 들어, (의사) 난수 생성기가 사용되는 경우 동일한 결과를 다시 만들려면 시드를 수정해야합니다. 유사성을 줄이는 또 다른 방법은 동일한 문서에서 텍스트와 계산을 결합하는 것입니다.

참고 문헌

데이터 재현성

dput()dget()

(바람직한 작은) 데이터 프레임을 공유하는 가장 쉬운 방법은 dput() 기본 함수를 사용하는 것입니다. R 객체를 일반 텍스트 형식으로 내 보냅니다.

참고 : 아래 예제 데이터를 만들기 전에 쓸 수있는 빈 폴더에 있는지 확인하십시오. getwd() 실행하고 폴더를 변경해야하는 경우 ?setwd 읽습니다.

dput(mtcars, file = 'df.txt')

그런 다음 누구나 dget() 함수를 사용하여 정확한 R 객체를 GlobalEnvironment에로드 할 수 있습니다.

df <- dget('df.txt')

큰 R 개체의 경우 재현성있게 저장하는 데 여러 가지 방법이 있습니다. 입력 및 출력을 참조하십시오.

패키지 재현성

패키지의 재현성은 일부 R 코드를 재현 할 때 매우 공통적 인 문제입니다. 다양한 패키지가 업데이트되면 이들 사이의 상호 연결이 끊어 질 수 있습니다. 이 문제에 대한 이상적인 솔루션은 코드 작성 날짜에 R 코드 작성기의 컴퓨터 이미지를 컴퓨터에 재현하는 것입니다. 여기에는 checkpoint 패키지가 있습니다.

패키지 작성자는 2014-09-17부터 CRAN 패키지 저장소 전체를 자신의 미러 저장소 인 Microsoft R Archived Network에 매일 복사합니다. 따라서 재현 가능한 R 프로젝트를 만들 때 패키지 재현성 문제를 피하려면 다음이 필요합니다.

  1. 모든 패키지 (및 R 버전)가 최신 버전인지 확인하십시오.
  2. 코드에 checkpoint::checkpoint('YYYY-MM-DD') 줄을 포함하십시오.

checkpoint 는 R_home 디렉토리 ( "~/" )에 디렉토리 .checkpoint 를 생성합니다. 이 기술 디렉토리에는 프로젝트에 사용되는 모든 패키지가 설치됩니다. 즉, checkpoint 는 프로젝트 디렉토리의 모든 .R 파일을 조사하여 모든 library() 또는 require() 호출을 선택하고 지정된 날짜에 CRAN에 있었던 형식으로 필요한 모든 패키지를 설치합니다.

PRO 패키지 재현성 문제가 해결되었습니다.
CONTRA 지정된 날짜마다 특정 프로젝트에서 사용하고자하는 모든 패키지를 다운로드하여 설치해야합니다. 그것은 꽤 오래 걸릴 수 있습니다.



Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow