R Language
Tijdreeksen en voorspellingen
Zoeken…
Opmerkingen
Voorspellingen en tijdreeksanalyses kunnen worden verwerkt met alledaagse functies uit het stats
, zoals glm()
of een groot aantal gespecialiseerde pakketten. De CRAN-taakweergave voor tijdreeksanalyse biedt een gedetailleerde lijst van sleutelpakketten per onderwerp met korte beschrijvingen.
Verkennende gegevensanalyse met tijdreeksgegevens
data(AirPassengers)
class(AirPassengers)
1 "ts"
In de geest van Exploratory Data Analysis (EDA) is een goede eerste stap om een plot van uw tijdreeksgegevens te bekijken:
plot(AirPassengers) # plot the raw data
abline(reg=lm(AirPassengers~time(AirPassengers))) # fit a trend line
Voor verdere EDA onderzoeken we cycli door de jaren heen:
cycle(AirPassengers)
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 1949 1 2 3 4 5 6 7 8 9 10 11 12 1950 1 2 3 4 5 6 7 8 9 10 11 12 1951 1 2 3 4 5 6 7 8 9 10 11 12 1952 1 2 3 4 5 6 7 8 9 10 11 12 1953 1 2 3 4 5 6 7 8 9 10 11 12 1954 1 2 3 4 5 6 7 8 9 10 11 12 1955 1 2 3 4 5 6 7 8 9 10 11 12 1956 1 2 3 4 5 6 7 8 9 10 11 12 1957 1 2 3 4 5 6 7 8 9 10 11 12 1958 1 2 3 4 5 6 7 8 9 10 11 12 1959 1 2 3 4 5 6 7 8 9 10 11 12 1960 1 2 3 4 5 6 7 8 9 10 11 12
boxplot(AirPassengers~cycle(AirPassengers)) #Box plot across months to explore seasonal effects
Een ts-object maken
Tijdreeksgegevens kunnen worden opgeslagen als een ts
object. ts
objecten bevatten informatie over seizoensfrequentie die wordt gebruikt door ARIMA-functies. Het maakt het ook mogelijk om elementen in de serie op datum aan te roepen met behulp van de window
.
#Create a dummy dataset of 100 observations
x <- rnorm(100)
#Convert this vector to a ts object with 100 annual observations
x <- ts(x, start = c(1900), freq = 1)
#Convert this vector to a ts object with 100 monthly observations starting in July
x <- ts(x, start = c(1900, 7), freq = 12)
#Alternatively, the starting observation can be a number:
x <- ts(x, start = 1900.5, freq = 12)
#Convert this vector to a ts object with 100 daily observations and weekly frequency starting in the first week of 1900
x <- ts(x, start = c(1900, 1), freq = 7)
#The default plot for a ts object is a line plot
plot(x)
#The window function can call elements or sets of elements by date
#Call the first 4 weeks of 1900
window(x, start = c(1900, 1), end = (1900, 4))
#Call only the 10th week in 1900
window(x, start = c(1900, 10), end = (1900, 10))
#Call all weeks including and after the 10th week of 1900
window(x, start = c(1900, 10))
Het is mogelijk om ts
objecten met meerdere reeksen te maken:
#Create a dummy matrix of 3 series with 100 observations each
x <- cbind(rnorm(100), rnorm(100), rnorm(100))
#Create a multi-series ts with annual observation starting in 1900
x <- ts(x, start = 1900, freq = 1)
#R will draw a plot for each series in the object
plot(x)