R Language
lubridate
Ricerca…
Sintassi
- ymd_hms (..., quiet = FALSE, tz = "UTC", locale = Sys.getlocale ("LC_TIME"))
- ora (tzone = "")
- intervallo (inizio, fine, tzone = attr (inizio, "tzone"))
- duration (num = NULL, units = "seconds", ...)
- periodo (num = NULL, units = "second", ...)
Osservazioni
Per installare il pacchetto da CRAN:
install.packages("lubridate")
Per installare la versione di sviluppo da Github:
library(devtools)
# dev mode allows testing of development packages in a sandbox, without interfering
# with the other packages you have installed.
dev_mode(on=T)
install_github("hadley/lubridate")
dev_mode(on=F)
Per ottenere le vignette sul pacchetto lubridate:
vignette("lubridate")
Per ottenere aiuto su qualche funzione foo
:
help(foo) # help about function foo
?foo # same thing
# Example
# help("is.period")
# ?is.period
Per ottenere esempi per una funzione foo
:
example("foo")
# Example
# example("interval")
Parsing date e datetimes da stringhe con lubridate
Il pacchetto lubridate
fornisce comode funzioni per formattare la data e gli oggetti datetime dalle stringhe di caratteri. Le funzioni sono permutazioni di
Lettera | Elemento da analizzare | Equivalente R di base |
---|---|---|
y | anno | %y , %Y |
m (con y e d) | mese | %m , %b , %h , %B |
d | giorno | %d , %e |
h | ora | %H , %I%p |
m (con h e s) | minuto | %M |
S | secondi | %S |
es. ymd()
per analizzare una data con l'anno seguito dal mese seguito dal giorno, ad esempio "2016-07-22"
o ymd_hms()
per analizzare un datetime nell'ordine anno, mese, giorno, ore, minuti, secondi, ad esempio "2016-07-22 13:04:47"
.
Le funzioni sono in grado di riconoscere la maggior parte dei separatori (come /
, -
e spazi bianchi) senza argomenti aggiuntivi. Funzionano anche con separatori incoerenti.
Date
Le funzioni di data restituiscono un oggetto di classe Date
.
library(lubridate)
mdy(c(' 07/02/2016 ', '7 / 03 / 2016', ' 7 / 4 / 16 '))
## [1] "2016-07-02" "2016-07-03" "2016-07-04"
ymd(c("20160724","2016/07/23","2016-07-25")) # inconsistent separators
## [1] "2016-07-24" "2016-07-23" "2016-07-25"
datetimes
Funzioni di utilità
È possibile analizzare i dati a ymd_hms
utilizzando ymd_hms
varianti ymd_hms
, inclusi ymd_hm
e ymd_h
. Tutte le funzioni datetime possono accettare un argomento del fuso orario tz
simile a quello di as.POSIXct
o strptime
, ma che per impostazione predefinita è "UTC"
anziché il fuso orario locale.
Le funzioni datetime restituiscono un oggetto di classe POSIXct
.
x <- c("20160724 130102","2016/07/23 14:02:01","2016-07-25 15:03:00")
ymd_hms(x, tz="EST")
## [1] "2016-07-24 13:01:02 EST" "2016-07-23 14:02:01 EST"
## [3] "2016-07-25 15:03:00 EST"
ymd_hms(x)
## [1] "2016-07-24 13:01:02 UTC" "2016-07-23 14:02:01 UTC"
## [3] "2016-07-25 15:03:00 UTC"
Funzioni parser
lubridate
include anche tre funzioni per l'analisi dei dati con una stringa di formattazione come as.POSIXct
o strptime
:
Funzione | Classe di uscita | Accettazione di stringhe di formattazione |
---|---|---|
parse_date_time | POSIXct | Flessibile. Accetta strptime stile strptime con lo stile del nome della funzione datetime in % o lubridate , ad esempio "ymd hms" . Accetterà un vettore di ordini per dati eterogenei e indovina quale sia appropriato. |
parse_date_time2 | POSIXct predefinito; se lt = TRUE , POSIXlt | Rigoroso. Accetta solo token strptime (con o senza % ) da un set limitato. |
fast_strptime | POSIXlt predefinito; se lt = FALSE , POSIXct | Rigoroso. Accetta solo token di durata strptime delimitata da % con delimitatori ( - , / , : , ecc.) Da un set limitato. |
x <- c('2016-07-22 13:04:47', '07/22/2016 1:04:47 pm')
parse_date_time(x, orders = c('mdy Imsp', 'ymd hms'))
## [1] "2016-07-22 13:04:47 UTC" "2016-07-22 13:04:47 UTC"
x <- c('2016-07-22 13:04:47', '2016-07-22 14:47:58')
parse_date_time2(x, orders = 'Ymd HMS')
## [1] "2016-07-22 13:04:47 UTC" "2016-07-22 14:47:58 UTC"
fast_strptime(x, format = '%Y-%m-%d %H:%M:%S')
## [1] "2016-07-22 13:04:47 UTC" "2016-07-22 14:47:58 UTC"
parse_date_time2
e fast_strptime
usano un parser C veloce per efficienza.
Vedi ?parse_date_time
per la formattazione dei token.
Data e ora di analisi in lubridato
Lubridate fornisce ymd()
serie di funzioni ymd()
per l'analisi di stringhe di caratteri in date. Le lettere y, m e d corrispondono agli elementi di anno, mese e giorno di una data-ora.
mdy("07-21-2016") # Returns Date
## [1] "2016-07-21"
mdy("07-21-2016", tz = "UTC") # Returns a vector of class POSIXt
## "2016-07-21 UTC"
dmy("21-07-2016") # Returns Date
## [1] "2016-07-21"
dmy(c("21.07.2016", "22.07.2016")) # Returns vector of class Date
## [1] "2016-07-21" "2016-07-22"
Manipolazione di data e ora in lubridate
date <- now()
date
## "2016-07-22 03:42:35 IST"
year(date)
## 2016
minute(date)
## 42
wday(date, label = T, abbr = T)
# [1] Fri
# Levels: Sun < Mon < Tues < Wed < Thurs < Fri < Sat
day(date) <- 31
## "2016-07-31 03:42:35 IST"
# If an element is set to a larger value than it supports, the difference
# will roll over into the next higher element
day(date) <- 32
## "2016-08-01 03:42:35 IST"
Instants
Un istante è un momento specifico nel tempo. Qualsiasi oggetto data-ora che si riferisce a un momento è riconosciuto come un istante. Per verificare se un oggetto è un istante, utilizzare is.instant
.
library(lubridate)
today_start <- dmy_hms("22.07.2016 12:00:00", tz = "IST") # default tz="UTC"
today_start
## [1] "2016-07-22 12:00:00 IST"
is.instant(today_start)
## [1] TRUE
now_dt <- ymd_hms(now(), tz="IST")
now_dt
## [1] "2016-07-22 13:53:09 IST"
is.instant(now_dt)
## [1] TRUE
is.instant("helloworld")
## [1] FALSE
is.instant(60)
## [1] FALSE
Intervalli, durate e periodi
Gli intervalli sono il modo più semplice per registrare gli spazi in lubridato. Un intervallo è un intervallo di tempo che si verifica tra due istanti specifici.
# create interval by substracting two instants
today_start <- ymd_hms("2016-07-22 12-00-00", tz="IST")
today_start
## [1] "2016-07-22 12:00:00 IST"
today_end <- ymd_hms("2016-07-22 23-59-59", tz="IST")
today_end
## [1] "2016-07-22 23:59:59 IST"
span <- today_end - today_start
span
## Time difference of 11.99972 hours
as.interval(span, today_start)
## [1] 2016-07-22 12:00:00 IST--2016-07-22 23:59:59 IST
# create interval using interval() function
span <- interval(today_start, today_end)
[1] 2016-07-22 12:00:00 IST--2016-07-22 23:59:59 IST
Le durate misurano l'esatto tempo che intercorre tra due istanti.
duration(60, "seconds")
## [1] "60s"
duration(2, "minutes")
## [1] "120s (~2 minutes)"
Nota: le unità più grandi di settimane non vengono utilizzate a causa della loro variabilità.
Le dseconds
possono essere create usando dseconds
, dminutes
e altre funzioni helper di durata.
Esegui ?quick_durations
per la lista completa.
dseconds(60)
## [1] "60s"
dhours(2)
## [1] "7200s (~2 hours)"
dyears(1)
## [1] "31536000s (~365 days)"
Le durate possono essere sottratte e aggiunte agli istanti per ottenere nuovi istanti.
today_start + dhours(5)
## [1] "2016-07-22 17:00:00 IST"
today_start + dhours(5) + dminutes(30) + dseconds(15)
## [1] "2016-07-22 17:30:15 IST"
Le durate possono essere create da intervalli.
as.duration(span)
[1] "43199s (~12 hours)"
I periodi misurano la variazione del tempo di clock che si verifica tra due istanti.
I periodi possono essere creati utilizzando la funzione period
e altre funzioni di supporto come seconds
, hours
, ecc. Per ottenere un elenco completo delle funzioni di supporto periodo, Esegui ?quick_periods
.
period(1, "hour")
## [1] "1H 0M 0S"
hours(1)
## [1] "1H 0M 0S"
period(6, "months")
## [1] "6m 0d 0H 0M 0S"
months(6)
## [1] "6m 0d 0H 0M 0S"
years(1)
## [1] "1y 0m 0d 0H 0M 0S"
is.period
può essere usata per verificare se un oggetto è un punto.
is.period(years(1))
## [1] TRUE
is.period(dyears(1))
## [1] FALSE
Date di arrotondamento
now_dt <- ymd_hms(now(), tz="IST")
now_dt
## [1] "2016-07-22 13:53:09 IST"
round_date()
prende un oggetto data-ora e lo arrotonda al valore intero più vicino dell'unità temporale specificata.
round_date(now_dt, "minute")
## [1] "2016-07-22 13:53:00 IST"
round_date(now_dt, "hour")
## [1] "2016-07-22 14:00:00 IST"
round_date(now_dt, "year")
## [1] "2017-01-01 IST"
floor_date()
prende un oggetto data-ora e lo arrotonda al valore intero più vicino dell'unità di tempo specificata.
floor_date(now_dt, "minute")
## [1] "2016-07-22 13:53:00 IST"
floor_date(now_dt, "hour")
## [1] "2016-07-22 13:00:00 IST"
floor_date(now_dt, "year")
## [1] "2016-01-01 IST"
ceiling_date()
prende un oggetto data-ora e arrotonda il valore intero più vicino all'unità di tempo specificata.
ceiling_date(now_dt, "minute")
## [1] "2016-07-22 13:54:00 IST"
ceiling_date(now_dt, "hour")
## [1] "2016-07-22 14:00:00 IST"
ceiling_date(now_dt, "year")
## [1] "2017-01-01 IST"
Differenza tra periodo e durata
A differenza delle durate, i periodi possono essere utilizzati per modellare accuratamente i tempi di clock senza sapere quando si verificano eventi come i secondi bisestili, i giorni bisestili e le modifiche all'ora legale.
start_2012 <- ymd_hms("2012-01-01 12:00:00")
## [1] "2012-01-01 12:00:00 UTC"
# period() considers leap year calculations.
start_2012 + period(1, "years")
## [1] "2013-01-01 12:00:00 UTC"
# Here duration() doesn't consider leap year calculations.
start_2012 + duration(1)
## [1] "2012-12-31 12:00:00 UTC"
Fusi orari
with_tz
restituisce una data come apparirà in un fuso orario diverso.
nyc_time <- now("America/New_York")
nyc_time
## [1] "2016-07-22 05:49:08 EDT"
# corresponding Europe/Moscow time
with_tz(nyc_time, tzone = "Europe/Moscow")
## [1] "2016-07-22 12:49:08 MSK"
force_tz
restituisce una data-ora con lo stesso orario di x nel nuovo fuso orario.
nyc_time <- now("America/New_York")
nyc_time
## [1] "2016-07-22 05:49:08 EDT"
force_tz(nyc_time, tzone = "Europe/Moscow") # only timezone changes
## [1] "2016-07-22 05:49:08 MSK"