pandas
टाइम सीरीज़ के साथ काम करना
खोज…
टाइम सीरीज़ बनाना
यहाँ कैसे एक सरल समय श्रृंखला बनाने के लिए है।
import pandas as pd
import numpy as np
# The number of sample to generate
nb_sample = 100
# Seeding to obtain a reproductible dataset
np.random.seed(0)
se = pd.Series(np.random.randint(0, 100, nb_sample),
index = pd.date_range(start = pd.to_datetime('2016-09-24'),
periods = nb_sample, freq='D'))
se.head(2)
# 2016-09-24 44
# 2016-09-25 47
se.tail(2)
# 2016-12-31 85
# 2017-01-01 48
आंशिक स्ट्रिंग अनुक्रमण
टाइम सीरीज़ को कम करने का एक बहुत आसान तरीका आंशिक स्ट्रिंग इंडेक्सिंग का उपयोग करना है। यह स्पष्ट सिंटैक्स के साथ तारीखों की श्रेणी का चयन करने की अनुमति देता है।
डेटा प्राप्त करना
हम बनाने के समय श्रृंखला उदाहरण में डाटासेट का उपयोग कर रहे हैं
सीमाओं को देखने के लिए सिर और पूंछ प्रदर्शित करना
se.head(2).append(se.tail(2))
# 2016-09-24 44
# 2016-09-25 47
# 2016-12-31 85
# 2017-01-01 48
subsetting
अब हम साल, महीने, दिन को बहुत ही सहज रूप से कम कर सकते हैं।
साल तक
se['2017']
# 2017-01-01 48
महीने से
se['2017-01']
# 2017-01-01 48
दिवस पश्चात
se['2017-01-01']
# 48
अपनी आवश्यकताओं के अनुसार वर्ष, माह, दिन की सीमा के साथ।
se['2016-12-31':'2017-01-01']
# 2016-12-31 85
# 2017-01-01 48
पांडा भी एक समर्पित प्रदान करता है truncate
के माध्यम से इस प्रयोग के लिए समारोह after
और before
मानकों - लेकिन मुझे लगता है कि कम स्पष्ट है।
se.truncate(before='2017')
# 2017-01-01 48
se.truncate(before='2016-12-30', after='2016-12-31')
# 2016-12-30 13
# 2016-12-31 85
Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow