खोज…


पैरामीटर

पैरामीटर विवरण
path_or_buf स्ट्रिंग या फ़ाइल संभाल, डिफ़ॉल्ट कोई भी फ़ाइल पथ या ऑब्जेक्ट, यदि कोई नहीं दिया गया है तो परिणाम स्ट्रिंग के रूप में लौटाया जाता है।
सितम्बर चरित्र, डिफ़ॉल्ट ',' आउटपुट फ़ाइल के लिए फ़ील्ड सीमांकक।
na_rep स्ट्रिंग, डिफ़ॉल्ट '' डेटा प्रतिनिधित्व गायब है
float_format स्ट्रिंग, डिफ़ॉल्ट फ्लोटिंग पॉइंट नंबरों के लिए कोई भी प्रारूप स्ट्रिंग नहीं
कॉलम अनुक्रम, लिखने के लिए वैकल्पिक कॉलम
हैडर बूलियन या स्ट्रिंग की सूची, डिफ़ॉल्ट सही कॉलम नाम लिखें। यदि स्ट्रिंग की एक सूची दी जाती है तो इसे स्तंभ नामों के लिए उपनाम माना जाता है
सूची बूलियन, डिफ़ॉल्ट सही लिखें पंक्ति नाम (इंडेक्स)
index_label यदि वांछित है तो स्ट्रिंग या अनुक्रम, या गलत, इंडेक्स कॉलम (एस) के लिए डिफ़ॉल्ट कोई भी कॉलम लेबल नहीं। यदि कोई नहीं दिया गया है, और हेडर और इंडेक्स ट्रू हैं, तो इंडेक्स नामों का उपयोग किया जाता है। यदि DataFrame MultiIndex का उपयोग करता है तो एक अनुक्रम दिया जाना चाहिए। यदि गलत अनुक्रमित नामों के लिए फ़ील्ड प्रिंट नहीं करते हैं। R में आसान आयात के लिए index_label = गलत का उपयोग करें
nanRep कोई भी वंचित नहीं है, na_rep का उपयोग करें
मोड str पायथन राइट मोड, डिफ़ॉल्ट 'w'
एन्कोडिंग स्ट्रिंग, वैकल्पिक एक आउटपुट फ़ाइल में उपयोग करने के लिए एन्कोडिंग का प्रतिनिधित्व करता है, पायथन 2 पर 'एससीआईआई' और पायथन 3 पर 'यूटीएफ -8' को डिफॉल्ट करता है।
दबाव स्ट्रिंग, वैकल्पिक स्ट्रिंग आउटपुट फ़ाइल में उपयोग करने के लिए संपीड़न का प्रतिनिधित्व करता है, अनुमत मान 'गज़िप', 'बज़ 2', 'एक्सज़' हैं, केवल तब उपयोग किया जाता है जब पहला तर्क एक फ़ाइल नाम होता है
line_terminator स्ट्रिंग, डिफ़ॉल्ट 'एन' आउटपुट फ़ाइल में उपयोग करने के लिए नया वर्ण या वर्ण अनुक्रम
के हवाले सीएसवी मॉड्यूल से वैकल्पिक निरंतर csv.QUOTE_MINIMAL के लिए चूक
quotechar स्ट्रिंग (लंबाई 1), डिफ़ॉल्ट '' 'वर्ण का उपयोग खेतों को उद्धृत करने के लिए किया जाता है
दोहरे उद्धरण बूलियन, डिफॉल्ट ट्रू कंट्रोल एक क्षेत्र के अंदर कोटा के उद्धरण
escapechar स्ट्रिंग (लंबाई 1), डिफ़ॉल्ट कोई भी चरित्र उपयुक्त होने पर सेप और क्वैश्चर से बचने के लिए उपयोग किया जाता है
खंड आकार int या कोई भी पंक्तियों को एक बार में लिखने के लिए नहीं
tupleize_cols बूलियन, डिफ़ॉल्ट गलत tuples (यदि सही है) या नए (विस्तारित प्रारूप) झूठी सूची के रूप में बहु_index कॉलम लिखते हैं)
डेटा प्रारूप स्ट्रिंग, डिफ़ॉल्ट कोई नहीं प्रारूप स्ट्रिंग डेटाइम ऑब्जेक्ट्स के लिए
दशमलव स्ट्रिंग, डिफ़ॉल्ट '।' दशमलव विभाजक के रूप में मान्यता प्राप्त चरित्र। उदाहरण के लिए ',' यूरोपीय डेटा के लिए

यादृच्छिक DataFrame बनाएँ और .csv पर लिखें

एक साधारण DataFrame बनाएँ।

import numpy as np
import pandas as pd

# Set the seed so that the numbers can be reproduced.
np.random.seed(0)  

df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))

# Another way to set column names is "columns=['column_1_name','column_2_name','column_3_name']"

df

      A         B         C
0  1.764052  0.400157  0.978738
1  2.240893  1.867558 -0.977278
2  0.950088 -0.151357 -0.103219
3  0.410599  0.144044  1.454274
4  0.761038  0.121675  0.443863

अब, CSV फ़ाइल में लिखें:

df.to_csv('example.csv', index=False)

Example.csv की सामग्री:

A,B,C
1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

ध्यान दें कि हम index=False निर्दिष्ट करते हैं ताकि CSV फ़ाइल में ऑटो-जेनरेट किए गए इंडेक्स (पंक्ति #s 0,1,2,3,4) शामिल न हों। यदि आपको इंडेक्स कॉलम की आवश्यकता है तो इसे शामिल करें, जैसे:

df.to_csv('example.csv', index=True)  # Or just leave off the index param; default is True

Example.csv की सामग्री:

,A,B,C
0,1.76405234597,0.400157208367,0.978737984106
1,2.2408931992,1.86755799015,-0.977277879876
2,0.950088417526,-0.151357208298,-0.103218851794
3,0.410598501938,0.144043571161,1.45427350696
4,0.761037725147,0.121675016493,0.443863232745

यह भी ध्यान दें कि आप शीर्ष लेख को हटा सकते हैं यदि header=False साथ इसकी आवश्यकता नहीं है। यह सबसे सरल आउटपुट है:

df.to_csv('example.csv', index=False, header=False)

Example.csv की सामग्री:

1.76405234597,0.400157208367,0.978737984106
2.2408931992,1.86755799015,-0.977277879876
0.950088417526,-0.151357208298,-0.103218851794
0.410598501938,0.144043571161,1.45427350696
0.761037725147,0.121675016493,0.443863232745

sep= तर्क द्वारा सीमांकक सेट किया जा सकता है, हालांकि सीएसवी फ़ाइलों के लिए मानक विभाजक ','

df.to_csv('example.csv', index=False, header=False, sep='\t')

1.76405234597    0.400157208367    0.978737984106
2.2408931992    1.86755799015    -0.977277879876
0.950088417526    -0.151357208298    -0.103218851794
0.410598501938    0.144043571161    1.45427350696
0.761037725147    0.121675016493    0.443863232745

कोई इंडेक्स और डेटा एन्कोडिंग के साथ सीएसवी करने के लिए सूची से पंडों डेटाफ़्रेम को सहेजें

import pandas as pd
data = [
    {'name': 'Daniel', 'country': 'Uganda'},
    {'name': 'Yao', 'country': 'China'},
    {'name': 'James', 'country': 'Colombia'},
]
df = pd.DataFrame(data)
filename = 'people.csv'
df.to_csv(filename, index=False, encoding='utf-8')


Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow