C Language => Tipi di dati

Osservazioni

Mentre char è richiesto per essere 1 byte, 1 byte non è richiesto per essere 8 bit (spesso chiamato anche un ottetto ), anche se la maggior parte delle moderne piattaforme di computer lo definiscono come 8 bit. Il numero di bit di implementazione per char è fornito dalla macro CHAR_BIT , definita in <limits.h> . POSIX richiede 1 byte per essere 8 bit.
I tipi di interi a larghezza fissa dovrebbero essere usati scarsamente, i tipi di C incorporati sono progettati per essere naturali su ogni architettura, i tipi a larghezza fissa dovrebbero essere usati solo se avete bisogno esplicitamente di un numero intero specifico (ad esempio per il networking).

Tipi interi e costanti

Gli interi firmati possono essere di questi tipi (l' int dopo l' short o l'opzione long è facoltativo):

signed char c = 127; /* required to be 1 byte, see remarks for further information. */
signed short int si = 32767; /* required to be at least 16 bits. */
signed int i = 32767; /* required to be at least 16 bits */
signed long int li = 2147483647; /* required to be at least 32 bits. */

C99

signed long long int li = 2147483647; /* required to be at least 64 bits */

Ognuno di questi tipi di interi con segno ha una versione senza firma.

unsigned int i = 65535;
unsigned short = 2767;
unsigned char = 255;

Per tutti i tipi, ma char la signed versione si presume se il signed o unsigned parte viene omesso. Il tipo char costituisce un terzo tipo di carattere, diverso dal signed char e dal signed char unsigned char e la signness (o meno) dipende dalla piattaforma.

Diversi tipi di costanti intere (chiamate letterali in C jargon) possono essere scritti in basi diverse e larghezza diversa, in base al loro prefisso o suffisso.

/* the following variables are initialized to the same value: */
int d = 42;   /* decimal constant (base10) */
int o = 052;  /* octal constant (base8) */
int x = 0xaf; /* hexadecimal constants (base16) */
int X = 0XAf; /* (letters 'a' through 'f' (case insensitive) represent 10 through 15) */

Le costanti decimali sono sempre signed . Le costanti esadecimali iniziano con 0x o 0X e le costanti ottali iniziano solo con uno 0 . Gli ultimi due sono signed o unsigned seconda che il valore si adatti al tipo firmato o meno.

/* suffixes to describe width and signedness : */
long int i = 0x32; /* no suffix represent int, or long int */
unsigned int ui = 65535u; /* u or U represent unsigned int, or long int */
long int li = 65536l; /* l or L represent long int */

Senza un suffisso la costante ha il primo tipo che si adatta al suo valore, cioè una costante decimale che è maggiore di INT_MAX è di tipo long se possibile, o long long altrimenti.

Il file di intestazione <limits.h> descrive i limiti degli interi come segue. I loro valori definiti dall'implementazione devono essere uguali o maggiori in grandezza (valore assoluto) a quelli mostrati sotto, con lo stesso segno.

macro	genere	Valore
`CHAR_BIT`	l'oggetto più piccolo che non è un bit-field (byte)	8
`SCHAR_MIN`	`signed char`	-127 / - (2 ⁷ - 1)
`SCHAR_MAX`	`signed char`	+127 / 2 ⁷ - 1
`UCHAR_MAX`	`unsigned char`	255/2 ⁸ - 1
`CHAR_MIN`	`char`	vedi sotto
`CHAR_MAX`	`char`	vedi sotto
`SHRT_MIN`	`short int`	-32767 / - (2 ¹⁵ - 1)
`SHRT_MAX`	`short int`	+32767 / 2 ¹⁵ - 1
`USHRT_MAX`	`unsigned short int`	65535/2 ¹⁶ - 1
`INT_MIN`	`int`	-32767 / - (2 ¹⁵ - 1)
`INT_MAX`	`int`	+32767 / 2 ¹⁵ - 1
`UINT_MAX`	`unsigned int`	65535/2 ¹⁶ - 1
`LONG_MIN`	`long int`	-2147483647 / - (2 ³¹ - 1)
`LONG_MAX`	`long int`	+2147483647 / 2 ³¹ - 1
`ULONG_MAX`	`unsigned long int`	4294967295/2 ³² - 1

C99

macro	genere	Valore
`LLONG_MIN`	`long long int`	-9223372036854775807 / - (2 ⁶³ - 1)
`LLONG_MAX`	`long long int`	+9223372036854775807 / 2 ⁶³ - 1
`ULLONG_MAX`	`unsigned long long int`	18446744073709551615/2 ⁶⁴ - 1

Se il valore di un oggetto di tipo char sign-extends quando utilizzato in un'espressione, il valore di CHAR_MIN deve essere uguale a quello di SCHAR_MIN e il valore di CHAR_MAX deve essere uguale a quello di SCHAR_MAX . Se il valore di un oggetto di tipo char non si estende al segno quando utilizzato in un'espressione, il valore di CHAR_MIN deve essere 0 e il valore di CHAR_MAX deve essere uguale a quello di UCHAR_MAX .

C99

Lo standard C99 ha aggiunto una nuova intestazione, <stdint.h> , che contiene definizioni per numeri interi a larghezza fissa. Vedere l'esempio intero a larghezza fissa per una spiegazione più approfondita.

String letterali

Una stringa letterale in C è una sequenza di caratteri, terminata da uno zero letterale.

char* str = "hello, world"; /* string literal */

/* string literals can be used to initialize arrays */
char a1[] = "abc"; /* a1 is char[4] holding {'a','b','c','\0'} */
char a2[4] = "abc"; /* same as a1 */
char a3[3] = "abc"; /* a1 is char[3] holding {'a','b','c'}, missing the '\0' */

I valori letterali delle stringhe non sono modificabili (e infatti possono essere inseriti nella memoria di sola lettura come .rodata). Il tentativo di modificare i loro valori comporta un comportamento indefinito.

char* s = "foobar";
s[0] = 'F'; /* undefined behaviour */

/* it's good practice to denote string literals as such, by using `const` */
char const* s1 = "foobar";
s1[0] = 'F'; /* compiler error! */

I letterali a più stringhe sono concatenati in fase di compilazione, il che significa che puoi scrivere un costrutto come questi.

C99

/* only two narrow or two wide string literals may be concatenated */
char* s = "Hello, " "World";

C99

/* since C99, more than two can be concatenated */
/* concatenation is implementation defined */
char* s1 = "Hello" ", " "World";

/* common usages are concatenations of format strings */
char* fmt = "%" PRId16; /* PRId16 macro since C99 */

I valori letterali stringa, come le costanti dei caratteri, supportano set di caratteri diversi.

/* normal string literal, of type char[] */
char* s1 = "abc";

/* wide character string literal, of type wchar_t[] */
wchar_t* s2 = L"abc";

C11

/* UTF-8 string literal, of type char[] */
char* s3 = u8"abc";

/* 16-bit wide string literal, of type char16_t[] */
char16_t* s4 = u"abc";

/* 32-bit wide string literal, of type char32_t[] */
char32_t* s5 = U"abc";

Tipi interi a larghezza fissa (dal C99)

C99

L'intestazione <stdint.h> fornisce diverse definizioni di tipi interi a larghezza fissa. Questi tipi sono facoltativi e vengono forniti solo se la piattaforma ha un tipo intero della larghezza corrispondente e se il corrispondente tipo firmato ha una rappresentazione a complemento a due di valori negativi.

Vedere la sezione commenti per suggerimenti sull'utilizzo di tipi di larghezza fissa.

/* commonly used types include */
uint32_t u32 = 32; /* exactly 32-bits wide */

uint8_t u8 = 255;  /* exactly 8-bits wide */

int64_t i64 = -65  /* exactly 64 bit in two's complement representation */

Costanti a virgola mobile

Il linguaggio C ha tre tipi di virgola mobile reali obbligatori, float , double e long double .

float f = 0.314f;        /* suffix f or F denotes type float */
double d = 0.314;        /* no suffix denotes double */
long double ld = 0.314l; /* suffix l or L denotes long double */

/* the different parts of a floating point definition are optional */
double x = 1.; /* valid, fractional part is optional */
double y = .1; /* valid, whole-number part is optional */

/* they can also defined in scientific notation */
double sd = 1.2e3; /* decimal fraction 1.2 is scaled by 10^3, that is 1200.0 */

L'intestazione <float.h> definisce vari limiti per le operazioni in virgola mobile.

L'aritmetica in virgola mobile è definita dall'implementazione. Tuttavia, la maggior parte delle piattaforme moderne (arm, x86, x86_64, MIPS) utilizzano operazioni in virgola mobile IEEE 754 .

C ha anche tre tipi di floating point complessi opzionali derivati da quanto sopra.

Interpretazione delle dichiarazioni

Una peculiarità sintattica distintiva di C è che le dichiarazioni rispecchiano l'uso dell'oggetto dichiarato come sarebbe in un'espressione normale.

Il seguente insieme di operatori con identica precedenza e associatività viene riutilizzato nei dichiaratori, vale a dire:

l'operatore unario * "dereferenziazione" che denota un puntatore;
l'operatore binario [] "subscription in array" che denota una matrice;
l'operatore (1 + n) -ary () "chiamata di funzione" che denota una funzione;
il () raggruppa le parentesi che sovrascrivono la precedenza e l'associatività del resto degli operatori elencati.

I tre operatori precedenti hanno la seguente precedenza e associatività:

Operatore	Precedenza relativa	Associatività
`[]` (abbonamento array)	1	Da sinistra a destra
`()` (chiamata di funzione)	1	Da sinistra a destra
`*` (dereferenziazione)	2	Da destra a sinistra

Quando si interpretano le dichiarazioni, si deve partire dall'identificatore verso l'esterno e applicare gli operatori adiacenti nell'ordine corretto come nella tabella precedente. Ogni applicazione di un operatore può essere sostituita con le seguenti parole inglesi:

Espressione	Interpretazione
`thing[X]`	una serie di dimensioni `X` di ...
`thing(t1, t2, t3)`	una funzione che prende `t1` , `t2` , `t3` e restituisce ...
`*thing`	un puntatore a ...

Ne consegue che l'inizio dell'interpretazione inglese inizierà sempre con l'identificatore e terminerà con il tipo che si trova sul lato sinistro della dichiarazione.

Esempi

char *names[20];

[] ha la precedenza su * , quindi l'interpretazione è: i names sono una matrice di dimensione 20 di un puntatore a char .

char (*place)[10];

Nel caso in cui si utilizzino le parentesi per sovrascrivere la precedenza, viene applicato prima * : place è un puntatore a una matrice di dimensione 10 di char .

int fn(long, short);

Non c'è alcuna precedenza da preoccupare qui: fn è una funzione che richiede long , short e ritorno int .

int *fn(void);

Il fn () viene applicato per primo: fn è una funzione che prende il void e restituisce un puntatore a int .

int (*fp)(void);

Sovrascrivere la precedenza di () : fp è un puntatore a una funzione che prende il void e che restituisce int .

int arr[5][8];

Gli array multidimensionali non sono un'eccezione alla regola; gli operatori [] sono applicati nell'ordine da sinistra a destra secondo l'associatività nella tabella: arr è una matrice di dimensione 5 di una matrice di dimensione 8 di int .

int **ptr;

I due operatori di dereferenziazione hanno la stessa precedenza, quindi l'associatività ha effetto. Gli operatori sono applicati nell'ordine da destra a sinistra: ptr è un puntatore a un puntatore a un int .

Dichiarazioni multiple

La virgola può essere utilizzata come separatore (* non * che agisce come l'operatore virgola) per delimitare più dichiarazioni all'interno di una singola istruzione. La seguente dichiarazione contiene cinque dichiarazioni:

int fn(void), *ptr, (*fp)(int), arr[10][20], num;

Gli oggetti dichiarati nell'esempio precedente sono:

fn : una funzione che si void e restituisce int ;
ptr : un puntatore a un int ;
fp : un puntatore a una funzione che assume int e restituisce int ;
arr : una matrice di dimensione 10 di una matrice di dimensione 20 di int ;
num : int .

Interpretazione alternativa

Poiché il mirror delle dichiarazioni viene utilizzato, una dichiarazione può anche essere interpretata in termini di operatori che potrebbero essere applicati sull'oggetto e il tipo risultante finale di tale espressione. Il tipo che si trova sul lato sinistro è il risultato finale che viene restituito dopo l'applicazione di tutti gli operatori.

/*
 * Subscripting "arr" and dereferencing it yields a "char" result.
 * Particularly: *arr[5] is of type "char".
 */
char *arr[20];

/*
 * Calling "fn" yields an "int" result.
 * Particularly: fn('b') is of type "int".
 */
int fn(char);

/*
 * Dereferencing "fp" and then calling it yields an "int" result.
 * Particularly: (*fp)() is of type "int".
 */
int (*fp)(void);

/*
 * Subscripting "strings" twice and dereferencing it yields a "char" result.
 * Particularly: *strings[5][15] is of type "char"
 */
char *strings[10][20];

Modified text is an extract of the original Stack Overflow Documentation

Autorizzato sotto CC BY-SA 3.0

Non affiliato con Stack Overflow

C Language
Tipi di dati

Ricerca…