Note ipersintetiche di LPC: i numeri di macchina, singola precisione, opzione bias, chopping, rounding.

Note:

Il seguente file presenta gli appunti personali, al momento non rivisitati od ampliati, della seconda lezione di Laboratorio di Programmazione e Calcolo. Potrebbero esser presenti refusi od affermazioni incorrette.

-Tra i separatori [-x——-x-] ci sono aggiunte personali, tratte dal web, inserite per chiarire alcune definizioni a livello tecnico.

La macchina assegna ad ogni numero reale una certa mantissa a seconda dello spazio dedicato e le rappresentazioni in essa non risultano esser continue, ossia esse sono discrete a causa delle approssimazioni dato che è impossibile rappresentare un numero reale con uno spazio in bit limitato. Ciò comporta errori di calcolo.

I numeri di macchina sono la rappresentazione interna dei numeri all’interno di un computer. Ogni sistema informatico utilizza una certa quantità di bit – ad esempio 32, 64, 128 bit – per rappresentare i numeri. A seconda della quantità di bit disponibili, si possono rappresentare differenti gamme di numeri e precisioni.

Per rappresentare i numeri di macchina si utilizza il sistema floating point normalizzato $m a t h b b F (β, t, L, U)$ ove $β g e q 2$ rappresenta la base, $t$ il numero di cifre significative, $L < 0$ il minimo valore dell’esponente ed $U > 0$ il massimo valore dell’esponente.

L’insieme è definito come: $m a t h b b F (β, t, L, U)$ ={ $Extra close brace or missing open brace$ } $c u p$ { $0, I n f, N a N$ }, ove $0 l e q a_{i} l e q β - 1, a_{1} > 0, L l e q e l e q U$ .

La normalizzazione è introdotta grazie alla limitazione su $a_{1}$ , la quale garantisce l’unicità di rappresentazione, 0 ha una rappresentazione a parte, ed implica $β^{t - 1} l e q m l e q β^{t} - 1$ . Infatti $m = β^{t - 1}$ se $a_{1} = 1$ ed i restanti $a_{i}$ risultano esser nulli ed $m = β^{t} - 1$ se tutti gli $a_{i}$ risultano pari a $β - 1$ .

$m a t h b b F (β, t, L, U) s u b s e t Q$ dato che, ad esempio, i numeri periodici od irrazionali non vengono rappresentati perfettamente.

Esempio: $t = 4$ , mantissa minima $m = 1000_{[β]}$ .

Se $β = 10$ allora $m = 10^{3}$ , se $β = 2$ allora $m = 2^{3}$ .

Se $x i n m a t h b b F (β, t, L, U)$ e non in {0, Inf, NaN}, allora per $| x | = m c d o t β^{e - t}$ si ha $x_{m i n} = β^{L - 1} = β^{t - 1} β^{L - t} l e q m c d o t β^{e - t} l e q (β^{t} - 1) β^{U - t} = β^{U} (1 - β^{- t} = x_{M A X}$

Si ha un overflow con conseguente interruzione di esecuzione quando il numero inserito in macchina risulta esser maggiore in modulo di $x_{M A X}$ , la codifica è Inf.

Si ha un underflow quando il numero inserito in macchina risulta esser minore in modulo di $x_{m i n}$ , tale approssimazione viene gestita dal sistema tramite approssimazione e non interruzione.

NaN significa Not a Number e corrisponde alle forme indeterminate riscontrate nel calcolo dei limiti in analisi.

Fissati N e t, in un sistema floating point si hanno N-t-1 bit per l’esponente con segno.

Esempio: Se si ha un byte a disposizione per la rappresentazione in fp in base 2, si potrebbe scegliere di avere una mantissa ed esponente di tre cifre adoperando poi i due bit per i rispettivi segni. In tal caso si ha come mantissa massima $111_{[2]} = 7$ $r i g h t a r r o w L = - 7, U = 7$ .

SINGOLA PRECISIONE E DOPPIA PRECISIONE PER LA RAPPRESENTAZIONE BINARIA β=2

Lo standard IEEE, Institute of Electrical and Electronic Engeneers, prescrive N=32bit=4byte (t=23bit + 8bit per l’esponente) per la singola precisione ed N=64bit=8byte (t=52bit + 11bit per l’esponente) per la doppia precisione.

-x———x-

cosa si intende per BIAS:

Nel contesto della rappresentazione flottante, come il formato IEEE 754, il bias è utilizzato per rappresentare gli esponenti dei numeri in modo che possano includere valori negativi. Il bias è una tecnica per semplificare la rappresentazione di numeri con segno e permette di includere sia valori positivi che negativi in un formato standardizzato.

Esempio:

Rappresentazione dell’esponente: Supponiamo di avere un formato di rappresentazione a virgola mobile che utilizza 8 bit per l’esponente. Se vogliamo rappresentare esponenti che vanno da -127 a +128, possiamo utilizzare un bias di 127. In questo modo:

-Un esponente di 0 sarà rappresentato come (127) (0 + 127).

-Un esponente di -1 sarà rappresentato come (126) (-1 + 127).

-Un esponente di +1 sarà rappresentato come (128) (+1 + 127).

Vantaggi: Utilizzando il bias, possiamo rappresentare esponenti con valori negativi senza dover utilizzare bit aggiuntivi per segnare il segno dell’esponente.

Applicazioni: Il concetto di bias è utilizzato non solo nelle rappresentazioni a virgola mobile, ma può essere utilizzato anche nella codifica di altre strutture dati, come per esempio nelle codifiche di interi.

-x—————x-

La singola precisione in C++ viene di norma utilizzata per le variabili di tipo float.

Poiché sono disponibili 8bit per l’esponente si potrebbe utilizzare un bit per il segno e sette bit per il numero in modo da ottenere $0 l e q | e | l e q 127$ ricavando le limitazioni L=-127 ed U=127. Per risparmiare la doppia rappresentazione dello 0, ossia il $(- 1)^{s}$ , si possono utilizzare tutti gli 8 bit per il numero ed ottenere $0 l e q | E | l e q 2^{8} - 1$ definendo tramite bias b=127 l’equazione e=E-b; ciò comporta L=-127 ed U=128.

La doppia precisione in C++ viene di norma utilizzata per le variabili di tipo double.

Con gli 11bit a disposizione per l’esponente si ha $0 l e q E l e q 2^{11} - 1$ . Dunque con bias b=1023 si ottiene L=-1023 ed U=1024.

Per L ed U non vi è alcuno standard universalmente riconosciuto, in generale si predilige l’opzione bias.

In $m a t h b b F (2, 23, - 127, 128), x_{m i n} = 2^{- 128} a p p r o x 2.9 c d o t 10^{- 39}$ ed $x_{M A X} = 2^{128} a p p r o x 3.4 c d o t 10^{38}$ .

In $m a t h b b F (2, 52, - 1023, 1024), x_{m i n} = 2^{- 1024} a p p r o x 5.6 c d o t 10^{- 309}$ ed $x_{M A X} = 2^{1024} a p p r o x 1.8 c d o t 10^{308}$ .

APPROSSIMAZIONE PER TRONCAMENTO (CHOPPING) ED ARROTONDAMENTO(ROUNDING).

$m a t h b b F$ è un sottoinsieme di Q, e dunque di R. Non tutti i numeri razionali ed irrazionali sono rappresentabili completamente tramite la memoria a disposizione del sistema.

Si definisce l’applicazione $f l : R r i g h t a r r o w F (β, t, L, U)$ ,

I numeri con modulo maggiore di $x_{M A X}$ vengono posti uguali a $p m I n f$ mentr quelli con modulo minore di $x_{m i n}$ uguali a 0.

Se $x = p m (0. a_{1} a_{2} \dots a_{p})_{[β]} c d o t β^{e}$ , ove $p l e q t$ ed $e i n [L, U]$ , allora $f l (x) = x$ , ossia è rappresentato così come è dato che è presente anche in F.

Se $x = p m (0. a_{1} a_{2} \dots a_{t} a_{t + 1} \dots)_{[β]} c d o t β^{e}$ , ove $e i n [L, U]$ , allora la rappresentazione dipende dal sistema in uso. Esistono due sistemi di approssimazione: il chopping ed il rounding.

Chopping: $f l (x) = p m (0. a_{1} \dots a_{t}) [β] c d o t β^{e}$ .

Rounding: agisce come il chopping se e solo se $a_{t + 1} < β / 2$ , altrimenti arrotonda $| x |$ al suo successivo numero di macchina.

ESERCIZIO:

Posto β=2 e t=3, come viene rappresentato $x_{[2]} = (0.0001111)_{[2]}$ in chopping? In rounding? [Soluzione in base-10: 14/128, 16/128]

Note ipersintetiche di LPC: i numeri di macchina, singola precisione, opzione bias, chopping, rounding.

Note ipersintetiche di LPC: i numeri di macchina, singola precisione, opzione bias, chopping, rounding.

Lascia un commento Annulla risposta