Corso di sistemi operativi!

Oltre a quanto visto nella puntata precedente, durante la terza generazione ebbe luogo una fenomenale crescita dei minicalcolatori, a partire dal PDP-1 del 1961.

Nella serie dei PDP successivi, fino al PDP-11, il più importante (per ragioni storiche) fu il PDP-7, sul quale venne sviluppata, da Ken Thompson (uno degli informatici dei laboratori Bell che aveva collaborato alla realizzazione di MULTICS), una versione ridotta per singolo utente di MULTICS, chiamata per

gioco UNICS (Uniplexed Information and Computing Service), che non tardò a convincere gli addetti ai lavori, diventando ben presto UNIX (implementato per la prima volta proprio su un PDP-11/20).

L'evoluzione incredibile dei minicalcolatori portò ad una migrazione delle caratteristiche dei SO nati per mainframe verso i SO usati su tali sistemi, cosicché UNIX potè avvantaggiarsi dei progressi compiuti negli anni precedenti.

A Cura di Angelo Carpenzano ( © )

Evoluzione dei sistemi operativi (III)

Lezione 7

La quarta generazione nasce con l'avvento dei circuiti LSI (Large Scale Integration), che portò, alla fine degli anni 70, alla costruzione dei primi personal computer, molto simili ai minicalcolatori come il PDP-11, ma più economici.

Venne introdotto il termine workstation (stazione di lavoro) per indicare i PC utilizzati da uomini d'affari, agenzie governative ed università, sebbene

non fossero altro che personal computer un pò più grandi, talvolta connessi insieme attraverso una rete.

L'aumentata diffusione dei calcolatori e l'accresciuta potenza di calcolo, portò allo sviluppo di varie case aziende per la produzione di software per PC,

il cui scopo principale era produrre software user-friendly, cioè amichevole, rivolto a persone che nulla conoscevano o volevano conoscere dei calcolatori, ma che non volevano rinunciare ad utilizzarli.

A Cura di Angelo Carpenzano ( © )

Evoluzione dei sistemi operativi (III)

Lezione 7

Una di queste aziende nascenti, denominata Microsoft, venne fondata da un giovane programmatore di nome Bill Gates, che qualche anno prima aveva scritto una versione di BASIC per Altair (che molti considerano il primo vero personal computer, prodotto nel 1975), che in poco tempo lo fece diventare multimilionario (quando si dice nato con la camicia_:-); nessuno allora era in grado di prevedere quanto grande sarebbe stata l'influenza di questa azienda nello sviluppo e la diffusione dei PC.

Sin dall'inizio i due maggiori sistemi operativi che dominarono la scena dei PC e delle workstation furono MS-DOS della Microsoft e UNIX.

MS-DOS (Microsoft - Disk Operating System) fu largamente usato su PC IBM e sui sistemi compatibili che utilizzavano i processori Intel (dall'8088 ai suoi successori); le prime versioni erano piuttosto primitive, ma le successive vennero arricchite di caratteristiche avanzate, molte delle quali riprese da UNIX (infatti, ironia della sorte, l'attuale avversario numero 1 di Linux - il più conosciuto dei figli di UNIX - allora era il principale distributore dei sistemi UNIX :-}).

A Cura di Angelo Carpenzano ( © )

Evoluzione dei sistemi operativi (III)

Lezione 7

UNIX invece spopolava sui calcolatori non-Intel e sulle workstation, particolarmente in quelle equipaggiate con chip RISC ad alte prestazioni.

In questo scenario, durante la metà degli anni 80, cominciavano a prendere piede le reti di personal computer, sui quali giravano i primi sistemi operativi di rete e i sistemi operativi distribuiti.

La fine degli anni 80 è caratterizzata dal diffondersi dei vari dialetti di UNIX, che dal progenitore di proprietà dell'AT&T (evolutosi nello UNIX System V con le sue varie release), derivarono diverse varianti (BSD, Minix, Linux, FreeBSD, OpenBSD, NetBSD, e altri ancora), alcune delle quali distribuite gratuitamente e con i sorgenti.

A Cura di

Angelo Carpenzano ( © )

Evoluzione dei sistemi operativi (III)

Lezione 7

Una nota particolare merita Linux, apparso per la prima volta nel 1991, che, nato su iniziativa di un giovane studente di nome Linus Torvalds, allievo di A. S. Tanenbaum (l'autore di Minix), ha ben presto ricevuto l'appoggio di numerosi sviluppatori sparsi in tutto il mondo, che hanno potuto contribuire al suo sviluppo soprattutto grazie ad Internet.

L'affermazione di questo SO è storia recente ed è tuttora in crescita.

Per concludere questa carrellata storica, non possiamo non menzionare l'incredibile diffusione dei sistemi operativi basati sul DOS di Microsoft (MS-DOS, Windows 3.x e Windows 9x), che, seppure con i loro difetti e demeriti, hanno certamente il merito di aver introdotto i PC nelle case di tutto il mondo.

Per il futuro siamo ancora in attesa e, come vedremo nella seconda parte del corso, si prospetta ricco di interessanti novità!

A Cura di

Angelo Carpenzano ( © )

Funzioni di un SO: gestione dei processi I

Lezione 8

Data la complessità di un SO, esso può avere componenti alquanto diverse tra loro e un sistema può differire da un altro per moltissimi aspetti.

Tuttavia all'interno di un qualsiasi SO è quasi sempre possibile trovare dei sottosistemi che interagiscono tra loro per realizzare le funzioni necessarie

alla gestione dell'intero sistema di elaborazione:

1. Gestione dei processi

2. Gestione della memoria principale

3. Gestione della memoria secondaria

4. Gestione del file system

5. Gestione dei dispositivi di I/O

6. Protezione delle risorse

7. Interprete dei comandi

A Cura di

Angelo Carpenzano ( © )

Funzioni di un SO: gestione dei processi I

Lezione 8

Un concetto chiave in tutti i sistemi operativi è il processo, ovvero l'istanza di un programma in esecuzione, che è costituito da:

1. il codice eseguibile (detto anche testo);

2. i dati su cui il codice lavora;

3. una lista (più o meno lunga) di strutture dati e informazioni che occupano risorse di sistema.

E' indispensabile comprendere che programma e processo sono due cose distinte.

Un programma è un'entità passiva, un codice binario che può risiedere in un sistema di memorizzazione (come il disco) anche se il computer è spento e la

cui durata può essere (almeno in teoria) infinita.

Di contro, un processo è un'entità attiva, che scaturisce da un programma quando questo viene mandato in esecuzione e la cui durata è variabile e dipende

dall'ambiente di esecuzione.

Inoltre per esistere un processo ha bisogno che il computer sia almeno acceso :-).

A Cura di

Angelo Carpenzano ( © )

Funzioni di un SO: gestione dei processi I

Lezione 8

Per chiarire meglio il concetto facciamo un esempio.

Quando in un sistema Microsoft WindowsÒ eseguiamo l'applicazione "Notepad" ("Blocco note" nella versione italiana), il sistema crea un processo a partire dal programma notepad.exe che si trova nella directory di sistema (tipicamente C:\WINDOWS).

Il processo non esiste finché non ne invochiamo esplicitamente la creazione, mentre il programma era già nel computer quando il sistema è stato avviato.

Se, inoltre, mandiamo più volte in esecuzione il programma (attenti a non esagerare!), vedremo aprirsi tante finestre dell'editor quante sono state le nostre selezioni: ciascuna copia del Notepad non è altro che un'istanza dello stesso programma notepad.exe, e per il sistema ognuna di esse è un processo distinto.

Altrettanto avviene in qualsiasi altro SO, anche se esistono varianti che al momento non è il caso di considerare.

A Cura di Angelo Carpenzano ( © )

Funzioni di un SO: gestione dei processi I

Lezione 8

Per potere eseguire un programma è necessario che esso sia caricato in memoria principale, insieme ad una serie di informazioni indispensabili, come ad es. valori di variabili e il puntatore alla prima istruzione da eseguire (noto come program counter, spesso indicato con la sigla pc), che complessivamente prendono il nome di contesto del processo.

Durante l'esecuzione il pc viene continuamente aggiornato per puntare alla locazione di memoria che contiene l'istruzione da eseguire al passo successivo.

Se un SO permette l'esecuzione contemporanea di più processi, detti anche task, allora si dice che il SO è multitasking o multiprogrammato.

Tutti i sistemi attuali sono multitasking, classici esempi di sistemi monoprogrammati sono le versioni di MS-DOS precedenti alla 5.0.

A Cura di

Angelo Carpenzano ( © )

Funzioni di un SO: gestione dei processi I

Lezione 8

In sistemi con un solo processore (per intenderci, la stragrande maggioranza dei PC) non è possibile che più processi vengano eseguiti contemporaneamente dall'unica CPU, ma esistono dei meccanismi del SO che consentono di avere l'illusione che ciò avvenga, attraverso un continuo passaggio da un processo all'altro; si parla perciò di pseudo-parallelismo, per distinguerlo dal parallelismo reale che avviene nei sistemi con più CPU.

Perché il multitasking possa funzionare è necessario che il SO, prima di passare da un processo ad un altro, salvi il contesto del processo che sta eseguendo attualmente, in modo che quando esso verrà rimesso in esecuzione, potrà proseguire dal punto in cui era stato sospeso senza accorgersi di nulla.

Quando un processore passa da un processo ad un altro si dice che esegue un cambio di contesto, ovvero un context switch.

Nella prossima puntata continueremo a parlare di processi.

A Cura di Angelo Carpenzano ( © )

Funzioni di un SO: gestione dei processi II

Lezione 9

Parte 1 di 4

Quanto detto nella scorsa puntata ci fa comprendere che un SO vive di processi.

In realtà il SO è anch'esso costituito da processi che cooperano adeguatamente per garantire un corretto funzionamento del sistema (almeno, questo è quello che si dovrebbe cercare di fare).

Riprendendo il discorso sul multitasking, diciamo innanzitutto che il modulo del SO che si occupa di gestire il context switch viene detto scheduler.

Lo scheduling, cioè l'operazione dello scheduler, può essere realizzato in modi diversi, secondo le modalità che il progettista del sistema sceglie di adottare.

Un obiettivo importante che deve essere perseguito, quando si sceglie un algoritmo di scheduling, è sfruttare al massimo il tempo di esecuzione della CPU,

evitando, nel contempo, che un processo ne monopolizzi l'uso impedendo agli altri processi di progredire.

A Cura di Angelo Carpenzano ( (c)

Funzioni di un SO: gestione dei processi II

Lezione 9

Parte 2 di 4

Riguardo a quest'ultimo aspetto, un SO è detto preemptive (o prelazionato) se lo scheduler può arbitrariamente sottrarre il processore ad un task per assegnarlo ad un altro (ad es. perché quest'ultimo ha una priorità maggiore); altrimenti si parla di scheduling non-preemptive.

Una tecnica di schedulazione molto usata è nota col nome di round robin.

Secondo lo schema round robin ad ogni processo viene assegnato un time slice, ovvero una piccola frazione di tempo (dell'ordine dei millisecondi), durante la quale gli viene aggiudicata totalmente la CPU.

Allo scadere del time slice il clock, ossia l'orologio di sistema che regola la temporizzazione delle operazioni della macchina, invia al processore un'interrupt

(un'interruzione), per indicare che il processo attuale ha occupato l'intero time slice assegnatogli e che è possibile eseguire un nuovo processo.

In base alle politiche attuate dal SO, la CPU esegue un context switch o continua a lavorare con il processo corrente.

Per sfruttare al massimo le potenzialità del sistema, il SO sospende un processo in esecuzione quando esso deve attendere che venga completata una determinata operazione.

A Cura di Angelo Carpenzano ( (c)

Funzioni di un SO: gestione dei processi II

Lezione 9

Parte 3 di 4

Ad es. se un processo deve leggere un file dal disco, passerà un certo tempo prima che i dati attesi dal processo saranno disponibili, a causa dell'elevato

tempo di accesso del disco (rispetto alla scala dei tempi di una CPU).

Sospendendo il processo fino al completamento del trasferimento dei dati, la CPU può essere assegnata ad un processo pronto per essere eseguito, evitando così che essa rimanga inutilizzata.

Dunque, un processo durante la sua esecuzione può trovarsi in diversi stati, che possiamo riassumere sommariamente in tre:

1. in esecuzione (quando il processo sta utilizzando effettivamente la CPU in quell'istante);

2. pronto (quando può essere messo in esecuzione, ma è temporaneamente sospeso per permettere ad un altro processo di eseguire);

3. bloccato (quando non può essere messo in esecuzione finché non accade un evento esterno, ad es. il completamento di un'operazione di I/O).

Generalmente, durante la sua vita, un processo transita continuamente da uno stato all'altro secondo le regole adottate dal SO.

Funzioni di un SO: gestione dei processi II

Lezione 9

Parte 4 di 4

Una transizione interessante è quella dallo stato di bloccato allo stato di pronto, che presuppone che il SO sia in grado di rendersi conto del verificarsi

di un dato evento.

Le soluzioni adottate sono generalmente due:

1. polling

2. interrupt

Con il polling il SO deve periodicamente interrogare i dispositivi di I/O per verificare il loro stato di esecuzione, spendendo tempo di CPU per controllare

tutti i dispositivi della macchina.

Con la tecnica degli interrupt, invece, sono le periferiche ad avvertire il SO quando si verifica un evento che ne cambia lo stato: questa soluzione è la

più efficiente ed è quindi la più usata.

Il meccanismo degli interrupt richiede un hardware opportuno per il controllo dei segnali di interruzione e i sistemi operativi che lo utilizzano (detti

per questo interrupt driven, cioè guidati dagli eventi) mantengono delle strutture software adeguate per riconoscere il tipo di interrupt ed intraprendere

le relative azioni di gestione.

Nella prossima puntata vedremo il sottosistema di gestione della memoria principale.

A Cura di Angelo Carpenzano (c)

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (I)

Lezione 10

Al momento dell’esecuzione ogni programma deve risiedere, almeno in parte, nella memoria centrale.

In un sistema monoprogrammato, questa condizione può essere facilmente soddisfatta imponendo un limite alla dimensione massima che un processo può avere;

soluzione, questa, certamente non elegante e poco efficiente.

La situazione si aggrava nei sistemi multiprogrammati, in cui un numero imprecisato di processi aventi dimensioni variabili possono contemporaneamente contendersi

il processore per l’esecuzione.

La contesa fra i vari processi riguarda naturalmente anche la memoria e il SO deve fornire dei meccanismi per tenere conto delle parti di memoria utilizzate

e di quelle libere, per allocare memoria ai processi quando ne hanno bisogno e deallocarla quando hanno finito, e infine per gestire gli scambi fra la

memoria principale e il disco, quando la memoria non è sufficiente a contenere tutti i processi.

A Cura di

Angelo Carpenzano ( © )

Funzioni di un SO: gestione della memoria principale (I)

Lezione 10

Infatti, con il timesharing, ad un sistema sono normalmente collegati tanti utenti e la memoria non è in grado di contenere tutti i loro processi, rendendo

così necessario scaricarne alcuni su disco.

Per far girare i processi che ad un dato istante risiedono nel disco, è necessario che essi vengano caricati in memoria: l’operazione relativa allo spostamento

di processi dalla memoria al disco e viceversa prende il nome di swapping (scambio) e il modulo del SO che se ne occupa si chiama swapper.

Alcuni sistemi operativi (ad es. Linux) richiedono una partizione dell’hard disk dedicata esclusivamente a questo scopo, mentre altri sistemi (ad es. Windows)

creano ed utilizzano un file particolare (in Windows questo file si chiama Win386.swp e si trova nella directory C:\WINDOWS\).

A Cura di

Angelo Carpenzano ( © )

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (I)

Lezione 10

Per permettere a più processi di risiedere contemporaneamente in memoria, questa viene divisa in partizioni o regioni, ossia porzioni di celle di memoria

contigue, che possono essere di dimensioni fisse o variabili, secondo le scelte fatte da chi sviluppa il sistema.

La maggior parte dei sistemi attuali utilizza partizioni variabili, perché presentano una maggiore flessibilità, resa necessaria dal fatto che i processi

hanno dimensioni molto diverse tra loro e non tutti richiedono la stessa quantità di memoria per poter eseguire.

Inoltre gran parte dei processi cambia dinamicamente la propria dimensione durante l’esecuzione, richiedendo di volta in volta una quantità di memoria variabile

e, spesso, non predicibile.

Occorre notare che, a seguito dello swapping, un processo non occupa sempre le stesse le regioni di memoria, anzi, la cosa più probabile è che ogni volta

che il processo viene rimesso in memoria dal dispositivo di swap (swap device), il SO gli assegnerà regioni differenti, in relazione alla situazione di

occupazione della memoria al momento in cui viene richiesto il caricamento di quel processo.

A cura di

Angelo Carpensano

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (I)

Lezione 10

Riguardo allo spazio di swap, l’allocazione può avere caratteristiche differenti da sistema a sistema: alcuni non allocano spazio sullo swap device fino

a che il processo non viene scaricato e ad ogni scaricamento questo può essere piazzato in una zona diversa del disco; altri sistemi al momento della creazione

del processo gli riservano spazio per lo swap sul disco, cosicché esso occuperà sempre lo spazio che gli è stato assegnato.

In quest’ultimo caso, quando il processo termina lo spazio viene liberato.

Lo swapping puro prevede che il caricamento e lo scaricamento di un processo avvenga per intero.

Esiste però una soluzione alternativa che tiene conto di una caratteristica comune a tutti i processi: ad un dato istante ogni processo esegue utilizzando

solo un sottoinsieme del suo spazio di indirizzamento.

A Cura di

Angelo Carpenzano ( © )

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (I)

Lezione 10

Lo spazio di indirizzamento è l’insieme degli indirizzi di memoria generati da un programma.

Ad un dato istante, un programma in esecuzione utilizza solo gli indirizzi relativi alle istruzioni che esegue in quel momento, per cui si potrebbe pensare

di tenere in memoria solo il sottoinsieme di indirizzi necessario, evitando di occupare la memoria con informazioni non necessarie.

Su questa importante proprietà si basa il metodo della memoria virtuale, di cui discuteremo nella prossima lezione.

A Cura di

Angelo Carpenzano ( © )

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (II)

Lezione 11

Nella scorsa puntata abbiamo accennato al metodo della memoria virtuale: l’idea di base della memoria virtuale è che la dimensione combinata di testo, dati

e stack dei processi può eccedere la quantità di memoria disponibile per essi.

Abbiamo anche notato che, ad un determinato istante, i processi non riferiscono tutto il loro spazio di indirizzamento, ma solo una sua parte: per indicare

questa proprietà si utilizza il concetto di località.

Poiché un processo indirizza celle di memoria contigue in una piccola porzione dello spazio di indirizzamento totale si parla di località spaziale (un caso

che possiamo immaginare è quello in cui un processo sta scorrendo in sequenza gli elementi di un array).

Poiché una stessa cella di memoria può essere riferita frequentemente per un certo intervallo di tempo, si parla di località temporale (ad es. una cella

di memoria viene prima letta e poi scritta).

A Cura di

Angelo Carpenzano (©)

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (II)

Lezione 11

Il SO può allora mantenere in memoria le parti che sono in uso in un certo momento, mentre le altre parti vengono mantenute nello swap device.

Tuttavia occorre notare che il processo cambia località quando passa da una fase dell’esecuzione all’altra, cosicché è necessario cambiare le sue parti

in memoria quando deve accedere a nuovi indirizzi.

La memoria virtuale si sposa molto bene con la multiprogrammazione: mentre un programma aspetta che una sua porzione venga caricata in memoria, è di fatto

in attesa di un’operazione di I/O e non può girare, cosicché il processore può essere assegnato ad un altro processo.

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (II)

Lezione 11

Naturalmente in un sistema di questo tipo, gli indirizzi generati dai programmi non possono riferirsi direttamente alla memoria, perché durante l’esecuzione

di un processo la memoria viene dinamicamente allocata e deallocata, per permettere di caricare e scaricare le porzioni degli spazi di indirizzamento usate

dai processi in memoria.

Per questo motivo gli indirizzi generati dai programmi vengono detti indirizzi virtuali e formano lo spazio di indirizzamento virtuale.

Gli indirizzi virtuali, anziché essere inviati direttamente alla memoria - come succede nei sistemi che non hanno la memoria virtuale -, vengono inviati

ad un’unità hardware, detta MMU (Memory Management Unit – unità di gestione della memoria), che trasforma gli indirizzi virtuali in indirizzi della memoria

fisica.

Possiamo pensare alla MMU come ad una funzione che riceve un parametro d’ingresso (l’indirizzo virtuale) e dà in uscita un valore (l’indirizzo fisico).

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (II)

Lezione 11

Lo spazio di indirizzamento virtuale viene suddiviso in unità chiamate pagine e le corrispondenti unità nella memoria fisica vengono dette pagine fisiche.

Pagine e pagine fisiche hanno la stessa dimensione e i trasferimenti da e verso il disco vengono effettuati sempre in unità di una pagina.

Quando la MMU riceve un indirizzo virtuale, essa calcola il numero della pagina alla quale appartiene: se essa è presente in memoria, la MMU estrae il corrispondente

numero della pagina fisica e l’indirizzo fisico corrispondente all’indirizzo virtuale; se la pagina non è in memoria viene invocato un page fault (fallimento

di accesso alla pagina), con il quale il controllo viene passato al SO che si occupa di recuperare al pagina dal disco.

Questo metodo di gestire la memoria pone una complessa problematica che deve essere accuratamente esaminata e risolta da chi progetta un SO.

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria principale (II)

Lezione 11

Innanzitutto la scelta della dimensione delle pagine è un fattore molto importante, perché da essa derivano le dimensioni delle strutture dati adibite alla

gestione della memoria.

Inoltre la traduzione di un indirizzo virtuale in un indirizzo fisico è un’operazione che ricorre ad ogni accesso in memoria, quindi, proprio per l’elevata

frequenza con la quale deve essere eseguita questa operazione, è necessario che la traduzione avvenga velocemente.

Quando si verifica un page fault il SO deve scegliere una pagina da rimuovere dalla memoria principale per far posto a quella che deve essere caricata;

occorre perciò scegliere un efficiente algoritmo che consenta di minimizzare i page fault futuri causati dalla rimozione di una pagina.

Questi sono solo alcuni dei problemi che un progettista di SO incontra nel progetto del modulo di gestione della memoria, anche se spesso è aiutato da un

hardware creato per supportare efficientemente una scelta piuttosto che un’altra.

A Cura di

Corso di Sistemi Operativi

Gestione del file system

Lezione 12

Parte 1 di 5

Uno degli aspetti che più interessano l’utente di un SO è la possibilità di memorizzare permanentemente (anche per decenni) le proprie informazioni e che

sia possibile reperirle facilmente in un secondo momento.

A tal riguardo, i requisiti essenziali che vengono richiesti ad un SO sono tre:

1. possibilità di memorizzare grandi quantità di informazioni;

2. conservazione i dati anche dopo la terminazione del processo che li ha creati;

3. possibilità per più processi di accedere concorrentemente a tali informazioni.

Per raggiungere questi obiettivi la soluzione comune adottata da tutti i SO è quella di registrare i dati su dischi e altri supporti esterni, in unità dette

file (termine inglese che vuol dire archivio).

Il sottosistema del SO che si occupa della gestione dei file è detto File Management System (FMS).

I file di un sistema, inclusi quelli che servono al suo stesso funzionamento, sono raccolti in una struttura detta file system, che ha il compito di presentare

agli utenti un’interfaccia semplice e immediata per accedere ai dati.

A Cura di

Corso di Sistemi Operativi

Gestione del file system

Lezione 12

Le caratteristiche e l’organizzazione di un file system variano da un sistema ad un altro, ma presentano, complessivamente, dei punti in comune:

- I file sono un meccanismo di astrazione, cioè offrono un modo per memorizzare e recuperare dati su un disco, senza che l’utente debba preoccuparsi del

modo in cui tale servizio viene realizzato.

- Un processo che crea un nuovo file gli assegna un nome, permettendo ad altri processi di utilizzare quel nome per accedere alle informazioni che esso

contiene.

- Ad ogni file è associato un gruppo di attributi, come il nome del file, la data e l’ora di creazione, la data e l’ora dell’ultimo accesso, la data e l’ora

dell’ultima modifica, la dimensione, il proprietario, un flag di sola lettura (per indicare se è possibile leggere/scrivere il file o se è consentita la

sola lettura), un flag di sistema (per indicare se è un file utente normale o un file di sistema), un flag “nascosto” (per indicare se è un file da non

visualizzare nel listato del file system), campi di protezione e tanti altri.

A Cura di

Corso di Sistemi Operativi

Gestione del file system

Lezione 12

- Il file system viene generalmente organizzato in una struttura ad albero, per mezzo di opportuni contenitori chiamati directory, che possono raccogliere

al loro interno file e altre directory.

- Vengono fornite dal SO una serie di operazioni per creare, cancellare, leggere, scrivere e rinominare file e directory, nonché operazioni per leggerne

e/o scriverne gli attributi.

Sebbene questi ed altri meccanismi siano forniti da tutti i sistemi operativi, vi sono delle differenze significative.

Alcuni sistemi, come MS-DOS, nominano i file mediante un meccanismo di estensione, cioè dividono il nome del file in due parti separate da un punto, dando

un significato particolare alla parte del nome che segue il punto.

A Cura di

Corso di Sistemi Operativi

Gestione del file system

Lezione 12

Ad es. un file chiamato prog.c rappresenta, per sistemi che adottano questa convenzione, un programma sorgente scritto in linguaggio C.

Altri sistemi, come UNIX, lasciano all’utente piena libertà sul nome da assegnare, permettendo che il nome di un file abbia più estensioni; ad es. prog.c.tgz

può essere utilizzato per nominare un file sorgente C compresso.

Inoltre il numero ed il tipo di attributi che un file può avere dipendono fortemente dal SO.

Ad es. i sistemi Windows 9x e Me, che adottano un file system basato su MS-DOS, noto come FAT, non associano dei campi di protezione ai file, che così possono

essere acceduti da chiunque.

Invece i sistemi Windows NT e 2000 (che adottano il file system denominato NTFS) e quelli basati su UNIX, come Linux, FreeBSD, Solaris e altri, associano

ad ogni file dei bit di protezione, ad es. distinguendo tra l’utente proprietario, il gruppo di utenti del proprietario e tutti gli altri utenti del sistema

(questi concetti verrano chiariti nelle lezioni successive).

A Cura di

Corso di Sistemi Operativi

Gestione del file system

Lezione 12

Altra importante differenza è l’implementazione delle directory.

Tipicamente una directory contiene un certo numero di elementi, uno per ogni file e directory in essa contenuti.

Prima che un utente possa accedere ad un file, il SO deve esaminarne gli attributi per decidere se rendere possibile o meno l’accesso e per aggiornarne

alcuni, come ad es. la data e l’ora dell’ultimo accesso.

Il progettista di un SO può scegliere di memorizzare gli attributi del file nell’elemento corrispondente della directory oppure in altre strutture indirizzate

da quell’elemento (v. figura).

Nella prossima puntata vedremo come un SO gestisce la memoria secondaria.

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria secondaria e dell’I/O

Lezione 13

Parte 1 di 5

Nelle scorse puntate abbiamo visto che, per rendere possibile la multiprogrammazione e il timesharing, si ricorre ad una gestione della memoria principale

che utilizza intensamente la memoria secondaria, con continui spostamenti di dati e programmi da e verso lo swap device.

Data l’elevata frequenza con cui viene richiesto questo trasferimento di informazioni, per gestire efficacemente un ambiente di questo tipo, un SO deve

offrire prestazioni elevate, riducendo al minimo il sovraccarico (overhead) dovuto a queste operazioni.

Per ottimizzare questi meccanismi, il SO deve fornire le seguenti funzionalità:

- tener conto dello spazio occupato sul disco e di quello inutilizzato;

- allocare spazio ai processi che lo richiedono e deallocarlo quando può essere liberato;

- schedulare le operazioni del disco rispetto a più richieste provenienti da processi utente e di sistema.

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria secondaria e dell’I/O

Lezione 13

Un problema interessante che caratterizza fortemente un sistema è l’implementazione del file system, cioè il modo in cui vengono memorizzati file e directory,

e in particolare come vengono associati i blocchi di disco a ciascun file.

Il più semplice schema di allocazione prevede che ogni file sia costituito da blocchi contigui di dati sul disco.

In questo modo è più semplice tenere traccia della collocazione dei blocchi relativi ad un file (basta memorizzare l’indirizzo del primo blocco e la dimensione

dei dati) e l’accesso alle informazioni è più efficiente, perché è possibile leggere l’intero file con una sola operazione.

Tuttavia non è realizzabile, perché difficilmente si conosce a priori la grandezza massima di ogni file; inoltre porta ad una frammentazione del disco,

dovuta allo spreco di spazio che potrebbe essere utilizzato altrimenti.

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria secondaria e dell’I/O

Lezione 13

Quest’ultimo problema potrebbe risolversi con la compattazione, o deframmentazione, che risulta spesso proibitivamente lunga e costosa (in termini di risorse

di sistema).

Le soluzioni più diffuse ricorrono ad un’allocazione a lista concatenata, in cui i blocchi associati ad un file sono sparpagliati nel disco.

Ogni blocco può contenere un puntatore al blocco successivo, oppure si può ricorrere ad una tabella, chiamata FAT (file allocation table) che contiene,

in ordine, i puntatori ai blocchi di disco costituenti il file e che deve essere costantemente mantenuta in memoria.

Utilizzare una lista concatenata di blocchi permette di non perdere spazio a causa della frammentazione del disco, ma, rispetto all’allocazione contigua,

rallenta l’accesso ai file.

Un ulteriore metodo per tenere traccia dei blocchi appartenenti ad un file consiste nell’associare a ogni file una piccola tabella, detta i-node, che elenca

gli attributi e gli indirizzi dei blocchi del file.

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria secondaria e dell’I/O

Lezione 13

Questo schema, utilizzato in UNIX e nei suoi “derivati”, è molto flessibile e consente di avere una frammentazione del disco praticamente nulla.

Accenniamo adesso ad un’altra utile funzione dei SO, la gestione dell’I/O, il cui scopo è quello di nascondere sia all’utente che al sistema, le caratteristiche

dei dispositivi di input/output.

Nel sottositema di I/O possiamo trovare essenzialmente tre elementi:

- gestione della memoria, per ottimizzare gli scambi di informazioni tra la memoria centrale e i dispositivi;

- una collezione di driver associati ai vari dispositivi del sistema, contenenti tutte le caratteristiche che dipendono dall’hardware;

- presentazione di un’interfaccia generica, che permette ai programmatori di utilizzare in maniera uniforme i driver dei dispositivi.

A Cura di

Corso di Sistemi Operativi

Funzioni di un SO: gestione della memoria secondaria e dell’I/O

Lezione 13