Basi di dati II, primo modulo (ordinamento 270/2004)
Anno accademico 2009-2010
Progetti e homework
Progetti
Sono finalizzati alla preparazione allo scritto, ma obbligatori.
Sono costituiti da due parti
- Sperimentare le strutture fisiche di un DBMS, definendo alcune relazioni
(ad esempio tre) e alcune interrogazioni (due o tre) che prevedano selezioni,
proiezioni e join. Utilizzare relazioni di dimensioni sufficientemente grandi da
rendere conveniente l'uso degli indici (si suggerisce di generare, con opportuni
progammi, dati sintetici casuali). Mostrare, con riferimento al DBMS scelto (DB2,
PostgresSQL, Oracle, etc.) il comportamento del sistema (in termini di piano di esecuzione
delle interrogazioni), in presenza e assenza di indici e prima e dopo l'aggiornamento
delle statistiche.
Sintetizzare il tutto in una relazione di alcune pagine (con allegati i test),
che permetta di comprendere il lavoro svolto e i risultati ottenuti.
- 7/05/2010 -
Sperimentare strumenti per il data warehousing. In particolare, si propone di
generare alcuni dei report citati nel terzo homework,
utilizzando gli strumenti della suite Pentaho e
precisamente Pentaho
Report Designer (versione attuale 3.6.0, disponibile per i vari ambienti,
linux-solaris-bsd, mac e windows).
Si consiglia di procedere nel modo seguente:
- Scaricare e installare lo strumento
- Sviluppare un semplice esempio seguendo la guida incorporata nello strumento stesso
(attraverso la voce "Help" della toolbar e la relativa sottovoce "Documentation").
- Svolgere il progetto richiesto secondo i seguenti passi (indicazioni preliminari,
saranno precisate presto):
-
Progettare gli schemi dimensionali (a stella) opportuni, come già richiesto
ai fini dell'homework
-
Studiare la base di dati sorgente
(20/05/2010, aggiornata 21/05; i quattro file contengono
script per creazione in DB2, creazione in HSQLDB, popolamento, cancellazione dei dati;
le operazioni di creazione possono aver bisogno di modifica in sistemi diversi)
-
Popolare gli schemi dimensionali (in una base di dati relazionale, su un DBMS a
scelta, cui lo strumento di reportistica accederà) attraverso opportune
trasformazioni della base di dati sorgente.
-
Definire, per ogni report, l'interrogazione SQL su cui si dovrà basare.
- Definire ed eseguire i report.
Viste le caratteristiche del progetto proposto, si consiglia di iniziare al più presto,
discutendo le varie problematiche sul forum, al fine di superare le difficoltà che
sicuramente si presenteranno.
Si segnala che l'obiettivo è soprattutto quello della comprensione del processo
e degli aspetti metodologici più che di quelli tecnici dello strumento.
Gli aspetti metodologici saranno utili ai fini delle prove d'esame.
Alcuni commenti (20/05/2010)
Novità (18/06/2010)
Sintetizzare il tutto in una relazione (10-15 pagine al massimo)
che illustri il lavoro svolto (ad esempio con riferimento
ai passi 1-5 sopra citati, mostrando cioè gli schemi dimensionali,
lo schema logico della base sorgente,
le trasformazioni utilizzate per popolare gli schemi dimensionali,
le interrogazioni su cui i report sono basati e i risultati dei report stessi).
Limitarsi agli aspetti essenziali: non servono molti commenti, se non per le scelte negli schemi
dimensionali e per le trasformazioni; il resto, schemi, interrogazioni e report, dovrebbe
essere autoesplicativo.
Vanno svolti preferibilmente in gruppi di due o tre persone e
consegnati in forma cartacea al momento dello
scritto finale o della seconda prova parziale (per gli studenti
di Basi di dati II che la sosterranno; chi intende sostenere la prima
prova parziale è opportuno che svolga prima di essa
almeno la prima parte del progetto, ma non verrà
effettuata al riguardo alcuna verifica).
Il lavoro può essere svolto in gruppo, ma gli esperimenti debbono essere,
almeno in parte, individuali.
Nota bene
Gli studenti che debbono sostenere l'esame di Tecnologia delle basi di dati
dell'ordinamento 509/1999 debbono fare riferimento alle
modalità previste
negli anni scorsi
Homework
Sono facoltativi ma è estremamente importante svolgerli
(e anche discuterli ad esempio sul forum), perché
le domande proposte
nei compiti di esame possono essere molto simili.