|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Università degli
Studi di Palermo Corso di laurea in Scienze
Statistiche ed Economiche
Relatore : Prof. Gianfranco Lovison Tesi di Laurea di
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Capitolo 6 - Presentazione dei risultati
Nel presente capitolo vengono esposti i risultati dell’indagine statistica sperimentale sull’utilizzo del World Wide Web in Italia. Dopo una breve panoramica sull’andamento degli accessi che ha caratterizzato il sito ospite durante l’intero periodo delle rilevazione, verrà presentato il profilo di tutte le unità contattate: rispondenti e non rispondenti. Questa analisi è stata realizzata grazie alle variabili rilevate automaticamente dalla CGI ed ha permesso, inoltre, di individuare la rete nazionale dei collegamenti all’indagine, le modalità di accesso al questionario, la distribuzione delle visite per mese, giorno delle settimana e fascia oraria e, infine, i browsers ed i sistemi operativi principalmente utilizzati da tutti i soggetti. Dopo aver introdotto le definizioni di base relative al trattamento dai dati mancanti, si dimostrerà che un test sulla natura MCAR delle mancate risposte equivale ad un test di omogeneità delle distribuzioni di rispondenti e non rispondenti rispetto alle variabili di cui si dispone per tutte le unità; verrà quindi saggiata l’assunzione MCAR sui dati raccolti, mostrando così che è possibile generalizzare i risultati ottenuti all’intero insieme di soggetti arrivati alle pagine Web dell’indagine, indipendendemente dal fatto che abbiano o meno risposto. A seguire si presenterà un quadro descrittivo dei risultati dell’inchiesta, avendo cura di confrontare la situazione emersa per l’Italia con altri dati disponibili e relativi sia al nostro Paese sia al resto del mondo; dai vari confronti con analoghe indagini sugli utenti Internet, in modo particolare con le indagini on-line dell’Università di Catania e dell’Università della Georgia, nonchè con l’indagine di Demoskopea, si avrà modo di constatare che, così come già evidenziato in passato da altri ricercatori (Nielsen, 1995; Pitkow, 1996; SRI, 1996), gli utenti che partecipano alle indagini on-line sembrano differire, sotto alcuni aspetti, da quelli intervistati telefonicamente e selezionati tramite uno screening preliminare effettuato su tutte le unità di un campione probabilistico. Nella fase conclusiva del capitolo vengono esposti i risultati derivanti dall’adattamento di modelli log-lineari, il cui scopo è stato quello di individuare le relazioni che intercorrono tra le principali variabili che influenzano le modalità di utilizzo di Internet, in particolare quelle demografiche, e le variabili che identificano le preferenze, i problemi percepiti e le modalità di accesso alla Rete.
La Tabella 6.1 mostra alcuni parametri che permettono di apprezzare il traffico registrato sul server sul quale si è svolta l’indagine, quali il numero di richieste inoltrate ed i distinti host serviti nei mesi delle rilevazione (dal Agosto a Novembre) e nel successivo mese di Dicembre. Come si può apprezzare dalla Tabella, il numero delle richieste inoltrate al server ha presentato un andamento crescente, da Agosto ad Ottobre, che come si vedrà nella Tabella successiva è imputabile principalmente allo svolgimento dell’indagine on-line. Il traffico ha poi subito un declino a Novembre, in concomitanza con la fine dell’indagine.
Tabella .1 - Traffico registrato dal server durante e dopo il periodo di indagine Nella Tabella 6.2 viene invece riportata la distribuzione di frequenza delle categorie di pagine consultate da tutti i visitatori del sito ospite. La singola "visita", contenente tutte le pagine richieste da un determinato utente, successivamente aggregate in categorie, è stata individuata tramite l’analisi dei log files (nel modo illustrato nel cap.4). In totale, durante l’intero periodo dell’indagine, sono pervenute al sito ospite 21.597 visite; in ognuna di esse l’utente ha potuto consultare più pagine appartenenti anche a più categorie, che dunque non sono mutuamente esclusive; la distribuzione marginale riportata in Tabella indica la frequenza con la quale ogni categoria è stata consultata, a prescindere dal numero di pagine richieste. Questo schema offre quindi una visione d’insieme sulle preferenze dei visitatori: la categoria contenente il monitoraggio quotidianamente aggiornato delle banche italiane in Rete, si è rivelata essere una delle zone del sito maggiormente visitate; risultato, questo, del tutto prevedibile per via dell’elevato numero di links che puntano proprio verso quella pagina, tramite la quale, si ricorda, era possibile accedere al questionario. La categoria assegnata all’indagine sperimentale ha registrato una frequenza di accesso estremamente elevata e del tutto analoga alla precedente.
Tabella .2 - Categorie di pagine del sito ospite visitate durante l’indagine
Il cartogramma della Figura 6.1, più che evidenziare la dislocazione geografica dei siti con accesso al questionario, dettaglio irrilevante se si riflette sul fatto che l’ipertestualità del Web annulla ogni distanza ed ogni riferimento geografico, trova la sua importanza nel mettere in evidenza il livello di partecipazione all’iniziativa da parte di società ed università italiane. Com’è ben visibile, in quasi ogni regione vi sono state delle entità con presenza su Internet che hanno scelto di collaborare pubblicando un collegamento ipertestuale all’indagine, con un addensamento maggiore nelle regioni del centro-nord. Sono invece restate del tutto escluse Molise, Umbria e Valle d’Aosta.
Figura .1 - Numero di collegamenti all’indagine per regione
Le modalità di accesso all’indagine on-line dipendono fondamentalemente dal tipo di sponsonsorizzazione realizzata. Nella Tabella 6.3 si può notare come circa il 70% dei soggetti arrivati al sito Web abbia seguito un link ipertestuale: il 15% ha trovato il collegamento consultando le pagine del sito ospite della Banca di Credito di Trieste, mentre il 53,1% è arrivato per mezzo di altri siti con dominio di primo livello "it". Questo risultato deriva appunto dalla fitta rete di collegamenti ottenuta grazie alla collaborazione di varie entità.
Tabella .3 - Modalità di accesso all’indagine (referer)
Figura .2 - Modalità di accesso all’indagine Di minore importanza si è invece rilevata l’introduzione dell’URL dell’indagine in vari motori di ricerca, in prevalenza con estensione ".com", tramite i quali è arrivato solo l’1,3% degli utenti. Sempre nell’ambito dei domini transnazionali, l’1,1% dei soggetti che ha partecipato allo studio è invece venuto a conoscenza dell’indagine, scegliendo poi di seguire il collegamento, da siti con estensione ".net", mentre solo 3 utenti hanno trovato un link in siti con dominio ".org". Per mezzo delle varie recensioni e segnalazioni in alcune riviste del settore, nonchè tramite gli annunci su mailing list e, in generale, tramite posta elettronica, il 24,6% degli utenti, una volta informato dell’indagine in corso, ha digitato direttamente l’URL, tramite tastiera, nel proprio browser. Infine, in 28 casi, individuati nella Tabella con la modalità "file", gli utenti sono arrivati al questionario (o al comunicato stampa e, solo successivamente, al questionario), tramite un link presente in una propria pagina HTML registrata in un qualche tipo di supporto magnetico. Relativamente ai 2370 siti di provenienza con dominio "it", è possibile specificare più in dettaglio la tipologia, così come appare nella Tabella 6.4: più della metà degli utenti provenienti da tali siti, il 54,9%, ha trovato un link all’indagine tra le pagine di un provider (net), mentre il 17,4% ed il 16,1% hanno trovato il collegamento, rispettivamente, in siti di tipo commerciale (com) e siti universitari (edu). Solo 6 utenti sono arrivati per mezzo di siti di organizzazioni no-profit (org). La Tabella 6.5 mostra invece in dettaglio l’esatta entità dei siti Web italiani che hanno permesso l’auto-selezione di almeno 15 unità. Il sito da cui è arrivato il più elevato numero di utenti è un Internet provider di Varese, SkyLink BBS; sempre di Varese è il sito Web della Società Astronomica Schiaparelli che ha dato anch’essa un contributo notevole, mentre le città e le tipologie dei successivi siti Web sono molto diverse tra loro.
Tabella .4 - Tipologia dei siti con dominio "it" e con collegamento all’indagine
Figura .3 - Tipologia dei siti con dominio "it" e con collegamento all’indagine
Tabella .5 - Siti italiani che hanno permesso l’auto-selezione di almeno 15 unità
Le unità che complessivamente si sono auto-selezionate, dunque la totalità degli utenti arrivati al sito dell’indagine, sono state 4465, di cui 1685 rispondenti e 2780 non rispondenti.
Tabella .6 - Composizione delle 4465 unità auto-selezionate In particolare, dalla Tabella 6.6 si può osservare come dei 2780 non rispondenti, 158 (il 5,7%) abbiano cercato di inviare il questionario e partecipare all’indagine, ma dopo qualche errore nella compilazione non hanno continuato nell’intento. I restanti 2622 utenti, al contrario, non hanno fatto nessun tentativo di compilazione e le informazioni relative a questa ultima categoria di utenti, rilevate tramite un particolare utilizzo della CGI, rappresentano una importante peculiarità dell’indagine on-line sperimentale. Infine, anche per i rispondenti può essere ottenuto un dettaglio analogo: di questi, 1128 (il 67%) hanno inviato correttamente il questionario nel primo tentativo, mentre 457 (33%) hanno commesso un qualche tipo di errore, corretto poi negli invii successivi. Nell’analisi non vengono inclusi gli utenti che hanno visitato solo la pagina del comunicato stampa e che non sono entrati nel questionario.
In considerazione della possibilità di disporre, per tutte le unità con dominio "it", di ulteriori variabili sulla natura dell’host (classe, categoria NASA e zona geografica), una distribuzione marginale di notevole rilievo è quella della Tabella 6.7 e riferita alla classificazione dei domini di primo livello.
Tabella .7 - Dominio di primo livello delle unità campionarie L’87% degli utenti contattati ha realizzato il collegamento tramite un’entità con dominio registrato presso il GARR e, per essi, è stato possibile ampliare le informazioni sull’host di origine (cfr.par. 6.5.2.). Il 4% dei domini è risultato sconosciuto poichè non è stato possibile trovare il reverse dell’indirizzo IP, mentre i rimanenti 279 domini di primo livello diversi da "it" (9%) possono essere ulteriormente suddivisi in due categorie: domini transnazionali del tipo .com, .edu, ecc., la cui distribuzione viene esposta nella Tabella 6.8, e quelli che fanno riferimento al codice ISO 3166 e che, per tanto, identificano un Paese.
Tabella .8 - Domini di primo livello transnazionali La successiva Tabella 6.9 mostra la distribuzione di rispondenti e non rispondenti per dominio di primo livello ISO 3166, tramite la quale è interessante notare come l’indagine on-line consenta, a costi indipendenti dalla distanza geografica, di sondare le opinioni di soggetti residenti in varie parti del mondo. Si veda, a tal proposito, anche la Figura 6.4.
Tabella .9 - Domini di primo livello non italiani con codice ISO 3166
Figura .4 - Paesi delle unità con dominio diverso da "it"
Figura .5 - Dislocazione geografica delle unità (base: domini "it")
La disponibilità di informazioni supplementari sui domini di primi livello "it" ha permesso di realizzare delle analisi più specifiche per gli utenti appartenenti a questa categoria. Il cartogramma della Figura 6.5 mostra la dislocazione geografica degli host dei rispondenti. Nell’interpretazione del grafico è necessario comunque tener in mente quanto precisato nel quarto capitolo, relativamente alla non sempre verificabile corrispondenza tra la collocazione geografica dell’host e quella effettiva dell’utente, soprattutto in relazione ai grandi providers con POP sparsi in tutta Italia. Dalla cartina si deduce una più elevata concentrazione nelle regioni del nord, sebbene le unità interessate all’indagine provengano da quasi ogni parte della penisola. Un importante elemento di valutazione nella caratterizzazione delle unità contattate deriva dalla classificazione dei rispettivi domini in classi analoghe a quelle assegnate ai domini transnazionali, così come è già stato fatto precedentemente per i siti di provenienza (referer). Come mostrato nella Tabella 6.10 e nella Figura 6.6, il 70% degli utenti partecipanti all’indagine ha realizzato il collegamento tramite un Internet provider. Tali utenti possono essere sia privati sia appartenenti a società od organizzazioni che non hanno ritenuto opportuno registrare un proprio dominio. Il 13% degli utenti sono invece caratterizzati da un dominio di tipo universitario, mentre l’11% si sono collegati per mezzo di un’entità commerciale. Il 3,4% ha potuto partecipare all’indagine usufruendo di un collegamento di una istituzione pubblica, mentre solo 25 utenti, pari allo 0,6% del totale, si sono connessi tramite un’organizzazione o un’associazione di un qualche tipo. E’ bene ricordare che questo tipo di informazioni nulla possono dire sull’attività realmente svolta dall’utente all’interno dell’organizzazione tramite la quale si collega, nè sul luogo da cui è avvenuto il collegamento. Relativamente ai soli rispondenti, ai quali sono state richieste queste ulteriori informazioni, sarà invece possibile caratterizzare ulteriormente le classi in cui sono stati suddivisi i domini di tipo "it".
Tabella .10 - Classe dell’host
Figura .6 - Classe dell’host Dalla Tabella 6.11 risulta evidente un maggiore addensamento al nord per tutte le classi di domini, sebbene le frequenze degli utenti collegati tramite providers rimangano elevate anche nelle rimanenti grandi aree geografiche. Questo risultato, se da una parte mostra la forbice nord-sud nell’utilizzo di Internet da parte di aziende private e all’interno delle università, dall’altra permette di notare che tale divario si presenta con un’enfasi più attenuata con riferimento all’utenza privata che si collega in dial-up, la quale può ormai usufruire di punti di accesso che ricoprono quasi tutti i distretti telefonici italiani.
Tabella .11 - Classe per area geografica dell’host Poichè la categoria "net" comprende sia gli utenti privati sia, in parte, anche le società che si appoggiano ai providers, la caratterizzazione di tale classe, al contrario delle altre, non si presta ad una interpretazione univoca e sarà dunque opportuno cercare di ottenere degli ulteriori elementi di valutazione. Nella Tabella 6.12 viene invece presentata la distribuzione marginale della categoria merceologica NASA, tramite la quale specificare ulteriormente la tipologia degli host.
Tabella .12 - Categoria NASA
Figura .7 - Categoria NASA La categoria 17 si riferisce al settore dell’istruzione e dell’editoria, la 26 alle società che offrono attrezzature da ufficio e cancelleria (dunque anche vendita di computers e hardware in generale), la 27 al settore della telematica ed informatica e, infine, la categoria 31 è quella che comprende enti e società di servizi. La distribuzione congiunta tra classe dell’host e categoria NASA permette dunque di specificare più in dettaglio la tipologia dei domini (Tabella 6.13).
Tabella .13 - Categoria Nasa per Classe
Come si può osservare dalla Figura 6.8, dopo i primi giorni successivi all’inizio dell’indagine, in cui si sono raggiunti anche i 60 accessi giornalieri, in tutto il mese di Agosto si è avuta una bassa affluenza, mentre nei mesi di settembre ed ottobre si è concentrato il maggior numero di accessi (Tabella 6.14).
Tabella .14 - Unità auto-selezionate per mese di rilevazione
Figura .8 - Andamento giornaliero degli accessi al questionario Relativamente alla distribuzione degli accessi per giorno della settimana, invece, dai totali per riga della Tabella 6.15 appare evidente come nei giorni lavorativi si sia concentrato il maggior numero di visite all’indagine, mentre il sabato, ed in particolar modo la domenica, si è sempre registrato un leggero calo.
Tabella .15 - Giorno della settimana di accesso per classe dell’host (base: domini "it") La distribuzione congiunta degli accessi per giorno della settimana e tipologia degli host fa notare come il decremento degli accessi nei giorni festivi sia imputabile principalmente agli utenti che accedono tramite organizzazoni commerciali, istituzioni pubbliche e, soprattutto, università, mentre gli accessi provenienti tramite providers non subiscono alcun calo particolare durante il fine settimana.
Uno degli obiettivi dell’indagine consiste nell’individuazione della fascia oraria preferita dagli utenti per la realizzazione del collegamento ad Internet. Per l’ottenimento di questa informazione, oltre alle risposte al relativo quesito inserito nel modulo on-line, è possibile analizzare anche l’orario effettivo di accesso al questionario rilevato automaticamente su tutte le unità. Tramite la successiva tavola a doppia entrata (Tabella 6.16) è possibile individuare le fascie orarie di accesso suddivise per classe dell’host. Nell’ambito della classe "net" si nota come una consistente fascia di utenza abbia realizzato il collegamento tra le 22 e le 7 del mattino, a dimostrazione del fatto che di questa categoria fanno parte molti utenti privati che, dovendo collegarsi da casa tramite modem, preferiscono farlo negli orari in cui le tariffe sono più convenienti; sempre in riferimento alla classe "net" è poi possibile supporre che gli accessi realizzati nelle ore del mattino e del primo pomeriggio siano, invece, quelli effettuati prevalentemente dalle società.
Tabella .16 - Fascia oraria di accesso al questionario per classe dell’host (base: domini "it") Al contrario, all’interno delle rimanenti classi, nella maggior parte dei casi le frequenze più elevate si riferiscono all’orario lavorativo.
Il 96,6% degli utenti contattati utilizza, per la navigazione in Rete, il browser Netscape Navigator (Tabella 6.17). Tale stima appare più elevata rispetto ai dati forniti da vari altri studi (Zona Research, 1996; Interse Webtrends, 1996; Inteco, 1996), dai quali emerge soprattutto una percentuale di utilizzo del browser della Microsoft, Internet Explorer, maggiore rispetto a quella ottenuta nell’indagine on-line descritta in questa tesi.
Tabella .17 - Browsers utilizzati In funzione delle diverse potenzialità permesse dalle varie versioni del browser della Netscape, è interessante notare che l’86,3% degli utilizzatori di Navigator disponevano già di una versione superiore alla 2.0. Infine, per quanto riguarda il sistema operativo, nell’82% dei casi è stato rilevato l’utilizzo di Microsoft Windows, in una delle sue varie versioni; in particolare, Windows 95 è stato utilizzato da poco più dalla metà di tutti i 4465 utenti (51%). Gli utilizzatori di Machintosh, invece, sono risultati essere solo l’8%.
Le indagini on-line, negli approcci usualmente adottati di cui si è discusso, soffrono di una evidente limitazione: si è nell’impossibilità di realizzare un campionamento probabilistico e, dunque, di utilizzare le tradizionali tecniche di inferenza statistica. Nell’indagine on-line sperimentale qui illustrata, in virtù della possibilità di usufruire di variabili sia sui rispondenti sia sui non rispondenti, all’impossibilità di ricorrere ad un campionamento probabilistico si è tentato di far fronte tramite uno studio del processo di auto-selezione delle unità, inquadrato nell’ambito del trattamento dei dati mancanti. Usualmente i problemi legati alla presenza di valori mancanti nelle indagini campionarie su popolazioni finite vengono indicati con il nome di "problemi di mancata risposta"; in maggiore o minore misura, infatti, in tutte le rilevazioni avviene che una parte delle unità intervistate non venga reperita, si rifiuti di collaborare o, comunque, non fornisca tutte le notizie richieste. Nell’ambito delle indagini on-line, invece, la "non-risposta" identifica la circostanza in cui un’unità, una volta venuta a conoscenza dell’indagine e posta in condizione di poter compilare ed inviare il questionario, decide di non farlo. In tale contesto, un test che permetta di saggiare l’assunzione MCAR (Missing Completely At Random), ovvero l’ipotesi che i dati mancanti relativi alle unità non-rispondenti non dipendano nè dai valori assunti dalle variabili osservate per i rispondenti e soggette ad analisi, nè dai valori che tali dati mancanti avrebbero assunto se fossero stati osservati, può consentire di estendere i risultati ottenuti sui rispondenti ad un insieme di utenti più ampio e, conseguentemente, rendere maggiormente valido il metodo di indagine on-line ed i relativi risultati. E’ dunque opportuno ricordare inizialmente le definizioni relative alle diverse tipologie di dati incompleti e le caratteristiche del meccanismo generatore dei dati mancanti, con riferimento alla tradizionale classificazione proposta da Rubin (1976), per passare successivamente all’applicazione del test. Indicando con
un modello "pieno" per i dati ed il meccanismo
generatore specifica una distribuzione Considerato che la matrice per tutti gli I valori osservati, invece, si diranno "observed at random" (OAR) se è soddisfatta la relazione:
per tutti gli Rubin definisce, infine, i valori mancanti "missing completely at random" (MCAR) se: per tutti gli Tra quelle considerate, la MCAR è la condizione più forte per la definizione di uno schema di dati incompleti poichè implica necessariamente il soddisfacimento sia della MAR che della OAR. I vettori di parametri In molte analisi statistiche con dati mancanti viene fatta l’assunzione MCAR. In realtà, riguardo alla possibilità di saggiare statisticamente l’ipotesi che i valori mancanti presenti in uno schema di dati siano MCAR o MAR, non esistono attualmente delle procedure di tipo generale e test formali di questo tipo non hanno ricevuto molta attenzione. Quando i dati mancanti si riferiscono ad una singola
variabile Nel suo programma BMDP8D, Dixon (1983) estende tale approccio nel caso di dati multivariati. Per ognuna della p variabili con valori mancanti il campione viene suddiviso in due gruppi, i casi in cui la variabile è osservata ed i casi in cui non lo è, e le medie delle rimanenti variabili osservate nei due gruppi vengono poste a confronto tramite il test t. Differenze significative tra le medie evidenziano che i dati non soddisfano l’assunzione MCAR. Questa procedura richiede però (p-1) test per ognuna delle variabili disponibili e p(p-1) statistiche t per poter verificare l’ipotesi MCAR. Infine, la procedura indicata da Little (1988) si propone uno scopo analogo, con il vantaggio di utilizzare una sola statistica test legata asintoticamente alla distribuzione c2.
Si consideri il caso in cui si hanno due sole variabili categoriali, A e B, in cui la prima è rilevata su tutte le unità (rispondenti e non rispondenti), mentre la seconda è rilevata solo sui rispondenti. In tale circostanza possono ottenersi due tabelle, una contenente le frequenze ottenute dall’osservazione di entrambe le variabili ed una contenente le frequenze della sola variabile A. La particolare configurazione assunta dai dati, disposti secondo uno "schema monotòno", viene illustrata nella Figura 6.9.
Figura .9 - Schema di dati monotòno con A più osservata di B Questa situazione può ovviamente essere generalizzata
al caso in cui si hanno In questo contesto, un test per l’assunzione MCAR su dati categoriali può essere basato sulle statistiche test proposte da Fuchs (1982) per l’adattamento di un qualsiasi modello log-lineare in presenza di dati mancanti. Come suggerito da Little (1989), infatti, le statistiche test fornite da Fuchs (1989, equazioni [4.1] e [4.2]), se impiegate per verificare l’adattamento di un modello saturo, possono essere utilizzate come statistiche test per saggiare la natura MCAR dei dati mancanti, in presenza di grandi campioni. La statistica test G2 proposta originariamente da Fuchs per una tavola a tre entrate e adattata al più semplice caso in cui si hanno due sole variabili A e B, è la seguente: dove Per l’applicabilità del test sui dati raccolti tramite l’indagine sperimentale è possibile dimostrare che tale statistica per saggiare l’assunzione MCAR equivale ad un test di omogeneità delle distribuzioni di rispondenti e non rispondenti rispetto alle variabili disponibili per tutte le unità. Per semplicità, la dimostrazione di tale affermazione può essere sviluppata nel semplice caso delle due sole variabili A e B. Per determinare le stime di
Questa semplificazione è possibile poiché la verosimiglianza del modello saturo può essere riscritta come prodotto di fattori con parametri "distinti", in cui ogni fattore corrisponde ad una sola delle tabelle. Poiché la probabilità marginale ottenuta tramite l’algoritmo EM è la seguente:
la probabilità di ogni singola cella nel caso di modello saturo con dati mancanti, diventa:
Andando a sostituire nella (6.1) le stime di massima verosimiglianza così ottenute e sviluppando i passaggi algebrici, si ottiene:
L’applicazione del test ai dati rilevati on-line consiste dunque nel saggiare la bontà di adattamento di un modello log-lineare in cui figurano le variabili disponibili per tutte le unità: tipologia dell’host (1), area geografica (2) e la variabile indicatrice dicotomica che identifica i rispondenti ed i non rispondenti (3). Scritto secondo la notazione proposta da Bishop et al. (1975), il modello assume la seguente configurazione:
L’ipotesi del modello consiste nell’assumere che non vi sia nessuna interazione di secondo ordine tra la variabile indicatrice (3) ed ognuna delle due variabili rilevate su tutte le unità (1 e 2), e che vi sia assenza di interazione di terzo ordine:
Il test per saggiare la bontà di adattamento del modello fornisce un valore di G2 pari a 54,91, con un p-valore pari a .961. Risulta dunque accettabile l’ipotesi di omogeneità delle due distribuzioni, al livello di significatività del 5%, ed è dunque verificata l’ipotesi MCAR sui dati mancanti.
L’utilizzo del questionario in HTML, congiuntamente all’apposita CGI, ha permesso di monitorare il numero di questionari, corretti o con errori, inviati per ogni singola unità, nonchè i tempi totali necessari per la compilazione e per l’eventuale lettura del comunciato stampa. Il tempo medio per la compilazione del questionario, comprensivo degli eventuali invii multipli a causa di errori da correggere, è risultato essere pari a 538,56 secondi, ovvero quasi 11 minuti, con una deviazione standard di poco più di 4 minuti.
Tabella .18 - Invii errati prima della compilazione definitiva
Tabella .19 - Questionari correttamente inviati per unità Come può osservarsi dalla Tabella 6.18, gli utenti hanno da subito inviato correttamente il modulo nel 73,1% dei casi, mentre il 20,7% ha dovuto rispedire una seconda volta il questionario, dopo aver corretto gli errori in esso contenuti e segnalati a video dalla CGI. Alcuni utenti, inoltre, seppur in una percentuale di casi molto contenuta, hanno inviato correttamente il modulo più di una volta, come si nota dalla Tabella 6.19. Dalla Tabella 6.20 e dalla relativa Figura 6.10 si vede come solo una bassa percentuale di utenti (2,6%) abbia concluso la compilazione entro i quattro minuti circa, mentre il 98,4% ha inviato correttamente il questionatio entro i 25 minuti (1500 secondi).
Tabella .20 - Tempo di compilazione del questionario
Tabella .21- Tempo di lettura del comunicato stampa
Figura .10 - Tempo di compilazione del questionario Il comunicato stampa non è stato letto da tutti gli utenti, poichè alcuni hanno trovato un link diretto alla pagina del questionario, dalla quale non era possibile entrare nel comunicato. Il valore minimo del tempo di lettura è dunque pari a 0 secondi, con un tempo massimo in alcuni casi eccessivo e duvuto probabilmente al fatto che gli utenti con accesso diretto ad Internet (attivo 24 ore su 24), pur non utilizzando il loro browser, hanno lasciato visualizzata la pagina del questionario per varie ore consecutive; come può vedersi dalla Tabella 6.21, solo in 18 casi si è registrato un tempo di lettura del questionario superiore ai 2000 secondi (33 minuti e 34 secondi).
Gli utenti del Web che hanno collaborato all’indagine sono prevalentemente maschi; tale dato, che nello specifico è pari al 90,6% (Tabella 6.22 e Fugura 6.11), non si discosta molto nè dalla stima fornita da Demoskopea (88%) nè da quella meno recente ottenuta dall’Università di Catania (92,6%). Il rapporto tra i sessi sembra invece differire maggiormente da quello stimato tramite la sesta inchiesta on-line del GVU Center, per mezzo della quale si è constatato che il 31,4% dell’utenza sondata on-line, nel mondo, è di sesso femminile; in particolare, per i rispondenti statunitensi tale percentuale sale al 32,4% e scende invece fino al 19,5% per gli utenti europei. Anche per la Nielsen più di un terzo dell’utenza statunitense è di sesso femminile, risultato che offre quindi la conferma che negli Stati Uniti l’utenza femminile ha già conquistato quote maggiori rispetto al resto del mondo, segnale di una maggiore diffusione del fenomeno Internet.
Tabella .22 - Sesso dei rispondenti
Figura .11 - Sesso dei rispondenti Relativamente all’età, la classe dai 25 ai 50 anni comprende il 76,5% degli utenti, mentre i soggetti che hanno dichiarato di avere oltre i 50 anni sono solo il 5,2% del totale (Tabella 6.23). Le maggiore frequenza di femmine, analogamente ai maschi, si trova nella classe d’età dai 26 ai 35 anni (Tabella 6.24).
Tabella .23 - Età
Tabella .24 - Età per sesso Figura .12 - Età dei rispondenti In questo caso i dati rilevati dalle due indagini on-line in Italia, messi a confronto con l’indagine di Demoskopea, conducono a risultati contrastanti: per l’Università di Catania la fascia d’età dai 25 ai 44 anni comprende, analogamente a quanto emerso dall’indagine sperimentale, un’alta percentuale d’utenza (il 75%), che invece si riduce al 58% nel campione di Demoskopea. Per il GVU, infine, l’età media è di 34,9 anni. La successiva Tabella 6.25 mostra invece la distribuzione marginale per la variabile "attività". La percentuale più elevata è quella riferita agli impiegati (27%), seguita dei liberi professionisti (18,2%), dagli studenti (15%), dai dirigenti (12,4%) e dai lavoratori autonomi (10,2%).
Tabella .25 - Attuale attività svolta
Figura .13 - Attività dei rispondenti Aggregando i soggetti appartenenti alle due categorie "ricercatori/docenti" e "studenti" si ottiene la quota d’utenza collocabile nell’ambito del mondo accademico e scolastico (22,9%), che è così confrontabile con l’analoga percentuale fornita dal GVU e pari al 25,2%. In particolare, l’incidenza degli studenti (15%) è pressocchè analoga a quella individuata dall’indagine svolta dall’Università di Catania, che è risultata essere pari al 16,2%.
Tabella .26 - Attività svolta per classe dell’host (base: domini "it") In questo contesto è possibile, ed appare rilevante, caratterizzare la classe dell’host relativamente alla condizione professionale. Dalla Tabella 6.26 si nota in particolare come le attività svolte dagli utenti che accedono tramite gli Internet providers siano molto variegate, a dimostrazione del fatto che la possibilità di avere un collegamento ad Internet si va diffondendo in ogni ambito sociale; casalinghe, operai e pensionati sono anch’essi collocabili esclusivamente in questa categoria di accesso. Al contrario, le restanti classi in cui sono stati suddivisi i domini di appertenenza sono caratterizzati da una figura di utente, realtivamente all’attività svolta, molto più specifica. Il titolo di studio, così come il sesso e l’attività, è interpretabile anch’esso come un indicatore del livello di diffusione del fenomeno: come già rilevato dall’Università di Catania, circa il 6% dei rispondenti ha soltanto la licenza media, mentre più della metà di essi (il 53,4%) ha interrotto gli studi solo dopo il conseguimento del diploma di scuola superiore, dato anch’esso quasi coincidente con il 51,7% trovato dall’Università catanese e leggermente più elevato rispetto al 48% fornito da Demoskopea. Dall’indagine sperimentale risulta inoltre che il 38,5% degli utenti è in possesso del diploma di laurea, contro il 42,1% di Catania ed il 52% di Demoskopea. Infine, il 2% degli utenti ha conseguito il dottorato di ricerca (Tabella 6.27 e Figura 6.14).
Tabella .27 - Titolo di studio
Tabella .28 - Ampiezza centro I dati relativi all’ampiezza del centro di residenza confermano la politica attuata dai providers verso una diffusione sempre più capillare dei punti di accesso in Rete, tale da non escludere i centri minori. La distribuzione di frequenza della Tabella 6.28 e, in maniera più diretta, la Figura 6.15, mostrano un’equa distribuzione dei rispondenti rispetto alle località di diversa dimensione.
Figura .14 - Titolo di studio
Figura .15 - Ampiezza centro
L’esatta individuazione dei motivi di utilizzo del Web è da annoverare tra i principali obiettivi della ricerca. Per questa domanda si è data agli utenti la possibilità di specificare più di un motivo di utilizzo e di discriminare, dove necessario, tra quelli principali e quelli secondari. Nella Tabella 6.29, così come nelle successive tabelle che si riferiscono a domande multiple, vengono presentate, accanto alle frequenze di risposta, anche le "percentuali di casi", calcolate come rapporto tra il numero di soggetti che hanno selezionato una specifica risposta ed il totale dei rispondenti; la somma di tali percentuali risulta pari a cento solo nel caso in cui ogni utente fornisce una sola risposta, ma poiché ogni soggetto ha sempre preferito esprimere più di una preferenza (al massimo tre, nelle domande in cui tale limite veniva posto), tale quantità sarà maggiore di 100. La somma di tali percentuali può essere interpretata come un indice medio del numero di risposte selezionate dagli utenti. Per esempio, dalla Tabella 6.29, emerge che i rispondenti hanno specificato, in media, poco meno di due motivi di utilizzo principale e più di tre motivi di utilizzo secondario.
Tabella .29 - I motivi principali e secondari di utilizzo del Web (risposte multiple)
Figura .16 - Motivi di utilizzo del Web (percentuale di casi) Il 70,5% dichiara di utilizzare il Web come strumento di lavoro e/o di affari e, nel 58,6% dei casi, tale motivazione riveste un’importanza principale. La percentuale dei soggetti che fanno del Web uno strumento di lavoro, che a livello mondiale è stata stimata dal GVU pari al 50,9%, a livello nazionale viene poi confermata, anche se leggermente ridimensionata, dal 46% di Demoskopea. Tali risultati sembrano confermare la tendenza in atto verso un uso della Rete per motivi principalmente professionali e di lavoro, anche alla luce di quanto emerso pochi mesi prima tramite l’indagine on-line dell’Università di Catania, in cui solo il 29,7% degli utenti aveva dichiarato di utilizzare Internet per condurre affari. In maniera meno evidente emerge l’utilizzo di Internet come veicolo commerciale al servizio dei consumatori, ovvero per acquistare on-line prodotti e/o servizi: solo il 3% degli utenti dichiara che lo shopping on-line è il motivo per cui utilizza principalmente Internet. Di notevole interesse appare invece il 19,5% di soggetti per i quali un tale motivo riveste un’importanza almeno secondaria. In generale, comunque, specialmente in Europa, la propensione verso lo shopping on-line è ancora bassa: il 41,16% degli utenti che hanno partecipato all’indagine on-line del GVU ha dichiarato di non aver utilizzato mai Internet a tali fini, percentuale che si alza fino al 57,34% per gli europei. A seguire, il 33,7% ha dichiarato di utilizzare il Web principalmente per motivi educativi e/o per studio mentre, indipendentemente dal livello di priorità assegnato, il 70% dei rispondenti afferma di utilizzare Internet per la semplice curiosità di navigare tra le sue risorse, dato che risulta essere di poco inferiore a quello stimato a livello mondiale tramite l’indagine GVU (77, 1%). Internet è poi intesa come forma di intrattenimento dal 51,5% degli utenti italiani sondati on-line contro il 63,8% degli utenti rispondenti da tutto il mondo (Figura 6.16). La Tabella 6.30 è stata ottenuta riportando le distribuzioni marginali dei principali motivi di utilizzo secondo le varie classi dei domini "it". Anche in questa circostanza, mentre nella maggior parte dei casi appare un’evidente associazione, spesso prevedibile, tra la tipologia dell’host ed il motivo di utilizzo, per la categoria di utenti collegati tramite providers è necessario analizzarne più in dettaglio le preferenze.
Tabella .30 - I principali motivi di utilizzo del Web per classe (risposte multiple, base: domini "it") Dei 1076 rispondenti della classe "net", 627 (il 58%) hanno affermato di utilizzare principalmente Internet come strumento di lavoro/affari, mentre 449 (il 41,7%) lo utilizzano come strumento per educazione/studio o ricerca universitaria. Questo dato, congiuntamente considerato a quanto emerso in precedenza, permette dunque di affermare che gli utenti arrivati all’indagine tramite providers commerciali risultano essere in prevalenza utenti che usufruiscono delle risorse di Rete a supporto della loro attività professionale o per la conduzione di affari, mentre meno della metà di essi ne fanno un uso didattico/educativo. E’ comunque necessario ricordare che, per questa domanda, ogni utente ha avuto la possibilità di fornire anche più di una risposta: escludendo quindi tutti coloro che hanno indicato congiuntamente i due precedenti principali motivi di utilizzo, si trova che solo 347 utenti (il 32%) hanno dichiarato di usare Internet principalmente come mezzo di lavoro, e non di studio o di ricerca universitaria.
Un obiettivo conoscitivo primario consiste nell’individuazione degli argomenti che maggiormente interessano l’utenza italiana; è stato quindi chiesto agli soggetti di segnare un massimo di tre argomenti preferiti di cui si interessano sul Web.
Tabella .31 - Gli argomenti di maggior interesse (risposte multiple, massimo 3 preferenze) Come si può vedere dalla Tabella 6.31, delle percentuali di casi di particolare rilievo si sono registrate in corrispondenza delle tre modalità: "informatica/Internet" (64,3%), "commercio, marketing e pubblicità" (28,4) e "grafica, immagini ed animazioni" (23,7%). In particolare, mentre l’interesse per Internet e per l’informatica in generale è stato palesato dagli utenti indipendentemente dall’attività lavorativa svolta, al contrario il commercio, il marketing e la pubblicità su Internet sono argomenti che interessano particolarmente la metà di tutti i dirigenti e dei lavoratori autonomi contattati (circa il 50%), seguiti dal 36,9% dei liberi professionisti. Una conferma di un utilizzo della Rete a sostegno dell’attività commerciale può farsi derivare dall’elevata percentuale di utenti, tra i 478 che preferiscono l’argomento "commercio, marketing e pubblicità", che hanno affermato di utilizzare Internet principalmente per lavoro/affari nella prima domanda (81,6%). Ulteriori relazioni tra l’argomento di utilizzo ed altre variabili esplicative, come sesso, età e professione, vengono trattate successivamente nel par. 6.11.
Strettamente connessi ai motivi di utilizzo della Rete, vi sono i vantaggi che l’utente dichiara di aver ottenuto dall’avere accesso ad Internet e, in particolare, ad alcuni suoi servizi. In questo caso si è lasciato libero l’utente di selezionare tutti gli items preferiti.
Tabella .32 - I maggiori vantaggi dell’avere accesso in Rete (risposte multiple) Come emerge dalla Tabella 6.32, l’importanza del nuovo mezzo come strumento di ricerca primaria e di informazione si riflette sulle opinioni di un’elevata percentuale di utenti: il 75,5% di essi sono concordi nel ritenere che uno dei maggiori vantaggi consiste proprio nella possibilità di reperire on-line informazioni di vario genere, mentre il 56,1% utilizza la Rete per consultare notizie su quotidiani, riviste e simili. Utilizzano poi usualmente la posta elettronica l’80,4% degli utenti (di cui il 70,1% si collega ad Internet quotidianamente), contro il 65% di Demoskopea. Solo il 43,6%, invece, afferma che un vantaggio dell’accesso ad Internet è quello di aver potuto usufruisce degli altri suoi servizi di comunicazione (mailing list, newsgroups, ecc.). Coloro che hanno dichiarato di trarre vantaggio, congiuntamente, sia dalla posta elettronica sia dagli altri servizi di comunicazione, costituiscono il 38,9% del totale. Un ulteriore vantaggio di rilievo nell’utilizzo di Internet riguarda la possibilità di scaricare software e files di varia natura; tramite l’indagine sperimentale si è arrivati ad una stima di utenti interessanti a questi tipo di applicazione, il 69,6%, dello stesso ordine di grandezza a quella trovata pochi mesi prima dall’inchiesta di Catania (60,3%); più moderata, invece, la stima fornita da Demoskopea, pari al 49%. Il 16,2% di utenti che dichiarano di aver avuto come vantaggio la possibilità di ordinare/acquistare on-line prodotti e servizi riconferma quanto trovato precedentemente a proposito dello shopping on-line come motivo di utilizzo, mentre molto modesto è ancora il vantaggio nell’utilizzo del Web come strumento per la comunicazione in videoconferenza, selezionato da appena il 3,7% dei rispondenti.
Tabella .33 - Altri vantaggi derivanti dall’accesso in Internet Nella Tabella 6.33 vengono infine riportati i vantaggi digitati manualmente da circa l’8% degli utenti, da cui emerge ancora l’importanza del Web come strumento di ricerca di informazioni specifiche altrimenti reperibili a costi e tempi più elevati.
Con la crescente diffusione del Web e la sua convergenza verso un utilizzo prevalentemente commerciale e di lavoro, i problemi percepiti dall’utenza diventano un fattore chiave nella comprensione delle reali possibilità di sviluppo del nuovo mezzo.
Tabella .34 - I problemi maggiormente sentiti (risposte multiple, massimo 3 preferenze) Il dato più rilevante riguarda senz’altro il problema dei costi delle comunicazioni, sentito dal 23% degli utenti, e che risalta ulteriormente se posto a confronto con i risultati dell’indagine GVU, dai quali emerge che solo il 7,75% dei rispondenti ritengono che quello dei costi costituisca un problema nell’utilizzo di Internet; in particolare, il problema è sentito principalmente dall’utenza europea (13,6%) e meno da quella statunitense (6,6%). Tra i partecipanti all’indagine GVU, inoltre, l’unica differenza relativa ai problemi percepiti dagli utenti dei due continenti (Stati Uniti ed Europa) riguarda proprio il tema dei costi di collegamento, mentre per le rimanenti problematiche vi è una quasi coincidenza di opinione. In tema di problemi percepiti dall’utenza, delle analogie emergono dal confronto dei dati delle due indagini on-line, quella del GVU e quella sperimentale: il 76,6% dei partecipanti all’inchiesta GVU ritiene problematica l’estrema lentezza del Web, opinione condivisa dal 67,1% degli utenti italiani; mentre il 34,1% degli utenti rispondenti da tutto il mondo dichiara che il reperimento delle informazioni su Internet non è ancora un compito facile, analogamente a quanto affermato dal 35,7% degli utenti italiani.
Tabella .35 - Altri problemi Il 6,8% dei rispondenti all’indagine sperimentale ha poi specificato un problema non presente tra le quelli direttamente selezionabili tramite questionario o, in alcuni casi, ha digitato un problema già presente in elenco. Per completezza, i principali problemi emersi con questa modalità aperta sono riportati in Tabella 6.35.
Il modo tramite il quale l’utente viene a conoscenza degli indirizzi delle pagine e dei siti su Internet è senza dubbio un indicatore del livello di diffusione e penetrazione del fenomeno nella società. Per individuare le fonti primarie da cui gli utenti attingono gli URL, è stato loro chiesto di segnare al massimo 3 items tra quelli proposti. I motori di ricerca sul Web e, a seguire, i links ipertestuali contenuti tra le pagine HTML sono i due strumenti maggiormente utilizzati dagli utenti per reperire sia i siti sia le singole pagine che stanno cercando. Tale risultato non sorprende, considerata l’estrema semplicità tramite la quale è possibile rintracciare determinate informazioni proprio usufruendo dei meta-indici e dei programmi di ricerca in Rete, quotidianamente aggiornati. In particolare, la percentuale di utenti che seguono i links (67,2%) è risultata inferiore rispetto a quella ottenuta dal GVU (86,92%) (Tabella 6.36).
Tabella .36 - Modalità di reperimento degli indirizzi Web (risposte multiple, massimo 3 preferenze) Il 14,5% dei rispondenti, poi, utilizza le informazioni contenute nei gruppi di discussione ed il 6,8% usufruisce anche degli indirizzi trovati alla fine dei messaggi e-mail (signature). Usenet, per i soggetti sondati dal GVU, è invece una fonte di maggiore importanza ed il 34,25% trova utile consultarne i newsgroups per reperire gli indirizzi. La diffusione della posta elettronica soprattutto negli Stati Uniti è, in tal senso, indicativa: sempre il GVU segnala che ben il 30% degli utenti si avvale delle signatures alla fine dei messaggi e-mail. In secondo luogo, si osserva la tendenza a seguire il fenomeno Internet ed individuare le risorse in esso disponibili anche tramite altri mezzi di comunicazione, esterni alla Rete, in prevalenza su riviste (40,9%) e giornali (34,3); la pubblicità televisiva ed i libri, in questo contesto, sembrano avere ancora molta poca influenza, al contrario di ciò che avviene negli Stati Uniti in cui, secondo il GVU, il 28% degli utenti si avvale proprio dei libri per trovare gli URL, mentre il 35,5% è aiutato in tale compito dalla pubblicità e dai programmi televisivi.
Tabella .37 - Modalità di reperimento degli indirizzi Web per età Sempre i ricercatori del GVU, nella presentazione dei loro risultati, fanno notare come le generazioni più giovani siano maggiormente propense a trovare gli URL tramite gli amici, mentre gli utenti di età più avanzata utilizzino maggiormente la carta stampata. Dalla Tabella 6.37 si ha una conferma al fatto che tale scenario è valido anche per la situazione italiana.
La distribuzione marginale del numero di mesi trascorsi dal primo collegamento ad Internet mostra che la percentuale di utenti con esperienza in Rete da più di 3 anni è abbastanza contenuta; circa il 20% dell’utenza è su Internet da meno di 6 mesi ed un terzo circa ha iniziato a navigare sul Web ed usare gli altri servizi di Rete da 6-12 mesi (Tabella 6.38 e Figura 6.17).
Tabella .38 - Mesi su Internet
Figura .17 - Mesi su Internet Dalla Tabella 6.39 si può notare come, al crescere dei mesi dal primo collegamento ad Internet, si evidenzi un’elevata frequenza in corrispondenza di un uso della Rete come strumento di lavoro/affari, mentre il surfing e la semplice curiosità nel navigare in Internet appare essere un motivo di utilizzo che non dipende dai mesi di esperienza.
Tabella .39 - Motivo di utilizzo per mesi di esperienza
Uno degli aspetti più rilevanti nella determinazione del profilo dell’utente riguarda il luogo, o i luoghi, di accesso ad Internet. Anche questa è una domanda multipla: poiché un utente può verosimilmente accedere ad Internet da più luoghi (per es.: da casa e da ufficio), è sembrato opportuno lasciare che ogni soggetto fosse libero di indicare tutti gli items necessari. Nella fase attuale in cui la Rete converge verso un utilizzo sempre più orientato al commercio elettronico, una preliminare distinzione da fare riguarda le due categorie di utente: gli utenti "consumer", che pagano per avere accesso in Rete, e coloro che invece usufruiscono delle risorse perchè dispongono di un accesso gratuito tramite l’ufficio (Tabella 6.40). Per la scuola e per l’università sorge l’esigenza di individuare in dettaglio la tipologia dell’utente: dei 303 soggetti che hanno dichiarato di avere un accesso tramite l’università, 159 sono studenti, mentre i rimanente 144 sono utenti che verosimilmente possiedono un accesso diretto dal proprio ufficio, in particolare i 75 docenti/ricercatori. Analogamente, dei 23 soggetti che hanno dichiarato di avere un accesso da scuola, solo 9 sono studenti. In questo modo è possibile confrontare il tipo di accesso in Internet con i dati forniti da Demoskopea: secondo la società di ricerca, il 54% degli utenti accedono da casa, contro il 69% dell’indagine sperimentale, dato che invece si avvicina maggiormente al 63,6% ottenuto dal GVU Center. Demoskopea rileva inoltre che il 46% degli utenti accede tramite l’ufficio, contro il più alto 55,3% dell’indagine sperimentale, percentuale che sale al 65% se si tiene conto degli accessi tramite scuola ed università che sono verosimilmente assimilabili alla modalità di accesso "ufficio".
Tabella .40 - Luoghi di accesso in Rete (risposte multiple)
Figura .18 - I luoghi di accesso ad Internet (risposte multiple) Infine, nella categoria "altro" ricade il 4,7% degli accessi risultati dall’indagine (percentuale che comprende anche coloro che accedono dagli Internet cafè), contro il 5% rilevato da Demoskopea. Puntando l’attenzione sui due luoghi di accesso principali, casa e ufficio, dalla Tabella 6.41 emerge che poco più di un terzo dei rispondenti dichiara di avere un accesso in entrambi i luoghi, mentre prevalgono coloro che hanno solo l’accesso da casa.
Tabella .41 - Collegamenti da casa e dall’ufficio
Tabella .42 - Luogo di accesso per classe dell’host Nella Tabella 6.42 le frequenze marginali riferite ai vari luoghi di accesso sono mostrate relativamente ad ogni classe dell’host. Come si può notare in corrispondenza della classe "com", a collegarsi da casa sono un numero di utenti quasi pari a coloro che si collegano dall’ufficio; in particolare, 77 utenti appartenenti a tale categoria commerciale hanno dichiarato di collegarsi sia da casa che dall’ufficio. All’interno della categoria providers si può notare quanto già evidenziato in precedenza: parte dell’utenza si avvale del collegamento tramite provider per accedere dal proprio ufficio, tramite la propria organizzazione che non ha un proprio dominio; in particolare, 361 utenti di questa categoria hanno affermato di usufruire di entrambi gli accessi (casa e ufficio). Infine, un risultato prevedibile si riferisce all’elevata frequenza di utenti che dichiarano di accedere dall’Università e sui quali è stato infatti rilevato automaticamente un dominio di tipo "edu".
L’elevata frequenza con la quale la maggior parte degli utenti dichiara di navigare sul Web, conferma il fatto che il loro profilo tende verso una figura di utente evoluto, che utilizza il Web prevalentemente per motivi di lavoro o professionali. Il 65,1% afferma, infatti, di accedere ad Internet quotidianamente. In particolare, tra tutti coloro che hanno dichiarato di avere un accesso da casa (1163), il 64,7% si collega tutti i giorni ed il 31,9% qualche volta alla settimana, mentre tra tutti coloro che hanno un accesso dall’ufficio (931), il 76,1% si collega quotidianamente e solo il 21,1% naviga sul Web qualche volta alla settimana. Infine, coloro che hanno un accesso sia da casa sia dall’ufficio (545), dimostrano di costituire la fascia di utenti più assidua, mostrando una frequenza di accesso giornaliera nel 79,4% dei casi e collegandosi solo qualche volta alla settimana nel 18,8% dei casi; di tali utenti, una percentuale bassissima, appena lo 0,9%, si collega una volta alla settimana o occasionalmente.
Tabella .43 - Frequenza di navigazione Approssimativamente, i dati della Tabella 6.43 sono analoghi a quelli presentati da Demoskopea che, in particolare, ha rilevato che solo il 25% degli utenti si collegano più volte alla settimana.
Tabella .44 - Ore settimanali mediamente dedicate alla navigazione Nella loro relazione finale, i ricercatori dell’indagine on-line di Catania avevano messo in evidenza come il numero di ore spese settimanalmente sul Web si fosse rivelato particolarmente elevato, oltre le loro aspettative. Questa indicazione, che è stata recepita nella formulazione del questionario e tradotta in classi tali da permettere di individuare con precisione anche un numero elevato di ore mediamente spese sul Web, si è rivelata utile. Dalla Tabella 6.44 si nota infatti che il 22% degli utenti dedicano alla navigazione oltre 9 ore alla settimana. Dalla Tabella 6.45, invece, può constatarsi come il numero di ore settimanalmente spese per la navigazione sul Web cresce in maniera proporzionale alla frequenza con cui vengono realizzati i collegamenti. Può notarsi come gli utenti che navigano per più di 9 ore alla settimana sono solo coloro che accedono più volte alla settimana o quotidianamente; vi è poi qualche utente che, nonostante realizzi dei collegamenti sporadici, dichiara di rimanere collegato settimanalmente per varie ore.
Tabella .45 - Frequenza di collegamento per ore settimanali mediamente dedicate alla navigazione In generale, dunque, prevale un uso delle risorse di Internet con una certa costanza nel tempo e con delle durate di collegamento non troppo elevate.
Infine, l’orario di accesso ad Internet pone in evidenza i problemi dei costi di comunicazione e della lentezza del Web già espressi dagli utenti, in maniera diretta, nelle precedenti domande. Un’elevata quota d’utenza, pari al 56,2%, ha dichiarato infatti di preferire i collegamenti notturni, realizzati dalle 22 in poi, mentre il 27,6% si collega dalle 16 alle 22 (Tabella 6.46).
Tabella .46 - Orario di accesso preferito Dalla Tabella 6.47 è infine possibile mettere a confronto la fascia oraria in cui l’utente ha realmente effettuato il collegamento per entrate tra le pagine Web dell’indagine e la fascia oraria che ha dichiarato di preferire. Ad esclusione della modalità "nessuna preferenza", si nota come le frequenze più elevate siano situate lungo la diagonale principale, a conferma della coerenza di quanto affermato dai rispondenti.
Tabella .47 - Fascia oraria di accesso al questionario per fascia oraria preferita L’offerta del servizio gratuito come incentivo alla partecipazione ha avuto degli effetti positivi sul livello di partecipazione: l’80,6% dei rispondenti ha infatti scelto di usufruire del servizio ed ha lasciato, pertanto, il proprio indirizzo e-mail. Tra i dati della Tabella 6.48, due sembrano essere particolarmente significativi: circa la metà degli utenti ha richiesto di essere aggiornato sul sistema operativo Windows 95, sistema il cui utilizzo effettivo è stato rilevato automaticamente dalla CGI sul computer della metà degli utenti contattati. Il secondo dato evidenzia che una sostenuta percentuale di utenti (41,2%) è interessata al monitoraggio delle banche italiane che hanno scelto di essere presenti sul Web. Il 14,8% degli utenti che hanno selezionato questo item (97 utenti) provenivano dal sito bancario, per cui è ipotizzabile che proprio tali visitatori siano dei frequentatori abituali del sito ospite il quale, si ricorda, ha tra le sue pagine più note la lista quotidianamente aggiornata delle banche italiane on-line (dalla quale era possibile accedere al questionario). Tra gli altri item maggiormente selezionati si trovano Netscape 32bit (36,3%) ed il manuale HTML in italiano (35%), che confermano l’interesse trovato, nell’ambito degli argomenti preferiti, nei confronti di Internet. Andando invece ad aggregare gli items in categorie omogenee, si ottiene la seguente Tabella 6.49, dalla quale emerge che la grande maggioranza degli utenti ha richiesto di essere aggiornata su alcune società di informatica che producono software e hardware e, in secondo luogo, su degli specifici titoli di software.
Tabella .48 - Il servizio gratuito (risposte multiple, massimo 10 preferenze)
Tabella .49 - Le preferenze degli utenti espresse tramite il servizio gratuito Se precedentemente era emerso che solo una bassa percentuale di utenti ritiene di avere ottenuto, tra i vantaggi della connessione in Rete, la possibilità di realizzare delle videoconferenze, adesso molti rispondenti sono interessati ai software che permettono di comunicare dal vivo con altri utenti (Powhow, Freteel, ecc.), richiedendo dunque di essere aggiornati sulla "telefonia" tramite Internet. A seguire, infine, molti utenti hanno richiesto gli aggiornamenti su software generico per Internet (browsers, ecc.) e su software più tecnico, come gli editors per HTML (o relativi manuali) e la programmazione delle CGI.
Nel presente paragrafo vengono esposti alcuni risultati preliminari dell’adattamento di modelli log-lineari, al fine di individuare le relazioni che intercorrono tra alcune variabili esplicative, come il sesso, l’età, l’attività, la frequenza con la quale si effettua il collegamento, ecc. e le preferenze nell’utilizzo del World Wide Web. Nella notazione usata per individuare i modelli presentati di seguito, per brevità vengono riportate soltanto le interazioni riscontrate tra le variabili esplicative e le variabili risposta, mentre si sottintente la parte di modello "minimale" costituita dagli effetti medi principali e da tutte le interazioni di primo ordine fra le eplicative. Sempre a fini di brevità espositiva, le stime MV dei parametri vengono commentate, ma non riportate. Nella Tabella 6.50 vengono presentati i modelli adattati sulle variabili che si riferiscono ai motivi di utilizzo del Web (indifferentemente motivo principale e secondario) e le variabili "sesso", "età" ed "attività".
Tabella .50 Motivo di utilizzo [1] x Sesso [2] x Età [3] x Attività [4] Dalla Tabella si evince che gli utilizzi di Internet come strumento di intrattenimento e di lavoro/affari dipendono entrambi dall’età e dell’attività, mentre non appaiono esserci delle significative influenze della variabile "sesso". In particolare, con riferimento ai parametri log-lineari, si evince che al crescere dell’età diminuisce la probabilità che si faccia un uso di Internet per lavoro/affari. Nè il sesso nè l’età hanno poi influenza su un utilizzo didattico/educativo di Internet, che dipende fondamentalmente dal tipo di attività svolta dall’utenza; sembrano caratterizzate da una bassa propensione verso questo tipo di utilizzo di Rete le modalità "dirigente", "lavoratore autonomo" e "libero professionista". La ricerca universitaria è invece associata, oltre che con l’attività, anche con il sesso, mentre quella commerciale dipende da tutte e tre le esplicative introdotte nel modello. Infine, di particolare interesse è lo shopping on-line che dipende soltanto dalla classe d’età dell’utenza, con una propensione verso un tale utilizzo che dimunuisce al crescere dell’età. Tramite la Tabella 6.51 si sono poi approfondite le relazioni intercorrenti tra gli argomenti preferiti dagli utenti e le variabili "sesso", "età" ed "attività". Nei confronti dell’argomento "arte", l’esame dei parametri log-lineari evidenzia una forte propensione delle femmine, propensione che aumenta al crescere della fascia d’età. In maniera analoga, anche nel caso del "commercio, marketing e pubblicità" vi è una maggiore propensione delle femmine, sebbene l’influenza del sesso, in questo caso, sia molto più debole che in quello precedente. Al contrario dell’argomento "arte", al crescere dell’età diminuisce la probabilità che l’utente sia interessato all’argomento "commercio, marketing e pubblicità". "Ingegneria e tecnologia" e "musica" sono due argomenti che non presentano nessuna relazione significativa con il sesso e l’età, mentre l’interesse verso "società e cultura" è dipendente soltanto dal sesso.
Tabella .51 Argomento preferito [1] x Sesso [2] x Età [3] x Attività [4] Volendo individuare con maggior precisione le variabili che influiscono sull’utilizzo di Internet per lavoro/affari, è stato adattato il seguente modello: Lavoro/Affari [1] x Commercio, mark. e pubb. [2] x Età [3] x Attività [4] [21][31][41] G2=78,34 p-valore=0,966 tramite il quale è possibile notare come questo tipo di utilizzo risulti associato proprio con un interesse dell’utente nei confronti del "commercio, marketing e pubblicità", oltre che con l’età e l’attività svolta; gli utenti maggiormente propensi a questo argomento sono risultati essere i dirigenti, gli impiegati, i lavoratori autonomi ed i liberi professionisti. L’argomento "Informatica e Internet" è invece legato sia al sesso, sia all’età, sia all’attività. Relativamente all’attività, le categorie professionali meno interessate sembrano essere quelle degli operai, dei ricercatori/docenti e degli studenti. Infine, l’interesse per i "passatempi, giochi, hobby e sport" diminuisce anch’esso con l’avanzare dell’età ed è influenzato dall’attività svolta, mentre è indipendente dal sesso. La Tabella 6.52 mostra invece le relazioni esistenti tra i vari vantaggi percepiti dagli utenti, derivanti dall’avere accesso in Rete, e le esplicative "sesso", "età" ed "attività".
Tabella .52 Vantaggio del collegamento [1] x Sesso [2] x Età [3] x Attività [4]
Dalla Tabella si apprezza il fatto che il considerare la possibilità di consultare le notizie on-line come un importante vantaggio dell’uso di Internet non dipende da nessuna delle tre esplicative considerate, mentre quello di trovare informazioni sul Web è in relazione con l’attività svolta dall’utente. Per quanto riguarda il telelavoro ("posso lavorare semplicemente da casa"), i parametri log-lineari mostrano una debole influenza della variabile sesso ed una significativa relazione con l’attività svolta. La valutazione dell’importanza di usufruire di servizi on-line a pagamento tramite Internet dipende dal sesso, con una debole relazione che indica una maggiore importanza data a questo aspetto da parte dalle femmine, e dal tipo di attività. La Tabella 6.53 si riferisce ai problemi percepiti dall’utente nell’utilizzo del Web; si è ipotizzato che i problemi dipendano principalmente dalla frequenza con la quale l’utente si collega ad Internet e dal tipo di attività svolta. In realtà, dai dati risulta che l’unico problema dipendente dalla frequenza di collegamento è il tempo necessario per vedere/scaricare le pagine sul Web, mentre i rimanenti problemi non presentano delle relazioni significative con le variabili esplicative.
Tabella .53 Problema [1] x Frequenza di coll. [2] x Attività [3] Per mezzo della Tabella 6.54 si può apprezzare il fatto che i due luoghi di accesso che sono risultati essere i principali (vedi Tabella 6.40), casa e ufficio, sono associati sia alla frequenza di collegamento sia all’attività, mentre l’accesso in Rete tramite l’Università risulta essere indipendente dalla frequenza di collegamento.
Tabella .54 Luogo di accesso [1] x Frequenza di coll. [2] x Attività [3] Per quanto riguarda il servizio gratuito, infine, dal seguente modello si nota come l’aver lasciato l’indirizzo e-mail per poter usufruire del servizio/incentivo sia relazionato solo con l’età, e non con l’attività: Servizio-E-mail [1] x Età [2] x Attività [3] [21] G2=28,24 p-valore=0,960 Questo risultato indica che la scelta degli items
offerti come incentivo per la compilazione è stata piuttosto
adeguata ed ha interessato in modo equilibrato tutte le categorie di utenti,
indipendentemente dall’attività svolta.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||