Sì, credo che Andrea abbia ragione per il crawler che usa Google Scholar nel caso degli IR.<div>Anche per quanto riguarda le annate dei periodici elettronici se registrate in SFX Google Scholar usa il suo crawler.</div><div>

È vero però che SFX mi dà la possibilità di decidere che cosa esporre a Google Scholar dei miei periodici elettronici: possono essere tutti o una parte. SFX in base alla mia scelta produce periodicamente un file XML che conterrà i dati delle mie collezioni ma con le specifiche che ho scelto.</div>

<div>Anche le piattaforme degli IR dovrebbero diventare più sofisticate e consentire scelte specifiche.</div><div>Pierfranco Minsenti</div><div><br><br><div class="gmail_quote">Il giorno 23 gennaio 2012 10:54, Andrea Zanni <span dir="ltr"><<a href="mailto:zanni.andrea84@gmail.com">zanni.andrea84@gmail.com</a>></span> ha scritto:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Scusate l'intervento forse off topic, <br>ma da quel che mi risulta Google Scholar non utilizza il protocollo OAI.<br>

Credo utilizzino una versione customizzata del crawler normale di Google.<br><br>Andrea Zanni<br><br>


AlmaDL<br><br><div class="gmail_quote">Il giorno 23 gennaio 2012 10:41, Pierfranco Minsenti <span dir="ltr"><<a href="mailto:pierfranco.minsenti@iuav.it" target="_blank">pierfranco.minsenti@iuav.it</a>></span> ha scritto:<div>

<div class="h5"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


Cara Alessandra,<div><br></div><div>sono d'accordo con tutto quello che scrivi e in particolare con l'esigenza di ripensare i formati di metadati degli IR.</div><div>Credo che un nostro limite (ma mi piacerebbe molto scoprire se in Italia qualcuno l'ha superato) è il fatto di non lavorare sulla interfaccia OAI-PMH per migliorarla, con il risultato che questo aspetto del lavoro da fare viene lasciato così come lo troviamo nel DSpace originario.</div>


<div>Vedo almeno 2 obiettivi concreti su cui bisognerebbe lavorare in comune:</div><div>1) chiedere (a CILEA?) di creare per DSpace un export OAI-PMH con un formato MODS. D'altronde l'OAI-PMH è stato creato fin dall'inizio con l'idea che dovesse  supportare diversi formati dati in parallelo: con il DC semplice solo come requisito minimo indispensabile, che non vuole dire sufficiente se lo si individua invece come un problema a causa del meccanismo del dumb-down. In alternativa: lavorare su export DC qualificati personalizzabili dall'istituzione</div>


<div>2) creare dei profili applicativi del Dublin Core (se rimane quello il formato dati degli IR) specifici. All'estero hanno già creato profili applicativi del DC molto specifici per poter rispondere a esigenze differenziate. Per es. in Australia per descrivere le loro pubblicazioni governative: AGLS: un profilo molto ben documentato, con tonnellate di pagine, fatto davvero bene e del tutto interoperabile con DC: <a href="http://www.agls.gov.au/" target="_blank">http://www.agls.gov.au/</a></div>


<div><br></div><div>Io penso che faremo grandi passi avanti se prendessimo ad esempio lavori di quel livello: così accurati, chiari, ben documentati, capaci di trovare un buon equilibrio tra standard internazionali da osservare e esigenze locali da supportare e valorizzare adeguatamente.</div>


<div><br></div><div>Per la questione DSpace / Google Scholar e la questione dei records senza full text: anche in questo caso io credo che si potrebbe far creare un set specifico che raggruppi tutti i records con il full text allegato.  Il punto quindi è arrivare a poter adattare l'interfaccia OAI e farle fare quello che ha senso che faccia per la nostra istituzione e i servizi di export che vogliamo attivare.</div>


<div><br></div><div>Pierfranco Minsenti</div><div><br></div><div><div>-- <br><div>Pierfranco Minsenti</div><div><br></div><div>Università Iuav di Venezia</div></div><div><div>Area infrastrutture</div><div>Divisione servizi ICT</div>


<div>Ex-Cotonificio Veneziano</div></div><div><div>Dorsoduro, 2196 | 30123 Venezia</div><div>Tel. <a href="tel:%2B39%20041%20257%201015" value="+390412571015" target="_blank">+39 041 257 1015</a></div><div><br>


</div></div><div>E-mail: <a href="mailto:pierfranco.minsenti@iuav.it" target="_blank">pierfranco.minsenti@iuav.it</a>  |  skype: pierfranco.minsenti</div>

<div><br></div></div><div><br></div><div><br><br><div class="gmail_quote">Il giorno 21 gennaio 2012 22:27,  <span dir="ltr"><<a href="mailto:abianchi@unibg.it" target="_blank">abianchi@unibg.it</a>></span> ha scritto:<div>


<div><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Gentile PierFranco,<br>

davvero il dublin core come namespace unico è veramente troppo stretto per<br>

gli IR, specialmente in casi come il nostro, in cui l'IR serve sia come db<br>

per la valutazione della ricerca, che come piattaforma "editoriale" (tesi<br>

dottorato etc.), che come repository della didattica.<br>

Giusto ieri ho saputo che, per "rincorrere" la nuova scheda del Sito<br>

docente del ministero dovrò aggiungere altri 3 dc.description: ne abbiamo<br>

già una profusione.<br>

<br>

I "service providers" con cui già ci interfacciamo (bncf, openAire, etc.)<br>

chiedono campi riservati o semantiche specifiche per alcuni campi. Vero<br>

che molto può essere fatto a livello di mappatura (magari con più di una<br>

baseurl?), ma non possiamo continuare a moltiplicare i dc.description e le<br>

qualificazioni casalinghe all'infinito. Spesso poi non soddisfano il<br>

criterio del dumb-down per cui quando poi si dequalifica in uscita...<br>

<br>

Bisognerebbe capire se il DCMI task group per i repository (ma esiste?)<br>

sta lavorando su qualche AP che tenga conto di tutti questi aspetti.<br>

Personalmente anch'io propendo per un'estensione MODS.<br>

<br>

L'altra via è quella, appunto, dei set: separare bene le collezioni in<br>

DSpace e poi scegliere di volta in volta quali esporre e a chi. La mia<br>

preoccupazione più grande in questo momento è Scholar: ora che ho nell'IR<br>

anche record bibliografici senza full text (sempre per la faccenda della<br>

valutazione della ricerca)... per il senso di colpa ho scritto una mail di<br>

autodenuncia a Scholar! Vorrei riuscire a indicizzarci solo le collezioni<br>

editoriali, che hanno il full text, ma come fare?<br>

<br>

Riguardo al rapporto con i repository disciplinari, di qualisasi età e<br>

fattezza, più vado avanti e più mi rendo conto che i nostri utenti<br>

(ricercatori) ci tengono moltissimo, del resto obiettivamente hanno un<br>

notevole valore aggiunto. ArXiv, RePEc e SSRN che al momento è il più<br>

desiderato (almeno dal riscontro che ho io).<br>

<br>

Come staff del repository ci siamo sobbarcati di "esporre manualmente"<br>

(nel senso che bisogna aggiornare record-per-record dei file txt messi su<br>

un ns. server) alcune collezioni dell'IR a RePEc, un lavoraccio!<br>

SSRN funziona a "inclusion", come dice Antonella, e non a<br>

"indexing/harvesting": il gioco è ancora più duro...<br>

Forse se riusciamo a fare dell'IR (anche) una vera piattaforma editoriale<br>

(oltre che per la disseminazione di copie aggiuntive di cose pubblicate<br>

altrove), sposando il green al gold OA secondo il modello overlay. Io ci<br>

credo, ma forse invece è come voler fare il risotto con la macchinetta del<br>

caffè?<br>

<br>

ale.b<br>

<div><div><br>

> L'ipotesi/domanda di Alessandra Bianchi sulle funzioni di SSRN<br>

> (indicizzazione dei records prodotti da repository esterni) è<br>

interessante<br>

> e rivela quella che rimane tutt'ora una strada ancora poco sfruttata nel<br>

mondo OAI: quella dei service providers che svolgano la funzione di<br>

aggregatori di metadati che harvestizzano metadati prodotti da archivi<br>

elettronici OA esterni e che una volta creato un indice unico tramite<br>

aggregazione offrano servizi: a cominciare dai servizi di ricerca. Il<br>

modello specializzato basato su due funzioni distinti, data providers /<br>

> service providers, previsto fin dalla nascita del protocollo OAI-PMH, di<br>

fatto non ha ancora visto la nascita di molti servizi da parte di<br>

service<br>

> providers che facciano da aggregatori di tipo disciplinare.<br>

> Hanno avuto più fortuna i grandi service providers come OAIster, non<br>

basati<br>

> su specializzazioni disciplinari. E anche Europeana è basata sulla<br>

filosofia del service provider OAI.<br>

> A questo punto però proviamo un attimo a riflettere: se esistessero<br>

service<br>

> providers che funzionano da aggregatori su base disciplinare, saremmo<br>

pronti, potremmo veramente approfittarne?<br>

> A me pare di no perché ho l'impressione che non abbiamo ancora<br>

> approfondito<br>

> a sufficienza tutte le criticità insite nella condivisione di records<br>

tramite protocollo OAI-PMH usato dai repository OA per esporre i<br>

metadati<br>

> e<br>

> dai service providers per harvestizzare<br>

> Ci siamo preoccupati di adottare piattaforme per la creazione di data<br>

providers OA come Eprints e DSpace, ma forse non ci siamo preoccupati a<br>

sufficienza di farci trovare pronti per i servizi di aggregazione. Questo<br>

richiederebbe delle operazioni preventive al livello di:<br>

> 1. partizione della base dati OA seguendo le convenzioni OAI che<br>

richiedono<br>

> la creazione di gruppi chiamati set costruendoli su base disciplinare 2.<br>

scelte precise a livello del formato dati che dovrà essere reso<br>

disponibile tramite OAI-PMH.<br>

> Invece se osserviamo la situazione dei repository DSpace per quanto<br>

riguarda il formato dei metadati, scopriamo che offrono la possibilità di<br>

> personalizzare gli elementi del Dublin Core, ma questa possibilità non<br>

ha<br>

> alcun effetto automatico a livello dei metadati esposti da DSpace<br>

tramite<br>

> protocollo OAI in cui il formato di default è il Dublin Core semplice a<br>

soli 15 campi e se non interveniamo il sistema opera conversioni<br>

automatiche che possono creare ambiguità. Così tutte le estensioni che<br>

abbiamo introdotto e usiamo nella interfaccia di editing dati verranno<br>

perse una volta che i nostri dati saranno harvestizzati dato che<br>

verranno<br>

> mappate e quindi schicciate solo sui 15 elementi del Dublin Core<br>

semplice<br>

> se non abbiamo lavorato anche sul modulo OAI di DSpace e creato una<br>

conversione automatica sensata.<br>

> Non ne sono sicuro, ma apparentemente sembra che tutte le installazioni<br>

di<br>

> DSpace italiane siano così: cioè a livello del modulo OAI hanno i<br>

metadati<br>

> in un solo formato: il Dublin Core semplice. Ma il protocollo OAI ha<br>

sempre<br>

> detto che quello era il formato dati minimo indispensabile, ma che se si<br>

volevano dati più ricchi bisognava adottare in più e in parallelo altri<br>

formati dati più ricchi: come per es. un profilo applicativo del Dublin<br>

Core o MODS.<br>

> Che in Italia si sia lavorato poco su questi aspetti lo si deduce anche<br>

da<br>

> un confronto a livello europeo per quanto riguarda l'elaborazione a<br>

livello<br>

> nazionale di un formato di metadati specifico per le tesi. Finora in<br>

Italia<br>

> non si è fatto un lavoro come quello fatto in Inghilterra, in Francia o<br>

in<br>

> Germania. Qui hanno elaborato il formato chiamato XMetaDiss, adottato<br>

anche<br>

> in Svizzera (nel sito della Biblioteca Nazjonale Svizzera esiste anche<br>

la<br>

> versione italiana scaricabile da<br>

> <a href="http://www.nb.admin.ch/nb_professionnel/01693/01699/01873/01894/index.html?lang=it&download=NHzLpZeg7t,lnp6I0NTU042l2Z6ln1ah2oZn4Z2qZpnO2Yuq2Z6gpJCDeHx2hGym162epYbg2c_JjKbNoKSn6A--" target="_blank">http://www.nb.admin.ch/nb_professionnel/01693/01699/01873/01894/index.html?lang=it&download=NHzLpZeg7t,lnp6I0NTU042l2Z6ln1ah2oZn4Z2qZpnO2Yuq2Z6gpJCDeHx2hGym162epYbg2c_JjKbNoKSn6A--</a><br>


)<br>

> Tutto quello che si è fatto in Italia sinora è consistito nelle<br>

raccomandazioni CRUI per il formato di metadati delle tesi di dottorato<br>

contenute nel documento del 2007 Linee guida per il deposito delle tesi di<br>

> dottorato negli archivi aperti (pag. 11). Per ragioni di<br>

interoperabilità<br>

> è<br>

> consigliata l'adozione del solo Dublin Core semplice a 15 elementi che<br>

in<br>

> effetti è il formato richiesto dal portale DART Europe. Non dico che si<br>

tratti di una scelta "sbagliata". Ma forse non copre tutte le esigenze. Per<br>

> es. ora in Italia ci si accorge che serve la data di nascita<br>

delll'autore<br>

> (lo studente) per disambiguare gli omonimi, ma il Dublin Core semplice<br>

non<br>

> prevede questo dato che invece è stato previsto dal formato<br>

> tedesco  XMetaDiss. Così ora chi gestisce i metadati per le tesi di<br>

dottorato non sa dove aggiungere la data di nascita dell'autore e se in<br>

DSpace aggiunge un elemento apposito, per es. un elemento chiamato<br>

dc:DateOfBirth, la conseguenza al livello dei metadati Dublin Core del<br>

modulo OAI di quella installazione DSpace è che quell'elemento nuovo viene<br>

> mappato su dc:date con quella tipica operazione di<br>

> schiacciamento/semplificazione propria delle conversioni a Dublin Core<br>

semplice. Con il risultato che in questo modo nel modulo OAI esisteranno<br>

due elementi dc:date: quello della data intesa come data di<br>

> pubblicazione/discussione e quello della data intesa come data di<br>

nascita<br>

> dello studente creando un tipico caso di ambiguità per semplificazione<br>

eccessiva del formato dati.<br>

> La soluzione giusta sarebbe stata quella di creare un profilo DC ricco<br>

valido a livello nazionale e poi, dato che il DC semplice è richiesto da<br>

DART Europe, lavorare fin dall'inizio a livello delle regole automatiche<br>

di<br>

> conversione al formato dati del modulo OAI di DSpace per impedire<br>

conversioni automatiche che creano ambiguità.<br>

> Insomma: mi pare che anche su questo fronte il confronto con il resto<br>

d'Europa dovrebbe spronarci a capire che abbiamo molto lavoro da fare. E<br>

sarebbe molto utile confrontarsi su questo.<br>

> Pierfranco Minsenti<br>

> --<br>

> Pierfranco Minsenti<br>

> Università Iuav di Venezia<br>

> Dorsoduro, 2196 | 30123 Venezia<br>

> Tel. <a href="tel:%2B39%20041%20257%201015" value="+390412571015" target="_blank">+39 041 257 1015</a><br>

> E-mail: <a href="mailto:pminsenti@iuav.it" target="_blank">pminsenti@iuav.it</a>  |  skype: pierfranco.minsenti<br>

> Il giorno 21 gennaio 2012 18:26, Antonella De Robbio <<br>

> <a href="mailto:antonella.derobbio@unipd.it" target="_blank">antonella.derobbio@unipd.it</a>> ha scritto:<br>

>> Cara Alessandra,<br>

>> Come dice Maria, RePeC è un repository federato, una sorta di network,<br>

mentre SSRN è anch'esop un network ma di fatto è un repository su modello<br>

accentrato (come arXive ed E-LIS per capirci).<br>

>> Solo che SSRN contiene anche papers ad accesso chiuso che vengono<br>

venduti. E' un modello di business diverso dai tipici OA, ma comunque<br>

interessante.<br>

>> E' un modello ibrido in quanto lavora con partners tra i quali editori<br>

e istituzioni in programmi che coinvolgono oltre 1.800 periodici<br>

scientifici e istituzioni di ricerca che forniscono le informazioni sulle<br>

novità in pubblicazione e accordano permessi per il deposito in SSRN.<br>

>> Essendo un repository a sé non ne "indicizza" altri, ma nemmeno RePeC<br>

funziona così: RePeC raccoglie dai repository locali che aderiscono al<br>

network.<br>

>> In altri termini non è che SSRN indicizza ma è possibile aderire per<br>

essere incluso.<br>

>> Anche gli autori possono sottomettere i loro papers, ci sono requisiti<br>

sul sito, ma devono essere stati pubblicati.<br>

>> Mi riferivo alla classifica Ranking web of world repositories, dove<br>

SSRN risulta al primo posto.<br>

>> antonella de robbio<br>

>> Il 20 gennaio 2012 14:46, Maria Cassella <<a href="mailto:maria.cassella@unito.it" target="_blank">maria.cassella@unito.it</a>> ha<br>

scritto:<br>

>> > Il 20/01/2012 13.50, Alessandra Bianchi ha scritto:<br>

>> >> Non si sa se SSRN può "indicizzare" in qualche modo le collezioni<br>

dei<br>

>> >> repository, stile RePEc?<br>

>> >> Il 20/01/2012 13:41, Maria Cassella ha scritto:<br>

>> > non vorrei sbagliarmi ma credo proprio di no l'architettura di PePEc<br>

>> e'<br>

>> > distribuita; quella di SSRN no, mi sembra abbia solo dei server<br>

>> mirror.<br>

>> > ciao<br>

>> > maria<br>

>> > _______________________________________________<br>

>> > OA-Italia mailing list<br>

>> > <a href="mailto:OA-Italia@openarchives.it" target="_blank">OA-Italia@openarchives.it</a><br>

>> > <a href="http://openarchives.it/mailman/listinfo/oa-italia" target="_blank">http://openarchives.it/mailman/listinfo/oa-italia</a><br>

>> > PLEIADI: <a href="http://www.openarchives.it/pleiadi/" target="_blank">http://www.openarchives.it/pleiadi/</a><br>

>> --<br>

>> Antonella De Robbio<br>

>> CAB Centro di Ateneo per le Biblioteche<br>

>> Università degli Studi di Padova<br>

>> Via Anghinoni, 3<br>

>> 35121 PADOVA (ITALY)<br>

>> <a href="tel:%2B%2B%2039%20049%208273654" value="+390498273654" target="_blank">++ 39 049 8273654</a><br>

>> ++ <a href="tel:334%206960555" value="+13346960555" target="_blank">334 6960555</a><br>

>> ""Chi ha trascurato la propria educazione non sa fare uso della propria<br>

libertà". Kant<br>

>> _______________________________________________<br>

>> OA-Italia mailing list<br>

>> <a href="mailto:OA-Italia@openarchives.it" target="_blank">OA-Italia@openarchives.it</a><br>

>> <a href="http://openarchives.it/mailman/listinfo/oa-italia" target="_blank">http://openarchives.it/mailman/listinfo/oa-italia</a><br>

>> PLEIADI: <a href="http://www.openarchives.it/pleiadi/" target="_blank">http://www.openarchives.it/pleiadi/</a><br>

> _______________________________________________<br>

> OA-Italia mailing list<br>

> <a href="mailto:OA-Italia@openarchives.it" target="_blank">OA-Italia@openarchives.it</a><br>

> <a href="http://openarchives.it/mailman/listinfo/oa-italia" target="_blank">http://openarchives.it/mailman/listinfo/oa-italia</a><br>

> PLEIADI: <a href="http://www.openarchives.it/pleiadi/" target="_blank">http://www.openarchives.it/pleiadi/</a><br>

<br>

<br>

--<br>

</div></div><div>Alessandra Bianchi<br>

Università degli studi di Bergamo<br>

Amministratore Aisberg - Archivio istituzionale ad accesso aperto<br>

dell'Università di Bergamo<br>

via dei Caniana, 2<br>

24127 - Bergamo<br>

tel.: <a href="tel:%2B39-035-2052548" value="+390352052548" target="_blank">+39-035-2052548</a><br>

</div>fax: <a href="tel:%2B39-035-2052569" value="+390352052569" target="_blank">+39-035-2052569</a><br>

mailto: <a href="mailto:alessandra.bianchi@unibg.it" target="_blank">alessandra.bianchi@unibg.it</a><br>

site: <a href="http://dspace-unibg.cilea.it/" target="_blank">http://dspace-unibg.cilea.it/</a><br>

<div><div><br>

<br>

<br>

<br>

<br>

<br>

<br>

<br>

<br>

<br>

<br>

<br>

_______________________________________________<br>

OA-Italia mailing list<br>

<a href="mailto:OA-Italia@openarchives.it" target="_blank">OA-Italia@openarchives.it</a><br>

<a href="http://openarchives.it/mailman/listinfo/oa-italia" target="_blank">http://openarchives.it/mailman/listinfo/oa-italia</a><br>

PLEIADI: <a href="http://www.openarchives.it/pleiadi/" target="_blank">http://www.openarchives.it/pleiadi/</a><br>

</div></div></blockquote></div></div></div><br><br>

</div>

<br>_______________________________________________<br>

OA-Italia mailing list<br>

<a href="mailto:OA-Italia@openarchives.it" target="_blank">OA-Italia@openarchives.it</a><br>

<a href="http://openarchives.it/mailman/listinfo/oa-italia" target="_blank">http://openarchives.it/mailman/listinfo/oa-italia</a><br>

PLEIADI: <a href="http://www.openarchives.it/pleiadi/" target="_blank">http://www.openarchives.it/pleiadi/</a><br></blockquote></div></div></div><br>

<br>_______________________________________________<br>

OA-Italia mailing list<br>

<a href="mailto:OA-Italia@openarchives.it">OA-Italia@openarchives.it</a><br>

<a href="http://openarchives.it/mailman/listinfo/oa-italia" target="_blank">http://openarchives.it/mailman/listinfo/oa-italia</a><br>

PLEIADI: <a href="http://www.openarchives.it/pleiadi/" target="_blank">http://www.openarchives.it/pleiadi/</a><br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div>Pierfranco Minsenti</div><div><br></div>

<div>Università Iuav di Venezia</div><div><div>Area infrastrutture</div><div>Divisione servizi ICT</div><div>Ex-Cotonificio Veneziano</div></div><div>Dorsoduro, 2196 | 30123 Venezia</div><div>Tel. +39 041 257 1015</div><div>

<br></div><div>E-mail: <a href="mailto:pierfranco.minsenti@iuav.it" target="_blank">pierfranco.minsenti@iuav.it</a>  |  skype: pierfranco.minsenti</div><div><br></div><div>---------------------------------------------------------------------------------</div>

<div>ll contenuto di questa e-mail e dei suoi eventuali allegati è rivolto</div><div>unicamente alle persone alle quali è indirizzato, e può contenere</div><div>informazioni la cui riservatezza è tutelata. Sono vietati la riproduzione</div>

<div>e l’uso di questa e-mail in mancanza di  autorizzazione del destinatario.</div><div>Se avete ricevuto questa e-mail per errore, vogliate cortesemente</div><div>informare immediatamente il mittente ed eliminare il messaggio dal</div>

<div>vostro sistema di posta. Il carattere confidenziale di questa e-mail</div><div>non viene meno a causa di questo errore.</div><div>--------------</div><div>This e-mail, together with any attachments, is intended for the named</div>

<div>recipient(s) only and may contain information that is privileged,</div><div>confidential or otherwise protected from disclosure. </div><div>Copying, dissemination or use of this e-mail or the information herein</div>

<div>by anyone other than the intended recipient is prohibited unless</div><div>expressly authorised by the sender. If you have received this e-mail</div><div>by mistake, please inform the sender as soon as possible and delete</div>

<div>the message and any copies of this message from your computer</div><div>system network. The confidentiality and privacy attached to this</div><div>email is not waived or destroyed by that mistake.</div><div>---------------------------------------------------------------------------------</div>

<br>

</div>