Pagina 1 di 1

"Composto da"

Inviato: lun, 05 giu 2006 20:08
di luke_old_boy
Salve,
scrivo per avere delucidazioni su una questione certamente banale, ma sulla quale non riesco a decidermi.
Consideriamo i verbi "formare", "caratterizzare", "comporre": si può dire
"io ho composto una poesia" ;
"io sono composto da acqua".
Nel primo caso "composto" è participio passato; tuttavia, nel secondo, è da considerarsi aggettivo? "comporre" è transitivo, da quello che so dovrebbe formare i tempi composti solo con "avere".
In generale come considerare tutte le forme "composto da", "formato da" ?

mi perdonerete la "bassezza" del quesito...
grazie

Inviato: lun, 05 giu 2006 20:21
di Marco1971
Benvenuto, luke_old_boy! :)

Non c'è nulla di banale nel suo interessante quesito. In frasi come è formato/composto di/da acqua, abbiamo che fare con participi passati usati in funzione aggettivale. Rimando a questo mio vecchio intervento.

Inviato: lun, 05 giu 2006 21:40
di luke_old_boy
Grazie per il suo intervento, Marco.
Mi spiego: per un corso universitario che sto frequentando (sull'intelligenza artificiale), devo identificare (annotare) tramite un Part-Of-Speech Tag ogni parola di un certo testo, utilizzando un certo software. Questo POS tag deve essere univoco: ad esempio, abbiamo "ADS" per Aggettivo Qualificativo Singolare, oppure "VPP" per Participio Passato.
Ho il seguente frammento:
"...l'enciclopedia conta più di 163000 voci, caratterizzate da un contenuto...".
Dovrei identificare univocamente, come participio passato oppure come aggettivo, la parola "caratterizzate".
Lei mi dice che abbiamo a che fare con participi passati in funzione aggettivale: in sintesi di participio passato quindi si tratta (perdoni i modi spicci dell'informatico...).

Dovendo scegliere , mi consiglia quindi di identificarlo come part. passato ?

A meno che non convinca gli autori del software che sto usando ad aggiungere una POS tag "PPA" (participio passato in funzione aggettivale), cosa anche possibile.

La ringrazio

Inviato: lun, 05 giu 2006 22:03
di Marco1971
Nella sua frase bisogna considerare caratterizzato come un aggettivo, a mio avviso.

Interessante il corso, m’interessa molto l’analisi dei corpora. Peccato che tutta la terminologia sia in inglese. :(

Non potrebbe convincere gli autori del programma a usare EPD (Etichetta Parte del Discorso) o ICG (Identificazione Categoria Grammaticale)? :D

Inviato: lun, 05 giu 2006 22:19
di Federico
Ogni occasione è buona per far proselitismo. :lol:

Inviato: lun, 05 giu 2006 22:20
di Marco1971
Preciso meglio: il participio passato serve a esprimere la compiutezza (reale o ipotetica) di un’azione (o d’una trasformazione). Le truppe nemiche hanno circondato la città –> La città è stata circondata dalle truppe nemiche (al passivo, con pieno valore verbale del participio passato). L’aggettivo invece esprime una qualità o uno stato cosí com’è al momento dell’enunciazione: La città è circondata di mura.

Nei tempi semplici, per disambiguare, possiamo ricorrere al verbo venire invece di essere: se dico La porta è aperta intendo normalmente in che stato si trova; se dico La porta viene aperta, disambiguo, e il participio passato ha valore verbale.

Inviato: lun, 05 giu 2006 22:28
di luke_old_boy
Il fatto che mi consiglia di considerarlo aggettivo mi conforta; vorrà dire che bisognerà raffinare le regole contestuali note al software, visto che la sua interpretazione preferita di "caratterizzate" era il p. passato, per quanto attiene all'analisi di quel frammento.
Per quanto riguarda il convincere gli informatici ad usare l'italiano al posto dell'inglese , è cosa ardua!
A nostra discolpa, c'è il fatto che l' I. è certamente molto legata al mondo anglosassone.

--
Leggo ora la sua precisazione: la ringrazio, è molto chiara

Inviato: lun, 05 giu 2006 22:37
di Marco1971
Il programma che usate difficilmente può percepire le sottigliezze della lingua; dopotutto è una macchina. :)

Sí, è vero che l’informatica è legata al mondo anglosassone, che l’ha inventata. Tuttavia credo che noi dobbiamo crearci la nostra terminologia, come hanno fatto e continuano a fare i nostri cugini francesi e spagnoli (a tacere degli altri).

Inviato: lun, 05 giu 2006 23:13
di luke_old_boy
E' possibile che lei abbia già conoscenza di queste cose, ma comunque le dico...
Il programma in effetti di suo non percepirebbe un bel nulla, se non possedesse un corpus annotato a cui attingere in modo cosiddetto stocastico (selezionando cioè l'annotazione più comune per la parola in esame), preocuppandosi poi di raffinare le interpretazioni tramite regole contestuali!
Il programma può accrescere la propria base di conoscenza, imparando per quanto gli è possibile; i curatori, possono aggiungere le regole contestuali.
Il programma controlla se la regola è verificata nel caso in esame (nel "contesto"): se è verificata, la applica.
La regola potrebbe affermare, nel nostro caso, "verifica se la forma in -ato, -ati, -ata, -ate di 'caratterizzare' è seguita da 'da/di' e non ha ausiliare 'avere' o verbo 'venire': se è così, considerare la parola Aggettivo".
E' evidente che bisognerebbe aggiungere un numero enorme di queste regole per avere un analizzatore molto accurato (e sto volutamente trascurando dettagli tecnici come la velocità di analisi, ecc...): questo implica inoltre la necessità di dargli in pasto moltissimi testi, per avere tante situazioni diverse. Altra limitazione: la lingua deve essere l'italiano corrente (una terzina dantesca lo getterebbe nello sconforto elettronico...).
Può aiutare la ricerca di regole che siano più generali possibile.
Comunque, con il tempo e l'esercizio, si potrebbe arrivare ad avere un analizzatore piuttosto accurato: nulla di strettamente paragonabile all'analisi umana, ovviamente.

C'è da dire che per l'inglese le cose sono più semplici e si hanno già analizzatori che possiamo definire soddisfacenti (accuratezza oltre il 93%), infatti la ricerca su questi analizzatori continua ancora un po' in Italia per l'italiano, mentre all'estero si è passati da tempo ad altro.

Inviato: lun, 05 giu 2006 23:29
di Marco1971
E infatti la realizzazione del mirabile dizionario COBUILD e della sua grammatica è stata resa possibile proprio grazie a questi programmi che lei cosí bene descrive. È vero anche, come dice lei stesso, che per l’inglese è piú facile, per il numero molto minore di forme flesse.