Le parti del discorso PoS Tagging: assigning a word to a part of speech / to a syntactic category. PoS tagging (or word category disambiguation) is the process of marking up a word in a text / in a corpus as belonging to a particular part of speech / syntactic category, focusing - its definition -its formal behaviour So, Pos tagging implies that - we can define the notion of ‘word’ - we can define the notion of ‘part of speech’ - we can sketch a neat boundary between two parts of speech Possible problems - A single word can represent more than one part of speech at different times (that is to say, in different contexts) - Some parts of speech are ‘open categories’, other parts of speech are ‘closed categories’ -The cross linguistic diffusion of parts of speech is not homogeneous (for example, languages spoken in East and South East Asia are always supposed to lack Adjectives) - The formal properties of words belonging to a part of speech may vary cross-linguistically Etc… Part of speech - a ‘typical’ definiton A part of speech (a word class, a lexical class, a lexical category, a syntactic category) is a class of words (or lexical items), which is generally defined by their syntactic or morphological behaviour. For example Noun: words inflected for case, number, gender, designating a concrete or abstract entity Verb: words without case inflection, but inflected for tense, person and number, signifying an activity or process performed or undergone Parts of speech and grammatical properties Gender Singular Dual Noun Number Trial Paucal inclusive Case Plural exclusive Italian: Noun: words inflected for number and gender, designating a concrete or abstract entity English Noun: words inflected for number designating a concrete or abstract entity Latin Noun: words inflected for case, number, gender, designating a concrete or abstract entity Italian: Noun: words inflected for number and gender, designating a concrete or abstract entity English Noun: words inflected for number designating a concrete or abstract entity Latin Noun: words inflected for case, number, gender, designating a concrete or abstract entity If we focus on syntactic or morphological behaviour, we can wonder whether Italian nouns, English nouns, and Latin nouns can be considered as members of the same class or not The ‘traditional’ view of parts of speech reduces the importance of cross-linguistic comparison. Problemi a livello intralinguistico STAMPAQuot: fece le ossa partecipando alle lotte operaie di Torino , quelle dei primi anni 6 STAMPAQuot: la posta alle tabacchine , le lotte operaie degli Anni Trenta . Cos ' è che non STAMPAPeri: un Mugello ? " ) , fino alle cinture operaie di Milano e Torino ; gli interrogat STAMPAPeri: le . In special modo , nelle società operaie e contadine l ' unione matrimoniale STAMPASupp: api in paglia e in feltro , assume 2 operaie esperte nel settore . Curriculum al NARRATRoma: re l ' alveare ad opera delle solite operaie o all ' agitare velocissimo delle a NARRATVari: importanza . In risposta alle lotte operaie e studentesche , alle manifestazion NARRATVari: parti sono nate le prime cooperative operaie , le università popolari , i movime NARRATTrVa: politicamente organizzati . Le masse operaie che facevano capo allo S.P.D. aveva PRACCRivis: ù di una decina di fuchi , mentre le operaie delle vespe polistine sono di solit PRACCRivis: a inibisce lo sviluppo ovarico delle operaie , rendendole per l ' appunto steril PRACCRivis: o dei telai , distribuiti nelle case operaie , e affidati alle donne che non lav PRACCVolum: studiato i rapporti tra le famiglie operaie , Petonnet le bande giovanili del s PRACCVolum: irando nel movimento stesso le masse operaie , scopo che non gli fu possibile ra PRACCVolum: agandisti e organizzatori di società operaie , emerse August Becker ( 1814-1871 PRACCVolum: ito , un ' inchiesta fra contadine e operaie tedesche della fine dell'800 rivela PRGAMMDocu: ivoluzionario e riflusso delle lotte operaie al fronte borghese costituito contr PRGAMMDocu: aziendali , a vantaggio delle altre operaie , che , egoisticamente non aderendo MISCVolumi: nuovo cambiamento nelle vecchie aree operaie dell ' immediata periferia : labora MISCVolumi: o senso ) dalle prime rivendicazioni operaie . Sul piano politico l ' adesione d EPHEMOpusc: nsioni per l ' allevamento delle api operaie e si inducono le famiglie a non cos MON2001_04: ssanta e Settanta , durante le lotte operaie e studentesche , e che si è poi for MON2005_07: poco gli operai e , ancor meno , le operaie . Regala - 261' " ' ' ? ? ? ' - ' " MON2005_07: erta fuori_dal mio terreno , le zone operaie dove la questione era ormai la cres MON2005_07: miche , un mondo democratico dove le operaie sono tutte uguali tra loro e dove s MON2008_10: so che quanti provengono da famiglie operaie o artigiane tendono a vivere in cop Problemi a livello intralinguistico STAMPAQuot: fece le ossa partecipando alle lotte operaie di Torino , quelle dei primi anni 6 STAMPAQuot: la posta alle tabacchine , le lotte operaie degli Anni Trenta . Cos ' è che non STAMPAPeri: un Mugello ? " ) , fino alle cinture operaie di Milano e Torino ; gli interrogat STAMPAPeri: le . In special modo , nelle società operaie e contadine l ' unione matrimoniale STAMPASupp: api in paglia e in feltro , assume 2 operaie esperte nel settore . Curriculum al NARRATRoma: re l ' alveare ad opera delle solite operaie o all ' agitare velocissimo delle a NARRATVari: importanza . In risposta alle lotte operaie e studentesche , alle manifestazion NARRATVari: parti sono nate le prime cooperative operaie , le università popolari , i movime NARRATTrVa: politicamente organizzati . Le masse operaie che facevano capo allo S.P.D. aveva PRACCRivis: ù di una decina di fuchi , mentre le operaie delle vespe polistine sono di solit PRACCRivis: a inibisce lo sviluppo ovarico delle operaie , rendendole per l ' appunto steril PRACCRivis: o dei telai , distribuiti nelle case operaie , e affidati alle donne che non lav PRACCVolum: studiato i rapporti tra le famiglie operaie , Petonnet le bande giovanili del s PRACCVolum: irando nel movimento stesso le masse operaie , scopo che non gli fu possibile ra PRACCVolum: agandisti e organizzatori di società operaie , emerse August Becker ( 1814-1871 PRACCVolum: ito , un ' inchiesta fra contadine e operaie tedesche della fine dell'800 rivela PRGAMMDocu: ivoluzionario e riflusso delle lotte operaie al fronte borghese costituito contr PRGAMMDocu: aziendali , a vantaggio delle altre operaie , che , egoisticamente non aderendo MISCVolumi: nuovo cambiamento nelle vecchie aree operaie dell ' immediata periferia : labora MISCVolumi: o senso ) dalle prime rivendicazioni operaie . Sul piano politico l ' adesione d EPHEMOpusc: nsioni per l ' allevamento delle api operaie e si inducono le famiglie a non cos MON2001_04: ssanta e Settanta , durante le lotte operaie e studentesche , e che si è poi for MON2005_07: poco gli operai e , ancor meno , le operaie . Regala - 261' " ' ' ? ? ? ' - ' " MON2005_07: erta fuori_dal mio terreno , le zone operaie dove la questione era ormai la cres MON2005_07: miche , un mondo democratico dove le operaie sono tutte uguali tra loro e dove s MON2008_10: so che quanti provengono da famiglie operaie o artigiane tendono a vivere in cop Parametri di classificazione • rapporto tra i costituenti del composto • presenza – assenza della testa Bisetto & Scalise (2005: 326): composti attributivi/appositivi subordinati endo. trasporto rifiuti exo. endo. tritacarne pesce palla exo. coordinativi endo. exo. pellerossa studente lavoratore Emilia Romagna “Attributive compounds are formed either by a noun and an adjective, as in blue cheese (where the adjective expresses a property and is in a modifier relation to the noun) or by two nouns, where the non-head very often is used somehow metaphorically, expressing an attribute of the head” (Bisetto / Scalise 2005: 327). pesce spada / sword fish pesce palla / globefish Fiume ‘river’ Riunione ‘meeting’ Riunione fiume fiume bomba lampo chiave mosca principe fantasma ombra [[X]N fiume]N [[X]N bomba]N [[X]N lampo]N [[X]N chiave]N [[X]N ombra]N … literal meaning ‘river’ ‘bomb’ ‘lightning’ ‘key’ ‘fly’ ‘prince’ ‘ghost’ ‘shade’ metaphorical extension ‘long’ ‘sensational’ ‘quick’ ‘crucial’ ‘small’ ‘principal’ ‘evident, but not seen’ ‘parallel, alternative’ X = riunione, interrogatorio, processo, discorso, discussione, X = notizia, intervista, rivelazione X = processo, guerra, viaggio, operazione, recupero X = parola, ruolo, concetto, elemento, posizione X = governo, ministro Dardano (1978: 184) : “Quando si formano delle intere serie con lo stesso Dnte, quest’ultimo tende a perdere ulteriormente la sua specificità semantica e a comportarsi quasi come un elemento suffissale” Bauer (2005: 98) : “The histories of many of the familiar and well-studied European languages give us a number of cases of compounds at one period of history becoming derivatives at a later period. […]. We find a particular word being used more and more frequently as a compound-element, perhaps to the extent that its use as a compound element is more frequent than its use as an independent word. In some of these cases the meaning which is observed in the compound instances is also distinct from the meaning which pertains when the word is used independently. I have two sets of examples of this stage, one from French, one from English. The French example set is the use of particular words in compounds, especially in journalistic styles. Specific instances are idée “idea” used as head element and choc “shock” or clef “key” used as modifying element […]: prix-choc “shock price”, idée cuisine “cooking idea”, mot clef “key word”. Arcodia (2008: 46) “la proprietà che una parola / morfema, o un’accezione di una parola / morfema, deve avere per essere considerate di natura affissale sono, oltre alla rigidità posizionale, un significato più generico (o perlomeno non più specifico) di suoi eventuali usi liberi, che deve ripetersi stabile nelle sue diverse istanze” It. ingegnere capo ‘head engineer’ filosofo ‘philosopher’ antropofilo ‘anthropophilic’ vs. vs. vs. capoufficio ‘head clerk’ bibliofilo ‘bibliophile’ filantropo ‘philanthropist’ Heine, Claudi, Hünnemeyer (1991: 43) “Both generalizing and isolating abstraction also appear to be present when grammaticalization is analyzed in terms of bleaching […]: lexemes become more “abstract” by losing their semantic specificities and by being increasingly reduced to their respective core meaning (generalizing abstraction) or to one particular part of their meaning (isolating abstraction). Abstraction of both types implies that its output is necessarily part of its input; that is, what happens in the course of grammaticalization is that concepts are merely reduced in their intensional content while their extension is increased” Alcune vitamine svolgono ruoli molto chiave nell’equilibrio ormonale I Magic hanno pagato molta inesperienza, mi aspettavo un ruolo più chiave di Dwight Howard Un processo più fiume di ogni precedente, data la mole dei documenti e la massa che mobilita di figuranti e comparse Hai fatto una riunione talmente lampo che hai fatto tutto da solo! (da Internet) Dopo una operazione lampo ed un recupero lampissimo, Baresi torna in campo per la partita più importante. Notizia bombissima! Priest Holmes si ritira? (da Internet) Quello che vede impegnato Van Nistelrooy è uno dei duelli chiavi della partita (La Repubblica) Quante parole chiavi usano gli utenti nelle ricerche? Ci sono sempre in mezzo i giochi politici, le ''notizie bombe'' Crollano Parigi, Londra, Berlino, Milano, Wall Street, sospese le quotazioni delle maggiori aziende, riunioni fiumi di governi e consigli di amministrazione (from Internet) pesce spada > pesci spada / *pesci spade Ho sottolineato in tre colori (giallo punti esegetici importanti, arancio parole chiavissime, rosa le opere) tutte le 16 pagine che l'Abbagnano-Fornero, vecchia edizione, dedica a Galilei Telefonata fiume fiumissima... ah, sapeste!! (da internet) Number agreement with the head noun Gender agreement with the head noun Comparative form Superlative form Adverb formation with -mente Occurrence in prenominal position Thornton (2004) They can agree in number with the head noun They can agree in gender with the head noun They can occur in comparative form They can occur in superlative form They occupy the syntactic slot usually assigned to adjectives They do not have a referential, but a descriptive function. Croft, W. (1991), Syntactic categories and grammatical relations: The cognitive organization of information, Chicago, Chicago University Press. Croft, W. (2000), Parts of speech as language universals and as languageparticular categories, in Vogel, P. / Comrie, B. (eds.), Approaches to the Typology of Word Classes, Berlin – New York, Mouton de Gruyter, 65-102. Visione ‘tradizionale’ - Noun, verb and adjective are categories of particular languages. - But noun, verb and adjective are NOT language universals – that is, there are NOT found in some languages. Croft (2000: 65) - Noun, verb and adjective are not categories of particular languages. - But noun, verb and adjective are language universals – that is, there are typological prototypes […] which should be called noun, verb and adjective. Croft (2000: 83): A proper theory of parts of speech that applies to all languages must satisfy the following three conditions in order to be successful. First, there must be a criterion for distinguishing parts of speech from other morphosyntactically defined subclasses. Second, there must be a cross-linguistically valid and uniform set of formal grammatical criteria for evaluating the universality of the parts-of-speech distinctions. Third there must be a clear distinction between language universals and particular language facts. Defining parts of speech 1st level: Universal Focus on function Cross-linguistic perspective Different words are part of the same class if they perform the same function 2nd level: Particular language facts Focus on form Idio-linguistic perspective Different words are part of the same class if they perform the same function and share the same formal behaviour “Syntactic categories, including those commonly labelled as parts of speech, are derivative from constructions that define them” (Croft 2000: 85) Constructions are the primitive elements of syntactic representation and categories are derived from them: it is a sample of different constructions with a common function that defines the boundaries of a category or of a part of speech. Typological comparison will sketch a pattern of variation and every single language will fit somewhere in this pattern of variation. This pattern of variation is defined by the combination of Objects Three semantic classes Properties Actions Reference Three pragmatic functions Modification Predication Funzione referenziale: individuazione di un’entità nella realtà, referente concreto su cui poi verr`a detto qualcosa. Funzione predicativa: attribuzione di proprietà o azioni ad un referente Funzione modificativa: specificazione dell’entità da designare per favorire l’individuazione di un referente tra tutti quelli possibili Croft (1991: 67) Objects Reference Modification Predication unmarked nouns genitive, adjectivalisations, PPs on nouns predicate nominals, copulas unmarked adjectives Predicate adjectives, copulas Properties deadjectival nouns Actions action nominals, participles, relative complements, clauses infinitives, gerunds unmarked verbs The theory defines universal prototypes for the three major parts of speech, but does not define boundaries for these categories. Boundaries are aspects of language-particular grammatical categories, determined by distributional analysis” The typological universals do not predict the exact behaviour of individual languages; rather, they predict that a language will fit somewhere in the pattern of variation allowed by typological marking theory (Croft, 1991) From universal prototypes to particular language facts function indicating morphosyntax distributional analysis Quindi, ogni lessema ha una propensione intrinseca e interente a realizzarsi come N, V o ADJ in base alle sua semantica (e alla funzione pragmatica naturalmente associata ad essa): oggetto > referenzialità > morfologia nominale proprietà > modificazione > morfologia aggettivale azione > predicazione > morfologia verbale In base a questa ‘propensione’, nel passaggio dal livello astratto (lessema) a quello concreto (forma flessa), le parole ricevono la morfologia prototipica di una specifica parte del discorso A livello interlinguistico non paiono attestate lingue in cui l’assegnazione della morfologia flessiva avvenga sistematicamente in controtendenza rispetto alla semantica ed alla conseguente funzione pragmatica. Ovviamente Nome Italiano Inglese Cinese Aggettivo Verbo Agreement Gender Number Case Adv formation Superlative Comparative Syntetic Analytic Syntetic Analytic ADJECTIVE Modification by property Italian Latin English X X X X X X X X X X X X X X X X X X X The universal-typological theory of parts of speech embraces constructions with and without function-indicating morphosyntax. Function-indicating morphosyntax overtly encodes the functions of reference, predication and modification for various classes of lexical items. As such, function-indicating morphosyntax falls under the structural coding criterion of the theory of typological markedness. The theory of typological markedness […] is a general theory of the relationship between form and meaning across languages The theory defines universal prototypes for the three major parts of speech, but does not define boundaries for these categories. Boundaries are aspects of language-particular grammatical categories, determined by distributional analysis” The typological universals do not predict the exact behaviour of individual languages; rather, they predict that a language will fit somewhere in the pattern of variation allowed by typological marking theory Moreover, the terms verb and adjective do not describe language-particular grammatical categories anyway. They describe cross-linguistic patterns of variation. In particular they describe a prototype. A prototype describes the core of a category; it does not say anything about the boundary of a category […]. In fact, the universal typological theory of parts of speech defines only prototypes for the parts of speech; it does not define boundaries. Boundaries are features of language-particular categories. Noun > reference to an object Adjective > modification by a property Verb > predication of an action “The function of modification is to create a new, ad hoc, opportunistic category that fits the speaker’s idea more closely” (Chafe 2012: 5) In such a theoretical framework, we cannot exclude cases of multiple class membership and of sporadic occurrence of linguistic constructions in atypical roles. Croft (2000: 96) “it is quite common cross-linguistically to find a lexical item used in more than one pragmatic function without overt derivation but with a significant and often systematic semantic shift […]. The relevant cross-linguistic universal is that these shifts are always towards the semantic class prototypically associated with the pragmatic function” The behavioural potential criterion specifies that the unmarked member displays at least as wide a range of grammatical behaviour as the marked member. The behavioural potential criterion is again formulated as an implicational universal. It allows for the possibility of marked members […] to have the same inflectional possibilities as unmarked members […] in some language. It excludes the possibility of marked members having more inflectional possibilities than unmarked members. The behavioural potential criterion also allows for the limited or “defective” behaviour of the marked member of a category […] without having to commit to the marked member being “in” or “not in” the category in a universaltypological sense.