Corpus Linguistics
Con il termine Corpus Linguistics si fa riferimento ad una raccolta di testi atti allo studio di una
componente linguistica, in particolare:
-Semantic Prosody
-Semantic Preference
-Ideology
Innanzitutto, per sviluppare un CL bisogna avere chiaro un argomento da trattare (Cellule
staminali, alieni, discorsi politici ecc..). Successivamente si procederà alla raccolta dei testi,
minimo una ventina (più sono, meglio è). Un CL può essere elaborato seguendo due strade:
-Parallel Corpus: un testo tradotto in più lingue, con analisi delle scelte linguistiche e della
terminologia usata.
-Comparable Corpus: più testi della stessa lingua facenti parte dello stesso argomento, con
analisi di un "node" e delle componenti linguistiche.
Scelta la strada da seguire, il programma che vi servirà per creare il vostro CL è AntConc,
scaricabile gratuitamente da questo link: http://www.laurenceanthony.net/software/antconc/
AntConc è un programma in grado di raccogliere i testi da voi selezionati e fare varie analisi su
cui poi andrete a creare il vostro progetto. Qui di seguito vi spiegherò come lavorare ad un
Comparable Corpus, prendendo come spunto il lavoro da me svolto per l'esame.
Dopo aver terminato la raccolta di testi, apriamo AntConc e selezioniamo in alto a sinistra
"File"->"Open File(s)", selezioniamo ed apriamo tutti i testi. Selezioniamo l'etichetta "Word List"
e premiamo "Start" in basso.
A questo punto il programma vi darà la lista completa di tutte le parole dei testi segnandovi
la frequenza con la quale compaiono. Il primo obiettivo è dunque quello di trovare un
"node", un'unica parola che possa essere un punto di partenza per una tesi sul corpus,
evitando però di prendere in considerazione:
-Articoli
-Preposizioni
-Congiunzioni
-Qualunque altra parola "vuota"
Esempio:
Nel corpus preso come esempio, l'argomento trattato dai testi è la Guerra del Vietnam, diviso
in 10 testi con testimonianze dei veterani o racconti sulla guerra e 10 testi che interessavano
la visione della guerra da parte del movimento Hippie. Il Node preso in considerazione è la
parola "Against"(contro), che presenta diverse sfaccettature a seconda del contesto e della
posizione. Against quindi, proprio per la sua natura, è un buon punto di partenza per
elaborare (spiegherò in seguito) una Semantic Prosody, una Semantic Preference (che in
realtà non ho evidenziato poichè Against è una preposizione/avverbio e quindi poco
propensa alla sostituzione da parte di un sinonimo) e una Ideology. Trovato il node,
spostiamoci nella sezione "Concordance", scriviamo in basso la parola trovata e premiamo
Start. Il programma adesso vi darà una lista di tutte le apparizioni della parola all'interno
delle frasi e sulla destra il/i file da cui è stata presa. In basso a sinistra vedrete la scritta "Total
No. #" ovvero il numero di volte in cui occorre la parola. Questo è un dato da riportare
all'interno della presentazione.
L'analisi del node prende in considerazione cosa sta "attorno" al node, ovvero la/le parole
immediatamente precedenti o quelle immediatamente successive. Per evidenziarle basta
andare in basso nella sezione "Kwic Sort" e impostare i vari livelli: 1R sta per la prima parola
alla destra del node, 1L per la prima parola alla sinistra del node e così via. Starà a voi
decidere come impostare i livelli e fatto ciò, premete "Sort".
Il risultato sarà questo:
Fatto ciò, il prossimo obiettivo è quello di trovare la Semantic Prosody, ovvero estrapolare la
connotazione (positiva, neutrale o negativa) del node a seconda della costruzione delle frasi
di cui fa parte. Against, ad esempio, ha una connotazione negativa se usato in frasi come
"USA against Vietnam" o "Fighting against U.S. forces", ma prende una piega positiva se
trovato in frasi come "Demonstration against the war" o "Hippie's movement against
Vietnam war". Facendo quindi un bilancio sul numero di volte in cui appare come negativo e
come positivo, Against non ha una Semantic Prosody ben definita, limitandoci ad
identificarla come "Neutrale".
Il passo successivo è la Semantic Preference, ovvero la scelta di quel determinato termine
rispetto ad un suo sinonimo, cercando di estrapolarne le ragioni linguistiche o ideologiche.
L'ultimo obiettivo è l'inquadramento della Ideology, il pensiero di fondo che si può trarre
leggendo i testi. A seconda della costruzione della frase o dell'utilizzo di un lessico rispetto
ad un altro, si può cogliere il senso di favore o non favore dell'argomento che si sta
trattando. Ad esempio, se prendiamo come argomento la ricerca sulle cellule staminali
cercando di raccogliere una quantità di testi che portano ad un rapporto di neutralità
sull'argomento, si può cogliere l'ideologia di accettabilità verso il trattamento in quanto utile
per curare malattie ma si possono riscontrare opinione contrarie in quanto è un metodo
pericoloso e non ancora sicuro al 100%. Il segreto quindi di un corpus sta proprio in questo:
trattare un argomento in modo positivo, negativo o neutrale (partendo già dalla scelta dei
testi) influenzerà il lavoro di estrapolazione dei contenuti.
Corpus Linguistics
Vietnam War and anti-Vietnam
movement
Dario D’Amato
The analysis of the word
“Against”
The word “against” occurs 87 times in these 24
texts. The word is often preceded or followed
by a noun, and in some cases by a verb.
Noun + against -> 55 times
Verb + against -> 32 times
Against + (article) noun -> 87 times
The word I took as node is "against", because it could
carries different meanings. Although the word is often
used in sentences like:
"American against Vietnam", we can also found it in
other sentences, such as "Demonstration against the
war" or "The major non-Communist Cambodian
political and resistance organization fighting against the
Vietnamese occupation force."
As said before, the word doesn't refer only to
the fighting between USA and Vietnam, but
also to the hippie's movement, that fought
against war through peace. Thus, semantic
prosody could be negative whereby the word is
used only in USA vs. Vietnam context,
but thanks to other uses for the hippie's
movement, the semantic prosody of 'against'
can be neutral.
1. Vietnam – 544 times
2. War – 525 times
3. Vietnamese – 209 times
4. American – 201 times
5. Military – 201 times
6. People – 175 times
7. South (+ Vietnam/Korea) – 171 times
8. Me – 157 times
9. Enemy – 149 times
10. Time – 139 times
Vietnam veteran’s terminology is full of collocations and acronyms, and we can find them
in the “Vietnam Veteran’s terminology.txt”. Here are some collocations:
•AMNESTY BOX: a bright blue box made of solid steel shaped like a free-standing US
Postal box but about half again as high, twice as deep, and maybe four times as wide.
•BIG RED ONE (BRO): nickname for the 1st Infantry Division, based on the red
numeral "1" on the division shoulder patch. "If your gonna be one, be a Big Red One!!“
•DRESS WHITES: the formal light weight uniform for the Navy and Coast Guard.
•FREE FIRE ZONE: any area in which permission was not required prior to firing on
targets.
•LONG GREEN LINE: column of infantry advancing through jungle terrain.
•WHITE MICE: South Vietnamese police. The nickname came from their uniform
white helmets and gloves.
•ZONE AND SWEEP: artillery tactic/fire pattern to cover a target with an "X" pattern
of fire.
Get out of:
Get rid of(disfarsi di qualcosa):
Get away with:
Get caught up (essere beccati):
Make contact with:
Petered out against (esaurirsi)
Despite + noun/verb –ing form
7 times
3 times
1 time
2 times
2 times
1 time
3 times
Different fonts from different positions about
the Vietnam War allow us to understand the
ideology and feelings of American people in
those years. Apart from anti-vietnam texts, we
can see how American soldiers didn't want to
fight that war, also thanks to the stories about
that period, that figure out how American
politicians wanted to carry on the war just for
their proud.
"So seeing a lot of those things got me to think what I was doing in Vietnam
and I started to think about my own life and how I put myself in such a danger of being
killed at 18 years old." - 1.txt
"Maybe three or four percent will drop out because they are just thinkers and so the
military sees thinkers as being very dangerous, so they get rid of them. They get rid of
them, but it’s definitely brainwashing." - Allen Nelson.
"Part and parcel with anti-war marches, petitions, picket signs, were the small round
colorful political buttons. "Make Love, Not War" (originally made by the Sexual
Freedom League in Berkeley, CA), "Get out of Vietnam." "End the War." "Yankee,
Come Home"
(from the Stanford Committee for Peace in Vietnam) and many others." - Political
buttons from the anti-Vietnam war protests and the hippie days in the late 1960s
"Forward he cried from the rear
And the front rank died
And the general sat, and the lines on the map
Moved from side to side" - Us and Them.txt
One sentence that drew my attention and it is also
important to understand the soldiers' pain is: "After about a
week I finally told the guards I'd write the confession. I had
to get out of the ropes, collect my thoughts[...]". Starting
from the idiom "At the end of (one's) rope" (The limit of
one's patience, endurance, or resources), "to get out of the
ropes" could means that soldiers couldn't
bear down with that situation, and he had to find a way out.
The posttraumatic stress disorder that afflicted soldiers after
the war affirms that.
Scarica

Corpus Linguistics