Ingegneria linguistica

Come utilizzare la forza del linguaggio

Language Technology
DE EN ES FR IT


Contents

Il linguaggio oggi
Il linguaggio in azione
Il linguaggio è fondamentale
Il linguaggio al nostro servizio

Tecniche e risorse

Che cos'è l'ingegneria linguistica?   Componenti della tecnologia
Tecniche
Identificazione e verifica del locutore
Riconoscimento della voce
Riconoscimento dei caratteri e delle immagini
Comprensione del linguaggio naturale
Creazione del linguaggio naturale
Creazione del discorso

Risorse linguistiche

Lessici
Lessici specialistici
Grammatiche
Raccolte

La catena dello sviluppo e dell'applicazione

L'impatto dell'ingegneria linguistica

La concorrenza in un mercato globale
Una migliore informazione
Accesso diretto ai servizi
Automazione delle operazioni commerciali
Comunicazione efficace
Accessibilità e partecipazione
Nuove opportunità in campo educativo
Svago, tempo libero e creatività

I vantaggi
Glossario - Terminologia corrente


Il linguaggio oggi

Il linguaggio in azione

Il linguaggio è lo strumento naturale della comunicazione umana, è il modo più efficace che abbiamo per esprimerci. Del linguaggio ci serviamo per enunciare idee e concetti complessi, per gestire risorse umane, per negoziare, per persuadere, per comunicare le nostre necessità, per esprimere i nostri sentimenti, per narrare, per trasmettere la nostra cultura alle generazioni future, per creare il bello in poesia ed in prosa. Il linguaggio forma parte integrante di tutti gli aspetti della nostra vita.

L'uso che facciamo del linguaggio è ancora limitato. Per lo più, serve per stabilire una comunicazione diretta tra gli esseri umani e non interviene nelle nostre relazioni con i sistemi, i servizi e le macchine che utilizziamo quotidianamente. Anche tra le persone, le possibilità di comprensione sono abitualmente limitate ai gruppi che condividono una stessa lingua. Da questo punto di vista, il linguaggio può essere considerato più un ostacolo che un aiuto alla comunicazione.

è in atto un'evoluzione che modificherà profondamente il nostro modo di utilizzare il linguaggio e ne accrescerà grandemente il valore in ogni aspetto della comunicazione. Questa evoluzione è il frutto dei progressi realizzati nel campo dell'ingegneria linguistica.

L'ingegneria linguistica ci offre la possibilità di ampliare e migliorare l'uso del linguaggio per farne uno strumento più efficace. Fondata sul cospicuo patrimonio di conoscenze sul linguaggio e sul suo funzionamento che la ricerca ha accumulato, essa trae alimento dal complesso di risorse linguistiche che si sono costituite nel corso degli anni (grammatiche e dizionari elettronici, banche dati e repertori terminologici). La ricerca accresce la nostra conoscenza del linguaggio e sviluppa le tecniche necessarie per comprenderlo e manipolarlo. Le risorse costituiscono la base di conoscenze che ci permettono di riconoscere, convalidare, comprendere e manipolare il linguaggio sfruttando la potenza degli elaboratori elettronici. Le nuove vie aperte da questa conoscenza del linguaggio contribuiranno alla soluzione dei problemi politici, sociali ed economici.

L'ingegneria linguistica è una tecnologia che si basa sulla nostra conoscenza del linguaggio per ampliare il campo d'applicazione dei sistemi informatici:

Nuove possibilità ci si offrono di cambiare il modo in cui facciamo le cose, di renderle più facili e più efficaci, sfruttando lo sviluppo delle nostre conoscenze sul linguaggio.

Quando, oltre ad accettare le informazioni introdotte mediante la tastiera, una macchina potrà riconoscere il linguaggio naturale scritto e parlato, in varie lingue, ci sarà più facile fruire dei vantaggi che ci sono offerti da tutta una serie di servizi d'informazione e di comunicazione; sarà anche possibile effettuare operazioni commerciali a distanza, per telefono o per mezzo di altri servizi telematici.

Quando una macchina sarà capace di comprendere il linguaggio umano, di tradurre tra diverse lingue e di generare un discorso vocale oltre che un testo scritto, disporremo di uno strumento di straordinaria potenza, che ci sarà d'aiuto in molti campi.?

Una macchina che permetta di migliorare rapidamente la comprensione reciproca tra le persone renderà più efficace ogni forma di cooperazione, nelle attività economiche come nella gestione della cosa pubblica.

Il successo dell'ingegneria linguistica si concretizzerà nella realizzazione di queste possibilità. Alcuni risultati sono già stati raggiunti, ma devono ancora essere perfezionati. L'accelerarsi del ritmo del progresso lascia prevedere che già nei prossimi anni saranno raggiunti importanti traguardi.


Il linguaggio è fondamentale

Il linguaggio è lo strumento di una comunicazione efficace. Per mezzo del linguaggio possiamo registrare e assimilare informazioni. In sostanza, è il modo più appropriato di rappresentare la maggior parte delle informazioni che ci sono necessarie. Il linguaggio è di vitale importanza in campo economico e amministrativo ed è un elemento essenziale di molti aspetti della vita sociale, culturale e politica. Il linguaggio fa parte integrante della nostra cultura ed è grazie ad esso che ciascuno di noi può definire la propria identità.

La lingua è un elemento costitutivo della nostra identità nazionale e culturale, è il legame che ci unisce alle nostre tradizioni, il fondamento di ogni nostro sapere e lo strumento che ci consente di esprimere liberamente la nostra creatività.

La ricchezza dell'Europa è la varietà delle sue lingue e delle sue culture, grazie alla quale ciascuno di noi ha la possibilità di entrare in contatto con e di apprendere dalla cultura ed il modo di vivere di altri. Questo patrimonio comune è una delle basi della coesione della società europea.

Se vogliamo che i vantaggi di una società multilingue restino una delle caratteristiche dello stile di vita europeo, dobbiamo trovare il modo di superare gli ostacoli alla comunicazione e alla comprensione.

C'è chi sostiene che nei rapporti internazionali di natura commerciale, amministrativa e politica sia possibile soltanto l'uso di una o due lingue. In una certa misura questo è vero, ma una situazione del genere non sarà mai pienamente soddisfacente.

Il predominio di alcune lingue significherebbe uno squilibrio di potere inaccettabile e una sottoutilizzazione di risorse.

In particolare, molte persone sarebbero private della possibilità di partecipare pienamente a certe attività; questo comporterebbe una perdita per la società e un motivo di frustrazione per le persone. Col tempo, le lingue di minore diffusione si troverebbero messe ai margini, con la conseguenza di un'ulteriore riduzione della loro utilizzazione e di un'inevitabile perdita di ricchezza e di varietà della nostra cultura. Gli effetti sarebbero nefasti non solo per la percezione della nostra identità nazionale, regionale e culturale, ma anche per il nostro sentimento di appartenenza ad una società autenticamente europea, che non si limita a tollerare le minoranze, ma sa sostenerle e valorizzarle.

Restringere l'uso delle lingue significherebbe anche limitare l'accesso a tutta una serie di nuovi servizi e di tecniche e privare molte persone della possibilità di utilizzare i sistemi informatici nella propria lingua madre.

L'Europa può sfruttare la sua situazione di comunità naturalmente multilingue in un mondo multilingue per trarne vantaggi sul piano economico.

La nostra volontà di collaborare più strettamente, di creare un mercato unico senza barriere implica la ricerca di soluzioni ai problemi di un mercato multilingue. Venendo incontro ai nostri bisogni linguistici, in particolare per quanto riguarda il mondo degli affari, l'amministrazione e l'istruzione, l'ingegneria linguistica contribuirà a rafforzare la nostra capacità di competere in un mercato globale. Da un lato, l'esperienza nell'uso delle tecnologie che offrono una risposta ai bisogni di un mercato multilingue conferirà alle nostre imprese un vantaggio concorrenziale. Dall'altro, l'Europa potrà vendere al resto del mondo i propri prodotti linguistici.

Il modello dell'educazione continua è destinato a caratterizzare la società dell'informazione. I dirigenti di domani dovranno padroneggiare più di una lingua. L'ingegneria linguistica darà un importante contributo allo sviluppo dei sistemi di insegnamento personalizzato, non soltanto per quanto riguarda l'apprendimento delle lingue, ma anche ai fini della creazione di sistemi in grado di adattarsi più efficacemente alle esigenze degli studenti.

I prodotti che integrano funzioni linguistiche miglioreranno le prestazioni delle imprese, delle amministrazioni e delle persone.

I prodotti creati utilizzando le tecnologie del linguaggio rivoluzioneranno i nostri sistemi e amplieranno la gamma dei servizi a disposizione delle imprese, delle amministrazioni e del grande pubblico.

Il riconoscimento, la comprensione e la generazione del discorso mediante l'elaboratore elettronico renderanno più efficace e più umana l'interazione tra uomo e elaboratore elettronico.

Macchine in grado di comprendere il linguaggio naturale soddisferanno con maggiore precisione e sensibilità le nostre necessità in fatto d'informazione e ci aiuteranno a superare i problemi creati dalla sovrabbondanza di informazioni.

I servizi di traduzione che si avvarranno dell'ausilio degli elaboratori elettronici e la produzione di documenti in lingua straniera permetteranno non soltanto di migliorare le relazioni d'affari all'interno dell'Europa, ma contribuiranno a facilitare l'accesso ai mercati esterni.


Il linguaggio al nostro servizio

La capacità di sviluppare l'uso del linguaggio è la chiave della società dell'informazione multilingue, la società europea del futuro. I progressi dell'ingegneria linguistica ci permetteranno di:


Tecniche e risorse

Che cos'è l'ingegneria linguistica?

L'ingegneria linguistica è l'applicazione della conoscenza del linguaggio allo sviluppo di sistemi informatici in grado di riconoscere, comprendere, interpretare e generare il linguaggio umano in tutte le sue forme.

In concreto, l'ingegneria linguistica comprende una serie di tecniche e di risorse linguistiche. Le prime trovano applicazione in programmi informatici (software) e le seconde consistono in un insieme di conoscenze a cui si può accedere mediante il software.


Componenti della tecnologia

I processi fondamentali dell'ingegneria linguistica sono illustrati nel diagramma a fianco. Consistono essenzialmente in:

modello generale

(Diagramma)

Di questo modello generale esistono, ovviamente, molteplici varianti. Secondo l'applicazione della tecnologia, solo alcune di queste componenti sono necessarie.


Tecniche

L'ingegneria linguistica ricorre a varie tecniche, alcune delle quali sono esposte qui di seguito.


Identificazione e verifica del locutore

La voce ha per ogni persona lo stesso carattere di unicità delle impronte digitali e consente quindi di identificare un locutore e di verificare se si tratta di una persone autorizzata ad accedere a un servizio o a una risorsa. I problemi da risolvere riguardano, ad esempio, la capacità di riconoscere che la voce non è registrata, di selezionare la voce attraverso il rumore (dell'ambiente o del mezzo di comunicazione) e di identificarla in modo attendibile nonostante mutamenti temporanei (ad es. causati da una malattia).


Riconoscimento della voce

Il suono della voce è percepito dall'elaboratore elettronico in forma di onde analogiche, che sono analizzate per identificare le unità di suono (fonemi) che costituiscono le parole. Il riconoscimento del discorso, discreto o continuo, avviene sulla base di modelli statistici dei fonemi e delle parole. Per produrre modelli statistici di qualità, sono stati e continuano ad essere raccolti ampi campioni (corpus) e un gran numero di discorsi.

Perché la voce diventi uno strumento di uso corrente nella relazione con l'elaboratore elettronico, restano da risolvere alcuni problemi di rilievo. Il primo di questi è la capacità di riconoscere il discorso continuo, contrapposto al discorso pronunciato intenzionalmente come una serie di parole distinte separate da una pausa. Un altro problema è la possibilità di riconoscere qualsiasi locutore, in modo da evitare la necessità di insegnare al sistema a riconoscere la voce di una determinata persona. Una grossa difficoltà è rappresentata dal rumore che può interferire con il riconoscimento, rumore che può provenire dall'ambiente in cui si trova il locutore che utilizza il sistema o essere prodotto dal mezzo di comunicazione, ad esempio la linea telefonica. La riduzione dei rumori, il potenziamento dei segnali e l'individuazione di parole chiave possono sono i mezzi che possono essere utilizzati per giungere ad un riconoscimento preciso ed affidabile in ambienti rumorosi o attraverso reti di telecomunicazione. C'è infine il problema rappresentato dagli accenti, dalle inflessioni dialettali e dall'uso della lingua parlata, spesso grammaticalmente non corretta.


Riconoscimento dei caratteri e delle immagini

Il riconoscimento di un manoscritto o di un testo stampato richiede la trasposizione della forma spaziale dei segni grafici in una rappresentazione simbolica del linguaggio. Per la maggior parte delle lingue, questo significa riconoscere e trasformare caratteri. Il riconoscimento dei caratteri può essere di due tipi:

Il riconoscimento ottico dei caratteri a partire da un'unica famiglia di caratteri tipografici può raggiungere un grado di precisione assai elevato. Problemi sorgono quando il tipo di carattere è sconosciuto o molto decorativo o quando la stampa è di cattiva qualità. In questi casi difficili e nel caso dei manoscritti, buoni risultati si ottengono soltanto con il riconoscimento intelligente dei caratteri, sistema che richiede tecniche di riconoscimento delle parole che utilizzano modelli linguistici, come lessici o informazioni statistiche sulle sequenze di parole.

L'analisi delle immagini è strettamente associata al riconoscimento dei caratteri, ma implica l'analisi del documento per determinare in primo luogo la sua composizione in termini di grafici, fotografie, linee di separazione e testo, quindi la struttura del testo per identificare titoli, sottotitoli, didascalie, ecc. e poter trattare adeguatamente il testo.


Comprensione del linguaggio naturale

Va da sé che la comprensione del linguaggio è fondamentale per molte applicazioni. Tuttavia, non è sempre necessaria una comprensione perfetta. Infatti, una comprensione parziale è spesso una tappa preliminare di grande utilità, in quanto permette di procedere in modo intelligentemente selettivo nell'ulteriore approfondimento della comprensione.

Un'analisi superficiale o parziale dei testi consente di stabilire una coerente classificazione iniziale di testi di qualsiasi natura. Quest'analisi iniziale può poi essere utilizzata, per esempio, per concentrarsi su parti "interessanti" di un testo che saranno oggetto di un'analisi semantica più approfondita che determinerà il contenuto del testo appartenente ad un ambito specifico. Combinata a conoscenze statistiche e linguistiche, questa analisi può anche essere utilizzata per identificare automaticamente le caratteristiche linguistiche di parole sconosciute, che possono poi essere integrate nelle conoscenze del sistema.

I modelli semantici sono utilizzati per rappresentare il significato del linguaggio per mezzo di concetti e di relazioni tra concetti. Un modello semantico può essere utilizzato, ad esempio, per stabilire una correlazione tra una richiesta di informazioni e un significato implicito che sia indipendente dalla terminologia o dalla lingua in cui la domanda è stata formulata. Questo consente un accesso multilingue all'informazione senza che sia necessario conoscere la terminologia o la struttura utilizzate per indicizzare l'informazione.

Le combinazioni di analisi e generazione con un modello semantico permettono la traduzione di testi. Nella fase attuale di sviluppo, le applicazioni in cui questo è possibile devono essere limitate nel vocabolario e nei concetti, perché possano essere utilizzate adeguate risorse d'ingegneria linguistica. L'uso di modelli di strutture di documenti e di frasi comuni con elementi variabili permette la generazione di testi di alta qualità.


Generazione del linguaggio naturale

La rappresentazione semantica di un testo può essere utilizzata come base per la generazione del linguaggio. L'interpretazione dei dati di base o del significato implicito di una frase o di un sintagma può essere rappresentata nella forma di una sequenza di caratteri, o in una determinata lingua o secondo le istruzioni stilistiche di un sistema di programmazione di testi.


Generazione del discorso

Il discorso è generato a partire da modelli completi, associandovi elementi preregistrati o concatenando unità del discorso (fonemi, parole). La generazione del discorso deve tener conto di aspetti quali l'intensità, la durata e l'intonazione per produrre un flusso continuo e naturale.

è possibile stabilire un dialogo combinando il riconoscimento del discorso con la generazione semplice, o a partire dalla concatenazione di elementi del discorso umano memorizzati o sintetizzando il discorso mediante regole.

La creazione di una biblioteca di sistemi di riconoscimento e di generazione del discorso, con uno strumento grafico per la strutturazione della loro applicazione, permette a chi non è né un esperto di linguistica né un programmatore di produrre un dialogo strutturato che può essere utilizzato, ad esempio, nel trattamento automatico delle chiamate telefoniche.


Risorse linguistiche

Le risorse linguistiche sono componenti essenziali dell'ingegneria linguistica. Sono uno dei modi principali di rappresentare la conoscenza del linguaggio, utilizzata per il lavoro di analisi che porta al riconoscimento e alla comprensione.

La produzione e l'aggiornamento delle risorse linguistiche costituiscono un'impresa colossale. Le risorse sono prodotte secondo formati e protocolli standard in molte lingue dell'UE, per facilitare l'accesso di laboratori di ricerca e di istituzioni pubbliche. Molte di tali risorse sono disponibili tramite l'Associazione Europea delle Risorse Linguistiche (ELRA).


Lessici

Un lessico è un repertorio di parole e di informazioni ad esse relative. Tali informazioni possono riferirsi alla struttura grammaticale di ciascuna parola (morfologia), alla struttura sonora (fonologia), al significato della parola in diversi contesti, ad esempio in funzione della parola o del segno d'interpunzione che precede o segue. Un buon lessico utile può contare centinaia di migliaia di voci. I lessici sono necessari per ogni linguaggio di applicazione.


Lessici specializzati

Vi sono alcuni casi che richiedono, di norma, una ricerca specifica e la produzione di lessici distinti da quelli di uso generale.

Nomi propri: I dizionari di nomi propri sono essenziali per una comprensione effettiva della lingua, almeno per far sì che i nomi propri possano essere riconosciuti nel loro contesto come designazioni di luoghi, oggetti, persone, animali. Assumono una particolare importanza in molte applicazioni, specie in quelle in cui il nome ha una funzione centrale, come nei sistemi di navigazione a comando vocale, i servizi di prenotazione per le vacanze o di informazione sugli orari ferroviari basati su un trattamento automatico delle chiamate telefoniche.

Terminologia: Nel complesso ambiente tecnologico di oggi un gran numero di terminologie devono essere registrate, strutturate e rese disponibili per le applicazioni che integrano funzioni linguistiche. Molte delle applicazioni di ingegneria linguistica economicamente più interessanti, come la gestione multilingue dei documenti tecnici e la traduzione automatica, dipendono dalla disponibilità di appropriate banche terminologiche.

Reti di parole:Una rete di parole descrive le relazioni tra parole; ad esempio, sinonimi, antonimi, nomi collettivi, ecc. Può essere di grande utilità in applicazioni come la ricerca di informazioni, i sistemi di ausilio alla traduzione ("translator's workbench") e i sistemi burotici intelligenti per la redazione di testi ("authoring").


Grammatiche

Una grammatica descrive la struttura di una lingua a vari livelli: parola (morfologia), sintagma, frase, ecc. Una grammatica può trattare della struttura sia in termini di forma (sintassi) che di significato (semantica e discorso).


Corpus

Un corpus è una raccolta linguistica (testi o discorsi) che fornisce la base per :

Esistono corpus nazionali che comprendono centinaia di milioni di parole e altri costituiti per scopi particolari. Per esempio, un corpus può comprendere le registrazioni di conversazioni di automobilisti con un sistema di controllo simulato basato sul riconoscimento della voce ed essere poi utilizzato per determinare le esigenze degli utenti di un sistema di controllo a comando vocale destinato al mercato.


La catena sviluppo - applicazione

Il diagramma a fianco raffigura la catena delle operazioni che intervengono nell'ingegneria linguistica, dalla ricerca alla fornitura agli utenti finali di prodotti e servizi integranti funzioni linguistiche.

Modello di attività dell’ingegneria linguistica

Modello di attività dell'ingegneria linguistica

Il processo di ricerca e sviluppo porta allo sviluppo di tecniche, alla produzione di risorse e alla definizione di norme. Sono questi gli elementi costitutivi dell'ingegneria linguistica.

In pratica, l'ingegneria linguistica si applica a due livelli. Al primo livello vi sono alcune applicazioni di carattere generale, quali:

Al secondo livello, queste applicazioni di base sono utilizzate per dare una soluzione ai problemi reali in campo sociale ed economico. Ad esempio:

In generale, la capacità linguistica è integrata nei sistemi per potenziarne le prestazioni. L'ingegneria linguistica è una "tecnologia abilitante".


L'impatto dell'ingegneria linguistica

Le tecnologie linguistiche possono essere utilizzate per trovare soluzioni più idonee e più efficaci a tutta una serie di problemi nelle imprese e nelle amministrazioni. Possono essere utilizzate anche nel campo dell'istruzione, per aiutare le persone disabili e per offrire nuovi servizi alle organizzazioni e ai consumatori. Le loro ripercussioni possono essere rilevanti per quanto riguarda:


La concorrenza in un mercato globale

Il successo di un'impresa dipende in misura crescente dalla capacità di sostenere la concorrenza in un mercato globale. Il successo si basa sulla capacità di individuare i mercati, vendere efficacemente e fornire servizi di assistenza clienti della qualità desiderata. In molti casi l'applicazione dell'ingegneria linguistica può aumentare l'efficienza e ridurre i costi. Si tratta di applicazioni quali:


Migliore informazione

Una delle caratteristiche fondamentali di un servizio d'informazione è la sua capacità di fornire informazioni che rispondano esattamente ai bisogni reali e immediati dei clienti. Non è sufficiente fornire informazioni che rientrino approssimativamente nella categoria richiesta, che il cliente dovrà vagliare per estrarne quanto ritiene utile. Inoltre, se il modo di selezione dell'informazione comporta importanti omissioni, i risultati sono, nel migliore dei casi, inadeguati e, nel peggiore, possono essere fortemente fuorvianti.

L'informazione è disponibile a livello mondiale, ad esempio sul World Wide Web, in diverse lingue. In realtà, tuttavia, possono fruirne soltanto i clienti che siano in grado innanzitutto di formulare le loro richieste nella lingua in cui l'informazione è registrata e poi di comprendere la lingua in cui l'informazione è presentata. Grazie ai sistemi di traduzione automatica, la persona in cerca di un'informazione potrà formulare la sua richiesta nella lingua madre e in questa stessa lingua ricevere l'informazione, quale che sia la lingua in cui l'informazione è registrata.

L'ingegneria linguistica può migliorare la qualità dei servizi d'informazione utilizzando tecniche che non soltanto permettano di ottenere risposte più precise, ma accrescano notevolmente le possibilità di accesso a tutte le informazioni pertinenti disponibili. L'uso di tecniche come la ricerca di concetti, ossia un'analisi semantica dei criteri di ricerca e il loro confronto con un'analisi semantica della base di dati, dà risultati di gran lunga migliori di una semplice ricerca mediante parole chiave.

Uno dei principali benefici diretti della società dell'informazione sarà per il comune cittadino il miglioramento dell'infomazione fornita dai servizi pubblici. Sarà però compito dell'ingegneria linguistica facilitare l'accesso a questa informazione. Le persone che non hanno familiarità con l'interfaccia utente convenzionale di un sistema informatico potranno formulare le loro richieste a voce ed il sistema li guiderà attraverso le varie possibilità che si offrano loro. Quanti desiderano informazioni riguardanti altri paesi, che possono essere registrate in una lingua straniera, potranno riceverle nella propria lingua. Un buon esempio è quello di un servizio, in via di realizzazione, che fornirà informazioni sulle offerte di lavoro nell'Unione europea nella lingua madre dell'interessato. Ovviamente si tratta di posti di lavoro per i quali non sono richieste particolari conoscenze linguistiche. Il servizio sarà disponibile su Internet e sono in progetto locali pubblici in cui le persone in cerca di lavoro potranno utilizzare il servizio. Ad un servizio pilota monolingue funzionante nelle Fiandre, una sorprendente percentuale (26%) delle domande di lavoro è pervenuta da persone che avevano ottenuto le informazioni tramite Internet.

L'ingegneria linguistica darà un contributo in un gran numero di settori d'interesse pubblico. Un caso interessante è quello della raccolta di informazioni utili allo scopo di garantire l'ordine pubblico. Nell'individuazione dei traffici illeciti, ad esempio, un gran numero d'informazioni desumibili da fonti pubbliche o commerciali possono, se raffrontate e presentate nel modo opportuno, dare chiare indicazioni di attività sospette. I movimenti delle navi, le note di carico e le informazioni delle società possono evidenziare profili anomali di attività. La possibilità di produrre questi profili grazie ad un'analisi basata sul linguaggio è un importante aiuto.


Accesso diretto ai servizi

Negli ultimi anni si è fortemente sviluppato l'uso del telefono per la prestazione di servizi bancari, assicurativi e di assistenza. Per i clienti, servizi di questo tipo hanno il vantaggio di fornire risposte in tempi brevi, 24 ore su 24. Per i fornitori il vantaggio consiste nel fatto che, per svolgere la loro attività, non hanno bisogno di incorrere in spese logistiche. Utilizzando le tecniche di identificazione del locutore e di riconoscimento del discorso, è possibile automatizzare molti di questi servizi. La telefonata di un cliente può essere trattata da un sistema informatico in grado di stabilire un dialogo con chi ha effettuato la chiamata e di fornire il servizio con piena soddisfazione del cliente. L'esempio forse più significativo è oggi l'automazione dei servizi bancari telefonici, che già molte banche mettono a disposizione. Al cliente che telefona risponde un elaboratore elettronico che, in primo luogo, analizza le caratteristiche della voce del cliente per identificarlo e per verificare il suo diritto di accesso al servizio. Quindi si stabilisce un dialogo tra il cliente ed l'elaboratore elettronico per stabilire i servizi richiesti ed effettuare tutte le operazioni necessarie, per esempio pagare una fattura, fornire un estratto conto, ecc. Altri esempi possono essere l'acquisto di biglietti per spettacoli teatrali, l'effettuazione di prenotazioni per viaggi in treno, nave od aereo e i teleacquisti mediante la televisione via cavo.

L'automazione dei servizi per assicurarne la disponibilità 24 ore su 24, oltre ad avere vantaggi economici, eviterà anche che vi siano persone obbligate a lavorare in orari e condizioni disagevoli per provvedere alla necessaria copertura. I servizi saranno meglio organizzati, più rapidi ed affidabili. Inoltre, la registrazione automatica di una traccia per ogni transazione permetterà di assicurare le parti interessate sull'affidabilità del risultato.


Automazione delle operazioni commerciali

Molte delle operazioni che intervengono in una transazione commerciale (ordinazione, fatturazione, invio alla banca delle istruzioni di pagamento) possono essere effettuate senza necessità di un intervento umano utilizzando, ad esempio, la tecnologia EDI (Electronic Data Interchange). Per ora, tuttavia, gran parte delle operazioni commerciali prendono le mosse da un dialogo tra persone, per telefono, per iscritto o faccia a faccia. Grazie alla migliorata disponibilità di servizi telematici e all'uso crescente di Internet e del World Wide Web, si sono aperte nuove possibilità di automatizzare altre operazioni del ciclo commerciale (v. illustrazione a fianco). Il software linguistico svolgerà un ruolo prominente nel rendere tale automazione più facilmente utilizzabile e più efficace. Per l'utente uno dei vantaggi del World Wide Web è la pubblicazione dell'informazione in linguaggio naturale. Tuttavia, per essere in grado di percorrere e selezionare l'informazione del Web, un prodotto software deve possedere l'intelligenza necessaria per comprendere l'informazione pubblicata e confrontarla con le esigenze dell'utente. L'ingegneria linguistica può dare un importante contributo allo sviluppo di agenti intelligenti, in grado di facilitare ai consumatori l'uso degli strumenti del commercio elettronico. I consumatori potrebbero dare istruzioni orali a tale agente, di passare in rassegna il Web o servizi simili, leggere cataloghi e selezionare i prodotti idonei, cercare e negoziare prezzi, perfino raccogliere le offerte per una gara elettronica. Una volta esaminati i risultati, il consumatore potrebbe poi chiedere all'agente di emettere l'ordine e, dopo la consegna, chiedere alla banca di pagare una fattura elettronica. Gli utenti umani non percepirebbero in alcun modo la complessità delle operazioni commerciali soggiacenti, che sarebbero trattate dall'agente.

Anche l'assistenza clienti può essere migliorata mediante "help desk" elettronici basati su ipertesti, dotati di ulteriori strumenti integranti funzioni linguistiche.

Il ciclo commerciale

Il ciclo commerciale

I benefici di questa automazione sono notevoli. Essa permette, oltre ad una diminuzione dei costi in tutto il ciclo della transazione commerciale, una scelta più ampia di fornitori e di prodotti, di cui potrà essere esaminata e valutata l'idoneità; ne risulterà stimolata la concorrenza dei prezzi. L'intero processo sarà più rapido e più efficace e la registrazione dell'informazione pertinente garantirà l'accuratezza di tutti i processi derivati.

Col tempo, il commercio elettronico modificherà le caratteristiche stesse dell'impresa. SI ridurrà la necessità di intermediari. Le nuove e le piccole imprese potranno fare conoscere i loro prodotti e servizi rapidamente, efficacemente e senza spese eccessive. Tuttavia, senza la comprensione del linguaggio e una capacità multilingue questi benefici non potranno essere pienamente raggiunti.


Comunicazione efficace

La comunicazione è probabilmente l'uso più ovvio del linguaggio. Ma il linguaggio è anche il principale ostacolo alla comunicazione. Le difficoltà che continuamente intervengono nei rapporti tra culture e nazioni sono dovute non soltanto al problema di una traduzione precisa da una lingua all'altra, ma anche alle connotazioni culturali delle parole e delle locuzioni. Un esempio caratteristico nel contesto europeo è la parola "federale", che può designare una forma di governo delegato per chi già vive in una federazione, mentre per chi vive in uno Stato sovrano unitario può significare l'imposizione di un altro livello di governo, più remoto e centralizzato.

Grazie all'applicazione delle conoscenze sul linguaggio, che permette di offrire, con dizionari elettronici, thesauri ed altre risorse linguistiche, un migliore supporto ai traduttori e, a più lungo termine, di ottenere una traduzione automatica di alta qualità, queste barriere si ridurranno. A tutti i livelli, sarà possibile migliorare e accelerare la redazione, in più lingue, di documenti di carattere politico o commerciale. Le attività internazionali guadagneranno in efficacia e molto più numerose saranno le persone in grado di contribuirvi.

Un progetto che sta contribuendo con successo a migliorare le comunicazioni in Europa è, ad esempio, quello che riguarda l'interconnessione di diverse forze di polizia nei paesi dell'Europa settentrionale per mezzo di un linguaggio controllato limitato che può essere tradotto automaticamente in tempo reale. Questo sistema, oltre a contribuire alla prevenzione e all'individuazione della criminalità internazionale, permette anche ai servizi di soccorso di comunicare in modo efficace nei casi di grave emergenza.


Accessibilità e partecipazione

Uno dei campi in cui l'impatto dell'ingegneria linguistica sarà più rilevante è l'uso del linguaggio umano, in particolare del discorso, come interfaccia uomo/macchina. L'utilizzazione dei sistemi e dei servizi ne risulterà migliorata e non saranno soltanto gli esperti in informatica, ma anche le persone senza particolare formazione a poter fruire di questi servizi. Nell'era dell'informazione l'aspetto dell'accessibilità è fondamentale per una società democratica, aperta e giusta.

Un buon esempio dei servizi che saranno disponibili è quello di una consulenza legale automatizzata. L'accessibilità del sistema giuridico a tutti i cittadini sta diventando un serio problema in molte società in cui il costo della consulenza e dei procedimenti legali permette solo a chi gode di redditi elevati e a chi ha titolo ad un'assistenza legale di esercitare i propri diritti legali. Sarà possibile, utilizzando tecniche integranti funzioni linguistiche, non soltanto prestare una consulenza basata sulla comprensione del problema e sull'analisi delle disposizioni di legge applicabili, ma anche comprendere una descrizione del problema in linguaggio naturale e fornire, per iscritto od oralmente, la stessa consulenza che avrebbe fornito un legale. Un servizio del genere potrebbe essere consultato, per esempio, per mezzo di cabine installate nei palazzi di giustizia o negli uffici postali. Questo tipo di applicazione può anche essere utilizzato per informare i cittadini dei loro diritti in materia di assistenza sociale o di offerte di lavoro e per fornire un'interfaccia più semplice ed esauriente tra I cittadini ed una pubblica amministrazione più trasparente.

Sistemi in grado di comunicare con gli utenti in modo interattivo, attraverso il linguaggio umano, accessibili in luoghi pubblici o a casa propria, attraverso la rete telefonica o la TV via cavo cambieranno il volto della nostra democrazia. I cittadini potranno partecipare al processo decisionale grazie alla maggiore disponibilità di informazioni comprensibili e "obiettive" e per mezzo di sondaggi d'opinione condotti su vasta scala.

Per le persone disabili, in molti casi, l'applicazione delle tecnologie linguistiche sarà di grande aiuto. Gli elaboratori elettronici in grado di comprendere il linguaggio, ascoltare, vedere e parlare offriranno loro nuove possibilità di accedere ai servizi a domicilio e di esercitare un'attività professionale.


Nuove opportunità in campo educativo

L'educazione a distanza ha acquistato particolare importanza nella fornitura di servizi educativi, specie in relazione al concetto di "educazione continua" che costituirà una delle principali caratteristiche dell'era dell'informazione. L'efficacia dell'educazione a distanza e dello studio autodidattico è accresciuta dall'uso di servizi telematici ed informatici.

Le tecniche dell'ingegneria linguistica permettono di migliorare notevolmente la qualità e il successo dell'educazione che si avvale di ausili informatici. Un software didattico che non si limita a riconoscere se la risposta data dall'utente è giusta od errata, ma comprende la risposta, può orientare l'utente in maniera più corrispondente ai suoi bisogni. Gli studenti potranno così apprendere in modo più efficace e potranno concentrarsi più a lungo, perché è indiscutibilmente più stimolante lavorare con un software sensibile alle nostre esigenze.

In futuro, la conoscenza di più lingue sarà essenziale in molte professioni in Europa. Ovviamente, l'apprendimento delle lingue assistito da elaboratore elettronico (CALL) è un campo di primaria importanza per l'applicazione dell'ingegneria linguistica. Le conoscenze indispensabili per la capacità di comprensione della macchina sono anche alla base di un processo di insegnamento interattivo, che fornisca una diagnosi ad alto livello degli errori commessi dagli studenti e l'illustrazione dell'uso corretto.

Nuovi e più efficaci strumenti di apprendimento, utilizzabili a casa e sul luogo di lavoro, accresceranno notevolmente le possibilità di estendere le nostre conoscenze e acquisire nuove competenze.


Svago, tempo libero e creatività

L'attrazione esercitata dai videogiochi sui bambini è sintomatica dell'influenza che l'elaboratore elettronico può avere sulla nostra cultura. I giochi elettronici possono diventare più istruttivi e l'istruzione può diventare più piacevole ("edutainment", svago istruttivo). La possibilità di una telepresenza in ambienti virtuali quali musei, gallerie d'arte e biblioteche, permetterà, per ampi settori della società, esperienze culturali arricchenti, comodamente accessibili a domicilio. Le visite virtuali a questi archivi culturali saranno facilitate dalla tecnologia linguistica, che consente la ricerca e la selezione di tutte le forme di documenti basati sul linguaggio digitalizzato, l'indicizzazione e la ricerca di immagini, il doppiaggio di film o la produzione automatica di sottotitoli e la traduzione di documenti di biblioteca o di archivio.

Per un sempre più gran numero di persone, scrivere può diventare un'attività sempre più appassionante. Gli strumenti di redazione permetteranno di raggiungere risultati di qualità ben più elevata. L'uso di dizionari e thesauri "on-line", ad esempio, facilita la scelta della parola appropriata e permette di controllare la grammatica. Il risultato può essere molto più appagante per chi non abbia un'inclinazione naturale per la scrittura o sia privo della necessaria istruzione, ma desidera esprimersi in modo efficace nella corrispondenza commerciale o sociale.


I vantaggi

I vantaggi che il successo dell'ingegneria linguistica permetterà di ottenere sono innumerevoli. Tra questi:


Glossario

Termine Definizione [a] - acronimo; [n] - nome; [l] - locuzione; [v] - verbo

allineamento del testo

[l]

operazione consistente nell'allineare le diverse versioni linguistiche di un testo per poter individuare termini, frasi o espressioni equivalenti

ambiguità

[n]

caratteristica di una parola o di una frase che ne rende possibile più di un'interpretazione; nel primo caso perché la parola ha più di un significato, nel secondo perché la struttura della frase può essere analizzata in modo tale da farne emergere più di un significato

analisi del discorso

[l]

analisi diretta ad identificare le dipendenze linguistiche esistenti tra frasi

analizzare

[v]

(ingl. parse) analizzare il linguaggio per stabilirne la struttura e le relazioni a livello di sintassi e/o di semantica

analizzatore superficiale

[p]

(ingl. shallow parser) software che analizza il linguaggio in modo da ottenere un livello elementare di comprensione; spesso utilizzato per identificare passi di un testo che poi possono essere oggetto di un'analisi più approfondita diretta a specifici obiettivi

autenticazione della voce

[l]

verifica del locutore

banco di lavoro del traduttore

[l]

(ingl. translator's workbench) sistema software che fornisce un ambiente di lavoro per il traduttore umano, consistente in una serie di aiuti quali dizionari on-line, thesauri, memorie di traduzione, ecc.

CALL

[a]

elaboratore elettronico ('Computer') Aided Language Learning

campo

[n]

si riferisce di norma al settore di applicazione del software linguistico (banca, assicurazione, viaggi, ecc.); in ingegneria linguistica, significa che il vocabolario di una applicazione è ristretto, cosicché i fabbisogni di risorse linguistiche sono efficacemente limitati delimitando il campo di applicazione

controllo della versione

[l]

gestione della produzione, della registrazione e della pubblicazione di documenti

controllo stilistico

[l]

software che controlla un documento per garantirne la conformità ad un modello che definisce la struttura del testo e del documento che lo contiene; anche il controllo dell'uso delle frasi in un modo prestabilito

controllore grammaticale

[l]

software che controlla la correttezza grammaticale di un testo

controllore ortografico

[l]

software che controlla l'ortografia delle parole

corpus

[n]

v. Corpus

dal discorso al testo

[l]

processo di analisi del discorso e di produzione del suo equivalente testuale; un esempio tipico di applicazione dal discorso al testo è quello dei sistemi di dettatura

dal testo al discorso

[l]

operazione consistente nel produrre l'equivalente orale di un testo; un esempio tipico di applicazione dal testo al discorso è un sistema automatico di annunci in un aeroporto o una stazione ferroviaria

dialogo

[n]

flusso di linguaggio interattivo, a due direzioni alternate tra persone, una persona ed una macchina o tra due macchine

discorso

[n]

successione continua di linguaggio comprendente più di una frase

discorso continuo

[l]

discorso in cui il locutore non tiene conto dell'ascoltatore (p. es. un dispositivo di riconoscimento del discorso) inserendo pause tra le parole

dizionario

[n]

repertorio di parole, con relativa definizione, in genere limitata a descriverne il significato ed eventualmente l'etimologia

dizionario leggibile dall'elaboratore elettronico

[l]

un dizionario (v. sopra) che può essere letto da un software

enunciato

[n]

sequenza di suoni prodotti da un locutore tra due pause

estrazione di informazione

[l]

processo di selezione dell'informazione da una base di dati per mezzo di indici basati su parole chiave, semantica, e/o ricerca di concetti

fonema

[n]

unità minima di suono (analoga al morfema) che può essere identificata all'interno del flusso sonoro del discorso e che può essere distinta semanticamente

formalismo

[n]

modo di rappresentare le regole applicate per creare un modello di conoscenza linguistica

generare

[v]

produrre linguaggio in una forma da un'altra forma di linguaggio o informazione; v. anche generazione del linguaggio e generazione del linguaggio naturale

globalizzazione

[n]

processo di preparazione di un software da utilizzare in qualsiasi lingua ed ambiente culturale, o progettandolo in modo da renderlo utilizzabile in questo modo o aggiungendo strumenti al software esistente per facilitare la successiva localizzazione (v. sotto)

identificare

[v]

(ingl. tag) annotare un corpus associando alle parole informazioni che descrivono il contesto grammaticale delle parole e/o associazioni con altre parole

indicizzare

[v]

costruire un mezzo sintetico di riferimento all'informazione all'interno di una base di dati che, per l'informazione testuale, può basarsi su parole chiave o concetti

indipendente dal locutore

[l]

dicesi di un sistema di riconoscimento del discorso in grado di riconoscere il discorso indipendentemente dal locutore, ossia che non deve essere addestrato a riconoscere i singoli locutori

ingegneria linguistica

[l]

applicazione della conoscenza del linguaggio allo sviluppo di sistemi informatici in grado di riconoscere, comprendere, interpretare e generare linguaggio umano in tutte le sue forme

integrato con funzioni linguistiche

[l]

(ingl. language enabled/enhanced) dicesi di un'applicazione informatica che è stata migliorata nelle funzionalità, nelle prestazioni e/o nella presentazione grazie all'uso dell'ingegneria linguistica

interlingua

[n]

linguaggio inventato che può essere utilizzato come rappresentazione formale comune in cui il linguaggio naturale fonte può essere tradotto e da cui il linguaggio naturale di arrivo può essere generato

interpretare

[v]

in generale, attribuire un significato al linguaggio; anche tradurre da una lingua all'altra, per lo più oralmente, in tempo reale

ipertesto

[n]

sistema comunemente usato per i file di aiuto e nel World Wide Web, in cui il testo evidenziato è utilizzato per creare un collegamento (analogo a quello di un indice) con un testo attinente (spesso una spiegazione più dettagliata del termine evidenziato)

lemmatizzare

[v]

scomporre una parola flessiva nella sua radice e nelle sue desinenze

linguaggio controllato

[l]

linguaggio che è stato concepito per limitare il numero delle parole e la struttura del (o linguaggio artificiale) linguaggio utilizzato, per facilitare il trattamento del linguaggio; di norma gli utenti del linguaggio controllato operano in un settore in cui la precisione del linguaggio e la velocità della risposta sono essenziali, ad esempio i servizi di polizia e di urgenza, aviazione, controllo del traffico aereo, ecc.

linguistica computazionale

[l]

settore della linguistica applicata riguardante il trattamento del linguaggio naturale per mezzo dell'elaboratore elettronico

localizzare

[v]

adattare un software alle necessità locali in termini di linguaggio e cultura (ad es. per quanto riguarda le prassi legali e le convenzioni commerciali)

marcare

[v]

(ingl. mark up) annotare un testo in modo che la sua struttura e la sua presentazione siano definiti in modo che la struttura possa essere riprodotta da un sistema software diverso da quello utilizzato per la sua creazione

memoria di traduzione

[l]

sistema che costruisce conoscenze sulla traduzione da una lingua ad un'altra memorizzando e riutilizzando precedenti traduzioni

modellizzazione dell'utente

[l]

di norma, nel riconoscimento del discorso basato su un dialogo, una componente che cerca di essere sensibile ai vari tipi di utenti che il sistema può incontrare

modello Markov nascosto

[l]

una macchina in stato finito in cui non soltanto le transizioni, ma anche i risultati sono probabilistici; utilizzato attualmente nei sistemi di riconoscimento del discorso per contribuire a determinare le parole rappresentate dalle forme di onda sonora catturate

morfema

[n]

l'elemento minimo del linguaggio dotato di senso

morfologia

[n]

studio della struttura delle parole

multilingue

[aggettivo]

in senso proprio, si dice di qualcosa che esiste in una forma che può trattare più lingue, ma spesso utilizzato per indicare l'esistenza di versioni in più lingue

onomastica

[n]

studio scientifico dei nomi propri

riassumere

[v]

produrre una descrizione sommaria del contenuto di un documento

ricerca dell'informazione

[l]

termine generico abitualmente impiegato per indicare l'accesso a e la fornitura di informazione a partire da basi di dati in linguaggio naturale con qualsiasi metodo

ricerca di concetti

[l]

nel contesto della ricerca di informazione, ricerca effettuata mediante un'analisi semantica del filtro di ricerca raffrontata ad un'analisi semantica della base di dati

riconoscimento della voce

[l]

riconoscimento del discorso

Riconoscimento delle immagini

[l]

v. pagina 8 immagini

ROC

[a]

v. riconoscimento ottico dei caratteri

semantica

[n]

analisi del linguaggio diretta a determinarne il significato

sillaba

[n]

unità di pronuncia che comprende più di un suono (v. fonema) e più piccola di una parola

sintassi

[n]

sistema di regole che descrive in che modo possono essere formate frasi a partire da elementi di base del linguaggio, cioè morfemi, parole e parti del discorso

sommario

[n]

sintetica descrizione del contenuto di un documento

strumenti di redazione

[l]

(ingl. authoring) strumenti associati ad un sistema di trattamento testi e destinati ad aiutare l'autore di un documento, comprendenti abitualmente un dizionario o un thesaurus on-line, controllo ortografico, grammaticale e stilistico e strumenti per la strutturazione, l'integrazione e la connessione di documenti

test del mago di Oz

[l]

test in cui la componente meccanica automatizzata è sostituita da una qualche forma di intervento umano, ma in modo che l'utente che partecipa al test non sia a conoscenza della sostituzione

testo

[n]

usato di frequente per distinguere il linguaggio scritto, stampato o registrato simbolicamente (per mezzo della codifica di caratteri) dal discorso

thesaurus

[n]

dizionario di sinonimi

tradurre

[v]

trasferire un testo da una lingua ad un'altra

traduzione assistita da elaboratore elettronico

[l]

assistenza fornita ad un traduttore umano nella traduzione da una lingua ad un'altra mediante strumenti software

traduzione automatica

[l]

operazione consistente nella traduzione automatica da una lingua ad un'altra mediante un elaboratore elettronico

trattamento del linguaggio naturale

[l]

termine in uso dagli anni '80 per definire una classe di sistemi software che trattano il testo in modo intelligente

versione

[n]

edizione di un documento registrata come diversa dall'edizione precedente

Questo opuscolo è stato pubblicato a cura del gruppo LINGLINK Anite Systems, per conto dei partecipanti al settore Ingegneria linguistica del Programma Applicazioni telematiche.