Euromap Euromap Euromap
Euromap - your path to market for speech and language technologies  
 
The gateway to speech and language technology opportunities
European network of excellence in HLT
EC Programme fostering digital content on the global networks
EuromapHomeNewsMembersSitemapSearch
Euromap    
 Articles
   Natural language querying -EN
   MT in Bulgaria
   Speech-to-speech
   CAT Tools
   Information Access -Greece
   The Power Of Voice
   Language Tech in France
     > Language Tech in France FR
   Flanders speaking
   LT in Berlin - EN
   Beyond Simple Keywords -EN
   Crossing The Chasm
   Interview - Dr. Bartenstein -EN
   The Joy of Text
   How to HLT-Enable EN
   How to HLT-Enable NL
   Danish-Search Engines EN
   Austria - Way Ahead EN
   Email Response - EN
   Semantic Web
   Finnish Lessons
   Daily life-EN
 Mission
 Team
 Events
 Success Stories
 Newsletters
 eBusiness
 Tourism
 Tech Transfer
 Reports
 EU - HLT Fact Files
 HLT Policy Pages
 CEEC Info Centre
 Who's Who
 HLT Projects
 
Visit EUROMAP Language Technologies in these countries:

EUROMAP Article in English
Les technologies de la langue en France : objectif immortalit??


francophonie 52003

quote... Cinq mille cinq cents ans nous s?parent de la naissance du langage ?crit ? Sumer. Au cours de cette p?riode, des milliers de langues ont disparu de la surface de la Terre. ...unquote



Soci?t?s d'ing?nierie linguistique pr?sent?es

? Elan Speech

? Kalima

? Lingway

? Sinequa

? Softissimo

? Systran

? Telisma



quote... L? o? la France a pris du retard ... c'est dans le d?veloppement d'une cha?ne de production industrielle suffisamment solide et g?n?rique pour permettre aux entreprises de se positionner sur le march?. ...unquote

Etienne Lamort de Gall, Elan

Organisme et programmes pr?sent?s

? ANVAR
French Agency for Innovation

? ELDA
Evaluation and Language resources Distribution Agency

? ELRA
European Language Resources Association

? ERLI

? KEO
The Space Time Capsule

? Technolangue

?


quote... Si le concept de la Francophonie a incit? les pouvoirs publics ? financer la recherche, il s'est ?galement traduit par une focalisation sur la mission politique et culturelle de la langue, l? o? il aurait ?t? plus judicieux de proc?der ? une ?valuation rigoureuse des enjeux industriels et ?conomiques suscit?s par l'adaptation de la langue ? la soci?t? de l'information. ...unquote


Articles de m?me domaine publi?s sur HLTCentral

? Feature Article: Are we losing ground to the US?
by Joseph Mariani

? Success Story: Auralog's Speech-Enabled Language Learning Solution at Casino Group

? Success Story: ePatent - Internet Access To European Patent Databases Using Natural And Multilingual Language Interfaces

? Success Story: Championing Language Technologies - SPIRIT at COGEMA


quote... Se pose alors la question majeure: lorsque toutes les recherches auront ?t? effectu?es, lorsque les ressources seront disponibles, lorsque des outils auront ?t? mis ? la disposition de l'industrie et que les technologies seront devenues assez matures, comment gagnera-t-on de l'argent avec les technologies de la langue en France? ...unquote

par Andrew Joscelyne

Si tout se passe comme pr?vu, les terriens francophones dans 50 000 ans pourront d?couvrir ce que leurs tr?s lointains anc?tres?francophones, anglophones, hispanophones, germanophones, etc.?pensaient de l'univers en 2003. Un projet fran?ais baptis? KEO (www.keo.org) pr?voit en effet fin 2003 d'envoyer dans l'espace un satellite contenant un grand nombre de messages individuels et de textes r?dig?s en fran?ais ainsi que dans 59 autres langues. Objectif de cette ? biblioth?que d'Alexandrie contemporaine ? : transmettre ? ceux de nos lointains descendants qui parviendront ? d?chiffrer ces messages les pr?occupations qui sont les n?tres au troisi?me mill?naire.

Cinq mille cinq cents ans nous s?parent de la naissance du langage ?crit ? Sumer. Au cours de cette p?riode?dix fois plus courte que ce que durera la mission KEO dans l'espace?des milliers de langues ont disparu de la surface de la Terre. Aujourd'hui encore, une centaine de langues continuent de dispara?tre chaque ann?e (www.ogmios.org). Alors, existera-t-il en l'an 52003 une machine capable d'aider les habitants de la plan?te ? d?chiffrer ce que leurs anc?tres fran?ais, alors ? l'aube de la soci?t? de l'information, ont tent? de leur dire?

Peut-?tre pas, bien que des entreprises telles que Lingway et Sinequa figurent parmi les ? experts ? charg?s, dans le cadre du projet KEO, de l'analyse linguistique des messages qui s'envoleront dans l'espace. Ces deux entreprises illustrent parfaitement la mani?re dont les technologies de la langue, plus sp?cifiquement de la langue ?crite, ont ?volu? (certains diraient surv?cu) en France au cours de ces dix derni?res ann?es. N?anmoins, rien ne prouve pour l'heure qu'elles deviendront quasi immortelles!

Vingt ans de d?veloppement industriel
Alors que Sinequa, sp?cialis?e dans les technologies de recherche d'information, a ?t? cr??e en 1983 durant la premi?re vague du d?veloppement des technologies de la langue en France, Lingway est une toute nouvelle entreprise, cr??e en 2001. Son directeur, Bernard Normier, est n?anmoins l'une des figures historiques des technologies de la langue commerciales en France.

Apr?s avoir cr?? ERLI dans les ann?es 1980, une soci?t? charg?e de fournir des technologies de la langue pour des projets tels que le syst?me Minitel de France Telecom, il donne un nouvel ?lan ? l'entreprise dans les ann?es 1990. Celle-ci devient Lexiquest et part ? l'assaut du march? international, notamment de la Silicon Valley. Depuis, Lexiquest a ?t? rachet?e par une soci?t? technologique ?trang?re. Dans un sens, Bernard Normier est revenu ? ses premi?res amours, en cr?ant avec Lingway une nouvelle soci?t? dont la mission est de d?velopper des technologies destin?es ? ?tre int?gr?es dans des applications informatiques verticales.

Aux c?t?s de Sinequa et de Lingway, la France compte une bonne douzaine d'autres entreprises op?rant dans le secteur des technologies de la langue, ainsi qu'une douzaine de soci?t?s sp?cialis?es dans le traitement du langage parl?. Un r?sultat plut?t int?ressant compar? ? des pays comme l'Allemagne et le Royaume-Uni. Ces entreprises sont, pour la plupart, de petites structures, m?me si plusieurs grandes soci?t?s ont eu pendant longtemps des activit?s de recherche importantes en France : Xerox, France T?l?com, IBM et Thales, notamment. Certains de ces centres de R&D ont essaim?, comme IBM qui a donn? naissance ? Kalima, et France T?l?com qui a pondu Telisma. Pour Bernard Normier, l'augmentation du nombre de petites entreprises est factice dans la mesure o? nombre d'entre elles sont n?es, ? l'instar de la sienne, de l'?clatement de soci?t?s plus importantes, avec ? la cl? une fragmentation et une fragilit? financi?re croissantes.

Selon Etienne Lamort de Gall, directeur marketing d'Elan Speech, l'une des soci?t?s fran?aises les plus performantes dans le domaine du traitement du langage parl?, ? la cr?ation de nouvelles entreprises dans ce domaine est stagnante en France, ? quelques rares exceptions pr?s. ?. Une situation qui s'explique en partie par le blues qui a suivi l'?re des soci?t?s point.com, par la r?duction des budgets de d?veloppement ainsi que par la rar?faction des financements par capital-risque. De toute fa?on, m?me lors des plus beaux jours du boom, la France n'a jamais offert un environnement particuli?rement propice aux start-up. Pour Philippe Laval, patron de Sinequa, le ph?nom?ne est ?galement d? ? ce que les Fran?ais, ? s'ils excellent ? d?velopper de nouvelles technologies, ils ne savent en revanche pas les vendre. ?

La langue, un bien culturel plut?t que commercial
Il est ?vident que la France a su reconna?tre la n?cessit? de d?velopper des technologies de la langue. Que ce besoin ait ?t? satisfait ou non est une autre histoire. Apr?s au moins 25 ans de financements publics et europ?ens, le pays voit sa R&D largement reconnue ? l'?chelle internationale. C'est d'ailleurs la France qui, la premi?re, a lanc? le terme ? industries de la langue ? dans un rapport publi? en 1985 revendiquant le besoin urgent d'une ? mise ? plat de la langue fran?aise ? selon les termes de feu Maurice Gross, l'un des plus grands sp?cialistes fran?ais de l'ing?nierie linguistique, qui se montrait soucieux d'emp?cher la domination de l'anglais dans l'av?nement des technologies de l'information et de la communication.

C'est pr?cis?ment cet engagement g?opolitique ? r?affirmer le r?le de la France dans le monde ? travers sa langue (Francophonie) qui a guid? les d?cisions politiques, plut?t que la prise en compte des besoins des citoyens ou la concurrence ?conomique. Avec pour r?sultat, comme le souligne St?phane Chaudiron de la section Technologies de l'information et de la communication du Minist?re de la Recherche, une conscience croissante du ? d?clin ? du fran?ais en tant qu'idiome de communication scientifique et technologique, qui a rendu plus difficile la conception d'un v?ritable programme de d?veloppement des technologies de la langue. Si le concept de la Francophonie a incit? les pouvoirs publics ? financer la recherche, il s'est ?galement traduit par une focalisation sur la mission politique et culturelle de la langue, l? o? il aurait ?t? plus judicieux de proc?der ? une ?valuation rigoureuse des enjeux industriels et ?conomiques suscit?s par l'adaptation de la langue ? la soci?t? de l'information.

Quelle que soit la motivation id?ologique, cette politique a permis de d?velopper une solide plate-forme de R&D, soutenue comme le souligne St?phane Chaudiron par une ? stabilit? ? bienvenue au sein des diff?rents d?partements minist?riels (recherche, culture et industrie) qui ont tous, au fil des ans, suivi de pr?s et encourag? le d?veloppement technologique. L'engagement fort envers les technologies de la langue de Jacques Mathieu au Minist?re de l'Industrie en est une parfaite illustration.

Bernard Normier de Lingway voit dans ? le bon niveau des centres de recherche acad?miques ? l'un des points forts de la France. Etienne Lamort de Gall d'Elan consid?re pour sa part que la France compte un grand nombre de chercheurs bien form?s en linguistique, traitement du signal et traitement du langage. Il n'en reste pas moins une contradiction de taille : malgr? les importants efforts r?alis?s en mati?re de R&D, la France semble peiner ? concr?tiser ses travaux et ? mettre des technologies et des outils sur le march? commercial et industriel.

De nouveaux projets de R&D
Les derniers programmes sauront-ils modifier ce d?s?quilibre entre l'excellence de la recherche et la passivit? commerciale? Suite ? un rapport paru en 2000, le gouvernement a d?cid? de privil?gier trois pistes: d?velopper une infrastructure HLT en comblant les lacunes observ?es au niveau des ressources langagi?res?un projet baptis? Technolangue favoriser l'utilisation d'applications en fran?ais aupr?s du grand public, et enfin, offrir une meilleure formation aux biblioth?caires charg?s de g?rer les contenus num?riques. Ce train de mesures a pour objectif final d'encourager les entreprises ? utiliser les technologies de la langue pour renforcer leur comp?titivit? en mati?re de veille commerciale et autres activit?s de traitement du savoir sur le march? mondial.

Technolangue est dirig? par Joseph Mariani, autre figure historique de l'industrie des langues fran?aise et europ?enne, connu pour ses travaux sur le traitement automatique du langage parl? et aujourd'hui membre de l'?quipe en charge des technologies de l'information et de la communication au sein du Minist?re de la Recherche. Ce projet, qui b?n?ficie d'un budget relativement restreint (4 millions d'euros) vise n?anmoins ? mettre en place une infrastructure plus solide afin d'alimenter d'autres projets de d?veloppement li?s aux technologies de la langue, auxquels les r?seaux de R&D publics consacrent actuellement jusqu'? 100 millions d'euros.

En mettant l'accent sur la production de ressources langagi?res et leur ?valuation, Technolangue semble vouloir r?pondre aux acteurs des technologies de la langue qui ne cessent de d?noncer l'absence de donn?es solides permettant de tester les syst?mes et d'extraire des informations linguistiques, ce qui favoriserait les avanc?es technologiques.

Ainsi, ? l'occasion du r?cent salon organis? ? Berlin, Francis Charpentier, directeur g?n?ral de Telisma, sp?cialiste fran?ais reconnu des technologies de la parole, a soulign? les probl?mes pos?s par le manque de ressources linguistiques de bonne qualit?. Sans les bases de donn?es de prononciation de millions de mots en dizaines de langues, il sera tr?s difficile de d?velopper des syst?mes de reconnaissance de la parole pour les services de t?l?communications de nouvelle g?n?ration, accessibles via une interface multimodale.

Il se trouve que l'Agence pour l'?valuation et la distribution de ressources linguistiques (ELDA) a son si?ge en France. Cr??e en 1995, l'Association europ?enne pour les ressources linguistiques (ELRA, European Language Resource Agency) et son p?le op?rationnel, l'ELDA, se sont vu confier la d?licate mission de g?rer l'?valuation et la distribution des ressources en Europe, de mani?re ind?pendante, pour le compte de chercheurs issus tant du milieu universitaire que de l'industrie. Naturellement, ELRA est ?troitement associ?e ? l'initiative Technolangue, en tant qu'organisme ? but non lucratif. Sa zone d'influence n'est pas la seule Europe, mais l'ensemble du monde.

Bien que reconnu comme une excellente initiative, le programme Technolangue ?prouvera sans doute des difficult?s ? satisfaire tout le monde. Philippe Laval de Sinequa compare la situation fran?aise avec celle des Etats-Unis, o? ? les efforts de la DARPA (l'agence am?ricaine charg?e de la recherche en informatique) en faveur des ressources linguistiques sont 10 ? 100 fois plus importants qu'en France ? et o? la base de ressources cr??e est plus ou moins gratuite.

La gratuit? des ressources ne s'accompagne cependant pas forc?ment d'une am?lioration de l'infrastructure industrielle. Pour Fr?d?rique Segond, qui travaille au sein du d?partement D?veloppement commercial du ? Grenoble, l'un des rares laboratoires de R&D d?di?s aux technologies de la langue, l'une des principales difficult?s r?side dans le fait que ? les PME sp?cialis?es dans les technologies de la langue veulent pouvoir tirer un avantage commercial en ?change de leur contribution au d?veloppement des ressources pour la communaut?. Faute de quoi, ? long terme, elles seront tent?es de ne pas participer aux programmes de R&D. ?

Plut?t que de distribuer de petites subventions ? chacun, secteur public ou priv?, ce qui est plus ou moins l'habitude en France pour les programmes de R&D, Fr?d?rique Segond pense que des accords solides entre les acteurs du public et du priv? contribueraient largement ? garantir un retour sur investissement ?quilibr? : les acteurs industriels apporteraient leurs comp?tences de terrain et un int?r?t pour le processus de d?veloppement des ressources ; travailler avec eux permettrait ?galement aux ?quipes universitaires de gagner de l'argent. Il est tr?s difficile de demander ? une entreprise de travailler pour rien ! ?

Th?o Hoffenberg de Softissimo, qui dirige la deuxi?me plus importante soci?t? de traduction automatique de France apr?s Systran, pense lui aussi que la priorit? doit ?tre donn?e au d?veloppement des ressources. Il sait toutefois par exp?rience que si la production de ressources de qualit? pour des applications d'entreprise exige un niveau de comp?tences plus ?lev? que pour des prototypes de recherche, elle n'est toutefois pas consid?r?e comme suffisamment passionnante sur le plan intellectuel pour attirer les chercheurs universitaires. N?anmoins, il reconna?t qu'avec sa propre entreprise et Systran, une autre soci?t? implant?e en France, le pays dispose d'ores et d?j? d'une base de ressources in?gal?e en mati?re de traduction automatique.

Et l'argent dans tout ?a?
Se pose alors la question majeure: lorsque toutes les recherches auront ?t? effectu?es, lorsque les ressources seront disponibles, lorsque des outils auront ?t? mis ? la disposition de l'industrie et que les technologies seront devenues assez matures, comment gagnera-t-on de l'argent avec les technologies de la langue en France? Existe-t-il un v?ritable march?? S'agit-il d'un march? national ou forc?ment ?tranger? Les technologies de la langue pourront-elles trouver des applications sur le segment grand public ou seront-elles cantonn?es ? des applications de niche?

Pour Philippe Laval, ? le march? est essentiellement tir? par la technologie : nous vendons toujours ? des innovateurs, pas encore au c?ur du march?. ? La raison ? cela ? La plainte r?guli?rement ?mise par les analystes du march? et que Bernard Normier r?sume aujourd'hui ainsi : ? exception faite de la traduction, les clients ne savent pas qu'ils ont besoin des technologies de la langue. Ce qu'ils savent en revanche, c'est qu'ils ont besoin de solutions pour r?soudre certains probl?mes. ?

Si en 1995 l'arriv?e d'Internet comme service destin? tant aux entreprises qu'au grand public a progressivement mis en lumi?re le probl?me du multilinguisme en France (apr?s les ann?es plus faciles du Minitel, technologie exclusivement fran?aise) ainsi que le besoin de solutions de traduction automatique, on n'a observ? aucune volont? forte de la part des entreprises de mettre en ?uvre des technologies de recherche avanc?e, de r?sum? automatique, etc.

Dans de nombreux cas, ce sont les administrations et les entreprises publiques qui ont ?t? les plus promptes ? adopter ces technologies, selon une approche ?conomique typiquement fran?aise destin?e ? stimuler le d?veloppement technologique : l'Etat non seulement finance la recherche mais, ? travers ANVAR, l'agence fran?aise de l'innovation, il soutient le transfert technologique vers les PME dont les produits et les services sont finalement achet?s par ?des organisations d?pendant de l'Etat (minist?res, banques, SNCF, etc.).

Dire leurs besoins aux utilisateurs
Pour assurer la croissance du march?, il est n?cessaire de comprendre, selon Bernard Normier, que les technologies de la langue ne constituent qu'un ?l?ment d'un syst?me ou d'une solution plus globale. Il faut convaincre les entreprises et les d?veloppeurs d'applications grand public d'investir dans ces technologies. Pour Philippe Laval, le traitement du langage naturel finira par devenir un produit de base, un composant que l'on retrouvera dans toutes les applications informatiques. Mais nous n'avons encore aucune solution magique pour convaincre les consommateurs de s'int?resser ? ce qui existe.

Fr?d?rique Segond identifie une certaine ? absence de diversit? ? dans les applications disponibles, mettant en avant que le test le plus s?rieux pour les technologies de la langue matures viendra de grands projets multim?dia, dans lesquels l'intelligence linguistique ne repr?sentera que 30 % de l'ensemble. Ce qui signifie que si le march? ?volue in?vitablement vers une plus grande int?gration et une plus grande convergence des technologies de la langue (?crite et parl?e) et du traitement des connaissances en g?n?ral, ce qui manque ce n'est pas la technologie mais une plate-forme robuste permettant son ? industrialisation ?.

? L? o? la France a pris du retard, ? estime Etienne Lamort de Gall d'Elan, ? c'est dans le d?veloppement d'une cha?ne de production industrielle suffisamment solide et g?n?rique pour permettre aux entreprises de se positionner sur le march?. Une bonne R&D ne suffit absolument pas pour d?velopper un tissu ?conomique et industriel bas? sur les technologies de la langue orale, par exemple. ?

Toutefois, comme sur tout march? tir? par l'offre, ? c'est ? nous de cr?er la demande ? d?clare Etienne Lamort de Gall. ? Apr?s de nombreuses ann?es d'?vang?lisation, nous commen?ons ? sentir l'?mergence d'une demande r?elle pour les technologies de la langue orale. La demande fran?aise reste n?anmoins loin derri?re la demande enregistr?e aux Etats-Unis, en Allemagne et au Royaume-Uni. ?

La taille importe-t-elle?
Ce qui soul?ve la question de la taille du march?. Pour la plupart des petites entreprises pr?sentes dans le secteur des technologies de la langue, le chiffre d'affaires annuel ne d?passe par les 3 millions d'euros, et il est souvent bien inf?rieur. Se d?velopper ? l'international, m?me si c'est essentiel, n'est souvent pas possible compte tenu du co?t que repr?sente le d?veloppement de technologies pour d'autres langues. Un ph?nom?ne auquel semble cependant ?chapper le march? de la reconnaissance vocale, o? le multilinguisme est plus facile ? g?rer, gr?ce ? des accords de licence concernant des modules de traitement du signal existants.

Bien qu'il soit aussi difficile d'internationaliser des produits de synth?se de la parole que des applications textuelles, le premier march? d'Elan Speech aujourd'hui est l'Allemagne, un march? nettement plus pr?par? que la France ? accueillir l'application radicalement multilingue de l'entreprise. ? La taille du march? fran?ais ne permet pas ? une entreprise d'autofinancer sa croissance. ?

Consolidation ou?
Une consolidation entre les diff?rents acteurs du secteur permettrait-elle de r?soudre le probl?me de la taille du march? et de la fragilit? des entreprises ? Le sentiment g?n?ral est qu'il existe un risque r?el de voir de grandes entreprises ?trang?res prendre le contr?le de l'ensemble du secteur fran?ais d'un seul coup. Il existe d'ailleurs un pr?c?dent dans le secteur des logiciels de bureau : la France qui commercialisait plusieurs solutions de traitement de texte au milieu des ann?es 1980, p?riode o? l'ordinateur personnel a commenc? ? se g?n?raliser dans la population, ne compte plus aujourd'hui aucun ?diteur de logiciel national, m?me si le secteur logiciel emploie autant de personnes que le secteur automobile, gr?ce notamment aux bonnes performances de la France dans le domaine de l'int?gration syst?me avec des acteurs tels que Cap Gemini Ernst & Young.

Philippe Laval est convaincu qu'il est essentiel de consolider le secteur afin de r?sister ensemble ? la puissance des mastodontes de l'?dition logicielle. De m?me Etienne Lamort de Gall sugg?re que la consolidation n?cessaire pour se d?velopper ? l'international se fera sans doute naturellement ? travers des partenariats entre des soci?t?s fran?aises. Bernard Normier reconna?t que la consolidation est in?vitable, tout en pr?cisant que le manque ?vident de standards et la nature tr?s technique du march? n?cessiteront un management particuli?rement comp?tent dans le domaine. L'exemple c?l?bre de Lernout & Hauspie est pr?cis?ment ce qu'il faut ?viter.

Personne ne serait assez fou pour parier sur la capacit? de la technologie de la langue fran?aise ? survivre 50 000 ans avec le satellite Keo. Parall?lement, des entreprises telles que Lingway et Sinequa vont pouvoir mettre ? profit ce projet typiquement fran?ais - mi-conceptualisation po?tique, mi-vitrine universelle - pour collecter gratuitement quantit? de textes r?dig?s dans un grand nombre de langues. Heureusement, cinq ans devraient leur suffire pour offrir de meilleurs services aux entreprises.


Andrew Joscelyne

Bas? ? Paris, est consultant et r?dacteur sp?cialis? dans les technologies de la langue. Vous pouvez le joindre ? l'adresse suivante: .

The editors of HLTCentral would welcome any feedback on the article. Please send your comments to the .

Disclaimer: Any opinions expressed in this article are strictly those of the author and do not necessarily reflect the viewpoint of EUROMAP site or its editors. Copyright ? 2003 HLTCentral. All rights reserved.


go back top.gif  Version for printing Last updated: 4/1/03 5:34 PM

Please report problems to