![]() |
|
|||||
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
||||||
![]() |
|
||||||||||||||||||||||||||||||||||||
|
par Andrew Joscelyne Si tout se passe comme pr?vu, les terriens francophones dans 50 000 ans pourront d?couvrir ce que leurs tr?s lointains anc?tres?francophones, anglophones, hispanophones, germanophones, etc.?pensaient de l'univers en 2003. Un projet fran?ais baptis? KEO (www.keo.org) pr?voit en effet fin 2003 d'envoyer dans l'espace un satellite contenant un grand nombre de messages individuels et de textes r?dig?s en fran?ais ainsi que dans 59 autres langues. Objectif de cette ? biblioth?que d'Alexandrie contemporaine ? : transmettre ? ceux de nos lointains descendants qui parviendront ? d?chiffrer ces messages les pr?occupations qui sont les n?tres au troisi?me mill?naire. Cinq mille cinq cents ans nous s?parent de la naissance du langage ?crit ? Sumer. Au cours de cette p?riode?dix fois plus courte que ce que durera la mission KEO dans l'espace?des milliers de langues ont disparu de la surface de la Terre. Aujourd'hui encore, une centaine de langues continuent de dispara?tre chaque ann?e (www.ogmios.org). Alors, existera-t-il en l'an 52003 une machine capable d'aider les habitants de la plan?te ? d?chiffrer ce que leurs anc?tres fran?ais, alors ? l'aube de la soci?t? de l'information, ont tent? de leur dire? Peut-?tre pas, bien que des entreprises telles que Lingway et Sinequa figurent parmi les ? experts ? charg?s, dans le cadre du projet KEO, de l'analyse linguistique des messages qui s'envoleront dans l'espace. Ces deux entreprises illustrent parfaitement la mani?re dont les technologies de la langue, plus sp?cifiquement de la langue ?crite, ont ?volu? (certains diraient surv?cu) en France au cours de ces dix derni?res ann?es. N?anmoins, rien ne prouve pour l'heure qu'elles deviendront quasi immortelles! Vingt ans de d?veloppement industriel Apr?s avoir cr?? ERLI dans les ann?es 1980, une soci?t? charg?e de fournir des technologies de la langue pour des projets tels que le syst?me Minitel de France Telecom, il donne un nouvel ?lan ? l'entreprise dans les ann?es 1990. Celle-ci devient Lexiquest et part ? l'assaut du march? international, notamment de la Silicon Valley. Depuis, Lexiquest a ?t? rachet?e par une soci?t? technologique ?trang?re. Dans un sens, Bernard Normier est revenu ? ses premi?res amours, en cr?ant avec Lingway une nouvelle soci?t? dont la mission est de d?velopper des technologies destin?es ? ?tre int?gr?es dans des applications informatiques verticales. Aux c?t?s de Sinequa et de Lingway, la France compte une bonne douzaine d'autres entreprises op?rant dans le secteur des technologies de la langue, ainsi qu'une douzaine de soci?t?s sp?cialis?es dans le traitement du langage parl?. Un r?sultat plut?t int?ressant compar? ? des pays comme l'Allemagne et le Royaume-Uni. Ces entreprises sont, pour la plupart, de petites structures, m?me si plusieurs grandes soci?t?s ont eu pendant longtemps des activit?s de recherche importantes en France : Xerox, France T?l?com, IBM et Thales, notamment. Certains de ces centres de R&D ont essaim?, comme IBM qui a donn? naissance ? Kalima, et France T?l?com qui a pondu Telisma. Pour Bernard Normier, l'augmentation du nombre de petites entreprises est factice dans la mesure o? nombre d'entre elles sont n?es, ? l'instar de la sienne, de l'?clatement de soci?t?s plus importantes, avec ? la cl? une fragmentation et une fragilit? financi?re croissantes. Selon Etienne Lamort de Gall, directeur marketing d'Elan Speech, l'une des soci?t?s fran?aises les plus performantes dans le domaine du traitement du langage parl?, ? la cr?ation de nouvelles entreprises dans ce domaine est stagnante en France, ? quelques rares exceptions pr?s. ?. Une situation qui s'explique en partie par le blues qui a suivi l'?re des soci?t?s point.com, par la r?duction des budgets de d?veloppement ainsi que par la rar?faction des financements par capital-risque. De toute fa?on, m?me lors des plus beaux jours du boom, la France n'a jamais offert un environnement particuli?rement propice aux start-up. Pour Philippe Laval, patron de Sinequa, le ph?nom?ne est ?galement d? ? ce que les Fran?ais, ? s'ils excellent ? d?velopper de nouvelles technologies, ils ne savent en revanche pas les vendre. ? La langue, un bien culturel plut?t que commercial C'est pr?cis?ment cet engagement g?opolitique ? r?affirmer le r?le de la France dans le monde ? travers sa langue (Francophonie) qui a guid? les d?cisions politiques, plut?t que la prise en compte des besoins des citoyens ou la concurrence ?conomique. Avec pour r?sultat, comme le souligne St?phane Chaudiron de la section Technologies de l'information et de la communication du Minist?re de la Recherche, une conscience croissante du ? d?clin ? du fran?ais en tant qu'idiome de communication scientifique et technologique, qui a rendu plus difficile la conception d'un v?ritable programme de d?veloppement des technologies de la langue. Si le concept de la Francophonie a incit? les pouvoirs publics ? financer la recherche, il s'est ?galement traduit par une focalisation sur la mission politique et culturelle de la langue, l? o? il aurait ?t? plus judicieux de proc?der ? une ?valuation rigoureuse des enjeux industriels et ?conomiques suscit?s par l'adaptation de la langue ? la soci?t? de l'information. Quelle que soit la motivation id?ologique, cette politique a permis de d?velopper une solide plate-forme de R&D, soutenue comme le souligne St?phane Chaudiron par une ? stabilit? ? bienvenue au sein des diff?rents d?partements minist?riels (recherche, culture et industrie) qui ont tous, au fil des ans, suivi de pr?s et encourag? le d?veloppement technologique. L'engagement fort envers les technologies de la langue de Jacques Mathieu au Minist?re de l'Industrie en est une parfaite illustration. Bernard Normier de Lingway voit dans ? le bon niveau des centres de recherche acad?miques ? l'un des points forts de la France. Etienne Lamort de Gall d'Elan consid?re pour sa part que la France compte un grand nombre de chercheurs bien form?s en linguistique, traitement du signal et traitement du langage. Il n'en reste pas moins une contradiction de taille : malgr? les importants efforts r?alis?s en mati?re de R&D, la France semble peiner ? concr?tiser ses travaux et ? mettre des technologies et des outils sur le march? commercial et industriel. De nouveaux projets de R&D Technolangue est dirig? par Joseph Mariani, autre figure historique de l'industrie des langues fran?aise et europ?enne, connu pour ses travaux sur le traitement automatique du langage parl? et aujourd'hui membre de l'?quipe en charge des technologies de l'information et de la communication au sein du Minist?re de la Recherche. Ce projet, qui b?n?ficie d'un budget relativement restreint (4 millions d'euros) vise n?anmoins ? mettre en place une infrastructure plus solide afin d'alimenter d'autres projets de d?veloppement li?s aux technologies de la langue, auxquels les r?seaux de R&D publics consacrent actuellement jusqu'? 100 millions d'euros. En mettant l'accent sur la production de ressources langagi?res et leur ?valuation, Technolangue semble vouloir r?pondre aux acteurs des technologies de la langue qui ne cessent de d?noncer l'absence de donn?es solides permettant de tester les syst?mes et d'extraire des informations linguistiques, ce qui favoriserait les avanc?es technologiques. Ainsi, ? l'occasion du r?cent salon organis? ? Berlin, Francis Charpentier, directeur g?n?ral de Telisma, sp?cialiste fran?ais reconnu des technologies de la parole, a soulign? les probl?mes pos?s par le manque de ressources linguistiques de bonne qualit?. Sans les bases de donn?es de prononciation de millions de mots en dizaines de langues, il sera tr?s difficile de d?velopper des syst?mes de reconnaissance de la parole pour les services de t?l?communications de nouvelle g?n?ration, accessibles via une interface multimodale. Il se trouve que l'Agence pour l'?valuation et la distribution de ressources linguistiques (ELDA) a son si?ge en France. Cr??e en 1995, l'Association europ?enne pour les ressources linguistiques (ELRA, European Language Resource Agency) et son p?le op?rationnel, l'ELDA, se sont vu confier la d?licate mission de g?rer l'?valuation et la distribution des ressources en Europe, de mani?re ind?pendante, pour le compte de chercheurs issus tant du milieu universitaire que de l'industrie. Naturellement, ELRA est ?troitement associ?e ? l'initiative Technolangue, en tant qu'organisme ? but non lucratif. Sa zone d'influence n'est pas la seule Europe, mais l'ensemble du monde. Bien que reconnu comme une excellente initiative, le programme Technolangue ?prouvera sans doute des difficult?s ? satisfaire tout le monde. Philippe Laval de Sinequa compare la situation fran?aise avec celle des Etats-Unis, o? ? les efforts de la DARPA (l'agence am?ricaine charg?e de la recherche en informatique) en faveur des ressources linguistiques sont 10 ? 100 fois plus importants qu'en France ? et o? la base de ressources cr??e est plus ou moins gratuite. La gratuit? des ressources ne s'accompagne cependant pas forc?ment d'une am?lioration de l'infrastructure industrielle. Pour Fr?d?rique Segond, qui travaille au sein du d?partement D?veloppement commercial du ? Grenoble, l'un des rares laboratoires de R&D d?di?s aux technologies de la langue, l'une des principales difficult?s r?side dans le fait que ? les PME sp?cialis?es dans les technologies de la langue veulent pouvoir tirer un avantage commercial en ?change de leur contribution au d?veloppement des ressources pour la communaut?. Faute de quoi, ? long terme, elles seront tent?es de ne pas participer aux programmes de R&D. ? Plut?t que de distribuer de petites subventions ? chacun, secteur public ou priv?, ce qui est plus ou moins l'habitude en France pour les programmes de R&D, Fr?d?rique Segond pense que des accords solides entre les acteurs du public et du priv? contribueraient largement ? garantir un retour sur investissement ?quilibr? : les acteurs industriels apporteraient leurs comp?tences de terrain et un int?r?t pour le processus de d?veloppement des ressources ; travailler avec eux permettrait ?galement aux ?quipes universitaires de gagner de l'argent. Il est tr?s difficile de demander ? une entreprise de travailler pour rien ! ? Th?o Hoffenberg de Softissimo, qui dirige la deuxi?me plus importante soci?t? de traduction automatique de France apr?s Systran, pense lui aussi que la priorit? doit ?tre donn?e au d?veloppement des ressources. Il sait toutefois par exp?rience que si la production de ressources de qualit? pour des applications d'entreprise exige un niveau de comp?tences plus ?lev? que pour des prototypes de recherche, elle n'est toutefois pas consid?r?e comme suffisamment passionnante sur le plan intellectuel pour attirer les chercheurs universitaires. N?anmoins, il reconna?t qu'avec sa propre entreprise et Systran, une autre soci?t? implant?e en France, le pays dispose d'ores et d?j? d'une base de ressources in?gal?e en mati?re de traduction automatique. Et l'argent dans tout ?a? Pour Philippe Laval, ? le march? est essentiellement tir? par la technologie : nous vendons toujours ? des innovateurs, pas encore au c?ur du march?. ? La raison ? cela ? La plainte r?guli?rement ?mise par les analystes du march? et que Bernard Normier r?sume aujourd'hui ainsi : ? exception faite de la traduction, les clients ne savent pas qu'ils ont besoin des technologies de la langue. Ce qu'ils savent en revanche, c'est qu'ils ont besoin de solutions pour r?soudre certains probl?mes. ? Si en 1995 l'arriv?e d'Internet comme service destin? tant aux entreprises qu'au grand public a progressivement mis en lumi?re le probl?me du multilinguisme en France (apr?s les ann?es plus faciles du Minitel, technologie exclusivement fran?aise) ainsi que le besoin de solutions de traduction automatique, on n'a observ? aucune volont? forte de la part des entreprises de mettre en ?uvre des technologies de recherche avanc?e, de r?sum? automatique, etc. Dans de nombreux cas, ce sont les administrations et les entreprises publiques qui ont ?t? les plus promptes ? adopter ces technologies, selon une approche ?conomique typiquement fran?aise destin?e ? stimuler le d?veloppement technologique : l'Etat non seulement finance la recherche mais, ? travers ANVAR, l'agence fran?aise de l'innovation, il soutient le transfert technologique vers les PME dont les produits et les services sont finalement achet?s par ?des organisations d?pendant de l'Etat (minist?res, banques, SNCF, etc.). Dire leurs besoins aux utilisateurs Fr?d?rique Segond identifie une certaine ? absence de diversit? ? dans les applications disponibles, mettant en avant que le test le plus s?rieux pour les technologies de la langue matures viendra de grands projets multim?dia, dans lesquels l'intelligence linguistique ne repr?sentera que 30 % de l'ensemble. Ce qui signifie que si le march? ?volue in?vitablement vers une plus grande int?gration et une plus grande convergence des technologies de la langue (?crite et parl?e) et du traitement des connaissances en g?n?ral, ce qui manque ce n'est pas la technologie mais une plate-forme robuste permettant son ? industrialisation ?. ? L? o? la France a pris du retard, ? estime Etienne Lamort de Gall d'Elan, ? c'est dans le d?veloppement d'une cha?ne de production industrielle suffisamment solide et g?n?rique pour permettre aux entreprises de se positionner sur le march?. Une bonne R&D ne suffit absolument pas pour d?velopper un tissu ?conomique et industriel bas? sur les technologies de la langue orale, par exemple. ? Toutefois, comme sur tout march? tir? par l'offre, ? c'est ? nous de cr?er la demande ? d?clare Etienne Lamort de Gall. ? Apr?s de nombreuses ann?es d'?vang?lisation, nous commen?ons ? sentir l'?mergence d'une demande r?elle pour les technologies de la langue orale. La demande fran?aise reste n?anmoins loin derri?re la demande enregistr?e aux Etats-Unis, en Allemagne et au Royaume-Uni. ? La taille importe-t-elle? Bien qu'il soit aussi difficile d'internationaliser des produits de synth?se de la parole que des applications textuelles, le premier march? d'Elan Speech aujourd'hui est l'Allemagne, un march? nettement plus pr?par? que la France ? accueillir l'application radicalement multilingue de l'entreprise. ? La taille du march? fran?ais ne permet pas ? une entreprise d'autofinancer sa croissance. ? Consolidation ou? Philippe Laval est convaincu qu'il est essentiel de consolider le secteur afin de r?sister ensemble ? la puissance des mastodontes de l'?dition logicielle. De m?me Etienne Lamort de Gall sugg?re que la consolidation n?cessaire pour se d?velopper ? l'international se fera sans doute naturellement ? travers des partenariats entre des soci?t?s fran?aises. Bernard Normier reconna?t que la consolidation est in?vitable, tout en pr?cisant que le manque ?vident de standards et la nature tr?s technique du march? n?cessiteront un management particuli?rement comp?tent dans le domaine. L'exemple c?l?bre de Lernout & Hauspie est pr?cis?ment ce qu'il faut ?viter. Personne ne serait assez fou pour parier sur la capacit? de la technologie de la langue fran?aise ? survivre 50 000 ans avec le satellite Keo. Parall?lement, des entreprises telles que Lingway et Sinequa vont pouvoir mettre ? profit ce projet typiquement fran?ais - mi-conceptualisation po?tique, mi-vitrine universelle - pour collecter gratuitement quantit? de textes r?dig?s dans un grand nombre de langues. Heureusement, cinq ans devraient leur suffire pour offrir de meilleurs services aux entreprises.
Bas? ? Paris, est consultant et r?dacteur sp?cialis? dans les technologies de la langue. Vous pouvez le joindre ? l'adresse suivante: . The editors of HLTCentral would welcome any feedback on the article. Please send your comments to the .Disclaimer: Any opinions expressed in this article are strictly those of the author and do not necessarily reflect the viewpoint of EUROMAP site or its editors. Copyright ? 2003 HLTCentral. All rights reserved. |
||||||||
|