Chine-Japon : écriture et traduction au défi de l’intelligence artificielle et de l’encodage
Le traitement automatique du langage naturel a modifié notre rapport à la langue et à l’écriture. En quoi ces outils d’extraction terminologiques, de traduction assistée par ordinateur, de traduction automatique, de numérisation de textes et d’images… changent-ils nos gestes, nos usages de lecture et de traduction, nos pratiques d’enseignement et de recherche ?
Le lundi 6 février, l’Institut français de recherche sur l’Asie de l’Est (IFRAE) a organisé une rencontre avec le linguiste Jean Bazantay, spécialiste du Japon et maître de conférences à l’Inalco, la sinologue Pascale Elbaz, enseignante-chercheure à l’ISIT, Lia Wei, maître de conférences en histoire de l’art et archéologie de la Chine à l’Inalco, et le sinologue Pierre Magistry, chercheur en linguistique computationnelle et traitement automatique des langues à l’Inalco. Un débat animé par Guibourg Delamotte, maître de conférences à l’Inalco.
Un entretien passionnant avec le intervenant·e·s, publié par le site Asialyst, autour des évolutions et des enjeux (y compris politiques et géo-politiques) des systèmes d’écriture chinois et japonais à l’heure du numérique.
« L’encodage des caractères chinois sur un système informatique en Chine s’est opéré dans les années 1970-80. Pour ce faire, les caractères chinois ont été standardisés afin que l’encodage soit plus simple. Ce dernier a représenté un travail monumental pour la langue chinoise à cause du nombre conséquent de caractères. Un encodage taïwanais qui se veut englobant a été développé vers la fin du XXème siècle, en prenant en compte les variantes simplifiées et d’autres variantes plus complexes qui pourraient exister. De plus, il y a aussi une correspondance directe sur le code japonais pour faire de la conversion très simplement. Cependant, l’encodage se montrera un peu défaillant quant au traitement de textes historiques. Cet encodage n’a finalement pas été retenu comme encodage principal, c’est l’encodage Bigfile qui le sera par la suite, construit par des industriels taïwanais. Ces encodages ont été développés avant l’unicode, un codage qui a pour volonté de rassembler tous les encodages à travers le monde. Le Bigfile va être dédié au mandarin et va alors mettre de côté le taïwanais » (Pierre Magistry).
#écriture #Chine #Taïwan #Japon #JeanBazantay #PierreMagistry #LiaWei #PascaleElbaz #Inalco #Bigfile #unicode
