La ressource terminologique multilingue CAMEO pour les filières vitivinicole, textile, tannerie et verrerie
Résumé
Cet article s’inscrit dans le cadre de l’étude des langues de spécialité et vise à analyser et à documenter la terminologie du commerce de la région de la Vénétie (Italie) en tant que secteur particulièrement productif en matière d’exportation de spécialités locales. L’étude porte sur la description d’un projet entrepris par le Département d’études linguistiques et littéraires de l’Université de Padoue. Ce projet se donne pour objectifs : 1) la récolte et l’analyse de la terminologie de l’agroalimentaire, du textile, du cuir et du verre en tant que produits d’exportation majeure de la région de la Vénétie ; 2) la construction d’un support terminologique à la traduction spécialisée et à la rédaction technique de la documentation accompagnant le produit commercial. Nous présentons la méthode d’enquête adoptée afin de collecter et de documenter systématiquement la terminologie pertinente aux domaines de travail. Nous décrivons l’outil qui les classe et les organise : la base de données multilingue CAMEO (CommerciAl terMinology rEsOurce) rassemble des fiches terminologiques structurées et normalisées selon les normes ISO les plus récentes en matière de gestion terminologique. Enfin, nous mettons en lumière le potentiel de ce nouvel outil : la richesse des informations sur laquelle il ouvre profitera aux professionnels du texte, qu’ils travaillent dans une perspective monolingue (rédacteurs techniques) ou multilingue (traducteurs spécialisés). »
Abstract
This article is set within the framework of the field of specialty language studies. It aims to analyse and document the commercial and trading terminology of the Veneto region (Italy) as a particularly prolific sector for the export of local delicacies. The study describes a project undertaken by the Department of Linguistic and Literary Studies at the University of Padua. The aims of the project are: 1) to collect and analyse the terminology of agri-food, textiles, leather and glass as major export products of the Veneto region; 2) to build a terminological resource for the specialised translation and technical writing of the commercial product documentation. This paper thus presents the survey method adopted to systematically collect and document terminology relevant to the areas of work. It describes the tool that collects and organises them: the multilingual database CAMEO (CommerciAl terMinology rEsOurce) gathers structured terminology records standardised in accordance with the latest ISO standards for terminology management. Finally, this article highlights the potential of this new tool: the wealth of information it opens up will benefit text professionals, whether they work from a monolingual (technical writers) or multilingual (specialised translators) perspective. »
Table des matières
Texte intégral
Introduction
Cette étude s’inscrit dans les deux principaux volets du domaine disciplinaire terminologique. Depuis les années 1990, le linguiste français Alain Rey1 a proposé la distinction, acceptée et promue à plusieurs reprises par la communauté scientifique2, entre d’une part l’aspect théorique de la « terminologie », à savoir l’ensemble des principes et des approches pour l’analyse des concepts et des termes d’un secteur de connaissances spécialisées, et d’autre part son caractère pratique qui, sous le nom de « terminographie », documente les procédures et les méthodes d’identification, de description et de gestion de termes dans une ou plusieurs langues au sein des ressources terminologiques3. La réflexion théorique portant sur la terminologie s’oriente donc vers l’analyse de la double dimension conceptuelle et linguistique qui caractérise cette discipline4. Sur le plan linguistique, les termes sont configurés comme des verbalisations de concepts et ils sont employés dans les langues de spécialité, entendues comme une variété fonctionnelle d’une langue naturelle, dépendante d’un secteur de connaissance ou d’une sphère d’activité spécifique, utilisée pour satisfaire les besoins communicatifs (principalement référentiels) de ce secteur spécialisé5. Parallèlement, la dimension pratique de ce champ disciplinaire se traduit par la conception et la mise en œuvre de ressources terminologiques (dictionnaires, glossaires et bases de données) afin de fournir les outils de référence pour la documentation de la terminologie sectorielle et, dans une perspective multilingue, pour la traduction correcte de textes spécialisés6.
Dans un tel contexte, cette étude vise à apporter une contribution en termes de représentation et de gestion de la terminologie multilingue utilisée dans le domaine commercial. En particulier, nous allons décrire ici un projet entrepris en 2021 par le Département d’études linguistiques et littéraires de l’Université de Padoue pour concevoir et mettre en œuvre la base de données terminologique multilingue CAMEO (CommerciAl terMinology rEsOurce). Cet outil a été conçu avec l’objectif de collecter la terminologie utilisée dans quatre sous-domaines commerciaux afin de soutenir à la fois le processus de rédaction et l’activité de traduction en ce qui concerne la documentation technique accompagnant le produit commercial. Notre étude de cas porte sur la terminologie relative aux principaux produits exportés de la Vénétie (Italie) pour qu’ils puissent bénéficier de la mise à disposition d’une ressource multilingue. Selon les données fournies par le quotidien italien Il Sole 24 ore dans un article de 2018 intitulé « Al Veneto il primato delle esportazioni »7, les entreprises locales sont responsables d’environ 13,7 % en valeur de toutes les exportations italiennes. En référence aux estimations du système statistique régional pour la période 2017-20198, la Vénétie est l’une des régions leaders dans les secteurs suivants : 1) agroalimentaire, 2) textile, 3) du cuir et 4) du verre. En ce sens, le projet en question vise la documentation, l’analyse et la description de la terminologie commerciale de ces quatre sous-domaines de productivité locale à travers la mise en œuvre d’une nouvelle ressource librement accessible en ligne.
La section 2 de cet article propose un aperçu des études et des ressources actuellement disponibles pour les quatre domaines commerciaux identifiés ; la section 3 est consacrée à la description du projet et des objectifs concernant la documentation et la terminologie commerciale de la région. En particulier, nous décrivons la nouvelle ressource CAMEO, ses langues de travail, les utilisateurs identifiés, sa structure et les bénéfices qui en découlent. La section 4 illustre la méthodologie de travail adoptée dans le cadre du projet afin de collecter les termes commerciaux pertinents : d’abord, la collecte a été réalisée à travers une analyse de corpus, puis il y a eu la compilation de fiches terminologiques multilingues chargées sur l’application Web FAIRterm et ensuite leur intégration dans la base de données CAMEO. La section 5 illustre l’état actuel de la ressource, c’est-à-dire les données terminologiques actuellement disponibles et les sous-projets didactiques qui ont permis de recueillir la terminologie du domaine agroalimentaire, du cuir et du verre. Des exemples de termes collectés dans la base de données seront également illustrés dans cette section. Dans la section finale, nous présentons nos considérations et nos perspectives à moyen et long terme.
Contexte
De nombreuses études ont été menées par des chercheurs afin de documenter les caractéristiques terminologiques des quatre domaines commerciaux pris en compte9. Dans ce cadre, notre intérêt s’oriente vers l’analyse des ressources lexicales spécialisées disponibles pour le domaine commercial, à la lumière des exigences des entreprises manufacturières de disposer d’outils linguistiques exhaustifs et structurés afin de gérer de manière optimale une terminologie cohérente relative à leurs produits10. En effet, en analysant l’état actuel des ressources disponibles au niveau international, national et régional, nous pouvons constater la présence de nombreux outils nés de la nécessité d’harmoniser la terminologie utilisée chez les experts du secteur et de soutenir également l’activité de traduction de la documentation accompagnant le produit. Dans ce contexte, la plateforme Lexicool11 constitue un support valable afin de collecter une liste exhaustive des ressources multilingues classées par catégories, telles que la nourriture, les boissons, le textile (habillement et cuir) et le verre. En se concentrant sur les outils disponibles au niveau de la Vénétie, la région est riche en ressources qui se présentent sous forme de glossaires mono/multilingues consultables sur les sites internet des entreprises locales. Nous pouvons à ce sujet citer quelques exemples : 1) la société « Follador » propose un glossaire du vin monolingue en ligne12, 2) la société régionale des secteurs agricole, forestier et agroalimentaire met à disposition un dictionnaire téléchargeable au format PDF en italien, anglais et allemand13, 3) l’entreprise « Conceria La Veneta » fournit un fichier PDF avec une petite liste de termes en italien14, et enfin 4) pour la fabrication du verre, la région de la Vénétie met à disposition sur son portail une liste de termes techniques en italien15.
Or, en analysant ces outils, nous pouvons toutefois constater qu’ils présentent des limites au niveau de la richesse des données terminologiques fournies et pour la difficulté à réutiliser les mêmes données, souvent diffusées au format PDF, dans des logiciels de traduction assistée par ordinateur (TAO). En effet, les glossaires recueillent des informations minimales (donnant principalement pour chaque terme juste sa définition) et ces données se révèlent insuffisantes pour soutenir le processus de rédaction et/ou de traduction de textes spécialisés. Pour que les processus de décodage et de transcodage de la terminologie d’un domaine spécifique se déroulent de manière optimale, le professionnel du texte (traducteur ou rédacteur) doit pouvoir consulter un cadre exhaustif du comportement morphologique, syntaxique, sémantique et phraséologique du terme objet d’analyse16. L’initiative de l’Université de Gênes visant la mise en œuvre d’un glossaire œnologique multilingue s’inscrit dans cette perspective. Au niveau national, ce glossaire se configure comme la ressource la plus complète en termes de richesse de données et de variété linguistique pour la documentation œnologique17. L’outil se présente comme une base de données contenant des fiches terminologiques multilingues qui renseignent sur la définition, le contexte, la transcription phonétique, l’étymologie, les synonymes/antonymes du terme et de son équivalent. L’avantage évident de cette ressource, par rapport aux glossaires précédents, est la richesse des informations fournies, nécessaires au traducteur et/ou au rédacteur afin de contextualiser le terme et le désambiguïser.
Cependant, d’un point de vue structurel, nous pouvons constater que toutes les ressources mentionnées ci-dessus ne sont pas conformes aux normes internationales publiées dans le cadre de l’Organisation internationale de normalisation (International Standard Organisation – ISO) et actuellement en vigueur pour la gestion de la terminologie. Bien que parfaitement consultables en ligne, les données fournies ne peuvent pas être automatiquement réutilisées, par exemple, dans des systèmes et des applications de traduction assistée, nuisant par conséquent à l’exécution optimale du travail des professionnels du texte18. À cet égard, l’ISO TC/37 SC 319, en tant que comité technique pour la gestion de la terminologie, promeut l’adoption de la norme ISO 30042 : 201920 selon laquelle toutes les données terminologiques devraient être organisées au format Term Base eXchange (TBX) afin d’assurer leur interopérabilité et réutilisation. De plus, l’interopérabilité et la réutilisation sont deux des lignes directrices exprimées dans la publication de Wilkinson et al. de 2016 concernant la nécessité de structurer les données de la recherche de manière « FAIR » (Findable, Accessible, Interoperable, Reusable) afin de préserver de manière optimale les résultats de la recherche scientifique21.
CommerciAl terMinology rEsOurce (CAMEO)
En partant de l’analyse de l’état actuel, nous avons formulé un projet de recherche qui envisage la conception et la mise en place d’une nouvelle ressource terminologique multilingue, structurée et standardisée afin de collecter et de documenter la terminologie technique pour les quatre domaines commerciaux identifiés. La ressource terminologique est nommée CAMEO (CommerciAl terminology resOurce) et est librement accessible en ligne22, conformément aux principes de la science ouverte promus par l’association European Open Science Cloud (EOSC23). Dans les sous-sections suivantes, nous allons décrire les langues de travail de la ressource, les utilisateurs, sa structure et les avantages qui en découlent.
Langues de travail
Le choix des langues est basé sur les données fournies par le système statistique régional de la Vénétie24. En particulier, nous nous concentrerons sur les langues des pays ayant des réseaux commerciaux denses en termes d’exportation et d’importation avec la région. Le système statistique régional prévoit à cet égard la liste des États européens qui font du commerce avec la Vénétie par ordre de productivité décroissante (mise à jour au troisième trimestre 2019) et, parmi ceux-ci, nous avons l’Espagne avec 6 277 551 924 euros, l’Allemagne avec 5 082 643 416 euros, la France avec 1 162 177 384 euros et le Royaume-Uni avec 67 165 972 euros. En ce sens, les langues de travail de la ressource terminologique CAMEO sont l’italien en tant que langue source, le français, l’anglais, l’allemand et l’espagnol en tant que langues d’arrivée.
Utilisateurs
La ressource CAMEO est conçue pour répondre aux besoins d’information des professionnels chargés de la rédaction et de la traduction de la documentation commerciale. Les produits sont généralement accompagnés d’une description de leurs propriétés et de leurs fonctions. La composition de ce type de texte fait partie du processus de rédaction de documentations, telles que manuels d’utilisation, fiches techniques, étiquetages25. Dans ce contexte, la figure du communicateur technique se voit confier la tâche d’expliquer un produit dans sa globalité. L’association italienne pour la communication technique COM&TEC est le porte-parole, au niveau national, de nombreuses initiatives visant à encourager et à soutenir la formation de cette figure professionnelle. Ses compétences linguistiques et culturelles incluent une excellente connaissance de la terminologie spécialisée et une bonne maîtrise des langues. En ce sens, non seulement la rédaction, mais aussi la traduction acquiert un rôle fondamental pour la diffusion du produit. L’étude de la terminologie commerciale et, en particulier, sa gestion à travers une ressource multilingue librement accessible est donc une nécessité essentielle dans toute la phase de fabrication et d’internationalisation du produit.
Structure de la ressource
La structure de la ressource CAMEO s’inscrit dans une initiative plus large qui envisage la formulation du paradigme de la « terminologie FAIR »26 pour l’organisation optimale des données et des métadonnées terminologiques. En particulier, ce paradigme – déjà expérimenté dans des études antérieures pour la conception d’une ressource multilingue dans le domaine médical27 et du droit international28 – vise à rendre disponibles des données terminologiques trouvables, accessibles, interopérables et réutilisables conformément aux principes FAIR précités29. Le paradigme se matérialise par l’adoption de :
- la norme ISO 16642 de 201730 qui définit le métamodèle structurel abstrait Terminological Markup Framework (TMF) pour la représentation de ressources terminologiques afin de favoriser leur interopérabilité ;
- la norme ISO 12620 de 201931 qui définit les propriétés des catégories de données et leur documentation dans un répertoire ouvert qui garantit leur trouvabilité et leur accessibilité ;
- la norme ISO 30042 de 2019 – précédemment mentionnée – qui définit le format de représentation TermBase eXchange (TBX) spécifiquement conçu pour l’échange et, par conséquent, la réutilisation des données terminologiques.
L’adoption complémentaire de ces trois normes constitue la réalisation du paradigme de la « terminologie FAIR » adopté pour le développement de la ressource CAMEO.
Dans ce cadre et pour répondre aux besoins d’information des deux catégories d’utilisateurs identifiés, la base de données terminologique CAMEO est constituée d’un ensemble de fiches terminologiques multilingues, destinées à être le principal outil de regroupement de toutes les propriétés d’un terme et du concept qu’il désigne. Chaque fiche représente un seul concept qui peut être exprimé dans n langues et, pour chaque langue, il y a m termes (synonymes entre eux) qui désignent le concept lui-même. Chaque terme et ses équivalents sont alors accompagnés d’un grand nombre d’informations morphologiques, syntaxiques, sémantiques et phraséologiques32. La figure 1 montre une capture d’écran de l’environnement de travail de la ressource CAMEO.
[Figure 1 – Environnement de travail dans CAMEO - section caractéristiques formelles]
L’affichage de la fiche est bilingue afin que l’utilisateur puisse disposer des mêmes catégories de données disponibles pour le terme dans la langue source et son équivalent dans la langue cible. En particulier, la fiche est divisée en quatre sections principales, chacune contenant des propriétés différentes du terme :
1. Caractéristiques formelles : partie du discours, genre, nombre, prononciation, étymologie et formes dérivées.
2. Sémantique : définition, analyse sémique, synonymes, quasi-synonymes, hyperonymes, hyponymes.
3. Variation terminologique : nom scientifique, nom populaire, variante orthographique, acronyme, forme étendue et abréviation.
4. Usage : domaine, sous-domaine, contexte spécialisé, registre et collocations.
Par ailleurs, pour assurer la traçabilité des données fournies, toutes les références aux sources consultées et les informations sur l’auteur et la date de création/modification de la fiche en question sont précisées. De plus, la structure de la fiche terminologique permettra l’inclusion d’autres langues à l’avenir en fonction des besoins des utilisateurs de la ressource linguistique. Les fiches terminologiques de CAMEO peuvent donc être consultées et téléchargées au format TBX directement à partir de la ressource disponible en ligne. Cela permet à la fois aux rédacteurs et aux traducteurs d’importer la terminologie d’un secteur commercial donné dans différents systèmes de rédaction technique et de traduction assistée par ordinateur.
Avantages de la ressource
La conception et la mise en œuvre de la base de données terminologique multilingue CAMEO pour la rédaction et la traduction de documents techniques présentent de nombreux avantages selon de différents points de vue. En particulier, à travers la mise à disposition de cette ressource, nous poursuivons les objectifs suivants :
- Réduction du délai de commercialisation : la base de données permet de réduire le délai entre la conception d’un produit et sa commercialisation, en simplifiant les cycles de développement, de rédaction, de modification, de révision et de traduction. Avec cette base de données, les développeurs, rédacteurs, réviseurs et traducteurs peuvent tirer parti d’outils et de processus automatisés pour utiliser et valider la terminologie partagée.
- Cohérence : la gestion terminologique permet aux entreprises d’utiliser les termes de manière cohérente dans tous les types de communication (cahier des charges, interfaces graphiques, documentation technique). Étant donné que plusieurs auteurs contribuent à chacun de ces types de communication, cette gestion est le moyen le plus efficace de garantir que l’entreprise communique le même message et parle d’une seule voix.
- Précision : cette base de données conçue à des fins spécifiques permet une connaissance des données à un niveau très raffiné, d’en avoir une interprétation correcte et de faire un choix toujours optimal du terme, sélectionné en fonction du contexte indiqué.
- Homogénéité : disposer d’une unique base de données et d’une application conçue en fonction des besoins spécifiques des professionnels rend l’interrogation de la base de données beaucoup plus simple et efficace.
- Standardisation : avec une interface conçue avec les principaux utilisateurs de la terminologie technique, il est possible de réduire le temps nécessaire pour identifier les données à utiliser et d’évaluer leur uniformité et leur cohérence avec les plus récentes normes de datation.
La combinaison de ces garanties de qualité, de délai et de méthode produit un retour sur investissement sûr et cohérent. En particulier, disposer d’une terminologie multilingue précise et prête à l’emploi garantit un gain de temps considérable pour les traducteurs et les rédacteurs. Un document rédigé ou traduit à l’aide d’une base de données évite également les erreurs terminologiques, parfois porteuses de contestations, de dommages-intérêts et de demandes d’indemnisation.
Démarche terminologique de CAMEO
Les phases de collecte, de description et d’intégration de la terminologie au sein de la base de données CAMEO font l’objet d’une démarche procédurale précise afin d’assurer la qualité des données mises à disposition. Dans cette section, nous présentons d’abord l’approche théorique adoptée et, par la suite, nous décrivons le corpus objet d’analyse et la méthodologie de compilation et de saisie des données sur la ressource. La section suivante sera plutôt consacrée à l’illustration de quelques exemples de fiche terminologique.
Méthode
Afin de respecter les objectifs fixés avec la mise en œuvre de CAMEO, nous menons une analyse terminologique qui définit les phases du travail de recherche terminographique. En particulier, nous nous concentrerons sur les phases de travail suivantes :
Phase 1 : Compilation du corpus
La constitution d’un corpus consiste en la sélection et l’organisation de textes spécialisés, représentatifs du domaine analysé, qui serviront de base à toutes les recherches.
Phase 2 : Extraction terminologique
La deuxième phase implique l’identification et l’extraction des termes représentatifs du domaine et est réalisée à partir des textes collectés dans la première phase. En fonction de la taille du corpus, cette procédure peut être effectuée manuellement ou (semi-) automatiquement à l’aide d’un logiciel d’extraction automatique de la terminologie.
Phase 3 : Compilation des fiches terminologiques
Cette phase consiste en la collecte d’informations utiles à la description des termes extraits. Après une analyse ponctuelle et une synthèse précise des données les plus significatives, nous procédons à la compilation du modèle de fiche précédemment décrit, qui constitue l’outil-clé de regroupement des informations terminologiques pertinentes.
Phase 4 : Validation et intégration des données
Une fois les fiches multilingues remplies, la quatrième phase porte sur la validation du contenu des informations fournies et sur leur insertion dans la base de données CAMEO.
Mise en forme du corpus et extraction terminologique
Pour l’accomplissement de la première phase de la recherche terminographique, nous fondons les critères de sélection de notre corpus sur les résultats obtenus à partir de l’enquête statistique présentée dans la partie introductive sur les filières locales les plus productives. La documentation constituant notre corpus est donc représentative des domaines de l’agroalimentaire, du textile, du cuir et du verre. Comme déjà analysé dans Vezzani et Di Nunzio33, le corpus sélectionné pour le secteur agroalimentaire comprend la documentation relative aux principaux produits alimentaires et aux boissons d’exportation de la Vénétie. En particulier :
- Production de fromages locaux : la région possède une grande tradition laitière dont huit fromages AOP (Asiago, Casatella Trevigiana, Grana Padano, Montasio, Monte Veronese, Provolone Valpadana, Taleggio, Piave34).
- Production de vins de terroir : en effet, la Vénétie compte 28 vins à dénomination d’origine contrôlée (DOC) et 14 vins à dénomination d’origine contrôlée et garantie (DOCG35), tels que Soave, Valpolicella, Bardolino, Recioto, Prosecco.
Le corpus d’analyse pour la terminologie textile comprend des textes relatifs à la préparation, la filature, le tissage et l’ennoblissement des fibres textiles, des fils et des tissus, tels que la soie, le coton et la laine. Nous nous concentrerons notamment sur la documentation produite au sein de Venice Textile Manufacturers en tant que réseau d’entreprises vénitiennes soutenant l’excellence du secteur textile local36.
En ce qui concerne la terminologie du cuir, le corpus comprend la documentation relative à la préparation et au tannage du cuir, à la fabrication d’articles de voyage, sacs, maroquinerie et sellerie, à la préparation et à la teinture de fourrures, ainsi qu’à la fabrication de chaussures. Selon les données fournies par l’Unione Nazionale Industria Conciaria (UNIC37), la Vénétie est en fait l’un des plus grands districts de tannerie au monde, et le plus important d’Italie en termes de production et de nombre d’employés. Enfin, pour la terminologie du verre, le corpus s’appuie sur la documentation relative à la fabrication du verre sous toutes ses formes (plat, creux) et des produits verriers, obtenus par tout procédé. Nous nous concentrerons sur la production du verre artistique de Murano et du verre vénitien qui représentent une excellence locale capable de valoir, à elle seule, environ un quart de toute la production de verre artistique italien, avec une concentration que l’on ne trouve dans aucun autre secteur productif38.
Une fois collectée la documentation nécessaire pour les quatre langues de spécialité, nous procédons à la deuxième phase d’identification et d’extraction des termes véhiculant les informations sémantiquement pertinentes pour les domaines en question. Pour son développement, nous utilisons des systèmes d’extraction automatique de la terminologie. En particulier, nous nous référons aux logiciels Sketch Engine39 et TermoStat40 qui, parmi leurs différentes fonctionnalités, permettent de filtrer automatiquement une liste de « candidats termes » pour les domaines analysés. En effet, à travers une analyse contrastive entre deux corpus – le corpus spécialisé étudié et un corpus général plus large – les deux logiciels permettent sur la base de calculs statistiques de peser les désignations potentiellement pertinentes pour les domaines en question et de trier une liste de « candidats termes » qui feront ensuite l’objet d’une révision manuelle pour validation par l’expert terminologue.
Compilation des fiches sur FAIRterm et intégration dans CAMEO
Les étapes suivantes consistent en la collecte et l’analyse des données pour chaque terme extrait, afin d’encoder les informations obtenues au sein des fiches terminologiques constituant la base de données. L’outil spécifiquement conçu dans le cadre de ce projet pour la compilation de fiches multilingues s’appelle FAIRterm et est librement accessible en ligne41. FAIRterm est configuré comme une application Web afin d’assister le processus de décodage et de transcodage de la terminologie pour un domaine donné42. L’application prend en charge les 24 langues officielles de l’Union européenne, ainsi que le turc et le russe, et est actuellement utilisée comme ressource de référence dans de nombreux projets européens43 dans le cadre du macro-projet « Terminologie sans frontières44 » promu par l’Unité de Coordination de Terminologie (TermCoord45) du Parlement européen. Les fiches des termes pertinents pour les quatre domaines commerciaux sont donc compilées, vérifiées et validées sur l’application FAIRterm. Une fois les contenus validés46, les fiches sont transférées vers la ressource CAMEO47 et mises à la disposition des utilisateurs pour la libre consultation. FAIRterm et CAMEO sont donc complémentaires : la première permet la collecte et la gestion des données terminologiques, la seconde leur consultation à grande échelle. La figure 2 illustre l’environnement de travail de l’application FAIRterm conforme à la structure de la ressource CAMEO pour favoriser l’interopérabilité et le transfert de données.
[Figure 2- Environnement de travail dans FAIRterm (section variation)]
Les données terminologiques de CAMEO
Le projet qui a conduit au développement et à la mise en œuvre de la ressource CAMEO a débuté en janvier 2021. À l’heure actuelle, on dispose d’un nombre considérable de données pour les différents domaines commerciaux analysés. En particulier, le tableau 1 montre le nombre de fiches terminologiques, divisées en domaine et langue de travail et contenues dans la ressource au moment de la rédaction de cet article48.
[Tableau 1- Données terminologiques de CAMEO]
Langue de travail | Domaine | Nombre de fiches |
Italien | Agroalimentaire | 1 770 |
Italien | Cuir | 254 |
Italien | Verre | 254 |
Français | Agroalimentaire | 1 770 |
Français | Cuir | 254 |
Français | Verre | 254 |
Espagnol | Cuir | 250 |
Espagnol | Verre | 251 |
Anglais | Cuir | 251 |
Anglais | Verre | 251 |
Comme le montrent ces données, la langue italienne excelle en quantité de données étant la langue source de tout projet terminologique réalisé pour l’intégration de données dans CAMEO. En effet, l’enrichissement de la base de données multilingue est rendu possible grâce à la collaboration des étudiants du master en Langues modernes pour la communication et la coopération internationale de l’Université de Padoue. Ces étudiants sont spécifiquement formés en terminologie, linguistique de corpus, traduction spécialisée et rédaction technique. Ils conduisent des sous-projets terminologiques pour les quatre domaines d’études et, une fois validé, le résultat de leur travail est intégré dans la ressource CAMEO. Les sections suivantes proposent une brève description de ces sous-projets, concernant la terminologie agroalimentaire, du cuir et du verre, qui ont impliqué la compilation de fiches multilingues à des fins de traduction : le résultat de l’analyse terminologique s’est en effet toujours matérialisé dans la traduction spécialisée de la documentation technique relative aux principaux produits commerciaux de la Vénétie49.
Terminologie agroalimentaire
C’est cette terminologie qui constitue actuellement la plus grande collection de la base de données CAMEO (tableau 1). Pour sa collecte et sa documentation, deux projets ont été menés ayant l’italien et le français comme langues de travail. Le premier projet consiste en l’expérimentation de l’ergonomie de la ressource FAIRterm pour la compilation des fiches en termes de pratique pédagogique et de professionnalisation en traduction spécialisée50. Les étudiants, en tant qu’apprenants traducteurs, ont été invités à adopter une méthodologie de travail systématique afin d’accomplir de manière satisfaisante le projet requis pour l’évaluation finale consistant en une traduction active, de l’italien vers le français, de documentation technique pour le domaine de l’œnologie. Les portions de texte à traduire ont été extraites d’un manuel51 qui offre des notions techniques de viticulture, de vinification, de dégustation, d’œnogastronomie et de législation52. Le deuxième projet a été mené plutôt individuellement par une étudiante de master qui s’est concentrée sur la terminologie sectorielle de deux produits viticoles de majeure exportation : les vins de Valpolicella et le Prosecco53. En mettant également l’accent sur les aspects de localisation des sites Web, la participante s’est concentrée sur l’analyse de la terminologie du vin afin de proposer une traduction française de deux sites web locaux : « Consorzio per la tutela dei vini Valpolicella54 » et « Consorzio di tutela della Denominazione di Origine Controllata Prosecco55 ». L’analyse des termes à travers la compilation des fiches terminologiques a permis de détecter, entre autres, les sources de difficulté suivantes dans le processus de traduction :
- Ambiguïté ou absence de définition attestée du concept ;
- Variation terminologique dans la langue source ;
- Différence sémantique du terme italien et de son équivalent français.
En ce qui concerne la première catégorie, un exemple est représenté par le concept désigné par les deux équivalents complessità olfattiva et « complexité olfactive ». Bien que les deux termes soient quand même employés très souvent dans les sites e-commerce de vente de vin et dans les sites des entreprises vitivinicoles et de caviste, une explication claire du concept désigné et déjà attestée dans des sources fiables n’a pas été identifiée. Il s’est donc avéré nécessaire de formuler une nouvelle définition en langue naturelle (Figure 3) après un processus d’acquisition de connaissances spécialisées. La « définition par intension » a été formulée selon les instructions fournies dans la norme ISO 704 : 202256. Comme indiqué dans la norme, le rôle de ce type de définition est de fournir le minimum d’informations qui constituent la base de la conceptualisation et qui permettent de reconnaître un concept et de le différencier des autres concepts liés57.
[Figure 3- Fiche terminologique complessità olfattiva/ « complexité olfactive »]
La deuxième catégorie est celle dont nous avons repéré la plupart des cas terminologiques. En effet, dans quelques cas, nous avions choisi un terme à analyser dans un premier temps, mais en vérifiant le contexte d’usage dans plusieurs ressources, nous avons remarqué que souvent pour des raisons de fréquence d’usage, le terme source approprié en réalité était un autre ou se présentait sous une forme morphologique différente. C’est le cas par exemple du terme recipiente pressurizzato qui, bien que présent dans notre corpus, reste peu attesté dans les documents spécialisés. Ainsi, en effectuant des recherches plus approfondies, nous avons constaté qu’en œnologie le terme préféré par les experts est plutôt recipiente in pressione. Par conséquent, nous avons décidé de retenir recipiente in pressione comme le terme source et recipiente pressurizzato comme son synonyme. Un cas identique est constitué par pressa a polmone : nous avons décidé d’analyser au final pressa pneumatica comme terme source vu qu’il est plus fréquemment utilisé, et de considérer pressa a polmone comme son synonyme. Un dernier cas à mentionner dans cette catégorie est celui relatif aux termes terreno argilloso, terreno calcareo, terreno ciottoloso, « sol argileux-calcaire », « sol argileux-graveleux », « sol siliceux », « sol marneux », « sol volcanique-basaltique », « sol schisteux » et « sol sableux ». Ces termes ont posé des difficultés, car il fallait décider si les traiter comme des collocations (et donc analyser seulement terreno et « sol ») ou comme des termes à analyser à part entière. Après de nombreuses recherches, nous avons compris que ces termes en réalité ne sont pas de simples collocations, étant donné qu’il s’agit de différentes typologies de sols, chacun avec des caractéristiques morphologiques bien distinctes qui confèrent au vin une minéralité et des arômes très variés. Pour cette raison, nous avons décidé de considérer tous ces termes comme des termes à part entière, sauf « sol argileux-calcaire » et « sol argileux-graveleux » que nous avons traités comme des hyponymes de « sol argileux », et « sol volcanique-basaltique » considéré comme un hyponyme de « sol volcanique ».
Enfin, deux exemples que nous pouvons placer dans la troisième catégorie mentionnée ci-dessus sont millesimato et Riserva, pour lesquels nous avons remarqué une différence sémantique entre la langue source et la langue cible. En effet, millesimato est fréquemment utilisé en italien pour les champagnes, les vins mousseux et le prosecco, tandis qu’en français nous attestons un usage de ce terme seulement pour une minorité de ces typologies de vins comme l’explique aussi très clairement le Guide Hachette des Vins58. Quant à Riserva, il s’agit d’une mention considérée de haut prestige en Italie, tandis qu’en France ce terme ne qualifie pas automatiquement un vin de qualité, n’existant pas à présent un encadrement légal de cette mention dans le pays. De ces exemples, nous pouvons constater l’existence de différences entre les classifications des mentions entre Italie et France qui doivent être prises en considération lors du processus de traduction de la documentation spécialisée.
Terminologie du cuir et du verre
L’enrichissement de cette terminologie dans CAMEO a été réalisé, dans un premier temps, par deux étudiantes de master du cursus susmentionné. Elles ont travaillé dans une perspective trilingue dans deux projets ayant l’italien comme langue source et l’anglais et l’espagnol comme langues d’arrivée. Ces projets ont été consacrés à une étude contrastive de la variation terminologique multilingue pour les secteurs du cuir59 et du verre60. Dans les deux cas, l’objet d’étude est représenté par un corpus multimodal constitué, d’une part, d’une collection des documents écrits pour la fabrication des deux produits et, d’autre part, d’une collection des transcriptions de vidéos orales récupérées sur le web sur le même sujet. La compilation des fiches a permis de détecter dans les deux cas différents types de variations terminologiques (diastratiques, diaphasiques et diamésiques) qui se produisent dans les langues de spécialité objet d’analyse. Pour ces mêmes projets, la démarche de travail adoptée a conduit à la traduction trilingue de la documentation pour soutenir l’internationalisation de ces produits locaux : en particulier, 1) le « Piano Operativo 2020-2023 » du Distretto del Vetro Artistico di Murano e del Vetro Veneziano, et 2) le « Bilancio Ambientale d’Impresa e Audit Ambientali in Conceria » publié par l’Agence régionale pour la prévention et la protection de l’environnement de la Vénétie (ARPAV).
Parallèlement à ces projets individuels, une deuxième expérimentation a été menée avec les étudiants de master du même cursus pour les langues français/italien. Le projet reproduit la même méthodologie collective proposée pour l’analyse de la terminologie agroalimentaire décrite ci-dessus. Nous avons demandé à un groupe de 30 étudiants d’analyser la terminologie du cuir et du verre à l’aide de l’application web FAIRterm dans le but de traduire deux documents spécialisés (disponibles en ligne) dans les deux domaines en question : le premier étant une enquête technique sur l’impact environnemental de l’industrie du tannage61, le second un rapport de la province autonome de Trente sur les caractéristiques, les types et les technologies de production de verre62.
Compte tenu de la technicité du premier document, la terminologie analysée en langue source se réfère en particulier aux opérations de transformation et de production du cuir telles que rifinizione, lissatura, palmellatura, placcatura et smerigliatura. En ce qui concerne le terme rifinizione, par exemple, l’analyse s’est principalement portée sur l’identification de l’équivalent exact en langue cible. En effet, entre les deux options possibles pour la langue française « finition » et « finissage », il a été possible d’identifier à travers l’analyse du corpus une variation de registre linguistique – le premier étant principalement utilisé dans la documentation de vulgarisation et le second dans les textes spécialisés – qui a conduit au choix de « finissage » comme équivalent technique désignant le concept en question (Figure 4).
[Figure 4- Fiche terminologique rifinizione/ « finissage »]
En outre, nous avons constaté qu’un phénomène linguistique particulièrement récurrent dans l’analyse de cette terminologie est la polysémie. Les équivalents conceria et « tannerie » en sont un exemple. Selon le dictionnaire Treccani63, le terme italien conceria désigne : la technique de tannage du cuir, et l’établissement où s’effectue le tannage des peaux. Parallèlement, selon les informations fournies sur le CNRTL64, le terme « tannerie » désigne tant 1) l’établissement où l’on traite les peaux que 2) l’opération de tannage. Toutefois, d’après la même source, le terme couvre un champ sémantique plus large en tant qu’il désigne également 3) l’industrie du tannage, correspondant plutôt en italien à industria conciaria.
L’analyse de la terminologie du verre a permis de son côté de recueillir des termes désignant des objets en verre artistique, des techniques de fabrication de produits, des matériaux et des outils utilisés dans ce secteur, et des propriétés du matériau verre. Ces termes présentent des degrés de technicité différents : on passe de termes plus techniques tels que cera persa, zanfirico, vetro pulegoso, ou lattimo, à des termes communs également dans la langue générale, voire vetrata, decorare, perla, portagioie, ou abat-jour. Comme pour la terminologie du cuir, le phénomène linguistique de la polysémie est récurrent également dans cette langue de spécialité. Dans le domaine du verre, le terme ‘canna’, par exemple, désigne 1) une technique de fabrication du verre artistique, 2) un des outils employés dans cette technique, aussi bien que 3) l’objet semi-fini et celui fini fabriqués à partir de la technique homonyme. Il faut préciser que l’outil utilisé dans cette technique est également appelé canna da soffio et canna metallica, et l’objet fini est souvent désigné par les termes canna di vetro et canna vitrea.
Du point de vue de l’organisation des données, le fait qu’une désignation linguistique puisse pointer vers des concepts différents a impliqué la création de trois entrées terminologiques distinctes, chacune recueillant les informations linguistiques pertinentes pour l’objet en question.
[Figure 5- Fiche terminologique canna/ « canne »]
La figure 5 illustre à cet égard l’exemple de la fiche désignant le concept lié à l’objet semi-fini/fini. En ce sens, cette structuration de la ressource permet d’accompagner de manière efficace le processus de traduction à l’aide d’une désambiguïsation claire du référent objet d’analyse.
Conclusion
Cette étude a été consacrée à la description d’un projet récemment entrepris à l’Université de Padoue dans le but de documenter la terminologie des principaux secteurs d’exportation de la Vénétie (agroalimentaire, textile, cuir et verre). Nous avons présenté les raisons qui ont conduit à la conception et à la mise en œuvre de la nouvelle base de données terminologique multilingue CAMEO. CAMEO vise à se distinguer des autres ressources existantes dans le panorama actuel en termes 1) de richesse d’informations fournies par un nouveau modèle de fiche terminologique conçu ad hoc et 2) de standardisation structurelle conformément aux normes ISO afin de favoriser l’interopérabilité et la réutilisation des données terminologiques. Nous avons décrit la méthodologie adoptée pour la collecte et la documentation de la terminologie qui repose sur une enquête basée sur corpus spécialisés, l’extraction de termes pertinents, la compilation de fiches terminologiques sur l’application FAIRterm et leur intégration dans CAMEO. Enfin, nous avons décrit les projets pédagogiques menés par les étudiants qui ont permis d’enrichir la base de données. À l’heure actuelle, la ressource recueille un nombre considérable de données terminologiques disponibles en ligne pour consultation. Notre objectif à long terme est de maintenir CAMEO en tant qu’une ressource vivante, en menant des projets notamment dans le but de former de futurs professionnels du texte à la rédaction technique et à la traduction spécialisée. Enfin, en plus d’alimenter cette base de données, nous souhaitons l’intégration d’autres sous-domaines commerciaux et, selon les ressources, élargir le nombre des langues de travail, afin de mettre à disposition de la communauté une ressource davantage plurilingue pour l’internationalisation des produits locaux.
Notes
1Alain Rey, Essays on Terminology, Amsterdam/Philadelphie, John Benjamins Publishing, 1995.
2Entre autres : Maria Teresa Cabré, Terminology : Theory, methods, and applications, Amsterdam/Philadelphie, John Benjamins Publishing, 1999 ; Rita Temmerman, Towards new ways of terminology description : The sociocognitive-approach, Amsterdam/Philadelphie, John Benjamins Publishing, 2001 ; Marella Magris, Maria Teresa Musacchio, Lorenza Rega et Federica Scarpa (dir.), Manuale di Terminologia : Aspetti teorici, metodologici e applicativi, Milan, Hoepli, 2002.
3Alain Rey, op. cit., p. 129.
4Rute Costa, « Terminology and Specialised Lexicography : two complementary domains », Lexicographica, n° 29, 2013, p. 29-42.
5Michele Cortelazzo, Lingue speciali : la dimensione verticale, Padoue, Unipress, 1990.
6Didier Bourigault, Marie-Claude L’Homme et Christian Jacquemin (dir.), Recent advances in computational terminology, Amsterdam/Philadelphie, John Benjamins Publishing, 2001 ; Sue Ellen Wright, Gerhard Budin (dir.), Handbook of terminology management : application-oriented terminology management, Amsterdam/Philadelphie, John Benjamins Publishing, 2001 ; Hendrik Kockaert, Frieda Steurs (dir.), Handbook of terminology, Amsterdam/Philadelphie, John Benjamins Publishing, 2015.
7https://www.ilsole24ore.com/art/al-veneto-primato-esportazioni-AEzpHsdE
8http://statistica.regione.veneto.it/jsp/commercionuovo.jsp?D1=2019+III%B0&D8=_totven&D7=999-MONDO&D0=1&B1=Visualizza
9Entre autres : Cesare Moretti (dir.), Glossario del vetro veneziano : dal Trecento al Novecento, Venise, Marsilio, 2002 ; Elena Cardillo, Antonietta Folino, Maria T. Guaglianone, Francesca Iozzi et Maria Taverniti, « Terminologia specialistica per l’artigianato orafo e tessile calabrese », in Maria Teresa Zanola, Maria Francesca Bonadonna, Terminologie specialistiche e prodotti terminologici, Milan, EDUCatt, 2011, p. 31-45 ; Florence Ludi, « Le vin et sa terminologie », Traduire, n° 231, 2014, p. 52-59, consultable sur : http://journals.openedition.org/traduire/661; Francesca Chessa, Cosimo De Giovanni et Maria Teresa Zanola, La terminologia dell’agroalimentare, Milan, FrancoAngeli, 2015 ; Laurent Gautier, Eva Lavric (dir.), Unité et diversité dans le discours sur le vin en Europe, Berne, Peter Lang, 2015.
10Kara Warburton, « Managing terminology in commercial environments », in Hendrik Kockaert, Frieda Steurs (dir.), Handbook of terminology, Amsterdam/Philadelphie, John Benjamins Publishing, vol. 1, 2015, p. 359-391.
11https://www.lexicool.com/dizionari-online-per-categoria.asp
12https://folladorprosecco.it/glossario-del-vino
13https://www.venetoagricoltura.org/upload/pubblicazioni/glossario%20interreg/Glossario%20Italiano.pdf
14http://www.concerialaveneta.com/IMG/pdf/Glossario-industria-conciaria.pdf
15https://www.regione.veneto.it/web/cultura/dettaglio-news?articleId=150080
16Federica Scarpa, La traduzione specializzata : lingue speciali e mediazione linguistica, Milan, Hoepli Editore, 2001.
17Giuseppina Piccardo, « CeRTeM - Centro di Ricerca in Terminologia Multilingue dell’Università di Genova », Publifarum, n° 12, 2020. Consultable sur : http://www.farum.it/publifarum/ezine_articles.php?art_id=169
18Maurizio Naldi, Traduzione automatica e traduzione assistita, Bologne, Società Editrice Esculapio, 2014.
19https://www.iso.org/committee/48136/x/catalogue/
20ISO 30042. 2019. Management of terminology resources— Term-Base eXchange (TBX). Genève : International Organization for Standardization.
21Mark D. Wilkinson et al., « The FAIR guiding principles for scientific data management and stewardship », Scientific data, n° 3, 2016. Consultable sur : https://www.nature.com/articles/sdata201618.pdf.
24http://statistica.regione.veneto.it/index.jsp
25Luigi Muzii, La redazione dei documenti tecnici. Dalla progettazione alla realizzazione. Con esempi di documenti e istruzioni per l’uso degli strumenti informatici, Milan, FrancoAngeli, 1995.
26Federica Vezzani, Terminologie numérique : conception, représentation et gestion, Berne, Peter Lang International Academic Publishers, 2022.
27Federica Vezzani, Giorgio Maria Di Nunzio, « Methodology for the standardization of terminological resources. Design of TriMED database to support multi-register medical communication », Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication, n° 26 (2), 2020, p. 266–298.
28Federica Vezzani, Giorgio Maria Di Nunzio et Sara Silecchia, « La fraseologia dei trattati internazionali di disarmo : la risorsa terminologica DITTO », Umanistica Digitale, n° 14, 2022, p. 91-117.
29Mark D. Wilkinson et al., op. cit.
30ISO 16642. 2017. Computer applications in terminology – Terminological markup framework. Genève : International Organization for Standardization.
31ISO 12620. 2019. Management of terminology resources – Data category specifications. Genève : International Organization for Standardization.
32Les fiches sont initialement compilées pour la terminologie extraite en italien et, par la suite, pour les équivalents dans les langues d’arrivée préalablement identifiées.
33Federica Vezzani, Giorgio Maria Di Nunzio, « Elaborazione e gestione di (meta) dati terminologici », in Elena Chiocchetti, Natascia Ralli (dir.), Risorse e strumenti per l’elaborazione e la diffusione della terminologia, Eurac Research, 2022, p. 152-168.
34https://www.regione.veneto.it/web/agricoltura-e-foreste/disciplinari-dop-igp-stg
35https://www.regione.veneto.it/web/agricoltura-e-foreste/disciplinari-docg-doc-igt
38https://www.regione.veneto.it/web/attivita-produttive/marchio-del-vetro-artistico-di-murano
39Adam Kilgarriff, Vít Baisa, Jan Bušta, Miloš Jakubíček, Vojtěch Kovář, Jan Michelfeit, Pavel Rychlý et Vít Suchomel, « The Sketch Engine : ten years on », Lexicography, n° 1 (1), 2014, p. 7-36.
40Patrick Drouin, « Term extraction using non-technical corpora as a point of leverage. Terminology », Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication, n° 9 (1), 2003, p. 99-115.
42Federica Vezzani, « La ressource FAIRterm : entre pratique pédagogique et professionnalisation en traduction spécialisée », Synergies Italie, n°17, 2021, p. 51-64.
43https://yourterm.eu/toolbox/
46Actuellement, le processus de validation du point de vue linguistique des fiches est mené par les enseignants chargés des cours dans lesquels se déroulent les projets terminologiques. En outre, comme perspective à long terme et en fonction des ressources disponibles, nous envisageons d’intégrer une deuxième phase de validation des contenus à travers la consultation d’experts des différents secteurs concernés.
48Les travaux relatifs à l’étude de la terminologie textile sont actuellement encore au stade préliminaire, c’est pourquoi ceux-ci ne sont pas inclus dans le décompte indiqué dans le tableau 1.
49Le scénario traductif présenté dans les sections suivantes implique donc un processus de traduction d’une langue source L1 vers une langue cible L2, où la L1 représente la langue maternelle (dans ce cas l’italien) et la L2, la langue de travail étrangère de l’apprenant-traducteur (français, espagnol ou anglais). Le choix de ce cadre de travail est dû à la pratique de plus en plus courante de la traduction vers la L2 dans le monde de la traduction spécialisée, voir à ce propos : David Mracek, « The Role(s) of Native Speakers in L2 Translation », Studie z aplikované lingvistiky, n°10 (1), 2019, p. 7-25 ; Francisco J. Vigier-Moreno, « Corpus-assisted translation of specialised texts into the L2. From the classroom to professional practice », Trans-kom, n°12 (1), 2019, p. 90-106.
50« La ressource FAIRterm », art. cit., p. 51-64.
51Simone De Nicola, Antonio Garofolin, Bruno Pilzer, Giuseppe Vaccarini et Marco Larentis, Il manuale del sommelier : principi di viticoltura ed enologia, degustazione, abbinamenti, legislazione, altre bevande, Milan, hoepli editore, 2014.
52Pour une description des cas terminologiques qualitatifs analysés dans ce projet, voir : « La ressource FAIRterm », art. cit., p. 60-61.
53Federica Papi, In vino traduco : terminologie du vin et localisation de sites web, Mémoire de master, Université de Padoue, 2021.
54https://www.consorziovalpolicella.it
56ISO 704. 2022. Terminology work — Principles and methods. Genève : International Organization for Standardization.
57ISO 704. 2022, op. cit., p. 33.
58https://www.hachette-vins.com
59Ilaria Natali, Leather Terminology: Design and Implementation of a Multilingual Termbase as a Tool for Specialized Translation, Mémoire de master, Université de Padoue, 2021.
60Sara Boschini, Theoretical and Practical Analysis of Venetian Glass Terminology: A Study of an Italian-English-Spanish Termbase for Specialised Translation, Mémoire de master, Université de Padoue, 2021.
61https://www.arrr.it/documents/965920/1021815/3+Concia.pdf/8024a9a6-352e-400f-9ad7-dd643d1b2761
62https://www.calameo.com/read/000195356e96f4303d185
Pour citer ce document
Quelques mots à propos de : Federica Vezzani
Federica Vezzani est chercheuse en CDD au Département d’Études Linguistiques et Littéraires de l’Université de Padoue. Ses principaux intérêts de recherche sont la terminologie, la terminographie et la traduction spécialisée. Elle se concentre particulièrement sur la gestion de la terminologie multilingue selon les normes ISO, et elle a développé le paradigme de la terminologie FAIR pour l’organisation optimale de données terminologiques trouvables, accessibles, interopérables et réutilisables. Elle est auteure du livre Terminologie numérique : conception, représentation et gestion publié par Peter Lang en 2022.