|
|||||||||||||||||||||||||||||||||||||||||
| Sampler est un logiciel de cartographie (automapping). Le moteur repère, en utilisant des méthodes statistiques, les expressions apparaissant dans des contextes similaires (concepts). L'ensemble des documents ayant le même concept est appelé cluster. [1] |
Une mémoire de traduction (translation memory) est un système qui agrège des connaissances concernant la traduction d'une langue vers une autre en mémorisant et en réutilisant des traductions antérieures. [/]
Une mémoire de traduction se construit sur une base de données de traductions préexistantes. Cette base est constituée de groupes de documents dans lesquels les liens au niveau de la traduction sont consignés de manière explicite. L'exploitation de cette mémoire se fait par l'alignement ou l'appariement de textes. Le logiciel calcule automatiquement les correspondances entre les segments respectifs des 2 textes.
| Le concordancier TransSearch permet d'interroger des mémoires de traduction. "L'utilisateur lance une recherche à l'aide d'une requête (par exemple, toutes les occurrences d'un mot précis dans la base de données) et les résultats lui sont présentés sous forme de listes de paires de phrases satisfaisant la requête. {*} Le traducteur connaît ainsi tous les contextes d'utilisation d'un mot particulier. |
Modélisation de l'utilisateur (User modelling ) est une expression le plus souvent utilisée dans la reconnaissance de la parole reposant sur le dialogue. La modélisation s'effectue à l'aide d'un module qui tente d'adapter le système aux diverses élocutions des utilisateurs.
Un morphème est la plus petite unité significative du langage, cad qu'en tant qu'élément sémantique, il ne peut être divisé en plus petits éléments.
L'indexation d'un corpus textuel ou biliographique s'effectue à l'aide de notice documentaire ( un masque d’indexation). L'utilisateur indique les mots pertinents par rapport au contenu du texte dans la notice de celui-ci (en général dans le champ "mots clés"). Les mots clés sont des indicateurs de contenu, cad de la connaissance véhiculée par les documents. Le fichier Index des mots clés comprend une entrée pour chaque mot clé utilisé dans les notices. A cette entrée sont associées les notices comprennant le mot clé.
| Notice document
X : ID=22 Mots clés : industrie minière, statistique, borinage |
|
| Notice document
Y : ID=56 Mots clés : grève, chomage, borinage |
|
| Fichier Index Mots clès borinage : 22, 56 grève : 56 |
L'Indexation via l'utilisation de notice documentaire sera performante si on contrôle et limite les mots clès utilisés. Dans ce but, on utilise une liste de mots clés fermée ou gérée par un thésaurus (par exemple, le thésaurus de la firme ou du domaine concerné par les documents à indexés).
Notons que cette méthode d'indexation requiert des ressources humaines et du temps.
|
notice documentaire |
Désigne, en Analyse de texte, le mot (ou la liste de mots) autour duquel est construit un extrait de texte (dit contexte). Le mot pôle sert ainsi à rechercher les passages du texte où il apparaît.[-]
[0] Lexique de Michel Cartier - Mmedium - 1999 - http://www.mmedium.com/ |
||
[1] http://infotheque.tvt.fr/sampler_fonctionnement.htm - Possibilité de visualiser une carthographie sur le site Inforthèque |
||
{*} Puce Ceveil, vol.3 - N° 9-10 - 1997 - http://www.ceveil.qc.ca |
||
[/] A world of understanding - Language technologies - CD-Rom Linglink, European Commission |
||
[-] Glossaire ATO - Service d´Analyse de Textes par Ordinateur de l´Uniniversité du Québec (UQAM) |
||
|
||
Dernière modification:
Ce site est optimisé pour Netscape 6.0 ou pour Internet
Explorer 4.0 ou ultérieur;
Et pour une résolution de 600/800 (Modifiez-la SI nécessaire).
Tous droits réservés © OTIL, 1999, 2002