-
cma
-
a posté un article :
Les nuages de mots
Pour pouvoir créer des nuages de mots (et pour nos futures analyses avec itrameur) nous avons dû créer des gros fichiers contenant les textes de chaque URLs. Nous avons donc créé un gros fichier par langue ...Vendredi 20 Décembre 2019 à 12:42
-
a posté un article :
La completion de script
Après beaucoup de travail, nous avons fini notre script. voici un flowchart de script: Ce script va créer automatiquement des tableaux au format HTML selon le nombre des langues. Comme nous avons 4 langues à traiter, i...Jeudi 19 Décembre 2019 à 12:24
-
a posté un article :
Récupération de Bigrammes japonais.
La semaine dernière, nous avons écrit le script pour traiter des corpus japonais. Cependant, ce script n'a pas marché pour tout le monde et chaque personne a un problème différent.Heureusement, nous avons ...Mercredi 4 Décembre 2019 à 10:20
-
a posté un article :
Traitement de corpus japonais
Le japonais n'ayant pas d'espace comme en français, l'expression régulière "\w+" ne peut pas reconnaître correctement les mots japonais. Nous devons donc utiliser une autre méthode pour segmenter nos textes...Lundi 18 Novembre 2019 à 17:14
-
a posté un article :
Traitement de corpus chinois
L’une des grandes différences entre la langue chinoise et la langue française est que le français a une espace entre deux mots, alors que le chinois n’en a pas. En conséquence, avant de tra...Lundi 18 Novembre 2019 à 16:53
-
a posté un article :
Problème!
Nous avons rencontré un problème pour récupérer des URLs "en anglais".La dernière fois, nous avions récupéré des URLs de sites internets de toutes les langues que nous avons choisi, en...Mardi 5 Novembre 2019 à 13:43
-
a posté un article :
Récupération des URLs
Nous avons récupérer 50 URLs de sites internet contenant le mot manifestation dans les quatre langues que nous avons choisi d'étudier. Afin de récupérer ces URLs nous avons utilisé l'al...Lundi 21 Octobre 2019 à 17:50
-
a posté un article :
Exercice 2
Ecrire un script (dans le dossier PROGRAMMES) permettant de générer dans le répertoire TABLEAUX un fichier html contenant 1 tableaux avec 2 lignes (sur la première, votre nom, sur la seconde, le mot ...Mercredi 9 Octobre 2019 à 17:42
-
a posté un article :
Exercice 1
Ecrire un script (dans le dossier PROGRAMMES) permettant de générer dans le répertoire DUMP‐TEXT un fichier txt contenant 2 lignes (sur la première, votre nom, sur la seconde, le mot choisi pour vo...Mercredi 9 Octobre 2019 à 17:41
-
a posté un article :
Présentation
Bonjour! こんにちは! Hello ! 你好! Ce blog a été créé dans le cadre d'un projet encadré en M1 de Traitement Automatique des Langues. Nou...Mercredi 9 Octobre 2019 à 15:54
Blogs de cma
Blogs favoris
cma n'a pas encore de blogs favorisSuit 0 membres
cma ne suit pas de membreSuivi par 0 membres
cma n'est suivi par aucun membre -