Partagez vos passions
Rejoignez la communauté

  • cma


    • a posté un article :

      Les nuages de mots
      Pour pouvoir créer des nuages de mots (et pour nos futures analyses avec itrameur) nous avons dû créer des gros fichiers contenant les textes de chaque URLs. Nous avons donc créé un gros fichier par langue ...

    • a posté un article :

      La completion de script
      Après beaucoup de travail, nous avons fini notre script. voici un flowchart de script: Ce script va créer automatiquement des tableaux au format HTML selon le nombre des langues. Comme nous avons 4 langues à traiter, i...

    • a posté un article :

      Récupération de Bigrammes japonais.
      La semaine dernière, nous avons écrit le script pour traiter des corpus japonais. Cependant, ce script n'a pas marché pour tout le monde et chaque personne a un problème différent.Heureusement, nous avons ...

    • a posté un article :

      Traitement de corpus japonais
      Le japonais n'ayant pas d'espace comme en français, l'expression régulière "\w+" ne peut pas reconnaître correctement les mots japonais. Nous devons donc utiliser une autre méthode pour segmenter nos textes...

    • a posté un article :

      Traitement de corpus chinois
      L’une des grandes différences entre la langue chinoise et la langue française est que le français a une espace entre deux mots, alors que le chinois n’en a pas. En conséquence, avant de tra...

    • a posté un article :

      Problème!
      Nous avons rencontré un problème pour récupérer des URLs "en anglais".La dernière fois, nous avions récupéré des URLs de sites internets de toutes les langues que nous avons choisi, en...

    • a posté un article :

      Récupération des URLs
         Nous avons récupérer 50 URLs de sites internet contenant le mot manifestation dans les quatre langues que nous avons choisi d'étudier. Afin de récupérer ces URLs nous avons utilisé l'al...

    • a posté un article :

      Exercice 2
         Ecrire un script (dans le dossier PROGRAMMES) permettant de générer dans le répertoire TABLEAUX un fichier html contenant 1 tableaux avec 2 lignes (sur la première, votre nom, sur la seconde, le mot ...

    • a posté un article :

      Exercice 1
         Ecrire un script (dans le dossier PROGRAMMES) permettant de générer dans le répertoire DUMP‐TEXT un fichier txt contenant 2 lignes (sur la première, votre nom, sur la seconde, le mot choisi pour vo...

    • a posté un article :

      Présentation
      Bonjour!   こんにちは!   Hello !   你好!       Ce blog a été créé dans le cadre d'un projet encadré en M1 de Traitement Automatique des Langues. Nou...

    Plus...

    Blogs de cma

    Blogs favoris

    cma n'a pas encore de blogs favoris

    Suit 0 membres

    cma ne suit pas de membre

    Suivi par 0 membres

    cma n'est suivi par aucun membre