#!/usr/bin/perl # Obtenir la liste des mots # en supposant que tout le dico est contenu dans un seul fichier 'dico.html' # s'utilise comme ca : cat dico.html | ce_script.pl | sort | uniq >
liste_mots.txt while ( $ligne = <>) { $ligne =~ tr /A-Z/a-z/ ; # tout le monde en minuscule # html c'est pas toujours cool $ligne =~ s/é/é/g ; $ligne =~ s/è/è/g ; $ligne =~ s/ê/ê/g ; $ligne =~
s/à/à/g ; $ligne =~ s/â/â/g ; $ligne =~ s/î/î/g ; $ligne =~ s/ï/ï/g; $ligne =~ s/ô/ô/g ; $ligne =~ s/û/û/g ; $ligne =~ s/ù/ù/g; $ligne =~ s/ç/ç/g; if ( $ligne =~ 'font
size=\"\+1\"\>([a-z|é|è|ê|à|â|î|ï|ô|û|ù|ç|\-| ]+)' ) { # nouveau mot $mot = $1 ; print "$mot\n" ; } }
