mardi 6 décembre 2016

Contraintes de windows, journal de bord

Étant utilisateur Windows il y a plusieurs points intéressants à aborder sur l'avancement de notre script et sa mise en place dans le cadre de notre projet.
Nos manipulations doivent donc se faire sous cygwin, et si la fonction egrep est bien fourni de base, ce n'était pas le cas de la fonction lynx, qui nous permet de naviguer parmi nos URLs sur le web. Il est important de savoir qu'il est nécessaire de relancer le setup.exe installant cygwin afin de profiter d'autres packages, cygwin reconnait automatiquement alors les packages déjà présent et de nouveau peuvent être rajoutés. L'installation est donc moins intuitive que sous linux où la simple mention de la fonction offre un tutoriel d'installation.


L'objectif était actuellement de mettre en place un tableau sous format .html avec une extraction du contenu de nos URL et l'encodage de ce contenu, que nous voudrions convertir en utf-8.
Cependant, il y a plusieurs contraintes à travailler sous windows, notamment celui-ci en particulier:


Assez commun lorsque l'on travaille sous windows, des caractères parasites apparaissent en fin de ligne et empêche le bon déroulement du programme. Il est sensible de les supprimer, les éditeurs de texte ne font pas part de ces caractères et il ne suffit donc pas de simplement taper une expression régulière sur notepad++ pour s'en débarrasser. Heureusement, le problème est connu et il existe une fonction en solution, la commande dos2unix.


Si le fichier ne reconnait pas le fichier de configuration suite à une étourderie de ma part, on peut voir que cependant, le script s'exécute désormais.

Aucun commentaire:

Enregistrer un commentaire