Web site

Site Web.

Besoin

Mettre à disposition pour consultation un ensemble de pages Web.

Analyse

Un site Web a une adresse qui l'identifie de manière unique sur Internet. Les documents qui le constituent sont stockés chez un hébergeur.

Le webmestre (webmaster) publie les mises à jour (nouvelles pages, modifications, etc.) chez l'hébergeur.

Conception

L'adresse d'un site Web est représentée par une URL.

La publication chez l'hébergeur se fait généralement via FTP, WebDAV ou une interface utilisateur Web.

Notes

Même s'il n'est pas obligatoire, un nom de domaine propre à votre site est plus qu'appréciable. L'objectif est de lui donner un nom :

  • clair : éviter les noms dont la prononciation (en français ou avec d'autres accents) pourraient être équivoques.
  • simple à mémoriser
  • court à retaper
  • cohérent avec son domaine d'activité, autant de par son nom que par son TLD (.com pour commercial, .org pour le non lucratif, .net pour le réseau, .fr pour la france uniquement, etc.).

Evitez également les URL valides, mais inhabituels (ne commençant pas par www, ne finissant pas directement par .com .org ou .fr).

L'achat d'un nom de domaine est abordable aujourd'hui (on peut en trouver pour une dizaine d'euros/an). Si votre hébergeur ne supporte pas l'hébergement de noms de domaine, changez-en ou à défaut utilisez un service de redirection de votre nom vers l'URL de votre hébergement (les registrars en offrent souvent un).

Les informations contenues dans vos pages doivent être exploitables. C'est-à-dire :

  • visibles : atteignables par des moteurs de recherche et donc HTML, texte. Le flash n'est aujourd'hui pas analysé par ces moteurs.
  • extractibles
  • RDF

Etre lu

Structure

Lorsqu'une de vos pages sera élue dans un résultat de recherche sur Internet, il est important que le visiteur qui s'y rendra ne soit pas désemparé et puisse juger de l'ensemble de la qualité du site sur lequel il est arrivé. Il faut pour cela :

  • éviter les ensembles de cadres (frameset) dont votre page pourrait constituer qu'une partie peu exploitable sans les autres cadres. Les cadres ne facilitent pas non plus la pose de signets (bookmarks), alors posés sur l'ensemble invariable des cadres que sur le cadre particulier visité.
  • toujours fournir au moins un lien vers la page d'accueil (home) de votre site.
  • toujours fournir un moyen de vous contacter (via la page courante ou au moins la page d'accueil) pour une raison quelconque (remarque, problème juridique, etc.).

Liens

  • Mettez autant de liens que possible. Plus un site est inter-lié, plus il est facile et agréable à utiliser, et plus il est considéré pertinent par les robots
  • Feuilles de style
  • W3C

Accents

Les caractères accentués que vous tapez ont un code qui est spécifique à votre locale, ce qui n'est peut-être pas le cas de vos visiteurs. Afin que ceux-ci voient vos caractères accentués quelle que soit leur locale, veillez à ce que vos caractères accentués utilisent les expressions HTML adéquates (é egrave; etc.) ou spécifier que votre document est encodé avec un ensemble de caractères (charset) supportant ces accents, comme UTF-8.

Ponctuation

Contrairement à l'anglais, le français précède d'un espace un certain nombre de ponctuactions (?, !, :). En HTML, un espace est par défaut un caractère sécable, c'est-à-dire autorisant ce qui le suit à passer à la ligne suivante. Afin de conserver ces ponctuations à côté du texte qu'elles ponctuent, précédez-les d'un espace non sécable ( )

Les compteurs

Les compteurs n'intéressent que vous. Outre le fait qu'ils soient souvent interprété comme une marque de puérilité ("c'est moi le plus fort"), ils sont inutiles : personne n'ira voir votre page parce que d'autres vont la voir. Personne n'est non plus dupe sur le fait que ces compteurs sont trucables à volonté (total de départ, modifications).

Les pubs

Vos visiteurs ne viennent pas sur votre site pour voir de la pub. N'utilisez les pubs que si vous en avez vraiment besoin (vivre d'un site typiquement).

Abherrations

Anachronismes

On a parfois tendance à reproduire sur le Web les principes que l'on a trouvé dans les supports papier (livres, revues, etc.). Cela mène souvent à des abherrations, ignorant complètement les avantage d'un support informatisé. On trouve parmi ces abherrations :

  • les numéros (de page, de chapitre, paragraphe, etc.) qui étaient destinés à designer un endroit dans un texte sur papier. Dans un document Web, ils sont remplacés par des hyperliens qui permettent un accès direct et univoque à un document ou une portion de document (lien interne). Lorsque vous utilisez des numéros dans un document Web, c'est généralement pour afficher des listes ordonnées (exprimer un ordre, une priorité d'éléments).
  • les index : pour les mêmes raisons, ces associations mot->numéro de page sont remplacées par la fonction de recherche plein texte (sur un mot ou plusieurs).
  • les guillemets de citation qui servaient à délimiter celles-ci sur des livres sans styles ni couleurs. Un document Web peut utiliser divers styles, dont celui d'un passage de citation clairement délimiter (<cite>) et auquel on peut donner l'apparence de son choix. Les guillemets gardent toutefois un sens quand ils veulent exprimer, non pas une citation, mais une expression ou une approximation.

Mauvaise utilisation des moyens modernes

Il existe également des abherrations dans l'utilisation des moyens modernes eux-mêmes. Elles ne correspondent pas à la reproduction d'un réflexe issu d'un paradigme antérieur comme celui des livres, mais sont directement issues d'une mauvaise compréhension du nouveau paradigme Web. Il s'agit notamment de :

  • l'affichage de la valeur des hyperliens (https://monlien), ce qui nuit à la lecture et est sans intérêt (quand on veut reprendre un lien plus tard on le copie dans son presse-papier ou à plus long terme le met dans ses favoris). Parfois même ces valeurs sont affichées sans même constituer un hyperlien (on est alors obligé de copier la valeur du lien dans le presse papier et la coller dans la barre d'URL).
  • les liens de retour (vers la page précédente ou la position précédente dans la page courante) qui sont redondants avec le mécanisme du bouton Précédent (Back) des navigateurs.
  • l'utilisation du soulignement (au milieu d'un texte), qui est habituellement réservé aux hyperliens et qui trompent les internautes lorsqu'ils ne sont qu'un artifice de présentation. Mieux vaut les remplacer par un corps gras, un style italique, etc.
  • les tailles fixes de textes ou tableaux. Le navigateur adapte chaque fois que possible l'affichage du texte en fonction de la taille de la fenêtre chez le visiteur. Fixer des tailles absolues dans un document Web revient donc à ôter cet avantage à vos visiteurs, qui peuvent se retrouver un afficher un texte 800x600 dans une fenêtre pourtant maximisée à 1024x768. Les tableaux HTML ont l'avantage d'être dynamiques : ils adaptent leur taille en fonction de leur contenu, et le font généralement bien. C'est un avantage pour la rédaction (en vous évitant de spécifier tailles diverses) mais aussi et surtout à l'affichage pour vos visiteurs : les tableaux s'adapter à la taille de la fenêtre du navigateur lorsque c'est possible, permettant un affichage optimum pour chaque configuration d'écran. Evitez donc tant que possible de fixer des tailles. Elles peuvent être à la rigueur relatives (%) mais éviter surtout celles abolues (en pixels). Evitez également les fontes absolues (en pixels) et préférez les tailles relative (+1, +2, etc.)
  • Les images redondantes avec les moyens du Web :
    • incluant des bordures (superflues par rapport au border d'images ou de tableau),
    • des textes de légende (superflus par rapport à une caption de tableau)
    • des espacements par rapport au texte (superflus par rapport aux hspace et vspace du Web)
    • voire des couleurs de fond (pouvant être ajoutés/enlevés par le Web sur des images incluant de la transparence).
  • Les énumérations manuelles (listes à puces, listes ordonnées) alors que le Web gère tout cela via les unordered lists (<ul>) ou ordered lists ( <ol>) avec tous types de numérotations (1,2,3..., A,B,C..., i,ii,iii,iv...), indentations ou personnalisation des puces.
  • aspiration de site : aspirer un site Web revient à le rendre statique chez vous, et vous condamne donc à avoir une version toujours obsolète et télécharger, re-télécharger tout le site à chaque fois pour obtenir une petite différence (impliquant que vous n'y gagnez finalement même pas sur le rapport coût de communication/nouveautés). L'aspiration dans des buts de "sauvegarde" n'est même plus nécessaires, d'autres services de l'Internet (archive.org par exemple) se chargeant d'archiver le réseau mondial.

Aberrations comportementales

Il existe enfin d'autres abherrations, mais du côté des utilisateurs cette fois, et qui n'influent pas directement sur l'élaboration d'un site Web. On peut trouver parmi celles-ci l'impression de documents Web (un document Web n'est pas fait pour être imprimé - pas de saut de page - et un bon document Web n'est jamais long, mais utilise des hyperliens qui sont abolis par l'impression).

Référencement

La meilleure manière d'être référencé pour un sujet donné, au-delà des astuces de mots-clés meta, etc. c'est encore d'avoir un contenu de qualité et pertinent par rapport à ce sujet.

Parmi des règles simples, on peut citer :

  • Une page avec un titre pertinent
  • Un premier mot pertinent avec un style de titre
  • pointer vers une référence sur le sujet traité
  • être référencé de l'extérieur

Liens externes

Les liens que vous proposez vers d'autres sites sont censés refléter un intérêt que vous leur porter. C'est du moins la valeur que leur portent vos visiteurs. Si vous choisissez de pointer vers des sites au terme d'un simple accord mutuel avec le webmestre de ce site, juste pour être référencé, cela ôte toute valeur à vos liens, et donc à une partie du contenu de votre site. On fera moins confiance à ce que vous écrivez.

Les plaies

Bande passante

En induisant un traffic sur le réseau, votre site Web implique une consommation de la bande passante que celui-ci peut supporter. Les hébergeurs vous font payer cette consommation au forfait, proportionnellement, ou vous imposent un maximum (par mois typiquement, coupant tout accès une fois ce maximum atteint). Dans tous les cas, une consommation excessive devient un problème.

Cette consommation est induite par :

  • vos visiteurs normaux : pas de problème, le site est pour eux
  • les sites référençant vos fichiers
    • pages Web : pas de problème, interdire qu'on référence vos pages serait abherrant (autant ne pas placer votre site sur Internet sinon)
    • images, videos, documents PDF : ces documents sont généralement beaucoup plus volumineux que de simples pages Web et, si votre quota de bande passante est maigre, il est recommandé d'interdire leur accès en dehors de votre site Web (concrètement, refuser si le REFERRER de la requête ne vient pas de votre site).
  • les robots : ils parcourent l'Internet pour l'indexer dans leurs moteurs de recherche. Ils inspectent en tout premier lieu votre fichier robots.txt, où vous avez l'opportunité d'indiquer ce que vous attendez ou refusez d'eux.
  • vos visiteurs aspirant votre site  : ce sont des parasites n'ayant rien compris au principe de l'Internet. Si vous êtes certains de les différencier des robots, plusieurs mesures sont envisageables :
    • bannir leurs adresses IP si celles-ci sont fixes
    • restreindre l'accès à votre site par un login/mot de passe

Spam

Chaque fois que vous incluez une adresse email dans une page Web, un robot est susceptible de scruter cette page, détecter l'adresse, et l'ajouter à la prochaine liste de ses victimes de spam (voire d'émetteur de virus). Il est donc important de ne jamais placer de telles adresses en clair (que ce soit à l'affichage, mais aussi dans le code source HTML) mais de manière déguisée. Plusieurs options s'offrent à vous pour cela :

  • une fonction JavaScript calculant l'adresse (par concaténations de plusieurs chaînes par exemple).
  • une image affichant l'adresse email

Referrers

stats 404

Voir aussi