Les-CRIs.com notifie sur Mastodon. Compte : @Les_CRIs sur piaille.fr.
Cet article présente les fondements et les grandes lignes des Paquet-de-CRIs :
Ce que c'est, les avantages, la mise à disposition des articles de CRIs en mode distribué, etc...
Vous trouverez aussi une présentation générale pratique ici :
Les CRIs : Paquet-de-CRIs - présentation générale.
Explication synthétique, comment les télécharger, etc...
Conseil de lecture :
Cet article est une présentation historique, et générale, des Paquet-de-CRIs.
Si vous voulez du concentré d'efficacité pratique, préférez l'article de "présentation générale" indiqué ci-dessus.
Cela fait un moment que j'ai en tête de proposer les articles de CRIs dans un mode distribué, un peu comme on distribuait les journaux avant,
et surtout beaucoup dans le sens de l'hygiène numérique et de la mise à disposition des articles sans imposer l'obligation de passer par une demande systèmatique via les réseaux et serveurs de sites, pour chaque page.
Voici ce que sont les paquet-de-CRIs, l'histoire de leur genèse, et de leur génération, et les avantages de cette mise à disposition en mode distribué.
Aujourd'hui, on est le 2 mars, ... on génère... (voir l'autre article de CRIs du 2 mars 2022).
Mise à jour du 28 avril 2022 :
Ajout du chapitre : "Présentation générale et pratique des paquet-de-CRIs".
Modification dans le chapitre "Histoire de la génération des paquet-de-CRIs", pour l'utilisation de Wget, au lieu de HTTrack.
Mise à jour du 3 juillet 2024 :
Amélioration de l'introduction de l'article : mise en avant de l'autre article, synthetique et pratique, de "présentation générale".
Ajout du conseil de lecture.
Les chapitres sont :
Un paquet-de-CRIs, c'est une copie de l'ensemble du site www.les-CRIs.com à une date donnée, mise à disposition d'un bloc, pour usage en mode local.
Toutes les pages (articles), les images, peut être les sons et les vidéos, ... sont disponible en un seul fichier compressé (zip et tar.gz), pour utilisation en mode local sur votre équipement personnel et local.
Exemple de paquet-de-CRIs :
Cela sera par exemple un fichier : paquet-de-CRIs-version-site-internet-simple-220315.tar.gz
Dedans, vous avez tout le site www.les-CRIs.com.
Tous les articles, et les photos qui sont sur l'hébergement de ce site (ce nom de domaine).
Vous pouvez le décompresser sur un de vos outils numériques (ordinateur fixe ou portable, tablette, smartphone, ou autre).
Et le consulter à volonté en local.
Une fois décompressé, vous ouvrez la page : index.html
Dans votre navigateur Internet préféré (Firefox, Chromium, Brave, Iridium, Pale Moon, Gnome Web, ou autre...).
De ce que j'ai en tête, y aura une publication d'un nouveau Paquet-de-CRIs tous les mois.
Ça en fera 12 par ans. C'est bien déjà.
Peut être tous les 15 jours, ... ce qui ferait 24 par ans.
Autre possibilité : si je le fais à la mano (avant d'automatiser), il y a des chances que ce soit quand j'ai publié quelques pages, .... hop, un nouveau Paquet-de-CRIs à jour.
On verra...
Cela fait un moment que j'ai en tête de proposer les articles de CRIs dans un mode distribué, un peu comme on distribuait les journaux avant.
Environ depuis août-septembre 2021.
Cela m'est venu en voyant qu'en terme d'Hygiène Numérique, il y a des choses très simples à faire, en premier, quelque soit le système, l'OS, le type de machine (smartphone, ordinateur, tablette, ...) que l'on utilise.
Cette chose simple, c'est d'utiliser les éléments numériques en mode local, sur le système que l'on utilise, au lieu d'aller chercher en permanence, plusieurs fois, les éléments.
C'est valable pour des vidéos, des podcasts audio, des émissions et interviews, des documents et articles en tout genre.
L'idée s'est précisé quand j'ai appris, récemment, que Wikipédia mettait à disposition l'ensemble du site, pour ceux qui veulent l'utiliser en mode off-line.
Voir cette page :
Wikipedia:Database download
Et ce paragraphe d'introduction :
Wikipedia offers free copies of all available content to interested users.
These databases can be used for mirroring, personal use, informal backups, offline use or database queries (such as for Wikipedia:Maintenance). All text content is multi-licensed under the Creative Commons Attribution-ShareAlike 3.0 License (CC-BY-SA) and the GNU Free Documentation License (GFDL). Images and other files are available under different terms, as detailed on their description pages. For our advice about complying with these licenses, see Wikipedia:Copyrights.
Wikipedia le fait depuis des années... alors, allons-y !...
Télécharger un paquet-de-CRIs, comment les utiliser, comment en fabriquer un vous-même,...
Tous les détails pratiques sont décrits dans ces pages :
21 avril 2022 :
Les CRIs : Paquet-de-CRIs - présentation générale.
Pour faire cela, il faut récupérer le site depuis le serveur, puis empaqueter tout cela dans un fichier compressé, avec la date dans le nom de fichier, etc... et publier ce paquet dans la page qui va bien, sur le site.
Ou sur d'autres sites miroir... par exemple.
Pour la récupération du site : je pensais utiliser HTTrack, mais en fait (28 avril 2022) j'ai basculé sur Wget.
J'utilise déjà depuis des années HTTrack, et j'ai (donc) des scripts shell tout prêts pour facilement automatiser le process.
J'ai commencé il y a quelques semaines à améliorer les scripts et à concevoir l'automatisation pour les appliquer sur le site les CRIs.
J'utilisais HTTrack pour récupérer mes sites Internet et les archiver.
Ou aussi pour passer certains sites qui sont en pages en php (très peu de php, mais un peu quand même) vers du html statique.
Pour les mettre en ligne dans des hébergements qui ne font (même) pas du php.
Bon, ben là, j'ai fait les améliorations de mes scripts de base, et tenté de l'utiliser pour fabriquer les Paquet-de-CRIs.
Et,... patatras... y a un bug dans la génération des noms des fichiers : globalement, le site récupéré fonctionne, mais il tronque les noms des fichiers, et je trouve ça pas beau, et ça ne me plait pas.
Donc, finalement, rebelote, j'ai écrit un script pour utiliser Wget.
Wget a été une bonne surprise. Plus simple que HTTrack, il en fait moins, mais il est plus simple aussi à utiliser,... pour des tâches usuelles, habituelles, et qui ne demandent pas des subtilités dans la manière de récupérer un site ou quelques pages sur Internet.
Pour l'automatisation, j'ai d'abord eu la bonne surprise de voir qu'HTTrack est disponible en standard dans
OpenBSD. Donc, ça c'est bien.
Pour Wget : idem. Il est dispo en package tout prêts, dans OpenBSD.
Pour le reste, du Ansible, et du shell script.
Et du Cron pour que cela se fasse automatiquement à dates régulières...
J'ai commencé ces tâches, pour les scripts, pour faire une mini-plateforme Ansible pour automatiser la production des paquet-de-CRIs, etc...
Il faudra aussi automatiser la génération des pages qui mettent à disposition ces paquet-de-CRIs, au fil du temps, versions après versions...
Y a plus qu'à faire, faire, faire... quand j'aurai du temps pour cela.
La suite de l'histoire, au cours de 2022. Et 2023 (soyons réaliste).
Là, le 2 mars 2022, je lance la notion, et l'explication de tout ce truc.
Je vais commencer à faire quelques paquet-de-CRIs avec un script pour automatiser la fabrication du paquet, avec Wget.
28 avril 2022 : c'est en place, voir :
Les CRIs : Paquet-de-CRIs - présentation générale..
Vous disposez de l'équivalent du site les CRIs, en local, facile à consulter.
Fini les soucis de connexion qui rament, qui se coupent, du wifi dans le café ou dans le train, qui coupe ou mets deux plombes à vous servir parce que tout le monde est en train de vouloir quelque chose en même temps.
C'est comme au bistrot ou fast-food (soit disant rapide), quand vous y allez à midi trente, et qu'il y a un monde fou, et qu'il faut deux plombes pour avoir un truc à manger...
Vous pouvez consulter tranquillement les articles, même pendant votre retraite de réflexion sur le monde, isolée dans une cabane en bois dans les bois loin des grandes villes et des connexions internet.
Ou bien sur votre bateau, en train de faire le tour du monde.
J'ai souvent suggéré qu'il fallait du temps pour lire certains articles, et qu'une année sabbatique pour étudier un domaine (celui de l'argent par exemple) serait une bonne idée.
Je n'ai jamais suggéré qu'il fallait rester chez soi. Un tour du monde, ou des cotes d'espagne, en bateau, est une bonne idée...
Sur votre ordinateur, vous pouvez consulter tout le temps, facilement, l'ensemble du site.
Même quand le serveur est en panne, ou ralenti, ou le réseau est en panne.
Exemple : Cette nuit, chez moi, y a eu une coupure visiblement de minuit à 4 heures du mat... et c'était pas la box et la connexion adsl, c'était le raccord à l'internet par l'opérateur qui était en rade.
J'aurai pu être en grande frustration de lire des articles de CRIs !
Cette manière, de récupérer les éléments sur sa machine, et de les utiliser ensuite, en mode off-line, c'est plus confortable, et c'est aussi beaucoup plus sain, en terme d'Hygiène Numérique.
Plus sain que d'aller à tout bout de champs chercher les contenu sur le réseaux, sur les serveurs.
Je ne développe pas ici, cette manière de faire. Seulement une image, pour illustrer le sens du propos : c'est comme rapporter de la bouffe chez soi, depuis un traiteur ou un supermarché, ou ce que vous voulez,... au lieu de manger dans un bistrot, un restaurant, un fast-food, un boui-boui, etc...
Cela ne veut pas dire que les bistrots, restaurants, fast-foods, boui-bouis, etc... ce n'est pas bien. C'est que parfois, c'est bien de manger peinard chez soi.
Si vous voulez plus d'infos sur l'Hygiène Numérique, vous pouvez commencer par cet article :
11 avril 2020 :
Les CRIs : Au fil du temps : blagues internet et masques numériques - les gestes barrières numériques
Et oui, ... Vous ne pourrez plus vous plaindre : "Les CRIs, ça nous surveille !", "ca collecte plein d'infos sur moi !"
"Au secours, c'est big brother qui profite de me donner des beaux contenus super intéressants pour mieux me surveiller !.... les z'horribles méchants !!!...."
Comme pour Wikipédia : vous pouvez consulter les articles_de_CRIs en mode local, sur votre appareil, ... dans le plus simple appareil même si vous voulez,... bref, comme cela vous chante, sans que le serveur qui vous sert les pages n'en profite pour collecter des infos sur vos consommations de pages.
Bref, peinard,... façon Hygiène Numérique.
Le site www.les-CRIs.com ne collecte pas d'infos sur les visiteurs.
Plus tard, le serveur loguera les pages servies, pour avoir quelques statistiques de pages demandées, etc.
Mais cela n'est pas encore en place, et vu que cela n'a pas grand intérêt, c'est pas demain que je vais avoir le temps de faire cela.
De toute façon, avec les paquet-de-CRIs, ces statistiques de pages visitées seront de faible qualité,
puisqu'elles ne donneront une indication que des pages visitées via le site internet,
et non pas celles vues, lues, et usée jusqu'à la corde, ... via le mode local, avec un paquet-de-CRIs.
Si vous avez un doute sur ce qui a été écrit, à telle date, il vous suffit d'aller regarder dans votre version, en local, des articles-des-CRIs.
Vous pourrez constater que ce qui a été écrit à telle date, est bien la même chose que sur le site. Ou pas.
C'est vous qui aurez, sur votre outil numérique, en local, la version valide des articles, tels qu'ils ont été publiés, au fil du temps.
Plein-de-petits-paquets-de-CRIs, cela peut servir de validation, via la-trace-de.
la-trace-de, c'est un moyen de valider les choses, donc de bâtir de la confiance.
J'écrirai plus sur ce point, plus tard, quand cela sera utile et vaudra le coup de développer.
Le site Wikipédia complet fait plusieurs GigaOctets (Go) de volume.
Le site www.les-CRIs.com, il tient sur 10Mo. Oui, 10 MegaOctets.
C'est pas beaucoup, hein !
Je le sais parce que l'hébergement que j'utilise est limité à 10 MegaOctets par nom de domaine.
Oui, sur le plan pratique, quand on nous dit (constat) qu'il va falloir faire dans la sobriété, la parcimonie, ...
moi, j'ai déjà commené depuis longtemps.
2017 la mise en ligne des Article_de_CRIs.
Et oui... Le site www.les-CRIs.com tient sur 10 MegaOctets seulement.
C'est fou, non ?!!
Cette manne d'information de constats, de réflexions judicieuses, pertinentes, sur le monde tel qu'il est,... ça tient dans 10Mo.
Cette densité de complexité, de subtilité sur le monde, ... dans si peu de quantité d'information.
Étonnant,... mais vous pourrez le constater bientôt, en voyant un paquet-de-CRIs...
D'un point de vue licence d'utilisation, comme tout est déjà en license Creative Commons Attribution-ShareAlike 3.0 License (CC-BY-SA),
Vous pouvez utiliser librement le paquet-de-CRIs comme toute reproduction des articles des CRIs.
C'est libre.
Bref, les paquet-de-CRIs, c-est-pratique !
Et oui, vous l'avez vu venir, n'est-ce pas ?
Les Paquet-de-CRIs, cela va dans le sens de la tendance
plein-de-petits.
Et cela donne : plein-de-petits-paquets-de-CRIs.
En terme de technique globale et de structure, cela s'inscrit dans la tendance à la circulation de l'information.
Notamment avec un stockage et une utilisation en mode distribués.
Coucou ! 😳
Puisque vous êtes venu jusqu'à ce bas de page... jusqu'à cette mention CC By-SA... j'en profite pour pointer un constat.
Il faut que j'écrive un article sur les licences Créative Commons (By-SA et les autres variantes) :
Les licences Créative Commons sont super importantes par rapport aux moissons des contenus par les fabricants de modèles de langages et de modèles pour IA générative.
Pour passer d'une forme de pillage à des moissons et à du commerce équitable, pour les contenus mis à disposition sur l'Internet.
Tout en gardant la publication sur le web : libre, vaste, variée,... mise à disposition du plus grand nombre...
Dès que j'ai un moment, je mets en place une page d'article sur ce point. Ce constat.