Journal Les Archives de la planète (Albert Kahn, un Hari Seldon avant l'heure)

Posté par  (site web personnel) . Licence CC By‑SA.
14
21
août
2024

Amusante synchronicité, j'ai découvert Albert Kahn (1860-1940) le jour où je quittais à nouveau mon vieil ami Hari Seldon (fondateur de la psychohistoire, des deux Fondations et de l'Encyclopedia Galactica) après avoir refermé L'Aube de Fondation, roman publié par Asimov en 1993 et se terminant par le décès de Seldon.

Alors que son contemporain Paul Otlet voulait mettre le monde en fiches avec son Mundaneum, Albert Kahn, riche banquier jusqu'à la crise de 1929, voulait sauvegarder la (…)

Les langues peu documentées et le libre : quelques enjeux scientifiques

40
6
mai
2024
Culture

Comme beaucoup de domaines scientifiques, la documentation de la diversité linguistique entretient une relation forte avec les mondes du Libre. Dans cette dépêche, je vous propose de découvrir ce domaine à travers la présentation de plusieurs logiciels et ressources libres ou en accès ouvert. La documentation des langues étant un thème peu courant sur LinuxFr.org, on commencera par une présentation de cette problématique. Nous continuerons par une description des deux ressources principales existantes pour cataloguer et se repérer au sein de cette diversité linguistique. Je parlerai ensuite d’ELAN et de FLEX, deux logiciels utilisés pour annoter des enregistrements audio-visuels, une étape clef dans l’analyse linguistique, et qui permet le partage et la réutilisation de ces enregistrements. Enfin, après un court passage sur la question de l’archivage, je présenterai deux compilations de corpus de documentation en accès libre, une pratique récente qui permet de nouveaux questionnements quantitatifs sur les langues orales peu documentées, et qui contribue également à la transparence et la traçabilité des analyses linguistiques.

Archiver ses vidéos : retour d’expérience

Posté par  . Édité par Julien Jorge, orfenor, Ysabeau 🧶, Benoît Sibaud, gUI et Tequila_Yuen. Modéré par Arkem. Licence CC By‑SA.
54
18
jan.
2024
Audiovisuel

Préambule : ma vie (et peut-être aussi la vôtre)

Comme probablement beaucoup d’entre vous, j’ai des milliers de photos et vidéos accumulées au cours des 20 dernières années. C’est très pratique de pouvoir stocker cela sur un seul disque dur. Mais cela pose trois problèmes majeurs :

  1. la pérennité du support ;
  2. le classement des fichiers pour pouvoir en retrouver un en particulier dans… très longtemps.
  3. la possibilité de lire des fichiers dans plusieurs années (je pense à des fichiers Publisher 2.0 que je ne suis plus parvenu à lire par la suite – et non : les versions ultérieures à Publisher 2.0 ne lisent pas ces fichiers.

Ce texte s’adresse à toute personne qui se pose trois questions :

  1. Pourrai-je visionner mes fichiers vidéos dans 30 ans pour les montrer à mes petits-enfants ?
  2. Comment organiser/classer mes fichiers vidéos pour les retrouver rapidement ?
  3. Comment réencoder mes fichiers vidéos pour limiter la place occupée (ou, dit autrement : quel format utiliser) ?

Après avoir lu cette dépêche, je vous recommande très fortement de vous reporter aux commentaires qui suivent car vous y trouverez probablement des précisions, liens, corrections ou suggestions qui l’enrichissent.

  • Pour le point 1., aucun support n’étant inaltérable/incassable, la règle tient en une phrase : « sauvegarder sur plusieurs supports (pour parer une éventuelle défaillance), dans différents endroits (en cas d’incendie, de vol, d’inondation…) et si possible en chiffrant ses disques (pour protéger votre vie privée en cas de vol : c’est incroyablement simple sous linux)
  • Pour le point 2., j’avais rédigé un document il y a fort fort longtemps où j’expliquais que le seul classement pérenne était le classement chronologique (je vous laisse vous reporter au document pour comprendre pourquoi l’utilisation de logiciels propriétaires est à proscrire). Pour résumer, je crée un dossier par année (2023) dans lequel il y a douze sous-dossiers (2023_01, 2023_02 etc.) et dans chacun d’eux, je crée un dossier par jour avec la date et le lieu (par exemple, 2023_06_25_saint_denis_la_reunion indique immédiatement où et quand ont été prises les photos et les vidéos à l’intérieur de ce dossier). Les photos sont renommées (et retournées si nécessaire) automatiquement avec l’instruction jhead -autorot -nf%Y_%m_%d__%H_%M_%S_ *.jpg. Les vidéos sont renommées manuellement sous la forme 2023_06_25__video_02_christophe_et_philippe_en_velo.mov 1
  • Pour le point 3., le format JPG étant ouvert, la lisibilité des photos est garantie dans le temps. Pour les vidéos, c’est un peu plus compliqué puisqu’en général, trois formats interviennent :
    • le codec vidéo pour l’image (comme h264, h265, av1, mjpeg…) ;
    • le codec audio pour le son (comme mp3)
    • le format de conteneur (comme avi, mp4, mts…)

C’est là où on en revient à l’histoire de ma vie.


  1. note : je n’ai jamais trouvé comment récupérer les métadonnées des vidéos pour les utiliser dans le nom du fichier, comme je le fais avec jhead. 

Où il est question de conservation

Posté par  (site web personnel, Mastodon) . Édité par L'intendant zonard, Arkem et Pierre Jarillon. Modéré par Arkem. Licence CC By‑SA.
56
1
sept.
2023
Culture

À l’heure où les jardins regorgent de fruits et légumes (enfin, ceux qui ne subissent pas la sécheresse) et où l’on mitonne à tout-va conserves, confitures et terrines, le chemin de fer Transimpressux reprend les voyages dans le temps et l’espace commencés l’année dernière. Pour cette excursion, nous partirons de Babylone, vers 1750 avant notre ère, nous nous baladerons dans le fort romain de Vindolanda, au nord de l’Angleterre. Nous irons dire bonjour à Nicolas Flamel, nous passerons par le Portugal et la Belgique, par Sablé dans la Sarthe aussi. Sans oublier de faire un tour à Alexandrie et sur la Lune, eh oui, pour terminer à Nancy où nous ferons la connaissance de Fust et Shoeffer, quoique, ça aurait pu être Mayence.

Il s’agira, bien sûr, mais le lecteur ou la lectrice avisée aura déjà compris, de la conservation de l’écriture, de ses problèmes et de ses enjeux.

Le Transimpressux

Forum général.cherche-matériel scan massif de documents

Posté par  . Licence CC By‑SA.
Étiquettes :
5
6
août
2023

Bonjour.

Je suis en train de faire du tri dans mes affaires et avec le temps j'ai accummule pas mal de documents papiers.

Ces documents peuvent être des livres, des supports de formation, des releves de compte, des documents techniques que je ne trouve pas ou plus en ligne, etc … Et j'aimerais scanner tout ça pour me debarasser du physique et faire de la place

J'envisage donc d'utiliser un scanner permettant de numeriser facilement tout ça. Un scanner qui (…)

Forum Programmation.autre Est-ce faisable en .epub ? ou dans un autre format ?

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
2
4
nov.
2022

Bonjour à tous,

je cherche à mettre dans un fichier unique cette visualisation des annotations d'un enregistrement que j'ai mise au point:

http://jocelynaznar.eu/lexique_nisvai/form_visualisation.php?histoire=T50

L'intérêt pour moi est de pouvoir plus facilement archiver ces informations (données + visualisations interactives associées). Je pensais faire ça avec Epub, notamment via les médiaoverlays (https://www.w3.org/publishing/epub3/epub-mediaoverlays.html). Je me demandais si quelqu'un avec un peu d'expérience avec Epub pouvait me dire si c'était une bonne piste à explorer. Je suis sinon ouvert à toute autre (…)

Journal Sauvegarde et archivage, encore !!!

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
Étiquettes :
20
16
oct.
2022

'lut les gens,

Rappel du contexte

Ce journal s'inscrit dans un suite de journaux liés à la sauvegarde et à l'archivage des données dont vous retrouverez les liens plus bas. Le fait déclencheur de tous ces journaux étant une perte de données.
Ces journaux ont généré moult commentaires et de nombreux conseils éclairés, en soi je remercie linuxfr, ses contributeurs et lecteurs car grâce à tous ces conseils avisés j'ai grandement amélioré mon architecture de sauvegarde et archivage diminuant les (…)

Suivi — Liens Proposer une option pour archiver sur "Internet Archive"

#2041 Posté par  . État de l’entrée : ouverte. Licence CC By‑SA.
Étiquettes :
1
14
oct.
2022

L'idée de cette suggestion est de pouvoir proposer une option d'archivage automatique de la page soumise sur la section "Liens" par l'intermédiaire de Internet Archive. Ainsi, il serait possible d'avoir un aperçu du contenu originel du lien au moment de sa soumission sur la section, au cas où il se passait des modifications importantes de la page (graphisme et/ou contenu modifié, nouveau "proprio" du site, etc) ou une indisponibilité permanente.

Forum Linux.général numérisation albums : solution pérenne?

Posté par  . Licence CC By‑SA.
Étiquettes :
0
24
juin
2022

hello

après avoir effectué avec brio la numérisation de cassettes vhs, j'aimerais passer à quelques albums photo ; ffmpeg n'a donc plus trop sa place dans l'équation, cependant, utilisant un ordi windows (bahh) pour 1. les drivers 2. l'automatisation des manips' de scannage, je me suis demandé une dernière question :

quel format d'image serait le plus convenable pour numériser des documents format a4, qui soit la plus haute qualité en vue de pouvoir être retravaillés dans dix, quinze, vingt (…)

Journal démat' arch' fort

19
8
mar.
2022

'jour 'nal.

Deux commentaires (un sur les niveaux et un parlant explicitement de documents administratifs qui pour moi sont de second niveau), m'ont fait penser aux solutions de dématérialisation mise en place par certaines entreprises pour leurs employés et employées.

Mon expérience

Sans trop m'étendre, je vais faire un petit tour des plateformes que j'ai croisé, mais je ne sais pas trop quelles solutions techniques sont derrières .

MyPeopleDoc

J'ai vu l'entreprise A passer des document papiers aux documents en (…)

Journal Sauvegarde suite et fin ?

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
18
3
jan.
2022

'lut 'nal,

Pour commencer l'année, je continue ma série de journaux sur la sauvegarde, je vous vois venir "encore celui-là avec ses articles sur la sauvegarde, ça va commencer à devenir franchement lassant". En fait je me rends compte que je n'avais pas totalement asséché le sujet puisque je n'avais pas encore parlé d'archivage, c'est l'objet de ce journal.

Rappel du contexte

Mais un petit rappel s'impose, voici un bref résumé des précédents épisodes
- le premier journal de la (…)

FFV1, un format vidéo sans perte et libre, normalisé à l'IETF

116
24
août
2021
Audiovisuel

Si la compression vidéo sans perte est moins tendance que celle avec perte, elle reste utile dans certains domaines (par exemple l’archivage, que ce soit pour son stockage ou sa transmission, qu’il concerne des enregistrements de procès importants pour l’histoire ou le dernier blockbuster à la mode).
L’Internet Engineering Task Force (IETF) avait déjà normalisé des formats de compression avec perte (Opus, pour l'audio), mais pas encore de format sans perte : c'est à présent chose faite, cette fois-ci en matière de vidéo, avec la normalisation de FFV1 sous le doux nom de RFC 9043.

logo IETF

Arkiv : Sauvegarde de fichiers et bases MySQL + archivage sur Amazon S3 et Amazon Glacier

Posté par  (site web personnel) . Édité par ZeroHeure, Davy Defaud et claudex. Modéré par bubar🦥. Licence CC By‑SA.
Étiquettes :
26
13
août
2017
Administration système

Pour mes besoins personnels et professionnels, j’ai développé un script pour sauvegarder mes données (fichiers présents sur le disque local et bases de données MySQL) et les archiver sur Amazon S3 et Amazon Glacier.

Il est possible de choisir la fréquence de sauvegarde (jusque toutes les heures si nécessaire) et de définir une politique précise pour la purge des données. Il est ainsi possible d’avoir un comportement du type :

  • sauvegarde toutes les heures : les données sont enregistrées en local et envoyées sur Amazon S3 et Amazon Glacier ;
  • toutes les sauvegardes sont gardées en local pendant deux jours, puis on garde quatre sauvegardes par jour (une toutes les six heures) pendant cinq jours, puis une par jour pendant deux semaines, puis elles sont effacées ;
  • toutes les sauvegardes sont gardées sur Amazon S3 pendant deux semaines, puis on garde six sauvegardes par jour (une toutes les quatre heures) pendant deux semaines, puis deux par jour pendant un mois, puis elles sont effacées ;
  • toutes les données sont gardées sans limite de temps sur Amazon Glacier.

Le choix des services cloud d’Amazon se veut pragmatique. Amazon S3 est très utilisé pour stocker des données auxquelles on veut pouvoir accéder rapidement. Amazon Glacier est très pratique pour enregistrer des données sur le long terme pour un coût très bas.

Ce script propose une interface de configuration en ligne de commande qui se veut facile à utiliser. Les fichiers journaux se veulent aussi les plus lisibles possibles.