arnaudus a écrit 5237 commentaires

[^] # Re: Technologie et utilisation de la technologie

Posté par arnaudus le 25 août 2021 à 17:26. En réponse au journal Rendez moi mon futur!. Évalué à 5.

Comme ça tu n'as pas l'impression d'être en permanence "décodé".

Mouais, on a cette discussion régulièrement ici.

Observation: les pubs ciblées et les listes d'articles proposées (page d'accueil du site, "vous pourriez être aussi intéressé par…", "articles fréquemment achetés ensemble") semblent complètement débiles (protections périodiques alors qu'on est un homme, combinaison sado-maso alors qu'on cherche un bouquin sur Latex, etc).

Hypothèse 1: les IA des sites commerciaux sont foireuses (recherche grossière de mot-clés, photos ressemblantes, erreurs d'identification du profil, heuristiques pondues par un stagiaire…)

Hypothèse 2: les IA pourraient de fournir une liste de 10 articles pertinents, mais elles font exprès de te montrer n'importe quoi pour que tu ne te rendes pas compte que tu es pisté

Moi, je met l'hypothèse 1 à 100 contre 1. Largement.

Explication 1: pour de nombreux sites commerciaux, le ciblage est codé par des chimpanzés incompétents sous pression des commerciaux qui ont vendu une "intelligence artificielle" qu'on n'a pas les compétences pour développer.

Explication 2: les données sur lesquelles sont basées le ciblage sont foireuses ou incomplètes (plusieurs utilisateurs sur la même machine, configuration du navigateur avec purge des cookies, identification heuristique du profil facebook / google ratée…). Un facteur essentiel du profil de l'utilisateur (homme/femme, pro/particulier…) a très bien pu être raté (ou pas considéré dans la base de données).

Explication 3: le principe même du ciblage ne fonctionne pas (même une très bonne connaissance du profil de l'utilisateur ne permet pas de proposer un choix pertinent, parce qu'il y a trop de variété, le comportement est imprédictible, ou pas de corrélation entre les achats). Par exemple, si lundi: resto japonais, mardi: resto chinois, mercredi: proposer un resto thaïlandais ne fonctionne pas, parce que la plupart du temps on veut varier.

Par exemple, un mystère pour moi, c'est les "fréquemment achetés ensemble", typiquement sur Amazon. Je n'arrive pas à me rappeler une seule fois où ces suggestions étaient pertinentes, parce qu'elles proposent des articles identiques ou redondants, et pas du tout complémentaires. Par exemple, si tu achètes un joint pour le lave-vaisselle, le site te propose un autre joint pour un lave-vaisselle d'un autre modèle. Dans quel monde quelqu'un achète ensemble plusieurs joints pour plusieurs lave-vaisselle? La seule possibilité que je vois, c'est que la plupart des joints de lave-vaisselle sont achetés par des réparateurs de lave-vaisselle, auquel cas l'algorithme se vautre lamentablement, et me propose des articles absurdes. J'imagine que pour la plupart des vendeurs, les bases de données sont bruitées et biaisées par tout un tas de facteurs ou d'erreurs, et que les suggestions sont foireuses. Ça m'étonnerait qu'ils aient des équipes qui étudient rationnellement ce que fait l'algorithme et qui cherche à l'améliorer, même dans les grandes boîtes; si ça se trouve le truc fonctionne comme ça depuis 10 ans et personne n'a cherché à l'optimiser. Bref, penser qu'on est à la merci d'IA omniscientes qui font semblant d'être mauvaises pour influencer notre comportement sans qu'on en soit conscient, c'est un scénario de SF, mais ça me semble avoir 0 crédibilité. Il faudrait déja que les algo soient capables de fournir des solutions pertinentes avant de brouiller les cartes.
[^] # Re: Technologie et utilisation de la technologie

Posté par arnaudus le 25 août 2021 à 12:37. En réponse au journal Rendez moi mon futur!. Évalué à 10.

Ce qui est le plus bizarre dans ce genre de cas, c'est que ça a un impact direct sur le chiffre d'affaire. Mais c'est aussi la conséquence du découpage des tâches et de confier tout un tas de trucs à des prestataires. Celui qui développe la charte graphique du site n'est pas le même que celui qui gère la base de données, celui qui gère les commandes par Internet n'est pas le même que celui qui gère le site, etc. Au final, l'organisation est complètement sous-optimale, personne n'est responsable de la cohérence. C'est typique des grosses boîtes je pense, et des décideurs qui ne comprennent rien à la technique. Pour reprendre l'exemple de Casto, c'est la même équipe dans le magasin qui prépare les commandes web et qui prépare les retraits des gros articles (qu'il faut transporter au transpalette parce qu'ils sont dans la réserve). Eh bien, figurez-vous que cette équipe n'a pas la main sur les flux de retrait des commandes web. Du coup, en plein samedi après-midi, alors qu'ils sont déja à l'arrache sur les cliens qui attendent leurs articles qu'ils ont acheté physiquement dans le magasin, ils ont aussi des clients web qui se pointent toutes les 5 minutes. Au final, tout le monde poireaute une heure. Si c'est pas complètement débile comme fonctionnement! Comment peut-on imaginer qu'ils n'aient pas prévu de ne pas donner de RDV web sur les plages horaires déja surchargées?

Mais bon, tout ça, ça n'est qu'une conséquence de l'incompétence et de la désorganisation dans les grosses structures. Des incompétents qui ont un rôle de décision veulent couper les coûts, et mettent en place des systèmes dysfonctionnels (qui sont forcément plus coûteux); la culture d'entreprise fait qu'il est impossible ou difficile de faire remonter les dysfonctionnements ou de faire des propositions pour améliorer l'organisation, personne ne prend d'initiative localement (parce qu'il pense que ça n'est pas son rôle, parce qu'il pense qu'il n'est pas payé pour penser, parce que ça serait mal vu de la hiérarchie, parce que c'est bien fait pour les chefs incompétents que les clients soient mécontents…).
[^] # Re: Performances de compression par rapport à d'autres formats avec*pertes

Posté par arnaudus le 24 août 2021 à 18:04. En réponse à la dépêche FFV1, un format vidéo sans perte et libre, normalisé à l'IETF. Évalué à 10.

Euh… C'est peut-être complètement naïf, mais par rapport à une compression non-spécialisée (style zip ou rar), quel gain d'efficacité peut-on espérer?
# Technologie et utilisation de la technologie

Posté par arnaudus le 24 août 2021 à 17:21. En réponse au journal Rendez moi mon futur!. Évalué à 10. Dernière modification le 24 août 2021 à 17:23.

J'ai l'impression que toute technologie peut être mal utilisée. Ça peut être des interfaces mal conçues, des protocoles inadaptés, des humains incompétents, des tentatives de réduction des coûts trop brutales… C'est sans fin.

Au final, il ne faut pas oublier que des humains sont derrière le fonctionnement, et les dysfonctionnements sont souvent dûs à des humains débiles, fainéants, ou incompétents. Pour reprendre l'exemple de ton centre de radiologie; j'ai appelé une fois celui qui était proche de chez moi pour une radio en urgence, et on m'a répondu qu'il était nécessaire de prendre RDV, et que le prochain RDV était dans 6 jours. J'en ai appelé un autre, et la secrétaire m'a demandé pourquoi j'appelais, vu qu'il était évident qu'il suffisait de se pointer quand il s'agissait d'une urgence. A priori, deux centres de radiologie de même taille, deux communes voisines, même prix : rien ne peut justifier le fonctionnement du premier, sauf la bêtise, l'avarice, l'incompétence, ou la paresse.

Sur le fond, la déshumanisation a aussi parfois du bon. Je trouve ça appréciable de pouvoir faire beaucoup de démarches administratives par Internet, de manière générale, le téléphone n'est pas un bon outil pour les démarches. On ne peut pas partager de document, on doit transmettre les numéros et les noms par la voix, avec un taux d'erreur important. Pour avoir été expatrié pendant des années, le téléphone est aussi un outil terrifiant quand il faut s'exprimer dans une langue qui n'est pas sa langue maternelle. Et, pour des raisons ridicules de code du travail, personne ne répond au téléphone la nuit, ce qui fait qu'il faut toujours appeler sur les heures de boulot. Bref, les RDV et les démarches par Internet, c'est génial.

Par contre, ça s'interface mal avec le monde réel. Quand la base de données de RDV est sous Doctolib, on ne peut plus prendre de RDV en direct. C'est par exemple une partie de l'explication du faible taux de vaccination des > 80 ans : ceux qui n'ont pas été aidés pour prendre RDV n'ont pas pu le faire avec les moyens "standard". Mais ça n'est pas de la faute de la technologie. Dans de nombreux centres de vaccination, il y avait un agent derrière un ordinateur qui pouvait prendre un RDV pour des gens au téléphone ou qui s'étaient pointés. Mieux encore, il y avait des centres de vaccination où on prenait les petits vieux qui se pointaient sans RDV. Il suffit d'un humain quelque part dans la chaine qui prend une initiative intelligente, et pouf, ça se débloque.

La technologie et les contraintes associées ne sont malheureusement qu'une excuse supplémentaire pour que les glandus glandent. Mais blâmer la machine ne sert à rien, il faut blamer ceux qui l'ont achetée, installée, conçue, ou paramétré. Il y a plein d'exemples où l'informatique fait gagner du temps et de l'efficacité, mais il n'y a rien d'intuitif dans la mise au point d'une interface ergonomique ou d'un cahier des charges.

Ton futur idéal, c'est peut-être quand on aura l'expérience de ces interactions foireuses avec la technologie, et qu'on confiera la conception des interfaces à des gens dont c'est le métier.
[^] # Re: Très mauvaise idée

Posté par arnaudus le 24 août 2021 à 14:23. En réponse au message créer sa propre distribution Linux. Évalué à 2.

Bon, je me rends compte que je n'ai pas été très constructif. Je pense que ce qu'il faudrait faire avant tout, c'est d'embaucher un informaticien expérimenté pour être chef de projet / manager : OK sur le plan technique, mais surtout avec de l'expérience dans la maintenance de distributions (un mainteneur Debian, quelqu'un dans ce profil). Ça sera à lui de définir le cahier des charges avec vous; quelle genre de distribution, quel fréquence de mise à jour, quelles contraintes, quand on voudra une version beta, quand une version commercialisable, etc. En fonction de ça, le chef de projet estimera la taille de son équipe, et c'est lui qui assurera le recrutement. Il sera responsable des délais, des problèmes humains et techniques; il assurera à la fois le développement et la maintenance de la distrib, et le service support aux clients. S'il vous dit qu'il faut une équipe de 12, alors c'est qu'il faut une équipe de 12. C'est à lui qu'il faudra faire confiance, pas aux moules de Linuxfr.

Par contre, c'est sûr que si vous lui offrez un CDD de 4 mois en espérant avoir une distrib fonctionnelle au bout, il va se barrer tout de suite. Mais je pense que dans tous les cas, il faut embaucher ce genre de profil et lui confier les manettes; la boîte va peut-être couler parce que ça coûte trop cher par rapport aux revenus, mais au moins vous n'aurez pas fait n'importe quoi.
[^] # Re: Très mauvaise idée

Posté par arnaudus le 24 août 2021 à 11:13. En réponse au message créer sa propre distribution Linux. Évalué à 7.

Bah du coup il sait que Mandriva c'était 4M€ de capital et 50 mainteneurs, que Canonical c'est > 500 employés. Du coup, c'est logique, on part sur un ou deux développeurs à payer 4 ou 8 mois. Y'a pas de raison que ça se passe mal, parce qu'on va embarquer la dernière version du noyau et qu'on va travailler vite et bien. Sont un peu débiles les concurrents, ils distribuent des Linux d'il y a 10 ans, ils travaillent mal et lentement, et ils payent des dizaines de mainteneurs alors qu'une fois que la distribution est faite en 4 mois, bah ça continue à fonctionner tout seul. Tout est sous contrôle.

Sérieusement, si vous voulez installer et maintenir des postes Linux chez vos clients, installez une distribution existante et fournissez le support. Si vous voulez vendre un logiciel que vous développerez vous-mêmes, développez un logiciel portable, que vous pourrez installer sur le système du client sans lui imposer une distribution (mais il va falloir le développer, ce logiciel, ça ne se fait pas en deux mois avec un stagiaire). Si vous voulez maquiller une distribution existante pour faire croire que vous distribuez un produit original alors que c'est juste une Ubuntu sur laquelle vous avez changé les logos, faites-le, mais c'est juste de l'escroquerie. Mais créer une vraie distribution en quelques mois avec une toute petite équipe que vous ne pensez même pas conserver pour la maintenance, c'est juste zéro crédibilité. Être cassant et sûr de soi ne va pas changer la donne…
[^] # Re: je vais tennir compte de tous vos commentaires

Posté par arnaudus le 24 août 2021 à 10:43. En réponse au message créer sa propre distribution Linux. Évalué à 5.

Bah lancez vous. Ça n'est pas mon pognon, et c'est juste dommage pour les quelques colombinés que vous arriverez peut-être à attirer avec un produit défectueux.

Personnellement, je ne comprends pas comment on peut envisager d'investir dans un domaine dans lequel ni vous ni votre ami ne connaissez rien; visiblement, vous n'avez même pas envisagé qu'il fallait maintenir votre distribution, et vous avez sous-estimé d'un facteur 10 à 100 les RH pour créer une nouvelle distribution—je pense simplement que vous ne savez pas ce qu'est une distribution, vous ne parlez que de noyau et d'interface graphique.

Après, c'est toujours pareil : il y a parfois des gens qui réussissent un truc parce qu'ils ne savent pas que c'est impossible. Mais 1) pour un qui réussit ce truc, il y en a des milliers qui se plantent, et 2) la propabilité de réussite reste très supérieure parmi ceux qui connaissent les challenges à venir que parmi ceux qui y vont au pif. Mais bon, maintenant, vous êtes au courant, à vous de voir quel service vous souhaitez rendre à votre ami.
[^] # Re: Très mauvaise idée

Posté par arnaudus le 23 août 2021 à 18:26. En réponse au message créer sa propre distribution Linux. Évalué à 3.

Mouais, toujours pas convaincu. On ne sait pas quelle est sa cible, si ça se trouve, c'est complètement sans rapport avec sa propre activité? Par exemple, il veut installer sa distrib spécifiquement sur des bornes de commande dans un fast-food, bah lui il ne gère pas de fast-food, donc il n'a aucune raison d'utiliser son produit.

Évidemment, en bon commercial, il doit connaitre son produit. Et pour revenir à ce que je disais, il doit connaitre le marché : il doit savoir ce qu'est une distribution Linux, quels sont les concurrents, etc. Et c'est là qu'est le problème : comment pourrait-il parler par exemple des mises à jour de sécurité, quand visiblement il ne connait pas les rôles respectifs du noyau, des projets upstream, et de la distribution?

Mais dans tous les cas, le plus important c'est qu'il se fasse briefer par quelqu'un de compétent. Je ne crois pas qu'il doive apprendre l'informatique et qu'il doive maitriser Linux pour ça; s'il connaissait, ça aurait été un plus, mais je ne crois pas du tout que "va apprendre Linux et reviens quand tu sauras installer une distrib" soit un bon conseil.

Au fond, bien sûr, la question reste pourquoi se lancer dans un secteur technique et très concurrentiel quand on n'y connait rien techniquement et qu'on ne connait rien au secteur, mais à mon avis, c'est plus un problème de ne rien connaitre au secteur (c'est un manque de compétence sur son cœur de métier : le commerce) que de ne rien y connaitre du point de vue technique (ce qui serait le boulot de quelqu'un d'autre).
[^] # Re: Vraiment ?

Posté par arnaudus le 23 août 2021 à 16:32. En réponse au lien Les talibans se sont emparés d'appareils biométriques militaires américains. Évalué à 4.

À mon avis, ça dépend de ce que contient cette base.

Si elle contient des données identifiant des citoyens US (militaires, mercenaires, espions) ou des étrangers rendant actuellement service aux US (contre-espions), alors oui, c'est une belle bande de tanches.

Si elle n'identifie que des civils locaux qui ont rendu service aux US mais qui n'ont plus vocation à travailler pour eux dans l'avenir, alors pour l'armée, c'est complètement neutre : ils s'en foutent. Pour les civils en question, c'est différent, mais pour les militaires, c'était peut-être un choix de privilégier la destruction des données sensibles, et de laisser les données moins sensibles.

Plus sérieusement, connaissant les outils de forensics moderne, quel est votre meilleur moyen de rendre un disque dur illisible définitivement ?

Un bon coup de masse (ou une rafale d'arme automatique) et laisser trainer à l'extérieur dans la pourrière du désert, ça me semblerait suffisamment sécurisé pour la plupart des applications, non?
[^] # Re: Très mauvaise idée

Posté par arnaudus le 23 août 2021 à 16:23. En réponse au message créer sa propre distribution Linux. Évalué à 4.

Donc il devrait commencer par installer une distribution Linux sur son ordinateur et l'utiliser au quotidien pour ses usages professionnels.

Je ne suis pas complètement d'accord. Le gars est investisseur, ça n'est pas son boulot d'apprendre à utiliser les produits qu'il veut vendre. Son boulot, c'est d'identifier un besoin, d'évaluer le marché, de dimensionner son investissement, et de se lancer. Typiquement, un investisseur qui se lance dans des services low-cost, il ne va pas les utiliser pour lui. Tu vois le patron de Renault rouler en Twingo, ou le patron de Lidl manger les sous-marques qu'il vend? Attention hein, il doit faire croire qu'il utilise ce qu'il vend. Mais en vrai, bien sûr qu'il ne fait pas ça.

Par contre, le pote en question, il semble mal savoir s'entourer. Il me semble assez évident qu'il a demandé à quelqu'un qui n'y connait rien (et qui ne comprend visiblement rien de ce qu'on lui dit) de tâter le terrain, et ça, c'est très très inquiétant. Rien ne semble aller dans leur projet; les moyens qu'ils semblent vouloir investir sont 100 fois trop faibles par rapport à la tâche (créer une distribution, rien que ça), l'objectif de créer une distribution ne semble pas correspondre à leur business model (ils ne veulent pas vendre une distrib, mais vendre des services), et leur projet ressemble à 1000 projets précédents qui se sont vautrés (bricoler un Linux avec une interface graphique pour remplacer Windows chez des gens qui n'y connaissent rien à l'informatique, et la vendre moins cher que Windows).

Après tout, c'est leur pognon, ils font ce qu'ils veulent avec. Ceux que je plains, c'est les quelques pigeons qui pourront mordre à l'appât et payer pour ce truc.
[^] # Re: je vais tennir compte de tous vos commentaires

Posté par arnaudus le 23 août 2021 à 16:09. En réponse au message créer sa propre distribution Linux. Évalué à 5.

Il y a déja eu beaucoup de réponses très détaillées, et ta réponse semble montrer que tu n'as pas lu (ou pas compris).

utiliser un noyau Linux existant le plus récent si possible

C'est ridicule : évidemment qu'il veut installer un noyau récent, ça serait complètement débile de partir sur un vieux.

affecter une interface graphique existante et originale et l'imposer

Existante ou originale? Pour moi ça ne veut rien dire.

choisir toujours les solutions techniques les moins couteuses en temps et argents

C'est bien connu, c'est comme ça qu'on fait de la qualité.

du temps necessaire pour la réaliser par un ou deux informaticiens

J'ai l'impression qu'on a essayé de t'expliquer que c'était peut-être plutôt 10 à 20, voire plus pour travailler correctement, mais c'est pas grave, partez avec votre CDD sur 4 mois et vous verrez bien ce que vous aurez au bout…
[^] # Re: nouvelle distribution Linux avec une interface graphique originale

Posté par arnaudus le 23 août 2021 à 09:35. En réponse au message créer sa propre distribution Linux. Évalué à 8.

Cela permetrait a ces petites structures d'économiser leur licence Windows

Mouais, si le choix c'est Windows sans support ou Linux avec support, le prix du support va devoir être très très bas pour être équivalent à une licence Windows OEM (max 150€ à l'achat? Donc support Linux < 50€/an?).

Maintenir une distribution, c'est des milliers d'heures de boulot par mois si on le fait bien (gérer les rapports de bugs, corriger et/ou transmettre upstream, gérer les dépendances de milliers de logiciels, etc). Du coup, soit l'investisseur est millionnaire et voit gros, soit il va lancer une distrib montée à la va-vite qui ne fonctionne pas (base logicielle très petite, installation aléatoire, mise à jour déficiente, etc), soit il va monter une "fausse distrib" (par exemple une Ubuntu avec bureau visuellement personnalisé et les logos Ubuntu remplacés par les siens). Dans le derniers cas, je n'ai pas l'impression que les clients s'y retrouvent (même si le support est efficace et que ça marche, c'est quand même basé sur du pipeau). Et comme dit plus haut, le client est enfermé; ses machines tournent officiellement sur la distribution "PoteàToyo", et s'il ne connait rien, il ne va pas savoir qu'il peut changer de prestataire, ce n'est pas très honnête.

Vendre le support pour une distribution existante, c'est un schéma beaucoup plus classique. Ça rassure le client, qui peut se renseigner sur le produit. C'est comme un contrat de service dans un garage, on connait le modèle de la bagnole, et le garage assure la maintenance. Ce n'est pas le garage qui vend sa propre bagnole bricolée dans sa cour, ou une Renault à laquelle on aurait retiré les logos et changé la couleur des sièges.

Les besoins de tous les clients sont différents, mais personnellement je ne voudrais pas du tout que la boite qui assure la maintenance ajoute des briques logicielles expérimentales pour faire une interface "agréable" ou "facile". Il y a eu des milliers de tentatives équivalentes, et ça a toujours été un foirage total. Même avec Linux, les utilisateurs n'ont pas de problème d'interface : ils ont des problèmes avec le support du matériel (le wifi qui ne marche pas, etc), ils ont des problèmes de compatibilité logicielle (un client envoie un fichier Excel qu'on n'arrive pas à ouvrir correctement), ou ils n'arrivent pas à faire quelque chose qu'ils arrivaient à faire sous Windows. Mais les interfaces pour attardés (style "Toi cliquer ici pour aller voir Internet"), ça a peut-être un marché dans les EHPAD, mais dans le milieu pro, j'en doute un peu…
[^] # Re: les questions que se pose mon amis commercial

Posté par arnaudus le 20 août 2021 à 13:55. En réponse au message créer sa propre distribution Linux. Évalué à 2.

il veut CREER une nouvelle distribution linux (pour un besoin special, un truc qu'il lancerait depuis une clef USB ou un appareil exotique pour montrer à un client ?)

La demande n'est pas ambigüe. C'est clairement de ça qu'il s'agit.

la création d'une distribution linux soit une de plus a LinuxKubuntu & Linux-Mandriva & LinuxDebian …
[^] # Re: les questions que se pose mon amis commercial

Posté par arnaudus le 20 août 2021 à 13:53. En réponse au message créer sa propre distribution Linux. Évalué à 7.

C'est comme si je disais que je n'y connaissais rien en mécanique, mais que je vais embaucher un mécanicien pour qu'il me conçoive et fabrique une voiture, histoire de concurrencer les Peugeot, Renault, Toyota, et autre constructeur.

Excellente analogie :-)

et a proposé une évolution disruptive

La voila l'idée : il faut faire une distribution disruptive. Au lieu d'un vieux et banal Linux, il faut coder un nouveau système d'exploitation. Il suffit de s'y connaitre un peu en C et en assembleur, non? Bon, il faudra peut-être prendre un stagiaire en plus de l'informaticien, il faut être réaliste.

(c'est une blague pas très gentille. J'assume).
[^] # Re: les questions que se pose mon amis commercial

Posté par arnaudus le 20 août 2021 à 10:12. En réponse au message créer sa propre distribution Linux. Évalué à 5. Dernière modification le 20 août 2021 à 10:16.

C'est toujours pareil, c'est toujours plus facile de douter ou de dénigrer les entrepreneurs que de prendre le place. Ceci dit, il faudrait être sûr de ce que vous voulez faire, et que vous compreniez bien les contraintes et l'état du marché.

Le marché des distributions Linux est bien saturé. Il y a plusieurs (voire des dizaines) de distributions sur tous les créneaux : pour le grand public, pour les professionnels, pour les utilisateurs averties, pour les geeks, pour ceux qui veulent personnaliser une distribution en se basant sur un socle stable, etc. La grande majorité de ces distributions sont gratuites, c'est difficile de vendre Linux sans un solide service derrière.

Comme dit plus haut, faire et maintenir une distribution, c'est faire des dizaines de choix techniques qui nécessitent une très bonne compréhension de l'écosystème Linux : quel système de paquets, quelle périodicité de mise à jour, combien de paquets dans la distribution par défaut, quelles versions, quelle politique de mise à jour, quels choix techniques pour le son, pour le bureau, pour le serveur graphique, quelle gestion des drivers propriétaires, quel matériel supporté (processeur, carte graphique…)… Même ceux qui s'y connaissent très bien font des erreurs; par ailleurs, il est probable que beaucoup de combinaisons aient été tentées et que vous retrouverez des distributions très similaires sur le marché.

Je ne sais pas si c'est comparable, mais Canonical (qui maintient Ubuntu), c'est (en tout cas c'était au moment où ils ont lancé la distrib) 500 employés et 100M$ de budget. C'est sûr que c'est du très très lourd, mais ça donne quand même une idée de la quantité de travail pour créer, maintenir, et générer des revenus à partir d'une distribution linux (et encore, une grosse partie du job est faite par la communauté, notamment par la réutilisation des paquets Debian). Même sans faire de développement (juste faire une distribution à partir de logiciels existant), je ne pense pas que 4 mois de CDD pour un développeur puisse permettre d'écrire un cahier des charges approximatif… Il faudrait discuter avec des gens qui ont tenté le coup pour évaluer vraiment l'équipe minimale pour produire quelque chose d'utilisable (4 ou 5 personnes pendant 1 an? C'est très difficile à dire).

Si l'objectif est de vendre un service autour d'une distrib Linux, j'imagine que ça serait infiniment plus facile de vendre ce service autour d'une distribution existante.
[^] # Re: Droit d'auteur fantasmé?

Posté par arnaudus le 20 août 2021 à 09:46. En réponse au journal GitHub lance copilot, un générateur de code entraîné sur du code GPL. Évalué à 2.

Puis l'AI me génère de la musique que est totalement dans le style de Lady Gaga avec une voix synthétique qui ressemble fortement à Lady Gaga. Est ce que je peux m'attribuer le copyright et vendre la musique ainsi générée?

Argument très intéressant. J'imagine que personne ne sait vraiment. J'aurais tendance à penser que les mêmes arguments juridiques (flous) vont s'appliquer que pour n'importe quel artiste qui a copié le style musical d'un autre. Je ne pense pas qu'Oasis ait été poursuivi par les ayant-droit des Beatles, si? :-)

Sur le fond, d'après (le peu) que je comprends de la propriété intellectuelle, il va falloir avoir des arguments précis pour plaider la contrefaçon. Je ne suis pas sûr du tout qu'on puisse invoquer le droit d'auteur sur "un style". Il va falloir aller chercher des vrais bouts de morceaux qui ressemblent beaucoup, des paroles qui se ressemblent plus qu'elles ne devraient par hasard, etc. Si l'AI est bien faite et qu'elle a juste recopié le style, alors je pense que l'ayant-droit a peu de chances de s'en tirer.

avec un NDA puis je vends mon modèle au monde entier. Est-ce légal

Je pense que ça dépend des termes de la licence. Il y a forcément des clauses sur la commercialisation du résultat du traitement algorithmique des données. Je ne suis pas sûr que la précision de la prédiction soit le point central ici, ce que tu fais, c'est que tu prends les données, tu les traites, et du vends le résultat. Soit c'est autorisé, soit ça ne l'est pas. Il n'y a d'ailleurs pas besoin d'AI pour ça, le problème se poserait si tu appliquais n'importe quel traitement statistique aux données (lissage, flou Gaussien…) ou si tu fittais une fonction.

Ou j’entraîne une AI sur des designs de mode trouvés sur Internet

Alors là, je pense que ça ne pose pas de problème. On ne peut pas interdire aux ordinateurs de faire ce que font tous les créateurs. Peut-être faut-il juste s'assurer de la légalité du contenu de la base de données.

une simple citation de l'origine des données d'apprentissage n'est pas insurmontable

Les licences (libres ou non) s'appliquent mal aux données, parce que les données ne sont pas soumises au droit d'auteur (même si beaucoup le voudraient ou voudraient le faire croire). Une donnée n'est pas une oeuvre de l'esprit, même si elle a été coûteuse ou difficile à obtenir. La hauteur d'une montagne, par exemple, peut être réutilisée sans mentionner la personne qui l'a calculée. La seule raison de citer l'origine d'une donnée, c'est la rigueur ou l'honnêteté. Mais je ne pense pas que tu puisses appliquer une obligation légale. La question est un peu différente avec une grosse base de données, puisque c'est la base (et pas les données) qui peuvent être protégées.

que se passe-t-il quand quelqu'un à mis mon code sur github sans mon consentement?

Tout dépend de la licence de ton code. Si c'est du GPL ou équivalent, que la personne l'a obtenu légalement (en la téléchargeant sur ton site par exemple), alors la GPL lui donne le droit de rediffuser le code. Si ton code était sous une licence restrictive ou proprio, et que l'indélicat l'a republiée sous une licence fantaisiste sans ton autorisation, c'est de la contrefaçon. Contacter github en premier me semble la bonne démarche, j'imagine qu'ils vont recueillir les arguments des deux parties et agir en conséquence.

Je me suis toujours dit que les utilisateurs d'un code sous GPL pouvaient être facilement trompés par des intermédiaires peu scrupuleux (qui changent la licence par exemple), et que ça pouvait leur coûter cher. Par exemple, tu télécharges un truc sous github, tu le modifies et le commercialise. Et paf, 2 ans après, tu apprends que le code n'était en fait pas sous GPL et l'auteur original te poursuivait pour contrefaçon. Soit tu payes, soit ton business coule (puisque tu ne peux plus diffuser ton code sous les mêmes conditions), et pire, tes clients peuvent à leur tour avoir des problèmes (puisqu'ils ont pu diffuser ton code sous GPL de bonne foi). À un moment, le truc devient hors de contrôle, le code est partout, sous des licences trompeuses, et il semble très difficile de réparer l'erreur. Ça donne envie quand même de recontacter les auteurs originaux pour toute réutilisation qui pourrait poser problème (histoire de vérifier que leur code est bien sous GPL et que les fichiers récupérés sont bien les bons).
[^] # Re: up

Posté par arnaudus le 16 août 2021 à 11:07. En réponse au journal Amélioration de la coloration syntaxique C dans vim. Évalué à 6.

J'ai l'impression que ça ne dépend que de la philosophie du projet. Vim est avant tout un éditeur de texte, et pas un IDE. S'il faut parser 100k lignes de code pour mettre des couleurs sur une fonction de 3 lignes (et ça va être le cas, si tu as quelques include standard), alors tu vas le payer en terme de réactivité et de légèreté.

En ce qui me concerne, j'ai toujours utilisé un éditeur de texte léger et des terminaux pour coder, parce que j'ai l'impression que les IDE me font perdre plus de temps qu'ils m'en font gagner (mais bien sûr, c'est complètement personnel, et ça ne marche que sur les petits projets). Si la coloration syntaxique n'est pas instantanée (par exemple, s'il faut 1/2 s pour vérifier si A est un type ou une variable), alors on aura commencé à taper la suite avant de s'apercevoir qu'on a fait une erreur. On perd toute la légèreté et la réactivité de l'interface.

Du coup, si j'étais Monsieur Vim, je me contenterais d'une analyse locale au fichier, en utilisant une heuristique naïve. C'est le genre d'heuristiques sur lesquelles les compilateurs se basent pour émettre des warnings (par exemple sur if (A = B) ).

Sur le fond, c'est quand même vraiment bizarre que C ou C++ sont assez ambigüs pour ne pas être capables de déterminer si une ligne est une déclaration ou une instruction à exécuter sans avoir besoin de la totalité du contexte. Je comprends bien que c'est pour des raisons historiques et pragmatiques, mais quand on en est là, on peut quand même se poser des questions sur la cohérence du langage. Je ne pense pas que ça soit le job des éditeurs de texte de pallier les problèmes profonds des langages; quand la coloration syntaxique n'est pas possible, bah elle n'est pas possible, et puis c'est tout. C'est un peu comme si un langage permettait de lire le caractère qui indique un commentaire dans une variables globale ou un truc chelou comme ça; au bout d'un moment, il y a des choses qu'un éditeur de texte ne peut pas vraiment faire;
[^] # Re: points intéressants qui ont attiré mon attention

Posté par arnaudus le 16 août 2021 à 09:49. En réponse au lien L'Europe s'inquiète du potentiel rachat du Britannique Arm par l'Américain Nvidia. Évalué à 4.

le Royaume Uni se sépare d’un actif de plus de 35 milliards d'euros

Je n'y connais évidemment rien en géopolitique économique, mais est-ce que quand on vend un truc contre de l'argent, l'objectif n'est justement pas de compenser la valeur du "truc" par la quantité d'argent qu'on reçoit en échange?

Ou alors, 35 milliards c'est la valeur pour les actionnaires, alors que l'État Britannique évoque le manque à gagner pour la société (impots, emplois…) en cas de délocalisation? Sauf qu'a priori, la boîte appartient à ses propriétaires, pas à l'État, se plaindre de ce que les gens font avec ce qu'ils possèdent, c'est le point de départ du libéralo-communisme?
[^] # Re: up

Posté par arnaudus le 16 août 2021 à 08:26. En réponse au journal Amélioration de la coloration syntaxique C dans vim. Évalué à 10.
Je ne sais pas à quel point les devs de vim acceptent les heuristiques pour la coloration, mais C est tellement ambigü que ça semble impossible de ne pas faire d'erreur.
```
typedef int A; 
A * B;
```
déclare un pointeur de A, alors que
```
int A = 2;
int B = 3;
A * B;
```
fait une multiplication (et n'en fait rien, mais ça n'est pas un problème de syntaxe).

Si les déclarations de variables et les typedef sont dans un autre fichier, ça semble très difficile de faire une coloration syntaxique correcte sans se planter dans une partie des cas.
[^] # Re: Pendant ce temps, en Islande,

Posté par arnaudus le 13 août 2021 à 08:39. En réponse au journal Pass Covid, une liste noire ?. Évalué à 3.

Il me semblait (faute d'avoir lu le contraire, donc à vérifier) que l'immunité naturelle sur ce point était meilleure

La réponse immunitaire après avoir chopé le covid est plutôt bonne, mais le problème, c'est le variant delta : avoir attrappé une version antérieure ne te protège plus.

D'après Une étude récente dans Nature sur l'épidémie en Inde, Delta échappe bien aux anticorps naturels dû aux autres variants, et à une première dose de vaccin. Deux doses de vaccin protègent bien. Ça n'est pas des résultats certains, parce que c'est une réponse mesurée in vitro, ça n'est pas des données épidémiologiques.
[^] # Re: Pendant ce temps, en Islande,

Posté par arnaudus le 12 août 2021 à 17:06. En réponse au journal Pass Covid, une liste noire ?. Évalué à 4.

Je n'ai jamais prétendu avoir la science infuse.

l'ivermectine concernant la prophylaxie et traitements précoces

Pour l'instant : très indécis. Certaines méta-analyses avaient été très influencées par un article favorable à l'ivermective, qui a depuis été rétracté. Le consensus actuel semble d'être que si ça marche, c'est pas impressionnant, et ça nécessite probablement des doses qui sont supérieures aux autorisations existantes.

l'immunité naturelle vs vaccin

L'immunité naturelle des anciens variants protège peu du variant delta. Les vaccins sont beaucoup plus efficaces. Quand on a choppé le delta, je ne sais pas si on est protégé contre une nouvelle infection delta. Quelqu'un a des données?

la relation entre variants et vaccination

AstraZ et Johnson : protection assez inefficace contre le delta. Moderna & Pfizer: mauvaise protection après la première dose, bonne protection après la deuxième (> 90% en conditions réelles).

la décroissance de l'efficacité du vaccin avec le temps

Ça diminue vite, après quelques mois, comme en Israël, ~ 60% contre l'infection (mais reste > 90% contre les formes graves). D'où l'idée d'une 3e dose qui commence à faire son chemin, pour limiter l'infection (mais peut-être pas besoin pour les formes graves, sauf chez les immunodéprimés). Par contre, je ne sais pas si la décroissance est similaire entre vaccin et infection naturelle (a priori, la protection initiale du vaccin est bien meilleure, donc on part de plus haut).
[^] # Re: Pendant ce temps, en Islande,

Posté par arnaudus le 12 août 2021 à 16:56. En réponse au journal Pass Covid, une liste noire ?. Évalué à 3.

Certes, mais du coup, est-ce l'épidémiologiste qui parle ou le politique? Et pourquoi cette histoire de faire disparaitre le virus au fil des réinfections alors qu'il y a 4 coronavirus bénins et saisonniers qui tournent dans la population depuis des dizaines d'années (dont un qui est même peut-être responsable de la "grippe russe" de 1890, qui ressemble beaucoup au COVID19—sans l'hécatombe de vieux, puisqu'en 1890 les vieux ça ne courait pas les rues).
[^] # Re: Réaction à un tweet : est-ce bien raisonnable ?

Posté par arnaudus le 12 août 2021 à 16:50. En réponse au journal Pass Covid, une liste noire ?. Évalué à 3.

Je pense que c'est plutôt le contraire; les média ont longtemps résisté à présenter le FN comme un parti fréquentable malgré un support populaire important, jusqu'au jour où la pression a été trop forte (financière, puisqu'une partie des auditeurs/lecteurs/télespectateurs se sentait exclus, politique, puisque certaines revendications du FN se sont vu récupérées par des partis traditionnels, et sociale peut-être, avec la mise en accusation des journalistes). Je trouve ça assez étrange d'ailleurs que le FN/RN n'a pas beaucoup progressé dans les urnes depuis qu'il est devenu "fréquentable" dans les médias.

Par contre, je trouve que "fréquentable dans la rue", c'est vraiment nouveau, et vraiment lié au mouvement gilets jaunes. Je ne pense pas que les syndicats historiques accepteraient de défiler avec le RN.
[^] # Re: Réaction à un tweet : est-ce bien raisonnable ?

Posté par arnaudus le 12 août 2021 à 16:42. En réponse au journal Pass Covid, une liste noire ?. Évalué à 3.

La correction de Bonferonni est la plus "conservatrice" et s’applique dans tous les cas.

Le but, c'est quand même de corriger quelque chose. Si tu veux juste être conservateur, tu dis que ton estimation est entre 0% et 100%, tu ne peux pas te tromper.

L'exemple extrême, c'est quand deux variables sont identiques (parmi 100 merles, 45 sont des mâles et 55 sont des femelles, 45 sont noirs et 55 sont marron): tu crois faire deux tests mais tu n'en fais qu'un. À force d'être conservatif, tu vas être amené à demander des tailles d'échantillon beaucoup trop grandes, et c'est parfois impossibles (raisons éthiques, financières, logistiques…).

Dans tous les cas, c'est mathématiquement possible de calculer un CI avec n'importe quel risque alpha. Mais je ne comprends pas bien de toutes manières ce que veut dire un CI corrigé par Bonferroni. Quand tu dis "50% des sondés aiment la vanille (CI 95% 45-55) et 30% des sondés aiment la crème de marron (CI 95% 27-33)", les deux représentent bien des CI 95%, et je ne vois pas pourquoi faire deux tests devraient les modifier. Il n'est pas question ici de la probabilité que les deux proportions tombent en même temps dans l'intervalle. Si c'est le 95% qui pose problème, on peut juste reporter estimation et écart-type, ou fournir la distribution de l'erreur. L'écart type ne change pas quel que soit le nombre de tests…

Et ce que ma disgression rappelait, c’est que cette règle de N=30 elle-même a quelques conditions

De toutes manières, il ne se passe rien de spécial entre 29 et 31, donc c'est assez arbitraire (et je ne suis même pas sûr que ça soit une "règle"). De mémoire, c'est autour de 30 qu'on peut assimiler la loi de Student à une loi Normale, et qu'on peut appliquer le théorème central limite; c'est le genre de choses qui facilitaient les calculs avant les années 1990, quand on n'avait que des calculatrices non-programmables. J'avais uniquement avancé cet argument pour montrer ma désapprobation à l'idée que N=1000 était un petit échantillon, ce qui me semble absurde : de tous les points de vue, et même pour une binomiale, N=1000 est un gros échantillon, et les méthodes qu'on va utiliser sont les méthodes statistiques destinées à traiter les gros échantillons. Je ne voulais pas dire plus que ça. On ne va pas non plus appliquer les méthodes du "big data" (FDR, etc).

Avec l'utilisation des outils informatiques, de toutes manières, les approximations normales ne servent qu'à des discussions informelles. On peut calculer l'intervalle de confiance d'une binomiale même avec N=1000, et c'est même plus facile que de passer par une loi normale.
[^] # Re: Réaction à un tweet : est-ce bien raisonnable ?

Posté par arnaudus le 12 août 2021 à 13:57. En réponse au journal Pass Covid, une liste noire ?. Évalué à 4.

Dès que tu as plusieurs proportions, il faut appliquer https://en.wikipedia.org/wiki/Bonferroni_correction.

Non. La correction de Bonferroni s'applique aux tests qui sont indépendants, ce qui n'est pas le cas ici (c'est même la conclusion de l'article).

N=1000 pour des tableaux aussi détaillés, c’est totalement risible.

Aucune taille d'échantillon n'est risible du moment qu'on reporte les erreurs associées. Et comme déja discuté plus haut, N=1000 aura assez de puissance pour distinguer sans ambiguité les différences reportées (35% vs 49%), donc la taille d'échantillon est adaptée à la question.

N=30 pour estimer le paramètre d’une bernouilli c’est de la merde

Tout dépend du niveau de précision souhaité. Si c'est pour un ordre de grandeur, c'est suffisant. Si la question est "j'ai joué 30 fois à un jeu de hasard et j'ai gagné 5 fois", alors c'est compatible avec un lancer de dé à 6 faces, et ça n'est pas compatible avec pile ou face.

L'objectif des statistiques n'est pas de déterminer si le jeu de données "est de la merde" ou pas. L'objectif des statistiques est de déterminer ce qu'on peut dire ou non à partir des données. Si tu as des données sur 20 animaux super-rares, tu vas faire tes stats avec N=20. Tu ne pourras pas attraper un signal subtil, mais ça peut être suffisant pour une conclusion solide si les effets sont grands.

Et de toutes manières ça ne sert à rien d'améliorer la précision jusqu'à l'infini quand il y a des biais potentiels. Les sondages sur N=1000, c'est largement accepté, et c'est largement acceptable; comme je l'ai dit plus haut, préjugé < sondage < étude scientifique, et c'est vrai quelle que soit la taille du sondage. Épistémologiquement, on ne peut pas accepter l'idée que l'absence de données est plus informative que des données imparfaites. Dans un mode de pensée Bayesien, les données imparfaites permettent de tirer des conclusions dont la crédence est potentiellement limitée, mais si des données nouvelles ne modifient pas votre point de vue, c'est qu'il n'y a aucune variance à votre a-priori (et donc que rien ne peut vous faire changer d'avis).