February 17, 2025

Télécharger internet

theinternet.zip : les systèmes d'intelligence artificielle ont besoin de données humainement générées, et fiables, pour apprendre et générer des modèles utiles et génériques. D'où viennent ces données ? Notamment d'internet (qui contient un peu de tout). L'organisme "Common Crawl" télécharge et partage un corpus de pétaoctets de donnés (petabytes of data), collectées régulièrement depuis 2008. Dans la vidéo ci-après "L'IA est en train de s'empoisonner elle-même (et personne n'en parle)", l'intervenante Loubna Ben Allal (HuggingFace) évoque le chiffre de 200 à 400 téraoctets (non comprimés) de données par mois. Grand amateur de théorie de l’information et de compression de données, c'est l'occasion de repartager ce gif animé (datant d'avant au moins 2006) qui m'amuse encore. Rappel : la plupart des formats de compression que l'on utilise encore aujourd'hui quotidiennement (hormis pour la vidéo) sont de conception antérieures à l'an 2000. : zip, mp3, png, gif, mpeg.
 

Download the internet (zipped)

L'IA est en train de s'empoisonner elle-même (et personne n'en parle)
https://www.youtube.com/watch?v=AfgAEIK9F8c

February 16, 2025

L'ntelligence naturelle de Jorge Luis Borges

Quasi-inconditionnel amateur de l'écrivain Jorge Luis Borges, je frétillais à ce partage (merci KP) : "Jorge Luis Borges et la Machine à Fiction (CMS #1)". Une vidéo inspirée de l'article de 2023 "Borges and AI" de Léon Bottou et Bernhard Schölkopf. Un titre inspiré de "Borges and I", de Borges (par) lui-même. Je deviens sûrement trop vieux pour ce type de montage. On peut allègrement passer les 5'30" initiales, et apprendre quelques analogies intéressantes, fondées sur deux superbes textes de l'auteur argentin : "Le jardin aux sentiers qui bifurquent", et la célèbre "Bibliothèque de Babel" (qui a méchamment inspiré "Le nom de la Rose"). Cependant, si l'on réfléchit à deux des questions tempestives --- 1) les limites d'échelle des LLM quant aux donnés générées par des humains ("data wall") ou l'empoissonnement des données 2) l'impact sur des destinées humaines des systèmes de recommandation opaques estampillées #AI pour Intelligence Artificielle (est-ce tant piller ?), deux autres nouvelles du bibliothécaire de Buenos Aires méritent votre attention : "Funes ou la mémoire" (questions d'insomnies) et "La loterie à Babylone". Bref, par temps de froid, plutôt que de "prompter", lisez et relisez un auteur majeur du réalisme magique, plutôt que de succomber à la pensée magique entourant la hype-LLM. En écrivant ceci, je suis conscient de nourrir la bête. Peut-être avec un alicament ? Quelques lectures en commentaires.

"Jorge Luis Borges et la Machine à Fiction (CMS #1)" par Artificialis
https://youtu.be/Ic6HfP97e6k?t=327

"Borges and AI" by Léon Bottou and Bernhard Schölkopf
https://arxiv.org/abs/2310.01425

"Borges and I"  (Spanish "Borges y Yo") : "Borges's story raises many philosophical questions of Self and epistemology. Viewed through the analytic lens of Russell's knowledge by description, the story explores the interesting concept of knowledge of Self by description (as opposed to the more expected knowledge by acquaintance)"
https://en.wikipedia.org/wiki/Borges_and_I

Will We Run Out of Data? Limits of LLM Scaling Based on Human-Generated Data
https://epoch.ai/blog/will-we-run-out-of-data-limits-of-llm-scaling-based-on-human-generated-data

(Re)reading Borges in the AI Era
https://www.ie.edu/insights/articles/rereading-borges-in-the-ai-era/

Has AI scaling hit a limit?
https://foundationcapital.com/has-ai-scaling-hit-a-limit/

January 1, 2025

AIchronIA: time with artificial intelligence and space (aitopia, utopia)

 As artificial intelligence invades all domains of so-called "reality", remember that utopia was a antecedent to science-fiction. After Thomas More Utopia book (1516), this fictional "perfect" democratic society, in contrast to the then monarchies. Describing this on a far-away non-reachable place was a means to avoiding difficulties (from clerics, kings). Since then, this word describes an imaginary society possessing desirable traits (equality in justice, origin, economics, harmony etc.). Or the converse: a extremely unwishable place. It was altered to eutopia (eu- for good, or optimstic : Plato's "Republic", Tommaso Campanella's "City of the sun", Samuel Butler's "Erewhon", aka nowhere, almost backward) or dystopia (dys- for bad or pessimistic, think about 1984, "We" by Yevgeny Zamiatin, "Brave new world" by Aldous Huxley). In speculative fiction, one distinguishes subgenres like utopian/dystopian fiction. 

It can be extended to uchronia (or dyschronia) when we include different paths in time, like alternate history.

With the advent of "artifical intelligence", let us use the neologism "AIchronIA", inspired by a tweet by Greg Egan of LLM (or Large Language Models)

Don’t forget that in 2025, the days of the week will be determined by your favourite LLM, trained on day/month pairs from 2004-2023. So Jan 2 will have odds of: 

  • 1/10 of being Tuesday or Thursday
  • 3/20 of being Wednesday, Friday, Saturday, Sunday
  • 1/5 of being Monday

With generative IA, we are bound to new calendars.As time and space are intricate, we may not need the relative term AItopIA. Not yet.

Note: this idea could be related to "IA" meaning "Intelligence artificielle" in French (and possibly other latin-based languages), being a suffix -ia, like in Brian Aldiss sci-fi trilogy Helliconia.



March 6, 2024

Forfait Joule : grandeurs et unités du temps de travail

[Article très provisoire, pour arriver à la notion professionnelle de "forfait Joule" #ToutCaPourCa]

Quand on parle de travail que l'on fait, arrivent très vite les notions de temps et d'argent. Le taux horaire indique la rémunération pour une heure de travail.

Dans mon organisation, pourtant pourvue de chimistes, de thermiciennes, de physiciens, les ressources humaines et l'essentiel des managers restent très attachés au "travailler plus vite, plus longtemps, plus tard". Tout cela en heures, comme le rappelle "La pompe moderne" (aka "The Brassens") de la reprise de Daft Punk, "Plus dur, meilleur, plus rapide, plus fort" (Harder, Better, Faster, Stronger). Un vrai hymne olympique au boulot.

Or, quand le système s'enraille, on parle de "burn ou". Une extinction temporaire de l'envie ou la capacité à travailler. Une vraie bonne question d'énergie.

Tout cela pour dire que dans le système international (SI) des unités physiques, sept unités sont primordiales (à détailler)

Que représente un Joule, unité dérivée ? En physique, le joule s'exprime en exprime en  1 J = 1 N.m = 1 kg. m2: le travail exercé par la force d'un Newton dont le point d'application se déplace d'un mètre dans la direction de la force. 

 

Le salaire minimum interprofessionnel de croissance (Smic) est le salaire horaire en dessous duquel il est interdit de rémunérer un salarié, et ce, quelle que soit la forme de sa rémunération (au temps, au rendement, à la tâche, à la pièce, à la commission ou au pourboire). Le Smic s’applique sur l’ensemble du territoire métropolitain, en Guadeloupe, en Guyane, en Martinique, à la Réunion, et dans les collectivités d’Outre-mer de Saint-Barthélémy, de Saint-Martin et de Saint-Pierre-et-Miquelon.
https://www.urssaf.fr/portail/home/taux-et-baremes/smic.html

Smic horaire brut

Montants au 1er janvier 2024

Cas général     11,65 €     1 766,92 €
Salariés entre 17 et 18 ans (abattement de 10 %)     10,48 €     1 590,22 €
Salariés de moins de 17 ans (abattement de 20 %)     9,32 €     1 413,53 €

Le minimum garanti est fixé à 4,15 €.
Pour Mayotte : Smic brut horaire 8,80 € et Smic brut mensuel : 1 334,67 € (35 heures hebdomadaires). 





August 8, 2023

Weird Fishes Arpeggi : drôles de poissons (Radiohead)

 "I can't sleep with your memory"

 Weird Fishes / Arpeggi were caught in my top ten (and more) net song list. The song is from 2007 album "In Rainbow" by English rock band Radiohead. It popped up (once again) this summer on Mount Lozère (mont-Lozère, mont Losera). 

Grizac Castle, home of  Pope Urban V, born in 1310 as Guillaume de Grimoard

I was up to Grizac Castle (France, Occitanie, Lozère) from La Vernède (in a house, where very seemingly Robert Louis Stevenson stopped at with she-donkey Modestine), along GR 670, where Pope Urban V was born in the château in 1310 with the name Guillaume de Grimoard.

 
Grizac, Maison des totems (Jac cactus Mauduy)

One of the first houses welcomes you with "outside art" or "art brut", made of carved/painted wooden cuts. A home for Jacques (Cactus) Mauduy. Suddenly... weird fishes:

 Grizac, Maison des totems : Drôles de poissons, Weird Fishes/Arpeggi (Radiohead reminiscence)

I like synesthesia: when your nerve system routes signals through different/unrelated media. Like our senses get bitten by the worms... and weird fishes. Here are a couple of versions and nice covers. One of the weirdest being Weird Fishes flying animation by Tobias Stretch

 
Radiohead - Weird Fishes - Flying animation by Tobias Stretch 

For electro-fans (summer is here), the Arpeggi adaptation by Kelly Lee Owens in her Inner songs is great. Here are a handful of excellent versions:

"That look on my face was just pride"


August 13, 2022

#SODA un hashtag (mot-dièse) pour le partage d'information ?

Pourquoi #SODA ? Comme acronyme de "Sans Obligation D'Achat", pour le partage d'information à évaluer. Une proposition de mot-dièse ou de hashtag, voire d'objet.

Hashtag SODA pour "sans obligation d'achat"

Par la parole, par écrit, par SMS, par email, sur les réseaux sociaux... Une règle d'or est de vérifier l'information que l'on partage, diffuse (ou sinon de garder le silence). Et l'on ne sait pas tout vérifier dans un temps limité. 

Par ailleurs, l'on peut diffuser de l'information parce que l'on pense que le/la destinataire saura mieux  que vous en profiter. Exemple : je reçois une nouvelle dans le domaine un domaine médical précis (je ne suis pas médecin), par exemple une information tenue sur un effet sanitaire d'un vaccin. Il en arrive des tonnes, séparer le bon grain de l'ivraie est difficile. Mais cette info me semble (intuition) contenir un plus que je ne suffis pas. Si je choisis spécifiquement de la partager avec un ami épidémiologiste, c'est parce que je crois que cela peut l'intéresser, et qu'il saura mieux l'interpréter. Puis m'en dire plus, pointer une erreur... Gagnant-gagnant comme on dit.

Pour les diffusions plus larges, moins focalisées, à un groupe d'amis, une liste email, sur un réseau social, l'idée de base est analogue : l'un des récipiendaires pourra faire un commentaire utile, ajouter une source plus fiable, émettre un avis nuancé. Elle (l'idée) se complète par la dynamique propre aux réseaux sociaux : l'information se propage à d'autres personnes pouvant la jauger, et les fameux "algorithmes" peuvent vous proposer des contenus similaires.

Et alors, quel est mon problème ? Par probité intellectuelle, je passe bien au temps à ponctuer mes messages de circonlocutions fastidieuses pour dire : pour ton information, je ne suis pas sûr, ça mérite discussion, je ne comprends pas tout, avec toutes les précautions nécessaires, etc. Et parfois, je l'avoue, j'ai la flemme d'écrire ces précautions oratoires, et cela freine mes envois informatifs. Et souvent (Matodon, Twitter), le nombre de caractères est limité

Pour dire tout cela à la fois (et en même temps), je propose ce hashtag/mot-dièse plutôt francophone : l'acronyme #SODA pour "Sans Obligation D'Achat". Je n'en ai pas trouvé d’occurrence antérieure. C'est un peu comme l'ancien SGDG ou "Sans Garantie Du Gouvernement", mention légale dégageant la responsabilité de l'État quant à des dispositifs brevetés. Ce fut établi en 1844, la mention à disparu en 1968 en France, mais elle aurait encore cours en Belgique. 

Nota : le symbole ≜ (égal avec delta) signale en mathématique ou physique une définition. Dont je cherche toujours l'origine : Who first defined the "equal-delta" or "delta over equal" (≜) symbol? 

Linking dots: Information, Knowledge, Conspiration theory

July 26, 2022

ING bank scam : act 00 exposition

I live in France. In my life, I moved a lot. I had to open several novel bank accounts, because of regulations, regional rules, offers etc. OK. Traditional local banking went (for me) to a limit in terms of quality of service. It was always: "because of the computer" or "delay in central services". I had never been negative in bank deposit (except once with a mistake from SoGénAl), in the 1995's.

I therefore tried online banking, with a debit card, with two options:  MonaBanq, and ING Direct.The service was sleek, until it went so bad. MonaBanq was honest, ING Direct is  my worst direct banking experience ever. Now, I cannot access to my account. Your phone line cannot be reached

 

Let's wait for episode 01.

Télécharger internet

theinternet.zip : les systèmes d'intelligence artificielle ont besoin de données humainement générées, et fiables, pour apprendre et gén...