Yth a écrit 2671 commentaires

# Modélisation trop longue à débugger

Posté par Yth (Mastodon) le 19 décembre 2022 à 11:42. En réponse au message Avent du Code, jour 19. Évalué à 4. Dernière modification le 19 décembre 2022 à 11:44.
J'ai passé un temps fou à débugger ma modélisation pourtant pas si complexe.
Après j'ai rapidement constaté que l'approche naïve était idiote et explosive, donc j'ai testé deux limitation de l'exploration des possibilités :
- Si on peut construire un extracteur de géode, on le fait, c'est capital si on peut produire un robot-géode par tour, on ne fait plus que ça.
- On limite le nombre de robot de chaque type au coût maximal d'un robot pour ce type de ressources.
C'est empirique, j'ai juste testé ces règles sans chercher plus loin : ça valide les données de test !
Donc j'ai testé les données réelles et bingo.

En terme de stats pour les données de test, le nombre de possibilités testées :
- 85 156 pour le premier schéma en 24s.
- 47 477 pour le second schéma en 24s.
- 14 042 636 pour le premier schéma en 32s.
- 3 778 241 pour le second schéma en 32s.
Et 2 minutes 20 pour trouver ça, yuk…
Sur les données réelles, j'explore au total 492 462 chemins sur l'exercice 1, avec 30 schémas, et 4 661 927 chemins sur l'exercice 2 avec 3 schémas (les éléphants ont bouffés les autres schémas).
Ce qui ne prend que 44 secondes, donc les données réelles sont plus cool que les données de test, pour une fois.
- Yth, mélange d'intuition, et de mains gauches aujourd'hui.

[^] # Re: Plus cool que les jours précédents

Posté par Yth (Mastodon) le 18 décembre 2022 à 16:55. En réponse au message Avent du Code, jour 18. Évalué à 5.

J'ai jamais appris les algos classiques, Djikstra, BFS, A* etc, tendance à réinventer la roue à chaque fois.
Mais je faisais pareil en prépa avec les preuves de théorèmes à apprendre par cœur : jamais réussi, je voyais pas l'intérêt quand il suffisait de refaire la preuve en direct au tableau…

Bref, des set(), des unions, des différences, des intersections, pas besoin d'aller bien plus loin en Python, l'espace à analyser est tout petit, 10k cases, c'est rien, quand on sort d'une tour infernale de mille milliards de cube Tetris empilés sur une hauteur de quelques 1500 milliards…

Mon alog part des faces externes du pavé contenant notre rocher de lave en fusion, donc les 6 faces x=xmin, x=xmax, y=ymin, y=ymax, z=zmin, z=zmax.
Puis j'agrandis vers l'intérieur (si x < xmax/2 alors (x+1, y, z), sinon (x-1, y, z), pareil pour y et z), donc on a trois adjacents au lieu de six et on ne sort jamais de la zone.
On vire les cubes du bout de lave, on itère.
En 6 itérations c'est fini, on a tous les cubes de vide à l'extérieur, sur zone.
On prends les adjacents à la lave, on difference(lave), on intersection(exterieur), on remet dedans les cubes vides qui étaient hors zone.

Sinon on pouvait partir d'une zone de 1 plus grande dans chaque direction, et faire une itération de plus, mais bon, j'ai pas trouvé ça plus simple dans le code, et ça faisait passer à un espace de presque 13k au lieu de 10k, soit tout aussi négligeable, mais un peu moins.

J'ai modélisé une class Cube(tuple) pour mes triplets de coordonnées avec les property suivantes :
* adjacent pour les 6 cubes autour ;
* interior pour les 3 cubes vers le centre de la zone ;
* inside qui dit si un Cube est hors zone ou pas.
J'altère ma classe Cube une fois les données entièrement lues, pour fournir les bornes, et le milieu arrondi à l'entier pour marginalement gagner du temps de calcul en évitant les comparaisons entre entier et flottant. À noter que dans mon cas la division par deux est entière donc ça ne change rien. Et que le gain est marginal vu la taille des données.
Donc pas mal de préparation avant de lancer des calculs très simples au bout du compte.

class Cube(tuple):
    @property
    def adjacent(self):
        x, y, z = self
        yield Cube([x + 1, y, z])
        yield Cube([x - 1, y, z])
        yield Cube([x, y + 1, z])
        yield Cube([x, y - 1, z])
        yield Cube([x, y, z + 1])
        yield Cube([x, y, z - 1])

    @property
    def interior(self):
        x, y, z = self
        if x < self.mx:
            yield Cube([x + 1, y, z])
        elif x > self.mx:
            yield Cube([x - 1, y, z])
        if y < self.my:
            yield Cube([x, y + 1, z])
        elif y > self.my:
            yield Cube([x, y - 1, z])
        if z < self.mz:
            yield Cube([x, y, z + 1])
        elif z > self.mz:
            yield Cube([x, y, z - 1])

    @property
    def inside(self):
        for a, b, c in zip(self.minimum, self, self.maximum):
            if not (a <= b <= c):
                return False
        return True

cubes = {
    Cube(map(int, _.split(',')))
    for _ in sys.stdin.read().strip().splitlines()
}
x0 = min(x for x, y, z in cubes)
y0 = min(y for x, y, z in cubes)
z0 = min(z for x, y, z in cubes)
x1 = max(x for x, y, z in cubes)
y1 = max(y for x, y, z in cubes)
z1 = max(z for x, y, z in cubes)
rx = list(range(x0, x1 + 1))
ry = list(range(y0, y1 + 1))
rz = list(range(z0, z1 + 1))
Cube.minimum = (x0, y0, z0)
Cube.maximum = (x1, y1, z1)
Cube.mx = (x1 - x0) // 2
Cube.my = (y1 - y0) // 2
Cube.mz = (z1 - z0) // 2

# exo 1, une liste parce qu'on a des doublons, on veut les faces, pas les cubes.
exposed = [
    face
    for cube in cubes
    for face in cube.adjacent
    if face not in cubes
]
adjacent = set(exposed)

# Cubes adjacent au rocher, mais hors zone
adjacent_outside = {face for face in adjacent if not face.inside}
# Faces extérieures de la zone, hors cubes du rocher.
exterior = {Cube((x, y, z0)) for x in rx for y in ry}.union(
    {Cube((x, y, z1)) for x in rx for y in ry},
    {Cube((x, y0, z)) for x in rx for z in rz},
    {Cube((x, y1, z)) for x in rx for z in rz},
    {Cube((x0, y, z)) for y in ry for z in rz},
    {Cube((x1, y, z)) for y in ry for z in rz},
).difference(cubes)
# Algo de parcours de zone
interior = True
while interior:
    interior = {
        x
        for c in exterior
        for x in c.interior
    }.difference(exterior).difference(cubes)
    exterior.update(interior)
# Les cubes adjacent au rocher, mais pas à l'intérieur !
adjacent2 = adjacent.intersection(exterior).union(adjacent_outside)
# Et recalcul des faces exposées, mais uniquement à l'extérieur
exposed2 = len([1 for face in exposed if face in adjacent2])

print(f"{len(cubes)} Cubes")
print(f"{len(exposed)} Exposed faces (4604)")
print(f"{exposed2} Exterior faces (2604)")

Et voilà, à demain !

Yth.

[^] # Re: Linuxfr ?

Posté par Yth (Mastodon) le 18 décembre 2022 à 16:29. En réponse au lien Mort aux commentaires inutiles ! Écrivez des commentaires pertinents !. Évalué à 2.
On t'as dis d'aller écrire de la doc ! Allez, du vent…

Pfff.
- Yth.
[^] # Re: Peu d'obstacle?

Posté par Yth (Mastodon) le 18 décembre 2022 à 16:24. En réponse à la dépêche Le poste de travail Linux : un objectif gouvernemental ?. Évalué à 7.
C'est sous estimer la tâche. Une montée de version de Windows est déjà un investissement technique et du courage pour une DSI! Quid d'un changement d'OS!

C'est pareil, non ?
- Yth.
[^] # Re: Le Jour du Tetris

Posté par Yth (Mastodon) le 18 décembre 2022 à 15:28. En réponse au message Avent du Code, jour 17. Évalué à 2.
Et la solution, enfin, nous apparaît avec un mélange de brutalité et de finesse.

On reprend où on en était quand on croyait avoir raison : on vient de reboucler sur un état (n°block, n°instruction).
On compare avec un éventuel hash et snapshot enregistré pour cet état. La première fois qu'on boucle : on n'en a pas.
Donc on prend une photo, c'est à dire l'état du terrain sur l'ensemble des lignes qui forment le cycle potentiel, et uniquement elles (en gros : str(board[-(hauteur actuelle - hauteur d'avant):]).
On calcule le hash de cette photo pour comparer plus vite.
On stocke ces deux valeurs dans deux tableaux.

On continue, et maintenant on va revenir une troisième fois sur le même état ! Sauf que là on a un hash et une photo, on compare.
Si c'est différent, on remplace et on poursuit.
Si c'est identique, on valide en comparant la photo complète hein, faudrait pas planter sur une peu probable collision, et on a enfin trouvé un vrai cycle authentique et prouvé par une photo certifiée, avec signature !

On reprend l'algo là où on en était.
Et on constate que le premier vrai cycle commence au bloc 59 (!?!?! Mais… Pourquoi si peu ?), avec un cycle de 1705 blocs.
On a trouvé deux cycles rigoureusement identiques, le premier de 60 à 1764 et le second de 1765 à 3469.
Ils ont une hauteur de 2649 lignes, et on a donc comparé deux blocs de 2649 lignes de Tetris qui se suivent, et ils étaient rigoureusement identiques, et chacun des deux commence avec le même bloc à la même instruction. On cycle, c'est acquis.

La zone début + 2 cycles + fin fait toujours 4995 blocs, on ne simule pas un bloc de plus.
Et on a toujours un résultat valide, mais là on en est sûrs.
- Yth, et ben, m'auras pris la tête celui-là !
PS : Je nettoie un peu le code et je poste ça…
# Le Jour du Tetris

Posté par Yth (Mastodon) le 18 décembre 2022 à 10:53. En réponse au message Avent du Code, jour 17. Évalué à 2.
Suite à mes messages précédents, j'ai avancé dans la résolution efficace du problème, mais en réalité pas terminé.

Mon idée c'était qu'on cycle dès qu'on revient à un couple (n°block, n°instruction) qui est déjà passé, n°block c'est de 1 à 5, et n°instruction de 0 à 10091 chez moi (taille des données en entrée), et 0 à 39 pour les données de test.
Comme si ce seul état était déterministe, et que l'état du terrain n'entrait pas en ligne de compte.
Fourbement, ça suffit avec les données de test.

L'idée donc c'est générer des blocs en enregistrant à chaque itération la hauteur, on en aura besoin de quelques-unes à la fin.
Mais aussi on enregistre l'historique de l'état (n°block, n°instruction) et l'itération où elle s'est produite.

Dès qu'on a le sentiment de cycler, c'est à dire que notre état est déjà passé, on note l'itération où ça s'est produit la première fois, et la seconde.
La différence c'est la durée de notre cycle.
On a donc :
- la base non cyclique ;
- la durée d'un cycle ;
- la portion finale : (10**12-base)//cycle ;
- le nombre de cycle complet à inclure : (10**12-base)%cycle ;
- la hauteur ajoutée par un cycle hauteur[base+cycle] - hauteur[base] ;
En données de test ça fait une base de 14 blocs, un cycle de 35, une hauteur par cycle de 53.

Là on va simuler une tour complète en enlevant un maximum de cycles entiers au milieu, soit une hauteur de base + 2 cycles + fin, parce que avec un seul cycle on a des effets de bords.
Et on continue si nécessaire jusqu'à une hauteur de 2022 pour le premier exercice.

Là on a la hauteur à 2022, la hauteur ajoutée par un cycle, et la hauteur des extrémités avec deux cycles, on multiplie, on ajoute, on mélange à la bave de crapaud et hop, 1514285714288 sur les données de test.

En données réelles j'ai ce résultat :
Base de 39 blocs (?!?), cycle de 1725 (mais non c'est 1705 !!), et score final de 1555942028979 au lieu de 1553665689155.

L'idée est bonne, mais la réalisation craint un peu, la supposition de départ est fausse, je rappelle :

Comme si ce seul état était déterministe, et que l'état du terrain n'entrait pas en ligne de compte.

En pratique, je stocke comme état (n°block, n°instruction, représentation des X dernières lignes du terrain).
Et avec 995 lignes, j'atteins la vraie stabilité, la vraie base non cyclique, même si 14 suffisent pour trouver le résultat avec mes données.

Donc encore un peu de travail pour trouver vraiment le résultat sans le connaître à l'avance.

Par contre une unique construction de tour de 4995 blocs !
- Yth.
[^] # Re: Tetris style

Posté par Yth (Mastodon) le 18 décembre 2022 à 00:12. En réponse au message Avent du Code, jour 17. Évalué à 2.
Ah !
J'ai trouvé comment tout résoudre (ex 1 et 2) avec la simulation d'une seule tour, d'environ 3600 de haut pour mes données.
Je valide demain, ou lundi selon les exos de demain…
- Yth, dodo.
[^] # Re: Tetris style

Posté par Yth (Mastodon) le 17 décembre 2022 à 19:41. En réponse au message Avent du Code, jour 17. Évalué à 2.
Sachant que j'ai deux valeurs en dur pour la calcul du cycle :
1 million d'itérations max, et 2000 blocs à laisser passer.
Je n'ai aucune idée de comment déterminer des valeurs propres a priori, la boucle sort à la 3705è itération, donc j'ai de la marge avec 1 million…

Je sais que le cycle vaut 1705 et que je dois passer plus de 200, mais qu'à 300 ça passe, mais quid d'autres données ?
Donc j'ai pris large, passer 2000 lignes, et avoir un cycle de moins de 1 millions de blocs, mais en vrai, j'en sais rien.
Pas d'algo en tête pour ces valeur, ou même de calcul de maximum où je peux affirmer qu'avec ces valeurs là j'aurais forcément une réponse.
- Yth.
[^] # Re: Tetris style

Posté par Yth (Mastodon) le 17 décembre 2022 à 19:22. En réponse au message Avent du Code, jour 17. Évalué à 2. Dernière modification le 17 décembre 2022 à 19:23.
C'est plus compliqué que ça a priori.
Je n'ai pas de méthode de calcul du cycle, je le mesure en prenant des bornes assez grandes.

On a plusieurs problèmes :
- Trouver en combien de blocs on cycle, c'est à dire qu'en partant de l'ajout du premier bloc avec la première instruction, on revient à l'ajout du premier bloc avec la première instruction. Dans mon cas c'est en 1705 blocs, dans les données de test c'est en 35 blocs.
- Constater que le début de partie ne correspond pas du tout à un cycle répétitif, la situation est particulière, et le premier cycle commence… plus tard. Sur mes données il faut passer quelque chose entre 200 et 300 blocs pour démarrer le premier cycle.
- mesurer la hauteur ajoutée par un cycle complet normal en milieu de tour (donc pas le début, pas la fin).
- Et mesurer la fin, en haut, soit mille milliards modulo le cycle.
En pratique, il suffit de faire une tour de deux cycles plus la fin, on a un cycle normal et complet au milieu, donc on sait qu'on peut en rajouter autant qu'on veut, ça agrandira linéairement.

Le principe c'est ça, avec la fonction simulation() qui fait une simulation (ouais ouais ! Promis !), en paramètres les data, et le nombre de blocs à faire tomber. Elle retourne la hauteur finale. L'exercice 1 c'est l'appel avec 2022 blocs, et voilà.

Cas particulier, si je fournis un 3è paramètre, je laisse passer ce nombre de blocs, et je prend l'état (n° de bloc, n° d'instruction), et dès que je retrouve le même état, j'ai mon cycle, je sors la valeur !
Après on mesure, on calcule, ça marche.
```
data = sys.stdin.read().strip()
h1 = simulation(data, 2022)
print(f"Height of 2022 blocks: {h1}")

# Finding cycle length, knowing this limits would be enough
cycle = simulation(data, 1000000, 2000)
repeat, remain = divmod(1000000000000, cycle)
# Measuring 1 cycle, and 2 cycles, to determine what is the height added by one cycle in the middle.
h1c = simulation(data, cycle)
h2c = simulation(data, cycle * 2)
# All extremities with full cycle in the middle
# We can add any number of full cycles in the middle of this simulation, they'll add a fixed height.
hr = simulation(data, cycle * 2 + remain)
total = (h2c - h1c) * (repeat - 2) + hr
print(f"Cycle of {cycle} blocks, 1 Cycle {h1c}, 2 Cycles {h2c}, Cycle height {h2c-h1c}, Extremities height {hr}")
print(f"Total Height = {total}")
```
- Yth, comme prévu le samedi, j'ai moins de temps, commencé tard, mais c'était pas trop long…
[^] # Re: Ça chauffe, ça chauffe !

Posté par Yth (Mastodon) le 16 décembre 2022 à 23:07. En réponse au message Avent du Code jour 16. Évalué à 2. Dernière modification le 16 décembre 2022 à 23:09.
Pour le second tu dis qu'en prenant la solution du premier et en envoyant l'éléphant jouer avec les vannes non ouvertes par le premier, ça marche ?

Dingue ça…
Bon, 2min20 ça va au final, mais bigre… 37 millions de chemins testés !!!
- Yth.
[^] # Re: Une solution brillante

Posté par Yth (Mastodon) le 16 décembre 2022 à 15:28. En réponse au message Avent du Code jour 15. Évalué à 2. Dernière modification le 16 décembre 2022 à 15:29.
Ah, c'est pas mal en effet !
Plus d'init ou de repr, voire un triage automatiquement généré, ça va faire gagner du temps ce truc…
- Yth, mon implémentation des intersection est sérieusement buggée…

[^] # Re: Ça chauffe, ça chauffe !

Posté par Yth (Mastodon) le 16 décembre 2022 à 14:03. En réponse au message Avent du Code jour 16. Évalué à 4.

Côté algo :
* on crée nos valves (ou vannes, osef) ;
* on lie les objets les uns aux autres pour les liaisons directes ;
* on explore de proche en proche pour enregistrer la liste des autres valves avec la distance pour y aller depuis chaque valve ;
* on n'optimise pas en stockant la distance retour dans la valve distante, vu mon algo ça pouvait empêcher la valve distante de calculer certaines distances, modélisation fausse, résultat faux, et les données de test ne sont pas affectées ;
* on parcours à nouveau nos valves et on supprime les chemins vers les valves à flux nul, on réduit le problème aux seules valves utiles (15 en situation réelle, 6 en test), mais avec des distances complètes.

Là on ne cherche plus à se déplacer, juste à mesurer le temps qui passe à partir d'ici ou de là.
Et donc pour chaque situation :
* valve où on se trouve
* temps restant
* score final actuel (dès qu'on ouvre une valve on calcule directement toute la vapeur dégagée jusqu'au bout du temps imparti)
* liste des valves ouvertes

On calcule le score final en allant ouvrir chaque vanne accessible.

On récurse à partir de chaque destination possible (vannes encore ouvertes), et une fois au bout, soit du temps disponible (données réelles), soit de vannes à ouvrir (données de test), on a un chemin avec un score.

On ne retourne que le meilleur score, et pas tous les chemins trouvés, sinon on explose la RAM et la durée.
Et à la fin on a notre résultat.

class Valve:
    def __init__(self, name, flow, links):
        self.name = name
        self.flow = int(flow)
        self.locallinks = links.strip().split(", ")
        self.links = dict()
        # considering valve with no flow as already opened
        self.open = self.flow == 0

    def __repr__(self):
        return f"{self.name}@{self.flow}: {' '.join(f'{n.name}:{d}' for n, d in sorted(self.links.items()))}"

    def __lt__(self, other):
        return self.name < other.name

    def linkvalves(self, valves):
        self.valves = valves
        self.locallinks = [valves[link] for link in self.locallinks]
        # self.links = {link: 1 for link in self.locallinks}
        self.links[self] = 0

    def graph(self):
        explore = {self, }
        distance = 0
        while explore:
            distance += 1
            step = set(
                link
                for valve in explore
                for link in valve.locallinks
                if link not in self.links
            )
            for valve in step:
                self.links[valve] = distance
            explore = step

    def reducegraph(self):
        self.links = {
            link: score
            for link, score in self.links.items()
            if link.flow
        }

    def getscores(self, timeleft, currentscore, opened):
        self.scores = dict()
        for link, distance in self.links.items():
            timeafter = timeleft - distance - 1
            # valve already opened or too far to be useful
            if link in opened or timeafter <= 0:
                continue
            self.scores[link] = currentscore + timeafter * link.flow, timeafter
        return self.scores

regex = re.compile(
    r"Valve ([A-Z]+) has flow rate=(\d+); "
    r"tunnels? leads? to valves? ([A-Z, ]+)")
valves = {
    v.name: v
    for v in (
        Valve(*regex.match(line).groups())
        for line in sys.stdin
    )
}
for valve in valves.values():
    valve.linkvalves(valves)
for valve in valves.values():
    valve.graph()
for valve in valves.values():
    valve.reducegraph()

def nextscores(valve, currentscore, timeleft, opened, currentpath):
    path = valve.getscores(timeleft, currentscore, opened)
    if not path:  # end of the line !
        return currentscore, timeleft, currentpath, 1
    explored = 0
    r = (0, 0, "", 0)
    for link, (score, time) in path.items():
        x = nextscores(
            link,
            score,
            time,
            opened + [link],
            currentpath + "->" + link.name
        )
        explored += x[-1]
        r = x if x > r else r
    return r[0], r[1], r[2], explored

score, time, path, explored = nextscores(valves['AA'], 0, 30, [], 'AA')
print(f"Score {score}, explored {explored} paths : {path}")

Pour l'exercice 2 on conserve la même modélisation, aucun changement.
La fonction d'exploration change : on lui fourni deux explorateurs, chacun avec son chemin parcouru, et son temps restant.
Et on travaille sur l'explorateur qui a le plus de temps disponible à chaque itération.

class explorer:  # pour se simplifier la vie
    def __init__(self, valve, timeleft, path=None):
        self.valve = valve
        self.timeleft = timeleft
        self.path = path or valve.name

    def __call__(self, s):
        return f"{self.path}->{s}"

    def __repr__(self):
        return f"time remaining {self.timeleft} {self.path}"

    def __lt__(self, other):
        return self.timeleft < other.timeleft

def doublescores(e1, e2, currentscore, opened):
    if e1 < e2:  # look using the explorer with the most time remaining
        e2, e1 = e1, e2
    path = e1.valve.getscores(e1.timeleft, currentscore, opened)
    if not path:  # end of the line !
        return (currentscore, e1, e2, 1)
    explored = 0
    r = (0, 0, "", 0)
    for link, (score, time) in path.items():
        x = doublescores(
            explorer(link, time, e1(link.name)),
            e2,
            score,
            opened + [link],
        )
        explored += x[-1]
        r = x if x > r else r
    return r[0], r[1], r[2], explored

score, p1, p2, explored = doublescores(
    explorer(valves['AA'], 26),
    explorer(valves['AA'], 26),
    0,
    [],
)
print(f"Score {score}, explored {explored} paths, {p1} {p2}")

Et voilà, on a bien perdu du temps et fait chauffer la machine.

Yth.

[^] # Re: C'est trop pour moi

Posté par Yth (Mastodon) le 16 décembre 2022 à 13:45. En réponse au message Avent du Code jour 16. Évalué à 3.
Ça prend du temps là, je vais avoir du mal ce week-end.
Et faut que je rattrape le temps perdu au boulot…
À un moment ça va craquer aussi.
- Yth.
# Ça chauffe, ça chauffe !

Posté par Yth (Mastodon) le 16 décembre 2022 à 13:43. En réponse au message Avent du Code jour 16. Évalué à 3.
Et 6h30 après la publication du problème, il n'y avait que 2500 personnes à avoir eu une solution complète.
Pour ma part j'ai mis 25 minutes à coder la seconde partie à partir de la première, et la valider sur les données de test, en pleine visio boulot.
Puis 5 minutes à installer pypy et vérifier comment ça marche (réponse : bien).
Et 15 minutes de calculs pour avoir une solution… (J'ai killé la version cpython au bout de 20 minutes)
J'ai laissé tourner en espérant que ça allait marcher.

À noter que je stocke tous les chemins, puis je trie et je pond le dernier.
C'est utile pour le débuggage, mais complètement crétin : on peut toujours comparer au fur et à mesure et ne conserver que le dernier !

Fallait s'en douter déjà : sur les données de test, j'explore toujours les 720 possibilités, donc il y a sûrement une optimisation possible, pourtant aujourd'hui j'ai suivi mon conseil : réfléchir avant d'agir.
Pas assez…

J'ai recodé pour ne garder en mémoire que le meilleur chemin, et pas tous les chemins triés après coup.
Données de test, avec python3, plus rapide que pypy3 sur un délais aussi court :
Ex1 en 0.05s : Score 1651, 720 chemins explorés
AA->DD->BB->JJ->HH->EE->CC
Ex2 en 0,07s : Score 1707, 720 chemins explorés
AA->JJ->BB->CC AA->DD->HH->EE

Données réelles, avec pypy :
Ex1 en 0,5s : Score 1871, 106 839 chemins explorés
Ex2 en 2min21 : Score 2416, 37 306 254 chemins explorés

Et là, je réalise que les 15 minutes c'était 13 minutes pour afficher 37 millions de foutues lignes dans mon terminal débile, et peut-être un peu de temps pour gérer la RAM explosive de la liste de 37 millions d'entrées, et la trier à la fin…

Non mais sérieux…

Au passage cpython prends 2,1 secondes pour l'exo 1 réel contre 0,5 secondes pour pypy3.
Mais pour l'exo 2, pypy prend 2min21 quand cpython monte à plus de 20 minutes (il a pas terminé là).
pypy3 prend 108Mo de RAM, fixe quand on fait pas le crétin.
cpython3 reste à 12Mo de RAM, là aussi quand on ne fait pas l'idiot.
Et j'ai découvert que quand la RAM se réduit, Firefox décharge naturellement les onglets ouverts, pour rétrécir plutôt que de mourir !

Donc merci à Steph pour l'idée d'utiliser pypy :)
- Yth.
[^] # Re: Force Brute.

Posté par Yth (Mastodon) le 16 décembre 2022 à 11:27. En réponse au message Avent du Code jour 15. Évalué à 2. Dernière modification le 16 décembre 2022 à 11:27.
Alors j'ai un bug : il faut écrire if s > xmax + 1: à la place de if s > xmax:.

Paradoxalement ça ne pose aucun problème avec les données réelles, mais ça bugge avec les données de test, où sur un bord entre deux zone, adjacentes sur 6 cases, je trouve des trous que je ne devrais pas trouver.

Bref.
- Yth.

[^] # Re: Force Brute.

Posté par Yth (Mastodon) le 15 décembre 2022 à 19:08. En réponse au message Avent du Code jour 15. Évalué à 2.

D'ailleurs, en utilisant la technique de l'exercice 2 on peut refaire l'exercice 1 en immédiat :

# Pas de zone comme pour l'exo1, on retourne les intervalles comme pour l'exo2
class RobotSensor:
    def __init__(self, *args):
        self.sx, self.sy, self.bx, self.by, *self.other = args
        self.distance = manhattan(*args)

    def __contains__(self, line):
        return abs(self.sy-line) <= self.distance

    def __getitem__(self, line):
        deltax = self.distance - abs(self.sy-line)
        return self.sx-deltax, self.sx+deltax

sensors = [RobotSensor(*(int(x) for x in line)) for line in data]
r = sorted([sensor[line_to_check] for sensor in sensors if line_to_check in sensor])

xmin, xmax, holes = r[0][0], 0, 0
for s, e in r:
    if s > xmax:
        holes += s - xmax
    xmax = max(xmax, e)
beacons = len(set(s.bx for s in sensors if s.by == line_to_check))
result1 = xmax - xmin + 1 - holes - beacons
print(f"No beacon on {result1} positions"
      f" [{xmin}->{xmax}, {holes} holes and {beacons} beacons]\n")

Le calcul est immédiat.

Yth.

[^] # Re: Une solution brillante

Posté par Yth (Mastodon) le 15 décembre 2022 à 18:51. En réponse au message Avent du Code jour 15. Évalué à 2.
Ah, c'est joli ça, oui !
Comme quoi on ferait mieux de réfléchir avant d'agir hein…
- Yth.
[^] # Re: Force Brute.

Posté par Yth (Mastodon) le 15 décembre 2022 à 13:05. En réponse au message Avent du Code jour 15. Évalué à 2. Dernière modification le 15 décembre 2022 à 13:05.
En très pythonesque, l'itération par nombre premier se fait comme ça :
```
def iter():
    step, line = 747319, zone
    while True:
        yield line
        line = (line + step) % zone

for line in iter():
    ...
```
- Yth.
[^] # Re: Force Brute.

Posté par Yth (Mastodon) le 15 décembre 2022 à 12:40. En réponse au message Avent du Code jour 15. Évalué à 2.
Voilà le code à rajouter, on refait la classe en ZoneSensor pour retourner les bornes de l'intervalle sur une ligne, et à l'intérieur de la zone [0, 4000000] :
```
class ZoneSensor:
    def __init__(self, *args):
        self.sx, self.sy, self.bx, self.by, self.zone, *self.other = args
        self.distance = manhattan(*args)
    def __contains__(self, line):
        return abs(self.sy-line) <= self.distance
    def __getitem__(self, line):
        deltax = self.distance - abs(self.sy-line)
        return max(0, self.sx-deltax), min(self.zone, self.sx+deltax)

zone = line_to_check * 2
sensors = [ZoneSensor(*(int(x) for x in line), zone) for line in data]
try:
    for line in range(zone, -1, -1):
        r = sorted([sensor[line] for sensor in sensors if line in sensor])
        if r[0][0] != 0:
            raise BaseException(0, line)
        xmax = 0
        for s, e in r:
            if s > xmax:
                raise BaseException(s-1, line)
            xmax = max(xmax, e)
        if xmax != zone:
            raise BaseException(zone, line)
    print("Nothing found, there is a bug")
except BaseException as e:
    x, y = e.args
    print(f"Beacon on position {x}, {y}, value={x*4000000+y}")
```
Le sorted au début de la boucle va ordonner par le premier élément du tuple, donc le début des intervalles, puis en cas d'égalité par le second. A partir de là on sait que les intervalles vont de gauche à droite.
On note la fin de notre intervalle consolidé, et si l'intervalle suivant commence après, bingo, on a trouvé !
On teste vite fait au début ou à la fin, si notre case à trouver ne serait pas au début ou à la fin, et voilà.

Et bien sûr, on va pas se fouler, exception quand on a trouvé quelque chose : on arrête tout et on jubile !

À noter que je pars de la ligne du bas, mon nez m'a dit que l'auteur allait fourber et mettre la ligne à trouver vers la fin, j'avais raison, la mienne est la 3 391 794.
C'est peut-être là où je gagne le plus de temps en fait.
Sinon, pour essayer d'avoir de la chance, on peut parcourir la zone avec un index qui se balade en parcourant tout.
- step = un nombre premier avec 4000000
- i = 4000000 # parce que line % 4000000 ne vaudra jamais 4000000
- i = (i + step) % 4000000
En moyenne on va mettre pareil que si on ne sait pas où est la ligne, mais on tape au milieu dès le début et comme la probabilité que l'auteur n'ait pas mis sa ligne proche du bord, pour empêcher la force brute, est assez élevée, on a plus de chance d'avoir de la chance.
De l'autre côté (lignes croissantes de 0 à 4000000) ça prend 1min11s, et bien sûr on a le même résultat.
Avec un step de 747319 (nombre premier, donc premier avec 4000000, choisi au pif), je trouve le résultat en 49 secondes, assez proche de la moitié de la recherche totale ((1m11s+19s)/2=45s).
- Yth.
# Force Brute.

Posté par Yth (Mastodon) le 15 décembre 2022 à 10:35. En réponse au message Avent du Code jour 15. Évalué à 2. Dernière modification le 15 décembre 2022 à 10:37.
Soyons honnêtes, le premier exercice, je l'ai bourriné en force brute.
Objectif : soit une ligne donnée, trouver le nombre de cases qui ne contiennent pas de balises.
Donc les cases visibles par une robot-senseur quelconque, moins les balises sur la ligne (piège, haha !).

Je suis tombé dans un autre piège : il faut scanner la ligne 2 000 000, mais pour l'exemple (pour valider le code) il faut scanner la ligne 10. Mais bon, la réponse pour la ligne 10 du problème complet, c'pas la réponse attendue, bref…

La méthode bourrine :
* pour chaque robot-senseur qui voit la ligne donnée :
* faire un set() des cases vues set(range(début, fin)) ;
* union des sets() ;
* compter sa taille ;
* lister pour chaque robot-senseur sa balise, si elle est sur la bonne ligne ;
* supprimer les balises trouvées.

Ça marche en 1,25 secondes sur les données réelles, le résultat étant de 5838453 on a quand même fait un set-comprehension en double boucle d'une taille non négligeable.
La rumeur comme quoi Python c'est lent, c'pas toujours vrai hein, ya aucune optimisation dans mon code.
```
import sys
import re
def manhattan(x1, y1, x2, y2, *args):
    return abs(x1-x2) + abs(y1-y2)

class Sensor:
    def __init__(self, *args):
        self.sx, self.sy, self.bx, self.by, *self.other = args
        self.distance = manhattan(*args)
    def __contains__(self, line):
        return abs(self.sy-line) <= self.distance
    def __getitem__(self, line):
        deltax = self.distance - abs(self.sy-line)
        return range(self.sx-deltax, self.sx+deltax+1)

# inputs
line_to_check = 2000000 if len(sys.argv) <= 1 else int(sys.argv[1])
zone = line_to_check * 2
regex = re.compile(
    r"Sensor at x=(-?\d+), y=(-?\d+): "
    r"closest beacon is at x=(-?\d+), y=(-?\d+)")
data = [
    regex.match(line).groups()
    for line in sys.stdin
]
sensors = [Sensor(*(int(x) for x in line), zone) for line in data]

result1 = len(set(
    pos
    for sensor in sensors if line_to_check in sensor
    for pos in sensor[line_to_check]
)) - len(set(s.bx for s in sensors if s.by == line_to_check))
print(f"No beacon on {result1} positions\n")
```
Pour l'exercice 2, la méthode bourrine est hors de question.
Parce que sinon, mon PC serait toujours en train de calculer là.
Et l'énergie coûte plus cher que mon temps de cerveau disponible.
Optimisé, ça prend quand même 19 secondes, le ventilo a le temps de décoller.
- Yth.
[^] # Re: Beaucoup de temps pour animer et afficher joli

Posté par Yth (Mastodon) le 14 décembre 2022 à 16:34. En réponse au message Avent du Code, jour 14. Évalué à 2.
[^] # Re: Beaucoup de temps pour animer et afficher joli

Posté par Yth (Mastodon) le 14 décembre 2022 à 16:05. En réponse au message Avent du Code, jour 14. Évalué à 2.
Au passage, les images sont générées comme un bourrin :
- capture d'écran du terminal ;
- découpe avec Gimp ;
- redimensionnement pour avoir des caractères de 2x2 au lieu de 4x7 (taille minimale de terminology que j'utilise) ;
- réduire le nombre de couleurs à 3 (4 si je faisais une carte avec les rochers, le sable et les zones protégées) ;
- passer par trimage (qui doit faire un optipng ou pngcrush) ;
- et avoir des fichiers image minuscules :)
Yth.
[^] # Re: Beaucoup de temps pour animer et afficher joli

Posté par Yth (Mastodon) le 14 décembre 2022 à 16:01. En réponse au message Avent du Code, jour 14. Évalué à 2. Dernière modification le 14 décembre 2022 à 16:01.
Et maintenant, on allume le cerveau :

Pour l'exercice 2, la base se calcule trivialement : le sable formant une pyramide, on sait qu'il va de 500-hauteur à 500+hauteur, vu qu'on a 174 de haut (de 0 à 173), la coursive est en 174, et le sol en 175, le sable s'entasse donc de 326 à 674, et le sol doit s'étendre une case plus loin : de 325 à 675, comme « triché » dans mon code, sauf que ça se calcule de façon sûre avec d'autres données en entrée.

Pour l'exercice 2 encore, et suivant la remarque de Tanguy sur les zones protégées par les rochers pour calculer des surfaces :
On va créer des cases « dark » sous les lignes.
Une ligne de (x1, y1) à (x2, y2) avec x1<=x2 va générer une ligne protégée de gauche à droite de (x1+1, max(y1, y2)) à (x2-1, max(y1, y2)), donc si x1+1>x2-1 (ça arrive quand x1==x2, ligne verticale, ou quand la ligne horizontale fait 2 de large : x2=x1+1) on ne met rien.
Après on peut filtrer les cases bouchées (dark et rocher) sur la zone de pyramide de sable, c'est à dire quand 500-y <= x <= 500+y pour chaque élément. Ici on ne supprime rien, donc on n'a pas à gérer d'éventuels effets de bord, avec une plateforme qui dépasse de la pyramide de sable et peut protéger une zone qui serait ensevelie si la source du sable était plus haute.
La taille de la pyramide est, en prenant le triangle de droite et en le posant retourné au dessus du triangle de gauche, un carré de la hauteur totale, soit 175^2 = 30625 grains potentiels.
Ici ça ne suffit pas : un mur vertical sous une plate-forme va protéger une zone. Donc il faut ne pas réduire la ligne sur un côté si on a un rocher juste là.
Les données en entrée ne sont pas collaboratives, donc en fait on essaie toujours d'élargir la plate-forme qu'on considère pour la zone protégée du dessous, sur la gauche et la droite, puis on protège la ligne en dessous en retirant un élément à gauche et un à droite.
-> Ça fonctionne, il faut juste faire très attention à protéger une ligne en dessous des derniers rochers, le niveau de la coursive, mais pas plus bas au niveau du sol et en dessous, en traitant les données en flux on n'a pas la taille de la zone, donc la position du sol, donc on doit élaguer après coup pour le décompte : tout ce qui est en y < 175.
Voici l'image générée avec les rochers et les zones protégées en dessous :

Pour mon exemple, j'ai en zones protégées (rochers et dark) 1804 cases, donc 30625-1804 = 28821, c'est mon résultat !

Pour les deux exercices :
Quand le sable n'est pas en chute libre, il va s'empiler sur toutes les cases visiter, à terme, sauf à sortir du terrain de jeu pour l'exercice 1.
Donc on n'est pas obligé de faire tomber le sable grain par grain, mais on peut poser des couches, avec un algo récursif.
Il suffit de le faire prendre en remontant la récursion quand on a trouver où se poser en bas. Parce que si on ne trouve pas où se poser (exercice 1 uniquement), alors aucun grain suivant ne pourra se poser.
C'est beaucoup plus simple à mettre en œuvre pour l'exo 2 puisqu'un fil de sable trouvera toujours un endroit où s'arrêter, donc on peut remplir en descendant, et explorer à la fois à gauche et à droite en bas de chaque chute libre.
Pour l'exo 1, si on parcours normalement, qu'on pose les grains en remontant de la récursion et pas avant de descendre, et qu'on sort brutalement (exception python en haut de l'exploration) dès qu'on est au bout, on devrait avoir le résultat.

Je ne l'ai pas encore fait, il est tard, je devrais commencer ma journée de taf quand même :D
- Yth.

# Beaucoup de temps pour animer et afficher joli

Posté par Yth (Mastodon) le 14 décembre 2022 à 12:08. En réponse au message Avent du Code, jour 14. Évalué à 4.

Parce que un truc de 351 * 175 dans le terminal c'est galère quand même…

Bref, j'ai perdu plein de temps à faire une animation pas trop lente (j'ai fini par exponentiellement sauter des images : j'affiche l'image 2^n), et réussir à faire entrer ça proprement dans le terminal. Après coup j'ai réalisé qu'il suffisait d'afficher chaque grain de sable une fois calculé, au lieu de tout retracer… Dans un terminal… Diantre…

J'avais un bug débile aussi pour l'exo 2, comme je voulais un sol pas trop large pour l'affichage, j'ai essayé d'être intelligent, et ça n'a pas marché, j'ai fini par faire un affichage avec un sol pas très large, puis rajouter un sol très très large.

Après j'ai triché et j'ai juste mis le sol en dur aux bonnes dimensions pour tout afficher, une fois le résultat obtenu.

Deux belles images :
Premier exercice
Deuxième exercice

Et un code probablement trop complexe.
L'affichage déjà

class display:
    sand = " "  # "▒"
    sandcolor = 220
    void = " "
    rock = " "  # "█"
    rockcolor = 94
    start = "+"

    def __init__(self, x0, x1, y0, y1, *rocks):
        self.x0, self.x1, self.y0, self.y1 = x0, x1, y0, y1
        self.bg = [[
            f"{self.color(bg=0)}{self.void}" for x in range(x0, x1+1)
        ] for y in range(y0, y1+1)]
        for x in rocks:
            self.bg[x[1]-y0][x[0]-x0] = f"{self.color(bg=self.rockcolor)}{self.rock}"
        self.bg[0][500-x0] = self.start
        self.background = "\n".join(
            "".join(self.bg[y][x] for x in range(len(self.bg[0])))
            for y in range(len(self.bg))
        )
        self.width = len(self.bg[0])
        self.height = len(self.bg)

    def color(self, bg=None, fg=None, rgb=None):
        bg = f"\033[48;5;{bg}m" if bg else ""
        fg = f"\033[38;5;{fg}m" if fg else ""
        fg = f"\033[38;2;{rgb[0]};{rgb[1]};{rgb[2]}m" if rgb else fg
        if not bg and not fg:
            return "\033[0m"
        return f"{bg}{fg}"

    def cursor(self, row=0, col=0):
        if row < 0:
            row = self.height - row
        return f"\033[{row+1};{col+1}H"

    def __call__(self, *items, wait=0):
        print(self.str(items))
        if wait:
            time.sleep(wait)

    def item(self, item):
        return (
            f"{self.cursor(col=item[0]-self.x0, row=item[1]-self.y0)}"
            f"{self.color(bg=self.sandcolor)}"
            f"{self.sand}"
        ) if (
            item[0] >= self.x0 and
            item[0] <= self.x1 and
            item[1] >= self.y0 and
            item[1] <= self.y1
        ) else ""

    def str(self, items):
        return (
            f"{self.cursor()}"
            f"{self.color()}"
            f"{self.background}"
            f"{''.join(self.item(item) for item in items)}"
        )

Et le code en lui-même :

def input():
    for line in sys.stdin:
        x = list(tuple(map(int, r.split(','))) for r in line.split(' -> '))
        for _ in zip(x[:-1], x[1:]):
            yield _


class RockFormation:
    def __init__(self, input):
        self.finished = False
        self.source = (500, 0)
        self.carte = set()
        self.sand = set()
        for _ in input():
            self._add_rocks(*_)
        self.dim = self.calcdim(self.carte)
        self.rock = self.carte.copy()
        self.sand = set()

    def _add_rocks(self, r1, r2):
        x1 = min(r1[0], r2[0])
        x2 = max(r1[0], r2[0])
        y1 = min(r1[1], r2[1])
        y2 = max(r1[1], r2[1])
        self.carte.update(
            (x, y)
            for x in range(x1, x2+1)
            for y in range(y1, y2+1)
        )

    def add_rocks(self, r1, r2):
        self._add_rocks(r1, r2)
        self.dim = self.calcdim(self.carte)
        self.rock = self.carte.copy()

    def calcdim(self, carte):
        return (
            min(x[0] for x in carte),
            max(x[0] for x in carte),
            0,
            max(x[1] for x in carte),
        )

    def __call__(self):
        s = self._sand(*self.source)
        if not self.finished:
            if s in self.carte:
                print(f"Re-adding {s} !")
                raise IndexError
            self.carte.add(s)
            self.sand.add(s)
        if s == self.source:
            self.finished = True
        return s

    def _sand(self, x, y):
        if x < self.dim[0] or x > self.dim[1] or y == self.dim[3]:
            self.finished = True
            return x, y
        while (x, y+1) not in self.carte:
            y += 1
        if (x-1, y+1) not in self.carte:
            x, y = self._sand(x-1, y+1)
        elif (x+1, y+1) not in self.carte:
            x, y = self._sand(x+1, y+1)
        return x, y


def simulation(rocks):
    d()
    while rocks.finished is False:
        print(d.item(rocks()))


# Inputs
rocks = RockFormation(input)
# First simulation
d = display(*rocks.dim, *rocks.rock)
simulation(rocks)
result1 = len(rocks.sand)
print(f"{d.cursor(row=-4)}{d.color()}Resting sand : {len(rocks.sand)}")

# Second simulation preparation
rocks.finished = False
# Limited floor for display
# rocks.add_rocks(
#     (rocks.dim[0]-1, rocks.dim[3]+2),
#     (rocks.dim[1]+1, rocks.dim[3]+2)
# )
# d = display(*rocks.dim, *rocks.rock)
# # Big (not too huge) floor for simulation
# rocks.add_rocks(
#     (rocks.dim[0]-1000, rocks.dim[3]),
#     (rocks.dim[1]+1000, rocks.dim[3])
# )
# Enough floor knowing the solution
rocks.add_rocks((325, 174), (675, 174))
d = display(*rocks.dim, *rocks.rock)
simulation(rocks)
print(f"{d.cursor(row=-3)}{d.color()}", end='')
print(f"Resting sand : {result1}")
print(f"Filling sand : {len(rocks.sand)}")
print(f"Dimensions 1 : {dim1}")
print(f"Dimensions 2 : {rocks.dim}")
display2 = d.str(rocks.sand)

# Et enfin afficher le résultat pour les screenshots
w, h = tuple(os.get_terminal_size())
print("\n"*h)
print(display1)
print("\n"*h)
print(display2)
print(f"{d.cursor(row=-2)}{d.color()}", end='')

Il faut vachement zoomer arrière dans le terminal, après c'est écrit trop petit pour lire, mais on a une belle animation :)

Yth.

[^] # Re: python, en trichant

Posté par Yth (Mastodon) le 13 décembre 2022 à 15:50. En réponse au message Avent du Code, jour 13. Évalué à 3.
Ouais, j'ai essayé de faire un hack pour remplacer les chiffres seuls par des listes de chiffres, et après faire un json.loads() et juste comparer, en bricolant quelques trucs du genre on arrive à faire tourner les données de démo.

Pour faire court, c'est le premier exercice du calendrier où je n'ai pas fourni la bonne réponse du premier coup…

Après j'ai été moins « malin », et j'ai réussi…
- Yth.