Je suis en train d'essayer de mettre en place un moteur de recherche en Python. Pour l'enregistrement de l'index, ma base se compose de 3 tables :
mots (idMot, mot)
page (idPage, url)
index (idMot, idPage, nbOccurences)
Le problème est que en prenant 100 mots par page, et 200 000 pages indexes on se retrouve avec plus de 200 000 enregistrements dans la table page ainsi que 20 000 000 (200 000*100) dans la table index.
Sans compter le nombre (…)
Journal Mise en place d'un Index
14
mai
2004