DuckDuckGo est un moteur de recherche.
Créé par Gabriel Weinberg en février 2008, il utilise les résultats d'autres sites web (Crowdsourcing) comme Wikipedia. Son objectif est de permettre un accès rapide, pertinent et confidentiel à ces données brutes.
DuckDuckGo se différencie d'autres moteurs de recherche par une réelle confidentialité (versions SSL, non-JS, avec un service Tor caché, possibilité de remplacer le stockage des préférences personnelles par des urls personnalisées au lieu de cookies…).
Il vise aussi à donner une expérience de recherche plus rapide. Sur ce point, il permet d'obtenir des "réponses instantanées", c'est-à-dire des informations sans avoir besoin de cliquer sur l'un des résultats d'une recherche (un ou deux exemples). De plus, la syntaxe !bang permet d'effectuer des recherches sur des sites via DuckDuckGo. Ainsi, au lieu de taper "amazon" dans un moteur de recherche puis le titre du livre que vous voulez acheter sur le site d'amazon, vous pouvez taper directement, dans DuckDuckGo, "!a titre" ("!a" indique que "titre" sera cherché directement sur amazon.fr).
Le modèle économique de DuckDuckGo repose sur une publicité minimale et désactivable et sur les ventes effectuées à partir d'une recherche avec DuckDuckGo sur des site comme Amazon ou eBay. Il est possible de sélectionner le français pour la recherche mais pas encore pour l'interface.
Enfin, pour ne rien gâcher, DuckDuckGo consacre une partie de ses revenus à financer des projets libres.
Aller plus loin
- DuckDuckGo (2853 clics)
- Exemples de réponses instantanées (952 clics)
- FAQ (200 clics)
# pan ! pan ! pan !
Posté par Victor STINNER (site web personnel) . Évalué à 10.
\_o< coin
[^] # Re: pan ! pan ! pan !
Posté par tamerenshort . Évalué à 2.
o_/*PAF
# Le couteau suisse du web
Posté par zebra3 . Évalué à 9.
Ça fait un petit moment que je l'utilise, c'est un pur couteau suisse pour les geeks.
Déjà pour son système de bangs, d'ailleurs rechercher « !bangs » sur DDG affiche directement la liste, il y a quasiment tout. Mais en plus, il redirige vers les versions HTTPS lorsque c'est possible.
Depuis que je l'ai découvert, je l'utilise par défaut sous Epiphany, avec une bête recherche dans la barre d'adresse et un bang si besoin.
Pour ceux que ça intéresse, il suffit de définir la clef GConf /apps/epiphany/general/url_search à https://duckduckgo.com/?q=%s
Derniers détails :
Par contre, je ne connaissais pas le service caché Tor, je vais jeter un œil.
Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur
[^] # Vitesse
Posté par ʭ ☯ . Évalué à 1.
Et c'est rapide? Parce que là, LinuxFr vient de le faire tomber je pense...
⚓ À g'Auch TOUTE! http://afdgauch.online.fr
[^] # Re: Vitesse
Posté par zebra3 . Évalué à 2.
Bah oui, en tout cas il répond normalement pour moi (comprendre : pas moins rapidement que d'habitude)
Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur
[^] # Re: Le couteau suisse du web
Posté par jiyuu . Évalué à 2.
De même, je l'utilise depuis un certain temps.
Son point fort pour moi est que pour la plupart des recherches que j'ai à faire, la "réponse instantanée" est souvent très pertinente (voir les exemples dans la dépêche).
Dans les autres petits plus utiles, il y a la mise en avant du site officiel d'un projet, l'affichage des différents sens d'un mot lorsqu'un terme est ambigu ou bien encore les raccourcies claviers à la vi.
[^] # Re: Le couteau suisse du web
Posté par Naha (site web personnel) . Évalué à 2.
Malheureusement il manque l'essentiel : !dlfp !
[^] # Re: Le couteau suisse du web
Posté par ppr . Évalué à 2.
J'ai proposé cette syntaxe !bang. Elle sera active bientôt et renvoie à ce lien.
[^] # Re: Le couteau suisse du web
Posté par ppr . Évalué à 2.
la syntaxe !linuxfr marche et renvoie à un google personnalisé qui recherche sur linufr.
[^] # Re: Le couteau suisse du web
Posté par 태 (site web personnel) . Évalué à 3.
Et aussi
[^] # Re: Le couteau suisse du web
Posté par feth . Évalué à 3.
Ça, c'est vraiment pratique. On peut lui demander l'heure, l'heure ailleurs, des conversions etc.
Par contre il rame nettement plus que google :-)
[^] # Re: Le couteau suisse du web
Posté par 🚲 Tanguy Ortolo (site web personnel) . Évalué à 1.
Google a aussi un bot ?
[^] # Re: Le couteau suisse du web
Posté par Dr BG . Évalué à 3.
Google Talk Guru
[^] # Re: Le couteau suisse du web
Posté par MrLapinot (site web personnel) . Évalué à 2.
Ce n'est pas très étonnant, vu que c'est un client complet écrit en javascript (sur nodejs), et non pas un composant intégré au serveur.
# intégration avec les navigateurs
Posté par ppr . Évalué à 2.
J'ai oublié de le préciser dans la dépêche mais il est possible d'intégrer ddg à votre navigateur préféré.
La liste des navigateurs supportés est impressionnante !
http://duckduckgo.com/tools.html
[^] # Re: intégration avec les navigateurs
Posté par xkomodor (site web personnel) . Évalué à 6.
A ce sujet, Midori 0.3.3 intègre "Duck Duck Go" comme moteur de recherche par défaut ... c'est d'ailleurs comme cela que je l'ai connu.
Ce moteur un peu déroutant (difficile de perdre ses habitudes) au départ est finalement très agréable à utiliser
[^] # Re: intégration avec les navigateurs
Posté par grondilu . Évalué à 0.
Personnellement je n'utilise plus de module machin pour l'intégration d'un moteurs de recherche dans le navigateur.
Ma page d'accueil comporte un formulaire avec un seul champ "input" dans lequel je peux lancer une recherche yubnub:
Cet méthode présente l'avantage de fonctionner de la même façon sur tous les navigateurs, y compris les navigateurs textes.
Avec yubnub, DuckDuckGo est accessible notamment par le mot clef "ddg" pour la version standard, et "dg" pour la version ssl:
http://yubnub.org/kernel/ls?args=duckduckgo
[^] # Re: intégration avec les navigateurs
Posté par Sausad . Évalué à 1.
Ces sites (ddg ou yubnub) sont intéressants, mais je m'y "perd" un peu...
Qu'elles sont leurs spécificités ou avantages chacuns et par rapport à escaline (qui semblerait plus orienté communauté française mais assez réduite...)
J'avais découvert ce dernier (cette dernière on penserait à la drogue...) via dflp et avais aimé certaines recherches qui pointaient directement vers certaines pages (par exemple pour un parisien, bus 91 qui donnait le pdf de la ligne 91 - ça ne marche plus) et avoue toujours apprécier sur un écran large le w qui permet un split entre une recherche wikipédia fr & en
Ensuite c'est bien le choix, mais ça en fait des "environnements" à tester... ça va occuper !
Et dernière remarque, les réponses rapides de la page d'exemple de ddg, bah à part quelques liens en plus, ils peuvent surtout remercier Wolfram, non ?
[^] # Re: intégration avec les navigateurs
Posté par grondilu . Évalué à 0.
Je ne connais pas escaline mais je voudrais dire au sujet de yubnub que l'un des avantages que j'y vois, c'est l'aspect communautaire du truc. C'est à dire que ce sont les utilisateurs qui créent les commandes. Et c'est très facile à faire, ça prend deux minutes.
[^] # Re: intégration avec les navigateurs
Posté par Benjamin Danon (site web personnel) . Évalué à 0.
La commande « bus » fonctionne à nouveau ;)
http://escaline.org/man+bus
# je peut l'installer sur mon serveur ?
Posté par Adrien . Évalué à 4.
La FAQ me dit que duckduckgo est en partie non-« open source » :-(
Dommage, allez je retourne sous mon seeks auto-hébergé, qui lui au moins est libre…
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Sébastien SAUVAGE (site web personnel) . Évalué à 3.
<troll> Fais gaffe, tes paquets IP passent par des routeurs non-libres. Sûrement des saletés de CISCO. Tu devrais couper ta connexion internet. Et ton PC a probablement un BIOS non libre non plus. Tu devrais cesser de l'utiliser. </troll>
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Adrien . Évalué à 5.
Excuse moi de préférer utiliser des logiciels libres, d'autant qu'il y a des concurrents sérieux tout libres, comme seeks (mais d'autres aussi).
Donc oui si je peux utiliser seeks au lieu de DDG, gnash au lieu de flash-non-free, radeon au lieu de fglrx je le ferais…
[^] # Re: je peut l'installer sur mon serveur ?
Posté par gnuzer (site web personnel) . Évalué à 3.
Alors ça c'est du troll, sebsauvage, bravo.
C'est peut-être du second degré, mais allez, je me prends au jeu :
Tu confonds le but et le moyen. Le but, c'est de décentraliser les services qu'on utilise, afin d'en avoir le contrôle, en tant qu'utilisateur. Le moyen pour y arriver, c'est que ces logiciels soient libres, car on a besoin de liberté vis-à-vis des logiciels qu'on installe sur nos machines.
Donc le fait que le DuckDuckGo distant qu'on utilise soit libre, effectivement on s'en fout un peu. En revanche, le fait qu'on puisse installer un DuckDuckGo libre sur sa propre machine, ça c'est important.
Alors non, le fait que nos paquets IP passent par les routeurs non-libres de CISCO, ça n'est pas gênant, car ce sont des parties du réseau : que celui qui les possède soit libre ou pas on s'en fiche, du moment que ces routeurs font bien leur boulot et servent correctement l'utilisateur.
En revanche, que nos PC utilisent des BIOS non-libres, ça c'est grave, puisqu'il s'agit de programmes installés et exécutés sur nos machines. C'est pourquoi je ne pense pas être le seul inscrit sur ce site à m'intéresser de près à l'évolution de Coreboot...
[^] # Re: je peut l'installer sur mon serveur ?
Posté par louiz’ (site web personnel) . Évalué à 2.
Si j’ai bien suivi, utiliser Google Doc c’est bien, vu que (même si c’est pas libre) c’est pas installé sur notre propre machine ?
Et puis MSN en fait c’est cool du moment qu’on utilise un client libre comme aMSN.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par gnuzer (site web personnel) . Évalué à 2.
Non, ce que je voulais dire c'est que Google Docs ne nuit pas à notre liberté, d'une part parce qu'on a toujours la possibilité d'utiliser une suite bureautique en local sur son PC, et libre, d'autre part parce que ces suites bureautiques (Google Docs, OpenOffice, LibreOffice...) utilisent des formats ouverts et libres.
Un utilisateur de Google Docs peut échanger des documents avec un utilisateur de LibreOffice sans nuire à la liberté de ce dernier.
Mais Google Docs reste du SaaS, il nuit bien sûr à la liberté de celui qui l'utilise directement.
Par contre, MSN n'offre pas cette possibilité d'alternative. C'est un réseau centralisé reposant sur des formats (protocoles) fermés : je ne peux pas installer un serveur MSN libre chez moi. De plus l'utilisateur de MSN nuit à ma liberté, car si je veux communiquer avec lui, je dois utiliser des formats propriétaires (et on se fiche du fait que ces formats soient reconnus presque correctement par des logiciels libres à la limite de la légalité).
Si CISCO ne nuisent pas à la liberté de l'utilisateur, c'est parce que, à ma connaissance, ils utilisent des protocoles ouverts et libres, et qu'on peut faire exactement la même chose ailleurs avec des logiciels libres.
C'est un peu comme quand tu utilises un serveur jabber qui ne t'appartient pas : c'est du SaaS, tu n'as aucun contrôle dessus. Mais si le serveur jabber fait mal son boulot (défaillances, censure, etc...), tu peux monter le tien chez toi.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par dinomasque . Évalué à 0.
Ah ?
En quoi le SaaS nuit intrinsèquement à la liberté de ses clients ?
BeOS le faisait il y a 20 ans !
[^] # Re: je peut l'installer sur mon serveur ?
Posté par gnuzer (site web personnel) . Évalué à 0.
De la même façon qu'un logiciel propriétaire. Avec un SaaS, l'utilisateur n'a pas de contrôle sur le logiciel, et perd en partie le contrôle de ses données.
Enfin, c'est pas (que) moi qui le dit...
[^] # Re: je peut l'installer sur mon serveur ?
Posté par gnuzer (site web personnel) . Évalué à -2.
dis*
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Michaël (site web personnel) . Évalué à -1.
-1s/dit/dis/
[^] # Re: je peut l'installer sur mon serveur ?
Posté par dinomasque . Évalué à 4.
J'espère que la FSF va fermer cette abomination de GNU Savannah qui prive de liberté tant de développeurs alors.
BeOS le faisait il y a 20 ans !
[^] # Re: je peut l'installer sur mon serveur ?
Posté par gnuzer (site web personnel) . Évalué à -1.
T'as pas lu l'article ou tu le fais exprès ?
GNU Savannah est un site géré par la FSF, qui s'appuie sur un logiciel nommé Savane. Ce logiciel est libre , cornes de gnou, ça veut dire qu'on peut accéder au source et le modifier pour créer par exemple Gforge/FusionForge.
Comme on ne peut pas concevoir la gestion du développement d'un soft sans un minimum de centralisation, les devs de GNU utilisent Savannah pour faire leur boulot. Ainsi le réseau n'est pas acentré, mais il est décentralisé : si les utilisateurs de Savannah ne sont pas d'accord avec la façon dont le SaaS est géré, ils peuvent toujours créer leur propre communauté ailleurs, en l'appelant par exemple Gna!.
C'est quand même étonnant que tu utilises GNU Savannah comme exemple pour réfuter mes propos : cette forge a été créée justement comme alternative face aux problèmes de SourceForge, en se basant sur le code de celui-ci.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par dinomasque . Évalué à 4.
Savannah est un logiciel de forge fournit comme un service.
Si je n'aime pas un comportement de savannah.gnu.org, est-ce que je peux patcher le serveur ?
Quel contrôle ai-je sur les données placées chez Savannah que je n'ai pas chez n'importequel autre prestataire SaaS (Google par exemple, qui propose de rapatrier toutes ses données par des moyens standards) ?
Mon contre exemple ne visait pas à dénigrer Savannah (au sujet duquel je n'ai aucun reproche à faire) mais plutot à illustrer par l'absurde ton association SaaS = cacapalibre
BeOS le faisait il y a 20 ans !
[^] # Re: je peut l'installer sur mon serveur ?
Posté par gnuzer (site web personnel) . Évalué à 0.
C'est pas libre au sens où c'est centralisé, mais c'est libre au sens où c'est décentralisable.
Tout service centralisé sous-entend un contrat entre l'utilisateur et le fournisseur du service. Si tu n'a aucun reproche à faire à GNU Savannah, c'est que tu as confiance en ceux qui ont le véritable contrôle sur le service : tu sais qu'il ne sont pas du genre à altérer tes données, ou à mettre des DRM dans tes travaux, par exemple.
L'exemple qui me paraît le plus parlant, c'est celui du serveur Jabber : autrefois j'utilisais le serveur jabber de l'apinc : il était souvent indisponible, il y avait des changements trop fréquents de certificats, j'en ai eu marre, j'ai utilisé le serveur jabber de legtux, qui est moins souvent down. Désormais j'utilise également mon serveur jabber @home, sur lequel j'ai un contrôle total.
Pour revenir au sujet de départ, à savoir les moteurs de recherche, j'aime bien par exemple seeks, parce que seeks.fr marche bien et que j'ai la possibilité d'avoir mon seeks @home au cas où je perd confiance en seeks.fr. Par contre, il est regrettable que je n'ai pas cette possibilité avec DuckDuckGo, qui m'attire pourtant beaucoup pour ses qualités techniques.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par jve (site web personnel) . Évalué à 7.
De mémoire (pas d'éléphant), Gabriel fait tourner DDG sur FreeBSD. Le code est écrit en Perl et n'est pas publié.
Si il n'a pas changé son architecture récemment, c'est hébergé dans son sous-sol sur une connection FiOS Verizon (20mbps symetrique pour $100 par mois) avec un secours sur Amazon EC2/S3.
Pour un one-man-project, c'est plutot bien foutu. Mais ne vous leurrez pas, DDG n'est pas plus open source que Google.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par ppr . Évalué à 7.
Les logiciels que ddg utilise : http://www.gabrielweinberg.com/blog/2009/03/duck-duck-go-architecture.html
Le code de ddg (ou une partie ?): https://github.com/duckduckgo
J'ai posté un message sur le forum de ddg pour savoir quels logiciels utilisés sont propriétaires et pourquoi ceux-ci sont utilisés (pas encore de réponse, je vous tiens au courant).
En tout cas, le code semble accessible (en totalité ?) et ddg est largement fait avec des logiciels libres. De plus, il donne de l'argent aux FLOSS. Donc à moins d'être extrémiste à la Stallman, ddg est éthique et bon pour le web.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Jeanuel (site web personnel) . Évalué à 6.
à moins d'être aussi intègre que RMS.
Le choix des mots ...
[^] # Re: je peut l'installer sur mon serveur ?
Posté par B16F4RV4RD1N . Évalué à 1.
intégriste donc ? C'est à dire prêt à tout pour imposer son point de vue, quitte à frustrer ses interlocuteurs...
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
[^] # Re: je peut l'installer sur mon serveur ?
Posté par louiz’ (site web personnel) . Évalué à 4.
Non, intègre.
C’est pas parce que ça commence pareil que c’est le même mot…
[^] # Re: je peut l'installer sur mon serveur ?
Posté par dinomasque . Évalué à 1.
Moi je dis intégriste parcequ'il porte un jugement de valeur sur les autres sans remettre en question sa définition très limitée de la notion de liberté.
BeOS le faisait il y a 20 ans !
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Michaël (site web personnel) . Évalué à 0.
Peut-être que farvardin est un interprèteur GW-Basic de 1983?
[^] # Re: je peut l'installer sur mon serveur ?
Posté par ppr . Évalué à 4.
Voici la réponse du créateur de ddg au sujet de l'open-source :
source : http://duck.co/#Topic/28469000000580069
Donc pour les non-anglicistes, les raisons pour lesquelles ddg n'est pas totalement open-sources sont la pub et la concurrence (je comprend pour la concurrence mais je ne vois pas pour la pub). Sinon, il semble que ddg ne soit réalisé qu'à partir de logiciels libres.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Gniarf . Évalué à 5.
normal, spam et pub c'est quand même pas tout à fait pareil (ah bon ?)
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Dr BG . Évalué à 2.
Peut-être pour que certains sites ne connaissent pas l'algo de classement pour le fausser à leur avantage.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par claudex . Évalué à 2.
Tu très bien avoir un algo mais laisser les valeurs des constantes comme paramètre sans les diffuser.
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Adrien . Évalué à 4.
Donc en gros on utilise du libre, mais on ne code pas libre, super…
Un truc que je pige pas : les projets de moteur de recherche libre ont les mêmes problèmes de spam et compétition, pourtant ils font du libre. C'est un peu comme si on disais Openssh c'est pas libre parce que sinon des petits malins pourraient exploiter les failles, le raisonnement me semble foireux.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Larry Cow . Évalué à 5.
Les moteurs de recherche libres? Lesquels, ceux qui se contentent d’agréger les résultats des autres, ou bien ceux qui ne marchent juste pas?
(après, faut bien commencer quelque-part, je sais... mais ça fait une petite différence entre DDG et les MdR libres)
[^] # Re: je peut l'installer sur mon serveur ?
Posté par barmic . Évalué à 3.
C'est compliqué de faire un moteur de recherche libre qui n'utilise pas les autres moteurs à cause des ressources nécéssaires pour indexer le web et le mettre à disposition, mais il en existe un qui demande à chaque utilisateur de faire tourner un bot et weeks le ferras bientôt par indexation volontaire.
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Juke (site web personnel) . Évalué à 2.
Serait ce si génant pour Google de libéré son code ?
Si ils libéraient le code sous AGPL, quelqu'un qui ferait une copie n'aurait aucun intérêt car il lui faudrait des mois pour indexer autant de pages que Google. Et qui irait sur un site qui n'apporte rien de plus et qui est un ersatz de google ?
Pour le concurrent, si il veut proposer quelque chose de mieux, soit il l'écrit from scratch (et aujourd'hui il peut le faire), soit il se base sur le code libéré de google, et, dans ce cas, google pourrait également implémenter les changements vu que l'AGPL l'oblige à reverser les changements.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Adrien . Évalué à 2.
Un code libre ça veux aussi dire qu'en tant qu'utilisateur je pourrais savoir comment les résultats sont triés, je pourrait savoir quelle sont les meilleures choses à faire pour le référencement… Par exemple Linuxfr pourrait avoir son propre moteur de recherche pour le site web plutôt que de passer par google.
bref il n'y a pas que le concurrent qui pourrait en profiter, mais les utilisateurs, d'autant que la recherche peut influencer très fortement la façon de penser, de développer de nouvelles idées…
[^] # Re: je peut l'installer sur mon serveur ?
Posté par beagf (site web personnel) . Évalué à 10.
Attention, ta traduction est mauvaise, il ne parle pas de « pub » mais de « spam ». Dans le cas du Web on parle d'ailleurs plutôt de « webspam » ou de « spamdexing ».
Le spamdexing regroupe les techniques utilisées pour tricher avec les algorithmes de classements des moteurs de recherche afin qu'un site Web ce retrouve artificiellement mieux classé qu'il ne le devrait sur certaines requêtes.
Dans les début des moteurs de recherche, par exemple, la principale méthodes de classement reposait sur une mesure très simple : le TF/IDF. Pour savoir si un document est bon vis-à-vis d'une requête, on regarde pour chaque mot de la requête sa fréquence dans le document par rapport à sa fréquence dans l'ensemble des pages indexées.
Si le score du TF/IDF est bon, cela veut dire que globalement les mots de la requête apparaissent plus souvent dans ce document que dans un document moyen, il est donc probablement intéressant pour l'utilisateur.
Rapidement, le gens ont compris comment marchait ce type de moteur et ils ont commencés à remplir leurs pages de mots-clés fréquemment utilisés dans les requêtes qui les intéressait. Et les résultats des moteurs de recherche ont commencé à devenir n'importe quoi.
Ce fût le début de la guerre entre spammeurs et moteurs de recherche. Les moteurs trouvent de nouvelles manières de classer les pages et de déjouer les techniques des spammeurs, pendant que les spammeurs font l'inverse. C'est le problème de l'épée et du bouclier.
La grosse amélioration apportée par Google à été la combinaison de deux scores : une mesure de pertinence tout-à-fait classique combinée à une mesure de confiance, le fameux « page-rank ». Le principe est tout simple : en général un site web ne contrôle que les liens qui sortent de chez lui, pas ceux qui pointent vers lui. Si on fait confiance à un site, on doit pouvoir faire confiance au site vers lesquels il pointe et vice-verca.
On commence donc en donnant un bon score à quelques site de confiance et un mauvais score à des spammeurs et on propage une partie de ce score vers les sites qu'ils pointent. En itérant, le système finit par ce stabiliser avec des scores de confiance pour tout le monde. (je simplifie un peu...)
Ça a bien marcher pendant un moment jusqu'à ce que les spammeurs comprennent comment contourner le truc : d'abord l'échange de liens puis « les fermes de liens ». C'est-à-dire un ensemble de site Webs comportant un très grands nombre de pages web très fortement connectées (plusieurs millions de pages) qui vont servir d'accumulateurs à page-rank.
La guerre entre les deux est permanente et contrairement à la cryptographie par exemple, il est à peu près impossible de créer un algo qui soit résistant de manière intrinsèque car on ne contrôle que l'algo pas les données, les spammeurs peuvent donc étudier l'algo et produire des site web spécialement adapté pour cet algo.
Pour avoir fait ma thèse dans le domaine je connais très bien le problème et je peut te garantir que les spammeurs suivent de très près toute la recherche qui est faite dans le domaine et sont très réactifs. Il n'est pas rare de voir apparaître de nouvelles technique de spams destinées à contrer des techniques anti-spam qui viennent d'être publiées et qui ne sont même pas encore arrivées dans les versions de production des moteurs de recherche.
Je n'aime pas ça mais ici on est vraiment dans une situation ou les algos doivent rester secrets pour le bien de l'utilisateur, c'est ce qui permet d'avoir des résultats pertinents.
Pour ce qui est des moteurs de recherche OpenSource, il ne sont tous simplement pas concernés, soient ils n'utilisent que des algos déjà publiés et donc les résultats sont pourris, soient il ne sont utilisés que par trois péquins et sont donc loin d'être une cible pour les spammeurs. Mais tu peut-être sûr que si un moteur de recherche OpenSource ce met à fournir des résultats pertinents et commence à avoir du succès, la qualité des résultats va vite chuter.
Il y a pour le moment une incompatibilité fondamentale entre OpenSource, pertinence et succès.
[^] # Re: je peut l'installer sur mon serveur ?
Posté par Adrien . Évalué à 1.
C'est marrant l'opposition spammeur contre moteur de recherche me rappelle vraiment l'opposition cracker contre créateur de logiciel…
Or il se trouve que niveau sécurité le libre s'en sort très bien, donc je me dit naïvement que ça doit être possible dans le combat contre les spammeurs.
Peut-être que du contenu trié en partie par les utilisateurs pourrait changer la donne ? On verra bien :-)
[^] # Re: je peut l'installer sur mon serveur ?
Posté par beagf (site web personnel) . Évalué à 8.
Et tu es bien naïf en effet.
Au niveau sécurité, tu te bats chez toi dans un terrain que tu contrôles, le cadre est définis très clairement, tu as des moyens de tester, tu peux ajuster la surface d'attaque au minimum en fermant tout ce qui n'est pas utile...
Pour un moteur de recherche la situation est différente ne te bas pas chez toi mais dans le capharnaüm qu'est le Web, où quasiment tous les sites font de l'optimisation pour être correctement classés et où la limite entre optimisation et spamdexing est très floue, et où la satisfaction de l'utilisateur est la seule mesure et elle est difficilement mesurable.
Dis toi bien qu'il y a beaucoup de monde qui bosse la dessus et qu'il n'y en a pas beaucoup qui croient à la solution miracle. Le contenu trié par les utilisateurs est une piste en grande partie abandonnée depuis longtemps, dès que l'on permet à l'utilisateur de mettre son nez quelque part les spammeurs sont les premiers arrivés. Même sur des trucs plutôt confidentiels, il suffit de regarder la liste des commandes sur yubnub.org, elle est complètement inutilisable car pourrie de spam. C'est la même chose avec les commentaires de beaucoup de blogs, avec pas mal de wiki et autres.
Dès que tu permet à l'utilisateur de donner son avis, si ça à un intérêt potentiel pour les spammeurs, ils mettent en place une troupe de bot pour biaiser le truc. Pour tous les site ou l'on peut commenter ou donner son avis sur un produit sans l'avoir acheter, la majorité des avis sont du spam.
Et c'est pas un captchas ou autre qui va les arrêter, tu retrouves derrière des acteurs du porno sur le net qui ont plein de client près les remplir pour accéder à divers sites...
[^] # Re: je peut l'installer sur mon serveur ?
Posté par B16F4RV4RD1N . Évalué à 4.
les clients participent un peu au film si j'ai bien compris ? ;)
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
# confidentialité ?
Posté par mickabouille . Évalué à 7.
Et là, je vois pas le rapport. Entre JS et la confidentialité. JS peut être utilisé pour faire du tracking. Ou pas. Et on peut faire du tracking sans JS aussi.
[^] # Re: confidentialité ?
Posté par claudex . Évalué à 6.
Je crois que l'intérêt est de pouvoir désactiver le javascript (pour éliminer ce vecteur d'attaque) et d'avoir quand même quelque chose d'utilisable.
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
# Pertinence des resultats
Posté par moules . Évalué à 0.
Si l'UI est attirante, je n'utiliserai pas ce moteur de recherches pour la simple et bonne raison que la pertinence des résultats est une catastrophe.
Les deux premières recherches (sur mon nom, égocentrique que je suis, puis sur « minbif », un logiciel libre dont le site officiel n'est même pas sur la première page de résultats !) que j'ai effectuées m'ont dissuadé.
[^] # Re: Pertinence des resultats
Posté par jiyuu . Évalué à 3.
Pourtant quand je fais une recherche sur minbif, dans l'encadre s'affiche:
Après c'est vrai qu'il n'y a pas l'adresse du site officiel, juste un lien sur freshmeat. Mais de là dire que
c'est légèrement abusé.
Et sinon, as tu essayé une recherche sur weboob ?
[^] # Re: Pertinence des resultats
Posté par moules . Évalué à 1.
On 08/Apr - 17:39, jiyuu wrote:
Cf ma réponse au commentaire ci-dessous.
Oui pour weboob les résultats restent correct, c'est pour ça que je ne l'ai pas cité. Cela dit, si les trois premiers sont pertinents, ça dérive vite lorsqu'il se met à ne parler quasiment plus que de « weblogs ».
Je pense que c'est le principal problème, c'est qu'il va prendre des mots similaires sûrement plus utilisés que celui recherché, mais je ne pense pas que ce soit une bonne solution, puisque ça donne des résultats qui n'ont forcément rien à voir avec ce que la personne recherche. Un message du style de Google « Essayez avec tel mot » serait plus approprié.
[^] # Re: Pertinence des resultats
Posté par B16F4RV4RD1N . Évalué à 3.
le site de minbif c'est bien http://minbif.im/ ? Car c'est le premier résultat de la recherche avec DDG.
En tout cas les résultats de la recherche me semblent plutôt pertinents.
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
[^] # Re: Pertinence des resultats
Posté par moules . Évalué à 3.
Hum, je ne sais pas si comme Google les résultats varient en fonction du visiteur, mais chez moi j'ai :
Les 21 premiers résultats de recherche sont quand même incroyables. Pas le site officiel du projet, dès le troisième résultat commencent à sortir des sites qui ne matchent pas exactement le mot et qui n'ont rien à voir, les sites de Debian et Ubuntu très très loin derrière des pages sans aucun intérêt, etc.
[^] # Re: Pertinence des resultats
Posté par B16F4RV4RD1N . Évalué à 2.
hmm, tu n'as pas tort. C'est bizarre parce qu'hier j'avais le site officiel en premier (juste en dessous de la définition donnée par freshmeat), et aujourd'hui le site officiel n'arrive effectivement pas en premier, ni même sur la première page.
J'ai envoyé un message à propos de cela sur la page de feedbacks.
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
# Images et vidéos
Posté par muchos (site web personnel) . Évalué à 1.
Je viens de tester avec le bang :
* avec <!i> = direct sur Bing Images (argh)
* avec <!v> = direct YouTube
* quant à <!gi> ou <!gv>, c'est sur la plateforme Google et beaucoup plus rapide que par GG lui-même !
Je crois que je vais délaisser Google et me mettre là-dessus :p
Debug the Web together.
# euh...
Posté par JGO . Évalué à 2.
1) Je vais sur la page « exemples » donnés en lien dans la dépêche https://duckduckgo.com/goodies.html
2) Je clique sur « time in london »
3) Ça renvoie sur https://duckduckgo.com/html/?q=msft ... qui me renseigne sur le cours de l'action Microsoft ?????
[^] # Re: euh...
Posté par claudex . Évalué à 2.
Je n'ai pas du tout ce comportement.
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: euh...
Posté par JGO . Évalué à 2.
J'ai oublié de dire, javascript est désactivé. C'est explicitement indiqué dans la dépêche qu'ils supportent les grincheux anti-javascript comme moi.
[^] # Re: euh...
Posté par claudex . Évalué à 2.
Quand je désactive le JavaScript, le bouton ne fait tout simplement rien
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: euh...
Posté par JGO . Évalué à 2.
J'utilise Firefox 4, Firefox désactivé dans les options (Édition/Préférences). Le bouton, dans le code, dit :
<input type="text" value="time in london" id="msft">
<input type="button" onclick="goodie('msft')" value="go">
Quand je clique dessus, j'obtiens une page avec le message :
Et quand je clique sur « here », l'obtiens effectivement la page "msft", qui concerne les cours en bourse d'une entreprise.
[^] # Re: euh...
Posté par louiz’ (site web personnel) . Évalué à 3.
Essaye sans désactiver Firefox dans les options.
Il marche moins bien une fois désactivé.
[^] # Re: euh...
Posté par ppr . Évalué à 2.
Attention, la version par défaut de ddg utilise js. Mais l'on peut utiliser une autre version non-js à l'adresse suivante : https://duckduckgo.com/html
Il y a aussi
# Modèle économique
Posté par JGO . Évalué à 2.
« Le modèle économique de DuckDuckGo repose sur une publicité minimale et désactivable [...] »
Où ça ? J'utilise sans javascript (puisqu'ils le supportent), avec ou sans images, je ne vois aucune publicité.
« [...] et sur les ventes effectuées à partir d'une recherche avec DuckDuckGo sur des site comme Amazon ou eBay »
/etc/privoxy/user.action :
C'est ma config depuis que certains sites s'amusent à surligner en diverses couleurs sur leur page, les mots-clefs de la recherche google que j'ai tapée. C'est pas exprès contre DDG mais pour moi ça ruine leur modèle économique.
Le seul genre de pub qui passe, c'est des textes et liens non placés dans un DIV qui les discrimine. Voire une PNG placée sur leur propre serveur (pour les jours de fête où j'ai activé mis les images). Je veux bien regarder leur pub, voire cliquer sur des liens, mais j'ai pas moyen.
[^] # Re: Modèle économique
Posté par Littleboy . Évalué à 3.
La recherche sur Amazon avec le bang effectue une recherche direct sur Amazon.com avec leur referer dans l'URL. Du coup, ca change rien.
[^] # Re: Modèle économique
Posté par ppr . Évalué à 2.
C'est vrai il semble qu'il n'y ait pas de pub dans la version non-js : mieux vaut ne pas s'en plaindre...
[^] # Re: Modèle économique
Posté par muchos (site web personnel) . Évalué à 1.
Qu'est-ce qui explique que le plugin NoScript réagisse à la page http://duckduckgo.com/html ?
Debug the Web together.
[^] # Re: Modèle économique
Posté par ppr . Évalué à 2.
Je ne sais pas mais tu peux le signaler par le feedback
[^] # Re: Modèle économique
Posté par krumtrash . Évalué à 1.
Sachant que le bonhomme est hyper réactif par mail.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.