Concours de programmation chez Google

Posté par  . Modéré par Fabien Penso.
Étiquettes :
0
8
fév.
2002
Internet
Google organise un concours de programmation pour améliorer son "ripper" qui permet de digérer le format utilisé par google pour stocker ses documents. Plusieurs axes d'améliorations sont proposés.
Pour le moment, le code est en C++, mais Google est ouvert à des extensions en Java ou Python. La seule contrainte est de pouvoir compiler (s'il s'agit de C++) sur un Linux 2.2 ou 2.4 avec g++, d'utiliser du Java de Sun, ou du Python 2.2.

Que gagne-t-on ?
- $10,000
- une visite VIP de Google en Californie
- ton code qui tourne chez Google !
- être un vrai geeks ;-)

Bon, à votre vi^H^H emacs !

Aller plus loin

  • # L'est bizarre la licence...

    Posté par  . Évalué à 7.

    This repository of web page information is being provided to you by Google
    Inc. solely for academic and research purposes related to the Google
    programming contest. You may not modify, distribute, or make any commercial
    use of the repository.

    This source code is copyrighted 2002 by Google Inc. All rights
    reserved. You are given a limited license to use this source code for
    purposes of participating in the Google programming contest. If you
    choose to use or distribute the source code for any other purpose, you
    must either (1) first obtain written approval from Google, or (2)
    prominently display the foregoing copyright notice and the following
    warranty and liability disclaimer on each copy used or distributed.

    The source code and repository (the "Software") is provided "AS IS",
    with no warranty, express or implied, including but not limited to the
    implied warranties of merchantability and fitness for a particular
    use. In no event shall Google Inc. be liable for any damages, direct
    or indirect, even if advised of the possibility of such damages.
  • # Remarque concernant la recherche d'images

    Posté par  . Évalué à 10.

    Bon désolé si c'est un peu off-topic, car il semble que le sujet soit plutot l'indexation des documents textuels. Mais google dispose aussi d'un très bon moteur de recherche d'image, que j'apprécie beaucoup...

    Mais j'ai été très déçu de constater que seuls les gif et les jpg étaient indexées. Alors je ne demande pas de prendre en compte tous les formats d'images, mais peut-être au moins le png ! (et c'est tellement bien d'avoir un support de la couche alpha)

    Ca me fait toujours bien de la peine de voir le png autant délaissé, alors qu'il est officiellement le 3ème format d'image du web et le remplacant libre du gif depuis maintenant de très nombreuses années...

    Alors j'espère vraiment que google indexera dès que possible les png. Le service images.google.com était encore en beta il n'y a pas si longtemps, m'enfin quand même ça doit pas changer grand chose de rajouter un format de plus à indexer (et ils ne doivent pas être à ca près vu leur boulimie) !
    • [^] # Re: Remarque concernant la recherche d'images

      Posté par  (site web personnel) . Évalué à 10.

      Bon désolé si c'est un peu off-topic, car il semble que le sujet soit plutot l'indexation des documents textuels.

      non le sujet n'est pas sur l'indexation, car google s'en occupe deja, le sujet c'est plutot a partir de leur base de donnees deja faite, creer une application interessante qui utilise les document deja indexes par google.
  • # Precisions et un peu d'eau froide ...

    Posté par  . Évalué à 10.

    Google ne propose pas vraiment une amelioration du "ripper" (brouteur? cueilleur?), mais offre un "framework" contenant ce "ripper" parsant 900.000 pages et sur lequel les participants devront developper une appli "interessante", un jury en faisant l'appreciation.

    J'ai lu d'ailleurs quelque part (slashdot?) que les participants auront de meme a defendre devant le jury l'interet de leurs algorithmes (mais c'est pas dans les regles du concours, donc prenez ca comme une rumeur)

    Enfin un truc qui me plait moins dans leur reglement:
    "With regard to an entry you submit as part of the Contest, you grant Google a worldwide, perpetual, fully paid-up, non-exclusive license to make, sell, or use the technology related thereto, including but not limited to the software, algorithms, techniques, concepts, etc., associated with the entry."

    Bref toute contribution au concours appartient a Google qui peut placer votre code sous n'importe quelle license sans vous en demandez l'avis ...

    --
    Taliesin
    • [^] # M'ci /.

      Posté par  . Évalué à 10.

    • [^] # Tu parlerais pas de ça ?

      Posté par  . Évalué à 10.

      All entries must include an English-language explanation of the design. Entries must also include an argument that it will scale to 2 billion pages with reasonable runtime, as well as source code for the implementation. We strongly encourage you to include all data needed to support your claims, such as sample output from your program. Also, clear instructions and an easy to use demo program that allows experimentation with your system will help.

      C'est sur l'annonce chez Google...
    • [^] # Re: Precisions et un peu d'eau froide ...

      Posté par  . Évalué à 10.

      Bref toute contribution au concours appartient a Google qui peut placer votre code sous n'importe quelle license sans vous en demandez l'avis ...

      Cela n'a rien de choquant, il suffit de le savoir et de l'indiquer clairement comme c'est fait ici.
      Quand une SSII fait une prestation, le client est souvent le proprietaire du code, il en fait alors ce qu'il veut. Par contre, les concepteurs garde pour la "méthode", et donc peuvent la réutiliser sans contrainte.
    • [^] # Re: Precisions et un peu d'eau froide ...

      Posté par  (site web personnel) . Évalué à 10.

      Bref toute contribution au concours appartient a Google qui peut placer votre code sous n'importe quelle license sans vous en demandez l'avis ...

      Je ne suis pas d'accord, regarde ce qu'il y a sur le newsgroup du concours :
      There's been some confusion about Google's use of the code submitted by
      entrants to the contest. We'd like to make it clear that under the contest
      rules, Google does not claim ownership of the entries you submit. Instead,
      Google simply obtains a non-exclusive license so that we're not precluded
      from doing work in the same space as the entry you submit.

      You remain free to use your entry in any manner you see fit (e.g.,
      distributing it, selling it, licensing it, etc) as long as you comply with
      the license requirements as stated in or with the files you download or
      receive.

      We hope this clears up any confusion about the contest and ownership of the
      entries submitted. Our intent is purely to stimulate creative thinking about
      search over large datasets, and to recognize those who find this kind of
      problem interesting. Thanks for your interest and for taking the time to
      write to us.

      The Google Team
  • # Hum

    Posté par  . Évalué à 10.

    C'est pas tellement un concours de programmation puisque le but initial est de trouver l'idée à programmer : "quoi faire d'intéréssant avec le tas de documents que google a indexé ?"
    Quelqu'un a une idée ? ;)
    • [^] # Poster

      Posté par  (site web personnel) . Évalué à -1.

      On pourrait faire un gigantesque poster avec tous les doxuments et pleins de lignes de partout et dans tous les sens faisant office de liens.... Un peu comme le LinuxGraphicsProject fait avec le noyau ;-)
    • [^] # Re: Hum

      Posté par  . Évalué à -2.

      MOI MOI MOI! J'ai une super idée! On dirait que les documents, ben on pourrait les retrouver super vite rien qu'en connaissant une partie, même un seul mot du texte! Et puis on mettrait ça sur le ternet pour que tout le monde puisse en profiter!
      Ca serait cool, non?
  • # [OT] Question...

    Posté par  . Évalué à 10.

    Tant qu'on est sur Google, quelqu'un pourrait m'expliquer comment ils crévent pas de faim? Quelles sont leurs sources de revenus ? Parce que bon, je suppose que la maintenance d'une telle base de données online doit quand même coûter quelques (millions de) dollars par an, or la seule source de revenus apparente, c'est la pub sous forme de mots clefs mais vu sa rareté, je doute que ça les fasse s'enrichir.. Alors ? Google est il une émanation d'un grand groupe qui gagne beaucoup d'argent ailleurs ?
    • [^] # Re: [OT] Question...

      Posté par  . Évalué à 10.

      En gros 50% des revenus par la pub (boite sur la droite des recherches) et 50% par vente de leur technologie (ex: yahoo et d'autres payent pour utiliser le moteur de recherche google)
      Un article qui en parle un peu:
      http://www.journaldunet.com/0111/011120google.shtml(...)
    • [^] # Re: le modele economique de google

      Posté par  . Évalué à 10.

      Licence des resultats du moteur:
      Yahoo - par exemple - paye google.
      et recemment EarthLink est devenu client
      http://www.google.com/press/pressrel/earthlink.html(...)

      et puis y'a les pubs AdWords:
      http://www.google.com/ads/index.html(...)


      le blabla corporate en anglais
      ttp://www.google.com/press/overview_biz.html
    • [^] # Re: [OT] Question...

      Posté par  . Évalué à 10.

      Déjà, on ne sait ni leur chiffre d'affaire, ni leur resultat selon cette page, c'est donc pas possible de savoir si ils gagnent de l'argent :

      Seule piste que j'ai trouvé, cet article du JdN, ou ils parlent de leurs sources de revenu
      http://www.journaldunet.com/0111/011120google.shtml(...)
      • [^] # Re: [OT] Question...

        Posté par  . Évalué à 7.

        Il y a un article sur Google dans le Capital de ce mois-ci et si je me souvient ils disent que Google gagne de l'argent.

        Mais je crois qu'ils cherchent a diversifier les sources de revenus.
    • [^] # [OT] Question...

      Posté par  . Évalué à 10.

      Au registre des histoires bizarres, il y a cette interview dans laquelle le patron de Google dit qu'il leur revient moins cher d'utiliser de la DRAM plutôt que des disques durs...

      http://www.pcworld.com/news/article/0,aid,81685,00.asp(...)
      • [^] # DRAM moins cher que les HD

        Posté par  (site web personnel) . Évalué à 1.

        Ben si tu fais le rapport prix/performance/fiabilité pour une application trés spécialisée comme google, la mémoire doit couter beaucoup moins cher, car il faudrait autrement avoir une ferme de stockage avec des HD de compétitions et des liaisons trés hauts débits, ça ferait un goulot d'étranglement et les HD ne sont jamais à l'abri d'une panne, c'est de la mécanique quand même, donc ils n'atteignent pas 100% de disponibilité.

        Prix
        Quand tu vois les prix des fermes de stockage qui sont de plusieurs centaines de KF ça te paye quelques machines avec 4 go de ram et que tu peux mettre en redondance. Et quand tu vois le prix de la maintenance, ça te paye encore d'autres machines tous les ans.

        Performances
        Du coup leur appli tourne en RAM et sur le réseau interne à google, cela doit être bcp plus rapide quelques nanosecondes au lieu de quelques millisecondes pour chaque appel disque (sans compter le chargement en mémoire et le parcours de la mémoire).

        Fiabilité
        Le seul truc c'est qu'ils peuvent perdre toutes les données d'une machine en cas de panne de celle-ci, mais vu que le net change tous les jours, s'ils perdent 512mo~4go de donnée sur plus de 5000 machines, ce n'est pas trop grave.
        Par contre s'ils perdent une ferme de quelques To pendant quelques heures, ça se verra aussitôt, il y aura rupture du service, pour nous c'est pas trop grave, mais Yahoo pourrait tirer la gueule et demander des indemnités.
        Alors ils pourraient dupliquer leurs fermes de stockage, mais ça augmenterait encore le coup.

        Ce n'est pas une solution qui pourrait être adoptée si on veut que les informations soient persistantes, donc c'est trés valable pour google, mais pas pour une base de donnée d'une entreprise par exemple.

        Dés fois il faut payer plus cher au départ pour être moins cher et plus performant à l'arrivée.
  • # devel

    Posté par  . Évalué à -10.

    "Bon, à votre vi^H^H emacs ! "

    Ca sux grave vi et emacs...
    • [^] # Re: devel

      Posté par  (site web personnel) . Évalué à -7.

      Non c'est pas mal pour editer un fichier...
      Mais c'est vrai que pour developper, y'a largement mieux.
      • [^] # Re: devel

        Posté par  (site web personnel) . Évalué à 0.

        Ouai... Les IDE c bien et c bô tout plein, mais bien souvent pour ma part un VIM ou un EMACS suffisent largement. VIM, vi j'm :)
        Tha !
        • [^] # Re: devel

          Posté par  . Évalué à 10.

          Ah bon? EMACS fait pas ide? moi qui croyais que c'était un OS qui tournait par-dessus une VM lisp...

          Pour être sérieux, en fait on se retrouve devant 2 programmes qui sont loin de n'être que des éditeurs de texte, et qui se rapprochent d'un IDE. Suffit de voir tout ce qu'on peut faire sous emacs.
          Quand on dit à un windowsiens qu'on utilise un éditeur de texte pour coder, il n'est pas étonnant qu'il nous prenne pour des fous: lui, il pense tout de suite à notepad, pas à un soft avec indentation auto, coloration, etc...
          • [^] # Re: devel

            Posté par  . Évalué à 5.

            Si tu veux t'amuser, t'as un tic tac toe, un tetris, et plein d'autres jeux

            Et pis si tu déprimes un peu, t'as un psy...

            En plus, il t'affiche le niveau de batterie de ton portable, et peut te préparer le café (si, si -> http://www.chez.com/emarsden/downloads/coffee.el(...))
          • [^] # Re: joke

            Posté par  (site web personnel) . Évalué à 10.

            La semaine dernière, j'ai dit à Richard Stallman que certains pensaient que emacs était un bon OS et qu'il ne lui manquait qu'un éditeur... Il ne connaisait manifestement pas la blague, personne ne la lui avait encore sortie !
            Richard apprécie l'humour. Une ou deux heures plus tôt, à linuxexpo, il nous fait un excellent jeu de mot en français. Je regrette seulement de ne plus me le rappeler.
      • [^] # Re: devel

        Posté par  . Évalué à 10.

        Non c'est pas mal pour editer un fichier...
        Mais c'est vrai que pour developper, y'a largement mieux.


        Car IDE de dvpt et editeur sont contradictoires ?? Je pense pas.
        Tout d'abord, emacs est bien plus qu'un editeur, il inclus de nombreuses fonctions que tu cherches dans les IDE :
        - support cvs/rcs
        - coloration/identation
        - debogage dans emacs (avec gdb par exemple)
        - "indexation" des fonctions/methodes pour naviguer rapidemment dans le code
        - correction orthographique dans les commentaires : indispensable vu le niveau d'orthographe des informaticiens ;-)

        Mais surtout, il existe des IDE qui cohabitent avec emacs ou vi. Un premièr outil gère le projet (templates de fichiers, makefile, modélisation UML etc..), et le code est édité avec l'editeur de ton choix qui s'ontègre dans ton IDE. Togethersoft est un exemple (et il tourne sur linux).

        Et puis, quand le code fait moins de 10'000 lignes, emacs ou vi (plutot elvis ou vim) est plus que suffisant.
    • [^] # Re: devel

      Posté par  . Évalué à -2.

      p'tain.... mon trollomètre a explosé...
  • # Bonjour l'arnaque.

    Posté par  . Évalué à 2.

    Vu la popularite de Google et le boulot a faire, $10.000 ce n'est pas cher paye.
    Enfin, ils trouveront bien de bonnes poires pour leur faire leur boulot...
    • [^] # Re: Bonjour l'arnaque.

      Posté par  (Mastodon) . Évalué à 10.

      Moi je trouve ça plutôt sympa leur truc. Ils ne demandent pas de faire le boulot à leur place, mais de faire quelque chose d'original et d'utile à partir de leur base d'indexation. En gros pour le gagnant l'intérêt c'est d'appliquer son idée à tout le web indexé par google, ce qui est énorme, et gagner $10,000. Google, à priori, ne sait toujours pas s'il pourra faire quelque chose de rentable à partir de l'idée du gagnant. Et le gagnant garde la possibilité de publier son idée en GPL. Alors que demander de plus ?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.