Camille Roux Rapport Du Stage Ipernity 2007

Camille Roux Rapport Du Stage Ipernity 2007

carnille ROUX http://camilleroux. com RAPPORT DE STAGE sn STAGE DEVELOPPEUR S12 @ IPERNITY Sujet : Indexation plein texte de nombreux formats de documents contenant du texte, et leurs métadonnées Tuteur : T. M. Réalisé du 28 juin au 21 septembre 2007 Juin – Septembre 200 Polytech’Nice-Sophia ti Sni* to View Informatiques, S12 Camille ROUX REMERCIEMENTS Sciences Je tiens à adresser mes remerciements à toute l’équipe d’ipernity pour m’avoir rapidement intégré au sein de l’entreprise.

Grâce à eux, j’ai pu découvrir le monde des startups qui m’attire depuis longtemps, le fonctionnement au quotidien ‘une entreprise dynamique qui se doit de toujours rapidement répondre aux attentes de ses clients et aussl, la difficulté et les rlsques que représente sa gestion. je souhaite remercier, tout particulièrement, T. M. , mon maître de stage, 11 Le travail réalisé 14 Conclusion 19 Bibliographie . 20 Annexes . 1 Table des matières 26 Jilin – septembre 2007 Polytech’Nice-Sophia Antipolis, département Sciences page 2 INTRODUCTION De plus en plus de gens publient leurs articles, photos, vidéos et autres documents sur le web. Ceci leur permet de les partager avec qui ils veulent, mais aussi ‘y avoir accès de n’importe où, il suffit d’une simple connexion internet. Aujourd’hui, de nombreux

Désolé, mais les essais complets ne sont disponibles que pour les utilisateurs enregistrés

Choisissez un plan d'adhésion
Sltes Internet proposent d’héberger nos documents (souvent spécialisés pour un certain type : photo, vidéo, et beaucoup sont très célèbres dans le monde du web .

YouTube 3 propose déjà ce genre de fonctionnalités pour les photos et les vidéos, mais a souhaité faire de même avec les documents textes. pour ce faire, leur souhalt fut de trouver des systèmes pour extraire le texte brut et les métadonnées des documents pour pouvoir faire des recherches, mais aussi de chercher des ayens de les rendre facilement visualisables aux visiteurs et ce pour le plus grand nombre de documents « texte » possible (Microsoft Word et PowerPoint, OpenDocument, code source, C’est pour effectuer ces recherches et pour y trouver des solutions concrètes que cette entreprise m’a pris en stage pour l’été 2007.

Dans la suite de ce rapport, dans un premier temps, je vous présenterai ipernity, son histoire, ses projets, sa situation actuelle, Ensuite, je détaillerai l’objectif de mon stage, les contraintes et les moyens dont je pouvais disposer et bien évidemment, la solution que j’ai proposée. Enfin, je décrirai les différentes étapes de mes recherches et du développement ainsi que les problèmes que j’ai pu rencontrer tout au long du stage. page 3 IPERNITY IPERNITY’, AUJOURD’HUI L’ÉQUIPE Afin d’éviter de proposer PAGF 33 ent rébarbative des communautaire.

Les utilisateurs peuvent mettre en ligne tout type de documents (blog, photos, vidéos, mp3, dans un même espace (contralrement à la tendance actuelle qui consiste à se spécialiser sur un type précis de documents : Flickr pour les photos, Dailymotion pour les vidéos, Ce site internet moderne est destiné à un public très large. Il peut être utile aux familles et aux groupes d’amis pour sauvegarder et partager leurs photos de vacances ou de soirées. Il peut servir aussi à la promotion des réalisations de créateurs. Il y a déjà de nombreux photographes qui mettent en ligne leurs œuvres grâce à ipernity.

Ce seNice ajoute une autre dimension aux documents envoyés. Comme sur la plupart des sites communautaires actuels, il est possible de poster des commentaires sur un document, de partager ses photos avec seulement ses amis ou sa famille, de chatter en ligne ou d’envoyer un mail à un contact, Ces fonctions sont très ppréciées car elles permettent aux membres de se rencontrer ou encore d’avoir des avis extérieurs sur les documents qu’ils postent et les articles qu’ils écrivent. ipernity en plus de proposer l’hébergement, permet bien évidemment la consultation des documents en ligne.

Pour permettre au visiteur de ne pas être perdu dans la masse de documents Juin – Septembre 2007 page 4 3 documents grâce à un moteur de recherche. Il est également d’associer un lieu (géotag) et donc de faire des recherches par position géographique. Le système de recherche du service est très complet ; il st, en outre, possible d’effectuer des recherches par couleur, licence, utilisateur, . Afin de rendre le site plus attrayant et facile à utiliser, les développeurs ont utilisé des technologies web moderne, notamment PAJAX2.

Ces technologies permettent par exemple, d’éditer certaines informations sans changer de page ou encore d’écrire des articles de blog avec une interface proche d’un traitement de texte classique. LE MODELE DE REVENUS ipernity est une société anonyme présidée par Christophe Ruelle. Son siège est basé sur la technopole de Sophia-Antipolis, à Mougins-le-haut. Ses activités et son développement sont financés sur fonds propres. ipernity fonde son modèle économque sur 3 sources de revenus : Les abonnements de l’offre pro et de la vente de services exclusifs à la carte.

Voici le comparatif entre compte gratuit et compte pro . Volume de contenu supplémentaire publiable chaque mois (Upload) Disponibilité du format original des photos, vidéos et audios Disponibilité des documents publiés Insertions publicitaires dans les pages liées au compte prix PAGF s 3 un néologisme désignant un système de classification collaborative décentralisée spontanée. Le oncept étant récent, sa francisation n’est pas encore stabilisée, bien que le grand dictionnaire terminologique l’ait ajouté à sa base de données.

Le terme folksonomie est une adaptation française de l’anglais folksonomy, combinaison des mots folk (le peuple, les gens) et de taxonomy (la taxinomie). (Wikipédia France – Folksonomie 2005) 2 AJAX, ou Asynchronous JavaScript And XML (« XML et Javascript asynchrones est un acronyme désignant une solution informatique libre pour le développement d’applications Web. (Wikipédla France – Asynchronous JavaScript And XML 2007) page 5 QUELQUES CHIFFRES e trouvais intéressant de publier des chiffres concrets afin de caractériser la popularité, l’ampleur ou encore la croissance du site.

Cependant, il est difficile pour une startup naissante de communiquer là-dessus car ces données peuvent avoir un intérêt pour la concurrence ou peuvent ne pas être très avantageuses du point de vue de l’image (aucun Slte n’a des milllons de visites dès les premiers jours… ). La société m’a gracieusement tout de même autorisé à publier quelques informations chiffrées. Aujourd’hui, iperni c’est PAGF 6 3 chiffres sur ipernity (mail) 2007) IPERNITY, DE LA PREMIERE DEE A NOS JOURS HISTORIQUE Christophe Ruelle et Christian Conti se connaissent depuis longtemps. Ils sont, par exemple, tous les deux des anciens élèves de VESSI.

Ils ont également fréquenté la même pépinière d’entreprise à leur début. A ce moment là, ils faisaient partie des quelques rares pionniers français à voir le potentiel que pouvait représenter le web et à avor quelques idées pour l’explolter. Ensuite, ils se sont tous les deux lancés dans le monde des startups puis ont été adossés à de grands groupes de télécommunication (France Télécom pour Christophe et LibertySurf pour Christian). Touta bien marché pour eux pendant plusieurs années, puis ils ont passé le relais en 2001. Christophe a une problématique en tête depuis longtemps.

Il constate que de plus en plus de documents numériques sont créés, mais qu’aucune disposition n’est prise par leurs auteurs pour éviter de les perdre. Une photographie papier va être rangée dans un tiroir et il est fort possible qu’elle soit toujours là et dans un bon état des dizaines d’années après. Si on prend le cas d’une photo numérique sauvée sur disque dur, c’est très différent, il est quasi impossible que les fichiers e soient pas effacés par mégarde, que le disque dur tombe en panne ou soit formaté, De ce fait, une très grosse partie de notre patrimoine numérique va malheureusement être perdu.

Christophe réfléchit alors à des manières de sauvegarder ces données, de les organiser ou encore de le PAGF 7 3 Pendant ce temps, Christian visite le monde entier, les valises à la main. A cette époque, ipernity n’est pas du tout le site qu’on connaît aujourd’hul. Il s’aglt d’une entreprises, qui moyennant finances, recueille des récits, photos, vidéos, sur la vie du client afin décrire ne biographie ou une chronique familiale. Ce service était loin d’être accessible6 à tous et, de plus, les gens n’étaient probablement pas prêts.

Peu de personnes ont aujourd’hui conscience de la fragilité des documents numériques, et donc du fait que dans quelques dizaines dannées il n’en restera probablement aucune trace. Partant de ce constat, Christophe réfléchit à des concepts plus accessibles. Pour baisser les coûts, il faudrait que les gens recueillent et stockent eux-mêmes les données qu’ils souhaitent préserver et partager au lieu d’avoir à payer des gens qualifiés pour le faire. La finalité elle- même, devrait être plus simple qu’un livre ou un CD-ROM.

En pensant à tout ça, Christophe est ? ce moment là, en train de définir les concepts de base d’ipernity. com. Il est intéressant de remarquer que l’objectif, en revanche, reste le même : conserver et valoriser le patrimoine de mémoire de tout-un-chacun. En 2005, le premier prototype de publication en ligne voit le jour. Cette première version ne convenait pas tout-à-fait à l’idée que Christophe pouvait en avoir. Suite à ça, il parcourt le web à la recherche d’inspiration pour améliorer le service qu’il éveloppe et découvre Flickr7. Il y trouve de nombreuses idées et concepts innovant qu’il ajoutera par la suite.

Afin de créer ieux adapté possible à la PAGF B3 développement économique et pour apporter son expérience en matière de sites web communautaires. Assisté par T. , Christophe redéveloppe entièrement le site en y ajoutant des technologies (Ajax) et des concepts (tags, nuages de tags, apparus entre temps, provenant du web 2-0. Vous avez probablement remarqué que « ipernity » ne prend jamais une majuscule, ceci, pour des raisons esthétiques. 4 Internet Protocol, protocole utilisé pour le routage des paquets sur les réseaux Le site internet est encore accessible : http://ipernity. org. Ce service coûtait 990€ et donnait lieu à la réalisation d’un livre et d’un CD-ROM 7 Flickr est un servlce d’hébergement de photos développé par Ludicorp, une société canadienne de Vancouver fondée en 2002. Ce site est généralement considéré comme un symbole du web 2. 0. 8 MySpace est un service de réseautage social en ligne fondé aux États-Unis par Tom Anderson et Chris DeWolfe en Aout 2003, qui met gratuitement à disposition de ses membres nregistrés un espace web personnalisé, permettant d’y faire un blog, d’y envoyer ses photos et d’y remplir diverses informations personnelles. Wikipedia France – MySpace 2007) Polytech’Nice-Sophia Anti PAGF g 3 ent Sciences type. En mai 2007, ipernity a fait traduire la totalité de l’interface par des membres volontaires (qui en échange, ont reçu plusieurs comptes PRO). L’équipe de développement mit rapidement les traductions en ligne par la suite. C’est alors qu’un élément perturbateur arriva, le 12 juin précisément. Ce jour-là, Flickr a lui aussi mis en ligne une version multilingue de son site. Cet évenement enleva une partie de l’avance qu’ipernity pouvait avoir sur ce concurrent.

Heureusement pour la startup de Mougins-le-haut, juste après ça, Flickr a dû censurer du contenu pour les membres allemands à cause d’une loi qui est apparue peu de temps avant dans leur pays. Grâce cette actualité, ipernity a vu de nombreux membres de qualité (souvent des photographes) venir sur le site. IPERNITY DANS UNE BOULE DE CRISTAL Après avoir vu comment ipernity en est arrivé là, il est intéressant de faire un bond dans le futur et de voir ce à quoi cette société pourrait ou devrait essembler dans quelques années.

LES OB] ECTFS ipernity ne fait que démarrer et donc leur principal souhait, pour le moment, est de faire la démonstration que leur site fait partie de ce qu’il se fait de mieux actuellement. L’important, dans un premier temps, est que les gens aient envie de rester sur le Slte et qu’ils y fassent venir leurs amis ou des membres de leur famille. Si tel est le cas, alors une « dépendance » va se créer entre les membres et le site, ce qui permettra à ipernity d’avoir un bel avenir. Un objectif concret et réal Christian Conti, serait de