Tutorial Outwit – récupération d’images (6 commentaires)

La récupération d’images avec Outwit fonctionne avec de nombreux sites et en particulier avec les moteurs de recherche.

Ce petit tutoriel explique comment s’y prendre pour récupérer des images sur Google Image.

On lance par exemple au sein d’Outwit une recherche de “Couchers de soleils” dans Google Image en précisant que l’on souhaite des images de grande taille. Le résultat de Google s’affiche, comme ci-dessous.

A partir de là, on clique sur le Tab “Images” d’Outwit :

image

On obtient la liste des images détectées dans la page de Google. Nous allons maintenant récupérer ces images. Il faut d’abord cliquer dans la liste des images en haut puis la sélectionner en entier avec CTRL-A (ou partiellement).

May 24th, 2008 Post de Olivier Ezratty | 6 commentaires

Tutorial Outwit – récupération de listes (3 commentaires)

Après avoir décrit l’objet du logiciel Outwit Hub, passons à un petit tutorial qui vous permettra de l’expérimenter pour une application pratique: la récupération de listes de sites web. Il vous faudra d’abord installer ou disposer de Firefox 3.x de Firefox. Ensuite, vous installerez la bêta d’Outwit Hub. Elle fonctionne sur Windows, MacOS comme sur Linux.

Je vais utiliser ici un exemple de récupération de données structurées déjà exploité pour la préparation de mes supports de cours sur l’économie de l’innovation : la liste du Forbes 2000 qui regroupe les 2000 plus grandes entreprises mondiales. Elle est porteuse d’une très grande richesse d’informations. Cette liste apparait sous forme de tableaux que l’on peut copier coller à la main dans Excel. Mais il faut charger 20 pages ce qui est bien fastidieux.

May 24th, 2008 Post de Olivier Ezratty | 3 commentaires

Moissonner le web avec Outwit (4 commentaires)

Le web, ses sites et les moteurs de recherche ont une particularité : ils présentent des tonnes d’information, mais en général, faiblement structurées.

La couche de présentation “web/HTML” détruit la structure originelle des informations, très souvent stockées dans des bases de données. Il en résulte des silos de données disparates difficiles à exploiter. Pourtant, des trésors d’informations sont disponibles qui pourraient être mieux exploitées : données financières, listes diverses, comparaisons de prix, listes d’objets à vendre, etc.

image

May 24th, 2008 Post de Olivier Ezratty | 4 commentaires

Derniers posts

Recherche


L'auteur et le blog

Pour me contacter

Pour suivre ce blog

Ces liens permettent de s'abonner pour reçevoir automatiquement les nouveaux posts publiés sur ce blog.

RSS Feed
Subscribe to Bloglines
Subscribe to MyYahoo!
Subscribe to Google Reader
Subscribe to Newsgator
Subscribe to Netvibes
http://www.wikio.fr
Twitter

Vous pouvez aussi vous abonner pour recevoir un email à chaque nouvelle parution d'article.

Reco TechnoRati


Catégories

Posts les plus lus


Pub !

Commentaires récents
  • Patrick HANNEDOUCHE: Bonsoir Olivier, Mine de rien, l’entrepreneuriat progresse en France et vous en donnez des exemples plus que concrets. Arrêtons donc de nous...
  • Olivier Ezratty: Ce n’est pas une nouveauté ! C’est même dans l’article de Wikipedia sur Xavier Niel.
  • macha: Je ne sais pas si Mediapart et Backchich (vu leur sacro-sainte réputation d’intouchables super propres) apprécient de faire savoir que la grosse...
  • Le Phil: Merci pour cette analyse pertinente sur ces 3 fonds. Leur expertise du business du Net est clé et va au delà de la traditionnelle répartition sectorielle qui...
  • Benoît Granger: Oui, les grandes familles entrepreneuriales sont rares et ont un problème avec le financement des start up. Ce que fait Réseau Entreprendre est...

  • -- Contributeurs actifs --

    Principales publications

    Elles sont diffusées gratuitement (sous Creative Commons) et en PDF, certaines donnant lieu à des mises à jour périodiques :

    image
    L'accompagnement des startups en France
    Février 2010, deux à trois mises à jour annuelles
    CouvertureRapportCES
    Compte-rendu de visite du Consumer Electronics Show 2010
    Janvier 2010, publié tous les mois de janvier depuis 2006
    Livre Blanc Olivier Ezratty Opportunites Television Numerique Juin 2009
    image

    Il en reste encore ! Voici la liste complète des publications.

    Enfin, mes divers albums photos sur Picasa Web Album (voyages, conférences, portraits en studio, best of) ainsi que quelques vidéos sur YouTube.


    Sites à découvrir