Tutorial Outwit - récupération d’images (5 commentaires)

La récupération d’images avec Outwit fonctionne avec de nombreux sites et en particulier avec les moteurs de recherche.

Ce petit tutoriel explique comment s’y prendre pour récupérer des images sur Google Image.

On lance par exemple au sein d’Outwit une recherche de “Couchers de soleils” dans Google Image en précisant que l’on souhaite des images de grande taille. Le résultat de Google s’affiche, comme ci-dessous.

A partir de là, on clique sur le Tab “Images” d’Outwit :

image

On obtient la liste des images détectées dans la page de Google. Nous allons maintenant récupérer ces images. Il faut d’abord cliquer dans la liste des images en haut puis la sélectionner en entier avec CTRL-A (ou partiellement).

May 24th, 2008 Post de Olivier Ezratty | 5 commentaires

Tutorial Outwit - récupération de listes (2 commentaires)

Après avoir décrit l’objet du logiciel Outwit Hub, passons à un petit tutorial qui vous permettra de l’expérimenter pour une application pratique: la récupération de listes de sites web. Il vous faudra d’abord installer ou disposer de Firefox 3.x de Firefox. Ensuite, vous installerez la bêta d’Outwit Hub. Elle fonctionne sur Windows, MacOS comme sur Linux.

Je vais utiliser ici un exemple de récupération de données structurées déjà exploité pour la préparation de mes supports de cours sur l’économie de l’innovation : la liste du Forbes 2000 qui regroupe les 2000 plus grandes entreprises mondiales. Elle est porteuse d’une très grande richesse d’informations. Cette liste apparait sous forme de tableaux que l’on peut copier coller à la main dans Excel. Mais il faut charger 20 pages ce qui est bien fastidieux.

May 24th, 2008 Post de Olivier Ezratty | 2 commentaires

Moissonner le web avec Outwit (Commenter)

Le web, ses sites et les moteurs de recherche ont une particularité : ils présentent des tonnes d’information, mais en général, faiblement structurées.

La couche de présentation “web/HTML” détruit la structure originelle des informations, très souvent stockées dans des bases de données. Il en résulte des silos de données disparates difficiles à exploiter. Pourtant, des trésors d’informations sont disponibles qui pourraient être mieux exploitées : données financières, listes diverses, comparaisons de prix, listes d’objets à vendre, etc.

image

May 24th, 2008 Post de Olivier Ezratty | Pas de commentaires