La récu­pé­ra­tion d’images avec Out­wit fonc­tionne avec de nom­breux sites et en par­ti­cu­lier avec les moteurs de recherche.

Ce petit tuto­riel explique com­ment s’y prendre pour récu­pé­rer des images sur Google Image.

On lance par exemple au sein d’Outwit une recherche de “Cou­chers de soleils” dans Google Image en pré­ci­sant que l’on sou­haite des images de grande taille. Le résul­tat de Google s’affiche, comme ci-dessous.

A par­tir de là, on clique sur le Tab “Images” d’Outwit :

On obtient la liste des images détec­tées dans la page de Google. Nous allons main­te­nant récu­pé­rer ces images. Il faut d’abord cli­quer dans la liste des images en haut puis la sélec­tion­ner en entier avec CTRL-A (ou partiellement).

[...]

Tutorial Outwit - récupération de listes

Publié le 24 mai 2008 et mis à jour le 1 août 2008 - 3 commentaires -
PDFAfficher une version imprimable de cet article

Après avoir décrit l’objet du logi­ciel Out­wit Hub, pas­sons à un petit tuto­rial qui vous per­met­tra de l’expérimenter pour une appli­ca­tion pra­tique: la récu­pé­ra­tion de listes de sites web. Il vous fau­dra d’abord ins­tal­ler ou dis­po­ser de Fire­fox 3.x de Fire­fox. Ensuite, vous ins­tal­le­rez la bêta d’Outwit Hub. Elle fonc­tionne sur Win­dows, MacOS comme sur Linux.

Je vais uti­li­ser ici un exemple de récu­pé­ra­tion de don­nées struc­tu­rées déjà exploité pour la pré­pa­ra­tion de mes sup­ports de cours sur l’économie de l’innovation : la liste du Forbes 2000 qui regroupe les 2000 plus grandes entre­prises mon­diales. Elle est por­teuse d’une très grande richesse d’informations. Cette liste appa­rait sous forme de tableaux que l’on peut copier col­ler à la main dans Excel. Mais il faut char­ger 20 pages ce qui est bien fastidieux.

[...]

Moissonner le web avec Outwit

Publié le 24 mai 2008 et mis à jour le 1 août 2008 - 4 commentaires -
PDFAfficher une version imprimable de cet article

Le web, ses sites et les moteurs de recherche ont une par­ti­cu­la­rité : ils pré­sentent des tonnes d’information, mais en géné­ral, fai­ble­ment structurées.

La couche de pré­sen­ta­tion “web/HTML” détruit la struc­ture ori­gi­nelle des infor­ma­tions, très sou­vent sto­ckées dans des bases de don­nées. Il en résulte des silos de don­nées dis­pa­rates dif­fi­ciles à exploi­ter. Pour­tant, des tré­sors d’informations sont dis­po­nibles qui pour­raient être mieux exploi­tées : don­nées finan­cières, listes diverses, com­pa­rai­sons de prix, listes d’objets à vendre, etc.

[...]

Derniers posts

Derniers commentaires

“Egalement basée à Rennes, CinéAct (www.cineact.fr), créée en 2005 permet à l’ensemble des professionnels du monde du cinéma (exploitants, distributeurs, producteurs, r...”
“En effet, je vais corriger cela dans une silent release....”
“Merci beaucoup pour cet excellent guide. Pour information, le programme français IDEES de Microsoft n'existe plus et à laisser place au programme "BizSpark One" au niveau mondial. Julien Codorniou est toujours le bon c...”
“Bravo pour cette nouvelle version. A regretter que tu ne puisses faire un guide des start-up high-tech européennes, tant tes conseils seraient adaptés pour une grande part hors de l'hexagone. Mais j'imagine le défi! J...”
“Bonjour, J'ai un doute l'offre est tellement éclatée qu'il est possible que Steve réusisse en fédérant les énergies des autres acteurs... A mon avis l'enjeu c'est encore une fois de trouver le businees model de...”


Téléchargements gratuits

Diffusés gratuitement (sous Creative Commons) et en PDF :

image

CouvertureRapportCES

Voir aussi la liste complète des publications de ce blog.


Catégories