Verticrawl

Verticrawl
Verticrawl
Forme juridique SARL
Slogan « Votre Logiciel de recherche interne »
Siège social Drapeau de France Toulouse (France)


Verticrawl est un logiciel de moteur de recherche. Lancé en 1999, sa conception technique permet l'indexation plein texte dans plus de 220 formats de fichier dont Office, Pdf, vidéo et web. En tant que moteur de recherche sémantique, il est capable de reconnaître 68 langues.

En 2005, La solution de recherche est devenue totalement webservice à vocation SiteSearch. L'outil est donc destiné à une utilisation en ligne ou hors ligne de recherche pour site web. Les activités de gestion de contenu, les sites marchands ou les SEO (optimisation des moteurs de recherche) l'utilisent pour mettre en œuvre une fonction élaborée de recherche sur site.

Sommaire

Fonctions d'indexation

Outre les fonctions de crawling web, Verticrawl peut nativement indexer les protocoles https, ftps, news avec ou sans authentification. Étant dédié à une indexation sélective de contenu, l'exploitation de règles d'indexation spécifiques permet la collecte de données sélective, c'est-à-dire le crawling vertical (d'où son nom VERTICRAWL).

Le logiciel peut indexer des catalogues produits via des formats éditeur ou directement sur les serveurs de base de données.

Une interface d'administration permet à chaque client de consulter l'ensemble des processus et les données indexées.

Fonctions de recherche

Les fonctions de recherche sont mises à disposition sous forme d'API de dialogue avec le centre serveur. Chaque API dispose de trois formats (HTML, XML ou PHP) qui couvrent 99 % des besoins d'intégration des recherches sur site. Une aide en ligne contenant des scripts open source rendent l'intégration simple et rapidement opérationnelle.

  • moteur de recherche sémantique
  • plan de site automatique
  • table des matières automatique (index sémantique)
  • correction orthographique
  • suggestion de recherche associées
  • auto-completion
  • screenshot automatique (image des documents indexés)
  • logiciel de régie publicitaire multimédia et contextuelle nommé Answord

Ces fonctions sont toutes interfaçables y compris avec des applicatifs web2.0 ou AJAX. Le design de résultats d'un moteur de recherche est entièrement paramétrable.

Principales fonctions d'administration

  • Multi bases d'indexation
  • Architecture set and forget
  • Paramétrage des périodes de crawl
  • Statistiques de recherche avec géolocalisation et analyse comportementale
  • Paramétrage des API.

Clients et utilisateurs

Essentiellement des entreprises utilisant internet comme vecteur de leur activité. Il s'agit surtout de collectivités, de PME, de sociétés de référencement pour l'optimisation des moteurs de recherche (SEO) et de sites de commerce électronique.

Qu'est ce que le Webservice

À l'inverse d'un logiciel installé, le web service supprime toute contrainte d'infrastructure et de mise à jour du logiciel. Le principe de licence en mode ASP (commercialisé par un fournisseur d'applications en ligne), et maintenant SaaS (Software as a Service), garantit une évolution constante du produit ainsi qu'une disponibilité réelle du logiciel pour le client, sans installation. Dans le cas des moteurs de recherche, les ressources techniques sont bien plus complexes à mettre en œuvre que pour un logiciel classique (disponibilité, charge serveur, coût de l'infrastructure).

De même, le prix de licence est alors beaucoup plus attractif que pour un logiciel dit end-user, installé sur un serveur ou un ordinateur.

Évolutions

Verticrawl a intégré des fonctions de data-mining couplées au système de crawl pour extraire des données non structurées directement dans les pages web. E-miner peut collecter des liens en javascript (par exemple), reconnaître un prix, des informations techniques issues d'une fiche produit (sur un site marchand), etc.

Les données ainsi collectées sont exportables au format xml ou de base de données pour un système de veille marketing, de comparaison de prix, etc.

Identité du crawler

Le robot porte le nom suivant VerticrawlBot suivi d'un identifiant de client.

Liens externes



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Verticrawl de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

  • Moteur de recherche — Pour les articles homonymes, voir recherche (homonymie). Un moteur de recherche est une application permettant de retrouver des ressources (pages web, forums Usenet, images, vidéo, fichiers, etc.) associées à des mots quelconques. Certains sites… …   Wikipédia en Français

  • A9.com — A9.com, mis en ligne le 14 avril 2004, est un moteur de recherche sur Internet appartenant à la société Amazon.com. Ses résultats s appuient sur la technologie du moteur Windows Live Search (Google auparavant), complétés par les… …   Wikipédia en Français

  • ASPseek — est un moteur libre d indexation et de recherche dans des contenus Web. Il est sous licence GPL. Liens externes Page d accueil du projet ASPseek v · Moteurs de recherche Généraux …   Wikipédia en Français

  • AlltheWeb — fut un important moteur de recherche sur Internet présenté par Fast Search and Transfer en 1999 mais commencé dès 1997. Bien qu étant un rival de Google en taille et en technologie, le moteur n est jamais devenu aussi populaire. Créé en 1999 par… …   Wikipédia en Français

  • AltaVista — Pour les articles homonymes, voir Alta Vista. Logo de AltaVista Dates clés 1995 création …   Wikipédia en Français

  • Apache Solr — Solr Développeur Fondation Apache Dernière version 3.3 …   Wikipédia en Français

  • Ask.com — Pour les articles homonymes, voir Ask. Logo de la société Ask.com NASDAQ : IACI, anciennement Ask Jeeves, est un moteur de recherche sur Internet fo …   Wikipédia en Français

  • Astalavista — est un moteur de recherche consacré principalement à la sécurité informatique. Ce site tire son nom d une parodie, à mi chemin du castillan hasta la vista, « à la prochaine », et d AltaVista, moteur de recherche plus traditionnel. Il… …   Wikipédia en Français

  • Baidu — Logo de Baidu Création 2000 Personnages clés Robin Li, Chairman, CEO Shawn Wang, CFO …   Wikipédia en Français

  • Bing (moteur de recherche) — Pour les articles homonymes, voir Bing. Logo de Bing URL …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”