Caltech 101

Caltech 101

Caltech 101 est une base d'images numérisées créée en septembre 2003. compilée par plusieurs chercheurs à l'Institut des Technologies de California, comme Fei-Fei Li, Marco Andeetto, Marc 'Aurelio Ranzato et Pietro Perona. Elle a pour objectif de facilier les recherches et le développement de la technologie de vision cognitive, c'est-à-dire permettre à la machine de comprendre ce qu'elle "voit".


Elle est applicable aux techniques de reconnaissance, classification et de catégorisation. Caltech 101 contient un total de 9146 images, classées en 101 types d'objets (par exemple visages, pianos, montres...) et une catégorie d'image arrière-plan. Tout ceci est fourni avec des descriptions de chaque image, avec un script Matlab pour la visualisation.

Sommaire

Contexte

L'élaboration de cette base d'images part d'un constat assez simple. La majorité des machines cognitives et les algorithmes d'apprentissage nécessitent une connaissance d'un nombre assez élevé d'exemples, ceci dit, une liste longue et variée de données. Par exemple, des méthodes de reconnaissance faciale temps réel de Paul Viola et Micheal J. Jones a nécessité l'apprentissage de quelques 4916 visages auparavant. Le problème c'est que l'acquisition d'un tel large volume d'images, qui sont également appropriées est souvent difficile. D'autre part, le redimensionnement d'un grand nombre d'images et trouver celles intéressantes est souvent une tâche pénible. La base d'images de Caltech 101 a pour but de résoudre ces problèmes en prenant en charge le fournissement d'une base d'images prête, disponible et facilement accessible.

Avantages

Une présentation et une taille d’images uniformes En effet, toutes les images dans chaque catégorie sont uniformes en taille et en termes de position relative aux objets d’intérêt. Ce qui veut dire les utilisateurs de Caltech 101 n’ont pas besoin de perdre du temps dans le découpage et le redimensionnement des images avant d’êtres utilisées.

Un niveau faible de clusters Les algorithmes qui s’intéressent à la reconnaissance fonctionnent dans la majorité du temps par le sauvegarde des caractéristiques uniques à l’objet à reconnaître. Toutefois, l’arrière-plan des images prises sont très hétérogènes. Ceci cause un éventuel fonctionnement incorrect à cause du mauvais ordonnancement.

Une description détaillée des images

Inconvénients

En revanche, Caltech 101 présente des limites et faiblesses. En effet, la base de d’images contient un nombre limité de catégories qui ne représentent qu’une petite fraction des objet dont ils peuvent être le sujet de reconnaissance.

La base de d’images contient un nombre limité de catégories qui ne représentent qu’une petite fraction des objets dont ils peuvent être le sujet de reconnaissance.

Plusieurs catégories ne contiennent que peu d’images. Ce qui veut dire l’apprentissage exclusivement par ces images est insuffisant pour rendre l’algorithme capable de reconnaître ce type d’objet.

Les images sont très uniformes dans leur présentation, alignées à gauche ou à droite, et non complexes. Ainsi, elles ne sont pas toujours représentatives des cas pratiques. En réalité, les objets à reconnaître sont plus désordonnés et comportent des fluctuations dans les positions relatives, ainsi que leurs orientations.

Autres versions

Il existe une version améliorée Caltech 256 qui comporte plus de catégories et plus d’images plus proches du cas réel.

Articles connexes

Apprentissage automatique Traitement d'images Intelligence artificielle Banque d'images Reconnaissance de formes

Liens et documents externes


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Caltech 101 de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • Caltech 101 — is a dataset of digital images created in September, 2003, compiled by Fei Fei Li, Marco Andreetto, and Marc Aurelio Ranzato at the California Institute of Technology. It is intended to facilitate Computer Vision research and techniques. It is… …   Wikipedia

  • List of Zoey 101 characters — The following is a from the Nickelodeon TV series, Zoey 101. Contents 1 Main characters 1.1 Zoey Brooks 1.2 Dustin Brooks 1.3 Chase Matthews …   Wikipedia

  • М 101 — M101 Галактика История исследования Открыватель Пьер Мешен Дата открытия 27 …   Википедия

  • Мессье 101 — M101 Галактика История исследования Открыватель Пьер Мешен Дата открытия 27 …   Википедия

  • Overhead Imagery Research Data Set — The Overhead Imagery Research Data Set (OIRDS) is a collection of an open source, annotated, overhead images that computer vision researchers can use to aid in the development of algorithms.[1] Most computer vision and machine learning algorithms …   Wikipedia

  • Object categorization from image search — In computer vision, the problem of object categorization from image search is the problem of training a classifier to recognize categories of objects, using only the images retrieved automatically with an Internet search engine. Ideally,… …   Wikipedia

  • Bag of words model in computer vision — This is an article introducing the Bag of words model (BoW) in computer vision, especially for object categorization. From now, the BoW model refers to the BoW model in computer vision unless explicitly declared.Before introducing the BoW model,… …   Wikipedia

  • Arp-Katalog — Der Atlas of Peculiar Galaxies ist ein Astronomischer Katalog. In ihm sind 338 ungewöhnlichen Galaxien mit photographischen Aufnahmen aufgeführt. Die Antennen Galaxie (Arp 244) Inhaltsverzeichnis 1 Geschichte …   Deutsch Wikipedia

  • Hector Berlioz — Louis Hector Berlioz (December 11, 1803 ndash; March 8, 1869) was a French Romantic composer, best known for his compositions Symphonie fantastique and Grande Messe des morts (Requiem). Berlioz made great contributions to the modern orchestra… …   Wikipedia

  • California Institute of Technology — Motto The truth shall make you free [1] Established 1891 Type …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”