Aller au contenu

Toute classification est-elle imparfaite?


Invité Quasi-Modo

Messages recommandés

Invité Quasi-Modo
Invités, Posté(e)
Invité Quasi-Modo
Invité Quasi-Modo Invités 0 message
Posté(e)
il y a une heure, zenalpha a dit :

Bonjour quasimodo

Non, toute classification est "imparfaite" en statistique,  quels que soient les méthodes

Je ne parle pas d'imperfection technique 

Si tu condenses l'information de départ en la structurant, tu perds une partie de l'information de départ qui fait la specificité de chaque individu lorsque tu mets en oeuvre ta classification 

Le gain en structuration doit etre plus important que la perte d'information 

En Statistique lors d'une segmentation ou une typologie, nous n'actons pas a priori et sauf à ce que cela soit imposé pour des contraintes d'utilisation pratiques le nombre de critères segmentant.

Nous prenons chaque critère qui est discriminant dans la réduction de la variance à expliquer et nous n'injectons une nouvelle variable que si elle contribue à diminuer significativement le reliquat de la variance à expliquer 

Si tu me parles de data mining et de machine learning,le free lunch est un théorème qui n'est pas sur la thématique de la classification à proprement parler.

Il demontre une limite theorique sur la capacité d'un algorithme à résoudre différentes tâches car chaque algorithme repose sur des hypothèses de départ qui sont censées être representatives de la "réalité", hypothèses dépendantes du contexte...

Cela signifie que plus un algorithme est performant sur un type de problème, moins il l'est en moyenne pour d'autres types et donc il faut plusieurs algorithmes ou il faut que ton algorithme soit précisément adapté a ta problématique 

"Free lunch" car il n'y a pas de déjeuner gratuit...ce qui est gratuit quelque part, tu le payes autre part

Bonjour zenalpha,

Je suis pas certain que le problème soit tellement différent entre les statistiques et le machine learning. Quoiqu'il en soit dans ce dernier domaine, nous considérons toujours qu'il y a un taux d'erreur acceptable et qu'aucun algorithme n'est parfait même s'il fait un très bon score. Mais certainement que nous devrions distinguer entre classification à priori (qui tente de généraliser et cerner les contours d'un concept) et classification à posteriori sur un jeu de test qu'on va considérer comme exhaustif : cette dernière catégorie seule permet de classer à 100% de précision, mais c'est sans généralisation et notre solution sera caduc sur un autre jeu de données.

Lien à poster
Partager sur d’autres sites

Annonces
Maintenant
Membre, Agitateur Post Synaptique, 56ans Posté(e)
zenalpha Membre 22 889 messages
56ans‚ Agitateur Post Synaptique,
Posté(e)
Il y a 23 heures, Quasi-Modo a dit :

Bonjour zenalpha,

Je suis pas certain que le problème soit tellement différent entre les statistiques et le machine learning. Quoiqu'il en soit dans ce dernier domaine, nous considérons toujours qu'il y a un taux d'erreur acceptable et qu'aucun algorithme n'est parfait même s'il fait un très bon score. Mais certainement que nous devrions distinguer entre classification à priori (qui tente de généraliser et cerner les contours d'un concept) et classification à posteriori sur un jeu de test qu'on va considérer comme exhaustif : cette dernière catégorie seule permet de classer à 100% de précision, mais c'est sans généralisation et notre solution sera caduc sur un autre jeu de données.

Oui 

De ce point de vue, il est possible si on connaît la dimension du jeu de données rapportée a la population totale d'extrapoler la pertinence 

Mais bon...l'empirisme pas à pas donne pas fondamentalement de moins bons résultats 

Chaque algorithme a ses limites 

Lien à poster
Partager sur d’autres sites

Membre, 8ans Posté(e)
bouddean Membre 11 942 messages
Maitre des forums‚ 8ans‚
Posté(e)
Le 27/8/2018 à 14:43, Mr Wolfe a dit :

C'est comme dans ton salon...

T'as un placard pour la vaisselle, une bibliothèque pour les livres

le problème ne vient pas des assiettes ni du dictionnaire, la problème vient des livres de cuisine, ou les ranger ?:D

 

Lien à poster
Partager sur d’autres sites

Membre, Posté(e)
Boutetractyxreqs Membre 5 959 messages
Baby Forumeur‚
Posté(e)
Le 27/08/2018 à 11:18, Quasi-Modo a dit :

L'ordre domine-t-il sur le chaos? Peut-on considérer que toute classification est condamnée à être imparfaite ou incomplète?

Par exemple les discussions sur le forum que nous trouverons ici sont organisées en sections, et en sous sections, avec une rubrique "Autres" qui semble présente et la condition de possibilité même de la classification. Nous avons donc un cas de classification que nous pourrions considérer comme imparfaite.

Il semble qu'aucune classification ne soit vraiment parfaite, et qu'une rubrique autres ou divers soit systématiquement nécessaire : peut-on considérer qu'il en va de même dans les sciences par exemple, tout groupe de phénomènes non expliqués ouvrant la voie à d'autres catégories et d'autres théories permettant de classifier la réalité? Ce fût le cas par exemple avec la catastrophe ultraviolette.

Il y aurait bien la possibilité de classer les sujets par ordre alphabétique des titres par exemple, mais alors ce ne serait plus un ordre qui se ferait en fonction de la nature des objets impliqués dans le classement. Il me semble (sans avoir d'exemple précis qui contredirait cette affirmation) que justement, les classifications sont toutes imparfaites ou incomplètes!

Selon les humeurs des gens tu peux avoir une classification. Mais qui dit classification dit organisation et qui c'est qui s'oppose à l'ordre c'est le chaos.

Tous deux ne s'opposent en fait que de douleur et d'indolore.

Comme par exemple un chaos indolore comme chacun se retrouve dans son bordel se fait ordonné alors qu'un ordre disciplinaire douloureux ferait un chaos de revanche...

Lien à poster
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×