19,549 lectures

Fonctions de base radiales : types, avantages et cas d'utilisation

par Sanjay Kumar6m2023/01/24

Trop long; Pour lire

Cet article explique l'intuition de base, l'idée mathématique et la portée de la fonction de base radiale dans le développement de modèles d'apprentissage automatique prédictifs. La fonction Base radiale est une fonction mathématique qui prend une entrée à valeur réelle et génère une sortie à valeur réelle basée sur la distance entre la valeur d'entrée projetée dans l'espace à partir d'un point fixe imaginaire placé ailleurs. Cette fonction est couramment utilisée dans de nombreux algorithmes d'apprentissage automatique et d'apprentissage en profondeur.

featured image - Fonctions de base radiales : types, avantages et cas d'utilisation

Il s'agit d'un article d'introduction expliquant l'intuition de base, l'idée mathématique et la portée des fonctions de base radiale dans le développement de modèles d'apprentissage automatique prédictifs.

Table des matières

Introduction
Intuition de base d'une fonction de base radiale
Types de fonction de base radiale
Le concept du Réseau RBF
Portée et avantages du RBF
Conclusion
Références

Introduction

Dans l'apprentissage automatique, la résolution de problèmes basée sur des algorithmes basés sur des hyperplans dépend fortement de la distribution des points de données dans l'espace. Cependant, c'est un fait connu que les données du monde réel suivent rarement des hypothèses théoriques.

Il existe de nombreuses fonctions de transformation qui peuvent convertir la forme naturelle des points de données en distributions théoriquement recommandées en persévérant dans les modèles cachés des données. Radial Basis est l'une de ces fonctions renommées qui est abordée dans de nombreux manuels d'apprentissage automatique. Dans cet article, nous découvrirons l'intuition de base, les types et l'utilisation de la fonction de base radiale.

L'intuition de base d'une fonction de base radiale

La fonction de base radiale est une fonction mathématique qui prend une entrée à valeur réelle et génère une sortie à valeur réelle basée sur la distance entre la valeur d'entrée projetée dans l'espace à partir d'un point fixe imaginaire placé ailleurs.

Cette fonction est couramment utilisée dans de nombreux algorithmes d'apprentissage automatique et d'apprentissage en profondeur tels que les machines à vecteurs de support, les réseaux de neurones artificiels, etc.

Comprenons le concept et l'utilisation de cette fonction mathématique.

En temps réel, chaque fois que nous résolvons des problèmes complexes d'apprentissage automatique à l'aide d'algorithmes tels que SVM, nous devons projeter tous nos points de données dans un espace multidimensionnel imaginaire où chaque caractéristique sera une dimension.

Supposons que nous ayons un problème de classification pour prédire si un étudiant réussira ou échouera à l'examen.

Nous avons les caractéristiques suivantes comme variables indépendantes :

Notes aux examens internes
Marques dans les projets
Pourcentage de fréquentation

Ainsi, ces 3 variables indépendantes deviennent 3 dimensions d'un espace comme celui-ci-

Considérons que nos points de données ressemblent à ceci où-

La couleur verte représente les étudiants qui ont réussi l'examen
La couleur rouge représente les étudiants qui ont échoué à l'examen

Maintenant, SVM va créer un hyperplan qui parcourt ces 3 dimensions afin de différencier les élèves ayant échoué et réussis-

Donc, techniquement maintenant, le modèle comprend que tous les points de données qui tombent d'un côté de l'hyperplan appartiennent aux étudiants qui ont réussi les examens et vice versa.

Dans notre exemple, il était facile de créer l'hyperplan car un hyperplan linéaire et droit suffisait à discriminer les 2 catégories. Mais dans les projets complexes en temps réel, ces relations peuvent être violées dans de nombreux scénarios. Surtout lorsque vous avez des centaines de variables indépendantes, il n'y a aucune possibilité d'obtenir une relation linéaire entre les points de données de sorte qu'il sera difficile de créer un hyperplan optimal.

Dans de tels scénarios, les chercheurs appliquent généralement la fonction de base radiale à chacun des points de données afin qu'ils puissent passer un hyperplan linéaire à travers les points de données pour résoudre facilement le problème.

Considérez que nos points de données ressemblent à ceci dans l'espace-

Il est clair que nous ne pouvons pas utiliser un hyperplan linéaire tel qu'il puisse regrouper les points de données selon leurs classes.

RBF nous aidera dans ce genre de scénarios.

Certains chercheurs projetteront généralement ces points de données dans des dimensions beaucoup plus élevées afin que la distance entre les points de données augmente afin qu'ils puissent appliquer une fonction (RBF ou toute autre fonction) pour construire un hyperplan. Mais il n'est pas nécessaire de construire des dimensions élevées puisque c'est toujours la décision du statisticien/chercheur qui comprend les modèles dans les données.

Ensuite, nous devons marquer un point imaginaire dans l'espace comme celui-ci là où nous en avons besoin.

Après cela, nous devons dessiner des cercles concentriques basés sur ce point imaginaire.

La distance entre le centre et tout point de données positionné dans la limite du cercle s'appelle le rayon.

Après avoir calculé le rayon, nous devons passer cette valeur dans une fonction mathématique (RBF) qui renverra une valeur réelle. La valeur renvoyée sera l'amplitude transformée d'un point de données particulier utilisé pour d'autres procédures.

Types de fonctions de base radiales

Il existe plusieurs types de fonctions de base radiale. Chacun d'eux transformera la valeur d'entrée d'une manière différente. Certains d'entre eux sont-

Fonction de base radiale multiquadratique

Où,

r est le rayon
ε est une constante

La fonction ressemblera à ceci par rapport au temps,

Fonction de base radiale multiquadrique inverse

Où,

r est le rayon
ε est une constante

Fonction de base radiale gaussienne

Où,

r est le rayon
ε est une constante

J'expliquerai intuitivement ce que ces fonctions feront intuitivement dans l'espace. Il y a 2 processus différents qui sont effectués par ces fonctions-

Étendre les points de données dans le sens horizontal
Compression des points de données dans le sens vertical

Le processus d'expansion ressemblera visuellement à ceci-

Le processus de compression ressemblera visuellement à ceci-

Après l'expansion et la compression, les points de données auraient été transformés comme ceci-

Maintenant, nous pouvons facilement construire un hyperplan linéaire qui peut classer les points de données comme ceci-

Le concept du réseau RBF

Parfois, RBF est également utilisé avec des réseaux de neurones artificiels avec une couche cachée. Dans de tels types de réseaux, RBF sera utilisé comme fonctions d'activation dans les couches cachées. Outre la couche cachée, il y aura une couche d'entrée qui contient plusieurs neurones où chacun d'eux représente une variable de caractéristique et la couche de sortie aura une somme pondérée des sorties de la couche cachée pour former les sorties du réseau.

Ces réseaux sont appelés réseaux RBF.

Portée et avantages du RBF

Avec l'aide de la fonction RBF, il est possible de résoudre les problèmes dans les ensembles de données qui ont des distributions non linéaires complexes.
La fonction RBF a une forte tolérance au bruit d'entrée
Dans le réseau de neurones RBF, il n'y aura qu'une seule couche cachée très facile à gérer.
Les modèles cachés dans la distribution peuvent être mieux généralisés après l'application de la fonction RBF.
Dans le réseau de neurones RBF, nous pouvons facilement interpréter quelle est la signification/fonction de chaque nœud dans la couche cachée du RBNN. Ceci est difficile dans la perception multicouche.
Certains des hyperparamètres présents dans le perceptron multicouche tels que le nombre de nœuds dans la couche cachée, le nombre de couches cachées, etc. sont difficiles à optimiser. Mais ceux-ci ne se trouvent pas dans les réseaux de neurones RBF.

Conclusion

Dans cet article, nous avons discuté de l'une des fonctions de transformation les plus utiles en apprentissage automatique. J'ai essayé d'expliquer ce concept compliqué sans de nombreux calculs mathématiques approfondis de manière lucide ciblant les débutants dans l'espace d'apprentissage AIML.

Cette fonction est disponible en tant que bibliothèque intégrée dans la plupart des langages de programmation orientés science des données tels que Python ou R. Par conséquent, il est facile de l'implémenter une fois que vous avez compris l'intuition théorique. J'ai ajouté les liens vers certains des matériaux avancés dans la section des références où vous pouvez approfondir les calculs complexes si vous êtes intéressé.

Références

Fonctions de base radiales - Wikipédia
Réseaux à fonction de base radiale Archivé le 23/04/2014 sur la Wayback Machine
Tête de balai, David H. ; Lowe, David (1988)."Interpolation fonctionnelle multivariable et réseaux adaptatifs" (PDF) . Systèmes complexes . 2 : 321–355. Archivé de l'original (PDF) le 14/07/2014.
Michael JD Powell (1977). "Procédures de redémarrage pour la méthode du gradient conjugué". Programmation mathématique . 12 (1): 241–254. doi : 10.1007/bf01593790 . S2CID 9500591 .
Sahin, Ferat (1997). Une approche par fonction de base radiale d'un problème de classification d'images couleur dans une application industrielle en temps réel (M.Sc.). Virginie Tech . p. 26. manche : 10919/36847 . Les fonctions à base radiale ont été introduites pour la première fois par Powell pour résoudre le vrai problème d'interpolation multivariée.

L O A D I N G
. . . comments & more!

About Author

Sanjay Kumar@sanjaykn170396

Data scientist | ML Engineer | Statistician

Read my stories