Crédit : Pixabay/CC0 Domaine public
Afin de nous frayer un chemin à travers le monde, notre cerveau doit développer une compréhension intuitive du monde body qui nous entoure, que nous utilisons ensuite pour interpréter les informations sensorielles qui lui parviennent.
Remark le cerveau développe-t-il cette compréhension intuitive ? De nombreux scientifiques pensent que cela pourrait utiliser un processus similaire à ce que l’on appelle « l’apprentissage auto-supervisé ». Ce sort d’apprentissage automatique, développé à l’origine pour créer des modèles de imaginative and prescient par ordinateur plus efficaces, permet aux modèles informatiques de reconnaître des scènes visuelles en fonction uniquement de leurs similitudes et de leurs différences, sans étiquettes ni autres informations.
Deux études menées par des chercheurs du Centre Ok. Lisa Yang pour les neurosciences computationnelles intégratives (ICoN) du MIT fournissent de nouvelles preuves à l’appui de cette hypothèse. Les chercheurs ont découvert que lorsqu’ils formaient des modèles appelés réseaux de neurones en utilisant un sort spécifique d’apprentissage auto-supervisé, les modèles résultants généraient des schémas d’activité très similaires à ceux observés dans le cerveau des animaux qui effectuaient les mêmes tâches que les modèles.
Les résultats suggèrent que ces modèles sont capables d’apprendre des représentations du monde body qui peuvent être utilisées pour faire des prédictions précises sur ce qui se passera dans ce monde, et que le cerveau des mammifères pourrait utiliser l. a. même stratégie, affirment les chercheurs.
“Le thème de notre travail est que l’IA conçue pour aider à construire de meilleurs robots finit également par être un cadre pour une meilleure compréhension du cerveau en général”, explique Aran Nayby, chercheur postdoctoral à ICoN. “Nous ne pouvons pas encore dire s’il s’agit du cerveau entier, mais à différentes échelles et régions du cerveau, nos résultats semblent suggérer un principe organisateur.”
Naibi est l’auteur foremost de l’une des études, co-écrite par Rishi Rajalingham, ancien chercheur postdoctoral au MIT qui travaille maintenant au Meta Truth Labs, et l’auteur foremost Mehrdad Jazayeri, professeur agrégé de sciences du cerveau et des sciences cognitives et chercheur. membre de l’Institut de recherche McGovern. Recherche sur le cerveau. et Robert Yang, professeur adjoint de sciences du cerveau et cognitives et membre associé du McGovern Institute.
Ella Vitti, directrice du ICoN Middle, professeur de sciences du cerveau et des sciences cognitives et membre associée du McGovern Institute, est l’auteur foremost de l’autre étude, codirigée par Mikael Khona, étudiant diplômé au MIT, et Raylan. Schiffer, ancien associé de recherche au MIT.Pour l. a. technologie.
Les deux études seront présentées lors de l. a. conférence 2023 sur les systèmes de traitement de l’data neuronale (NeurIPS) en décembre.
Modéliser le monde body
Les premiers modèles de imaginative and prescient par ordinateur reposaient principalement sur l’apprentissage supervisé. Grâce à cette approche, les modèles sont entraînés à classer des pictures dont chacune a un nom – un chat, une voiture, and so on. Les modèles qui en résultent fonctionnent bien, mais ce sort de formation nécessite une grande quantité de données étiquetées par l’homme.
Pour trouver une choice plus efficace, les chercheurs se sont tournés ces dernières années vers des modèles construits grâce à une method connue sous le nom d’apprentissage variationnel auto-supervisé. Ce sort d’apprentissage permet à l’algorithme d’apprendre à classer les objets en fonction de leur similitude, sans fournir d’étiquettes externes.
« Il s’agit d’une approche très puissante automotive vous pouvez désormais exploiter de très grands ensembles de données modernes, notamment vidéo, et réellement libérer leur potentiel », explique Naibi. “Une grande partie de l’IA moderne que vous voyez aujourd’hui, en particulier au cours des deux dernières années avec ChatGPT et GPT-4, est le résultat de l. a. formation d’une fonction goal auto-supervisée sur un ensemble de données à grande échelle pour obtenir une représentation très versatile.”
Ces varieties de modèles, également appelés réseaux de neurones, sont constitués de milliers ou de hundreds of thousands d’unités de traitement connectées entre elles. Chaque nœud possède des connexions de power variable avec d’autres nœuds du réseau. À mesure que le réseau analyse de grandes quantités de données, l. a. power de ces connexions trade à mesure que le réseau apprend à effectuer l. a. tâche requise.
Lorsqu’un modèle effectue une tâche particulière, les modèles d’activité des différentes unités du réseau peuvent être mesurés. L’activité de chaque unité peut être représentée comme un modèle de déclenchement, similaire aux modèles de déclenchement des neurones du cerveau. Des travaux antérieurs de Nyby et ses collaborateurs ont montré que les paradigmes de imaginative and prescient auto-supervisés génèrent une activité similaire à celle observée dans le système de traitement visuel du cerveau des mammifères.
Dans les deux nouvelles études NeurIPS, les chercheurs ont cherché à déterminer si des modèles informatiques auto-supervisés d’autres fonctions cognitives pourraient également présenter des similitudes avec le cerveau des mammifères. Dans l’étude menée par Naebi, les chercheurs ont formé des modèles auto-supervisés pour prédire l’état futur de leur environnement à travers des centaines de milliers de vidéos naturelles illustrant des scénarios quotidiens.
“Au cours de l. a. dernière décennie, l. a. manière dominante de construire des modèles de réseaux neuronaux en neurosciences cognitives a été de former ces réseaux sur des tâches cognitives uniques”, explique Yang. “Mais les modèles formés de cette manière se généralisent rarement à d’autres tâches.” “Ici, nous testons si nous pouvons construire des modèles de certains facets de l. a. cognition en nous entraînant d’abord sur des données naturelles en utilisant un apprentissage auto-supervisé, puis en les évaluant en laboratoire.”
Une fois le modèle entraîné, les chercheurs l’ont généralisé à une tâche qu’ils ont appelée « Psychological-Pong ». Ceci est similaire au jeu vidéo Pong, dans lequel le joueur déplace une pagaie pour frapper une balle qui traverse l’écran. Dans l. a. model Psychological-Pong, l. a. balle disparaît peu de temps avant de toucher l. a. raquette, le joueur doit donc estimer sa trajectoire pour pouvoir frapper l. a. balle.
Les chercheurs ont découvert que le modèle était succesful de suivre l. a. trajectoire de l. a. balle cachée avec une précision similaire à celle des neurones du cerveau des mammifères, ce qui a été démontré dans une étude précédente de Raglingham et Jazairi pour simuler sa trajectoire, un phénomène cognitif connu sous le nom de « mentalisation ». Simulation.” De plus, les schémas d’activation neuronale observés dans le modèle étaient similaires à ceux observés dans le cerveau des animaux pendant qu’ils jouaient, en particulier dans une partie du cerveau appelée cortex préfrontal dorsomédial. Les chercheurs affirment qu’aucune autre classe de les modèles informatiques ont pu faire correspondre les données biologiques ressemblent beaucoup à cette catégorie.
« De nombreux efforts sont déployés dans l. a. communauté de l’apprentissage automatique pour créer une intelligence artificielle », explique Jazayeri. “L’significance de ces modèles en neurobiologie dépend de leur capacité à mieux capturer le fonctionnement interne du cerveau. Le fait que le modèle d’Aran prédit les données neuronales est vraiment vital automotive il suggère que nous nous rapprochons peut-être de l. a. building de systèmes artificiels imitant les phénomènes naturels. intelligence.”
Naviguer dans le monde
L’étude de Khona, Schiffer et Viti s’est concentrée sur un sort de cellule nerveuse spécialisée appelée cellule de grille. Ces cellules, situées dans le cortex entorhinal, aident les animaux à naviguer, en travaillant en conjonction avec les cellules de position de l’hippocampe.
Alors que les cellules de lieu sont actives lorsque l’animal se trouve dans un emplacement spécifique, les cellules de grille ne sont actives que lorsque l’animal se trouve à l’un des sommets de l. a. grille triangulaire. Les groupes de cellules de grille créent des grilles superposées de différentes tailles, leur permettant de coder un grand nombre de positions en utilisant un nombre relativement petit de cellules.
Dans des études récentes, des chercheurs ont formé des réseaux neuronaux supervisés pour imiter l. a. fonction des cellules de l. a. grille en prédisant l’emplacement suivant d’un animal en fonction de son level de départ et de sa vitesse, une tâche connue sous le nom d’intégration de chemin. Cependant, ces modèles s’appuient sur l’accès à tout second à des informations privilégiées sur l’espace absolu, informations dont l’animal ne dispose pas.
Inspirée par les étonnantes propriétés de codage du code de cellule de grille more than one spatio-périodique, l’équipe du MIT a formé un modèle variationnel auto-supervisé pour effectuer l. a. même tâche d’intégration de chemin et représenter efficacement l’espace ce faisant. Pour les données d’entraînement, ils ont utilisé des séquences d’entrée de vitesse. Le modèle a appris à différencier les positions selon qu’elles étaient similaires ou différentes : les positions proches généraient des symboles similaires, mais les positions supplémentaires généraient davantage de symboles différents.
“C’est similaire aux modèles de formation d’pictures, où s’il y a deux pictures de têtes de chat, leurs symboles doivent être similaires, mais si l’une est une tête de chat et l’autre un camion, vous voulez que leurs symboles entrent en conflit”, explique Khona. “Nous reprenons l. a. même idée mais l’appliquons aux trajectoires spatiales.”
Une fois le modèle formé, les chercheurs ont découvert que les modèles d’activation des nœuds au sein du modèle formaient plusieurs modèles de grille avec des durées différentes, très similaires à ceux formés par les cellules de grille dans le cerveau.
“Ce qui m’intéresse dans ce travail, c’est qu’il relie les travaux mathématiques sur les étonnantes propriétés de l. a. théorie de l’data du code de cellule de grille avec le calcul de l’intégrale de chemin”, explique Vietti. « Même si le travail mathématique était analytique (quelles sont les propriétés d’un code de cellule de grille ?), l’approche visant à améliorer l’efficacité du codage grâce à l’apprentissage auto-supervisé et à obtenir une régularisation de sort grille est synthétique : elle montre quelles propriétés pourraient être nécessaires et suffisantes pour expliquer pourquoi. .» Le cerveau a des cellules en forme de grille. »
Plus d’data:
Aran Nayby et al., Fondements neuronaux de l. a. simulation mentale : prédiction potential des représentations latentes dans des scènes dynamiques, arXiv (2023). DOI : 10.48550/arxiv.2305.11772
L’apprentissage auto-supervisé de représentations spécifiques à l’espace génère des cellules de grille multi-unités, neurips.cc/digital/2023/poster/72628
arXiv
Fourni par le MIT
Cette histoire a été republiée grâce à MIT Information (internet.mit.edu/newsoffice/), un website populaire couvrant l’actualité de l. a. recherche, de l’innovation et de l’enseignement du MIT.
l. a. quotation: Le cerveau peut apprendre à connaître le monde de l. a. même manière que certains modèles informatiques (30 octobre 2023) Extrait le 30 octobre 2023 de
Ce record est soumis au droit d’auteur. Nonobstant toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif uniquement.