Lexique Le Bon LLM

A

Adaptation à faible rang (Low rank adaption, LoRA)

ALIBI (élargissement de la fenêtre contextuelle)

ALiBi, ou Attention with Linear Biases, est une méthode de positionnement qui permet aux modèles de langage Transformer de traiter, lors de l'inférence, des séquences plus longues que celles sur lesquelles ils ont été entraînés. ALiBi réalise cela sans utiliser de véritables embeddings de position. Au lieu de cela, en calculant l'attention entre une certaine clé et une requête, ALiBi pénalise la valeur d'attention que la requête peut attribuer à la clé en fonction de la distance entre la clé et la requête. Ainsi, lorsque la clé et la requête sont proches, la pénalité est très faible, et lorsque elles sont éloignées, la pénalité est très élevée.

Cette méthode est motivée par la simple observation que les mots qui sont proches ont beaucoup plus d'importance que ceux qui sont éloignés. Cette méthode est aussi rapide que les méthodes d'embedding sinusoïdal ou absolu (les méthodes de positionnement les plus rapides qui existent). Elle surpasse ces méthodes et les embeddings rotatifs lors de l'évaluation de séquences plus longues que celles sur lesquelles le modèle a été entraîné (ce qui est appelé extrapolation).

Pourquoi est-ce important ?

ALiBi est important car il permet aux modèles de langage Transformer de gérer des séquences plus longues que celles sur lesquelles ils ont été initialement formés. Cela ouvre la voie à des applications dans lesquelles des informations contextuelles plus longues sont nécessaires pour une meilleure compréhension du texte. En élargissant la fenêtre contextuelle, ALiBi améliore les performances des modèles de langage et leur capacité à traiter des tâches complexes nécessitant une prise en compte d'un contexte plus large.

Comment est-ce utilisé en 2023 ?

En 2023, ALiBi est utilisé dans les modèles de langage Transformer pour permettre la manipulation de séquences plus longues. Il est utilisé lors de l'inférence pour traiter des textes qui dépassent la longueur des données d'entraînement. Cette capacité est particulièrement utile dans des domaines tels que la traduction automatique, la génération de texte, l'analyse de sentiment et bien d'autres, où une compréhension du contexte étendu est essentielle. ALiBi est utilisé pour améliorer les performances des modèles sur ces tâches et pour les adapter à des scénarios réels nécessitant une prise en compte d'un contexte plus large et diversifié.

Alignement

Annotation

Apprentissage non supervisé (ou unsupervised learning)

Apprentissage supervisé / Supervised learning

Architecture d'un modèle

B

Bard

BERT

Bloom

C

Chatbots

ChatGPT

Claude

Clustering

Cognitive computing

Common Crawl

Compromis Biais-Variance

Cross validation

D

DALL-E

Deep learning

Discriminator (en GAN)

Données synthétiques

Les données synthétiques sont des données artificielles générées à partir de données originales et d'un modèle entraîné pour reproduire les caractéristiques et la structure des données d'origine. Cela signifie que les données synthétiques et les données originales devraient donner des résultats très similaires lorsqu'elles sont soumises à la même analyse statistique.

Pourquoi est-ce important ?

Les données synthétiques sont importantes car elles offrent plusieurs avantages dans le domaine de l'apprentissage automatique et de l'analyse des données. Premièrement, elles permettent de préserver la confidentialité des données sensibles en créant des données artificielles qui ne contiennent aucune information personnelle identifiable. Cela facilite le partage des données pour la recherche et le développement de modèles sans compromettre la vie privée des individus.

Deuxièmement, les données synthétiques peuvent être utilisées pour augmenter la taille d'un ensemble de données limité. Lorsque les données réelles sont rares ou coûteuses à collecter, générer des données synthétiques peut permettre d'augmenter la quantité de données disponibles pour l'entraînement des modèles, ce qui peut améliorer leurs performances et leur capacité de généralisation.

Enfin, les données synthétiques sont utiles pour la création de scénarios fictifs ou pour effectuer des tests dans des environnements contrôlés. Par exemple, dans le domaine de la simulation, les données synthétiques peuvent être utilisées pour créer des modèles réalistes et représentatifs de situations spécifiques, ce qui permet de prendre des décisions éclairées et de prévoir les résultats dans des conditions simulées.

Comment est-ce utilisé en 2023 ?

En 2023, les données synthétiques sont largement utilisées dans divers domaines tels que l'apprentissage automatique, la recherche en sciences sociales, la cybersécurité et la simulation. Dans l'apprentissage automatique, elles sont utilisées pour créer des ensembles de données d'entraînement plus vastes et plus diversifiés, ce qui améliore les performances des modèles.

Dans la recherche en sciences sociales, les données synthétiques permettent d'étudier des questions sensibles sans compromettre la vie privée des participants. Elles sont également utilisées dans la cybersécurité pour simuler des attaques et tester la résilience des systèmes.

En simulation, les données synthétiques sont utilisées pour créer des environnements virtuels réalistes, reproduisant des scénarios réels ou hypothétiques. Cela permet d'explorer différentes possibilités, de prendre des décisions éclairées et de prévoir les résultats avant de les mettre en pratique dans le monde réel.

DoNotDelete

E

Effondrement du modèle

Embeddings

F

Falcon

Falcon est une nouvelle famille de modèles de langage de pointe créée par l'Institut d'Innovation Technologique d'Abou Dabi et publiée sous licence Apache 2.0. Notamment, Falcon-40B est le premier modèle "véritablement ouvert" doté de capacités rivalisant avec de nombreux modèles propriétaires actuels. C'est une excellente nouvelle pour les praticiens, les passionnés et l'industrie, car cela ouvre la voie à de nombreux cas d'utilisation passionnants.

Pourquoi est-ce important ?

La famille Falcon revêt une grande importance car elle offre des modèles de langage de pointe, largement accessibles et ouverts, offrant des performances comparables voire supérieures à celles des modèles propriétaires. Cela permet à un plus grand nombre de personnes de bénéficier de ces modèles pour une variété de tâches telles que la génération de texte, la traduction automatique et bien plus encore. L'ouverture de Falcon ouvre de nouvelles perspectives pour l'exploration, la recherche et l'innovation dans le domaine de l'intelligence artificielle et du traitement du langage naturel.

Comment est-ce utilisé en 2023 ?

En 2023, Falcon est largement utilisé dans la communauté de l'apprentissage automatique et du traitement du langage naturel. Les chercheurs, les développeurs et les passionnés peuvent exploiter les modèles Falcon pour une multitude de tâches, des expériences rapides aux projets de recherche avancée. Les modèles Falcon-40B et Falcon-7B offrent des performances de pointe et sont adaptés à différents matériels. Ils peuvent être utilisés pour l'inférence, le réglage fin et bien plus encore. De plus, les versions instruct de Falcon sont disponibles pour les tâches de type assistant virtuel, facilitant ainsi leur utilisation dans ces scénarios spécifiques. La qualité des modèles Falcon est garantie par leur entraînement sur un volume massif de données web, avec une attention multi-requêtes pour une meilleure performance. L'année 2023 voit l'utilisation répandue de Falcon pour des tâches variées, propulsant la recherche et l'innovation dans le domaine du langage et de l'IA.

Fenêtre contextuelle

Few-Shot Prompting

Fine tuning

G

GAN

Generator

GGML

Google colab

GPT

GPU

Un processeur graphique, ou GPU (Graphics Processing Unit), est un circuit électronique spécialisé initialement conçu pour accélérer les graphiques informatiques et le traitement des images. Il est utilisé soit sur une carte vidéo, soit intégré sur des cartes mères, des téléphones mobiles, des ordinateurs personnels, des stations de travail et des consoles de jeux. Cependant, au fil du temps, il a également été utilisé pour des calculs non graphiques impliquant des problèmes dits "embarrassingly parallel" (très parallélisables) grâce à leur structure parallèle. Parmi ces utilisations non graphiques, on retrouve l'entraînement des réseaux de neurones et le minage des cryptomonnaies.

Pourquoi est-ce important ?

Les GPU sont essentiels dans le contexte des modèles de langage à grande échelle en raison de leur capacité à gérer de grands volumes de calculs en parallèle. Le traitement parallèle est un élément clé de l'apprentissage profond, qui est le processus par lequel les modèles de langage apprennent à partir de grandes quantités de données textuelles. De plus, les GPU sont particulièrement efficaces pour effectuer les calculs en virgule flottante nécessaires pour l'entraînement de ces modèles. Sans les GPU, l'entraînement des grands modèles de langage serait beaucoup plus lent et plus coûteux.

Comment est-il utilisé en 2023 ?

En 2023, les GPU sont encore largement utilisés dans la formation des modèles de langage à grande échelle comme GPT-4. Ils sont particulièrement utiles pour les tâches qui nécessitent de nombreuses opérations de multiplication de matrices, qui sont un élément central de nombreux algorithmes d'apprentissage profond. Avec l'avancement de la technologie, les GPU sont devenus de plus en plus puissants et efficaces, permettant l'entraînement de modèles de langage toujours plus grands et plus précis. De plus, l'évolution des frameworks d'apprentissage profond a rendu l'utilisation des GPU plus facile et plus accessible, même pour les personnes sans connaissance approfondie du matériel.

H

Hallucination

La "hallucination" est un concept dans le domaine des grands modèles de traitement du langage naturel (NLP) ou des grands modèles de langage (LLM) lorsqu'un modèle produit des réponses inexistantes ou incorrectes, mais le fait de manière à donner l'impression d'être confiant dans sa réponse. En d'autres termes, une hallucination se produit lorsque l'intelligence artificielle générative analyse le contenu qui lui est fourni, mais en arrive à une conclusion erronée et produit un nouveau contenu qui ne correspond pas à la réalité. Par exemple, un modèle d'IA entraîné sur des milliers de photos d'animaux, lorsqu'on lui demande de générer une nouvelle image d'"animal", il pourrait combiner la tête d'une girafe avec la trompe d'un éléphant. Bien que ces résultats puissent être intéressants, les hallucinations sont des résultats indésirables qui indiquent un problème dans les sorties du modèle génératif.

Pourquoi est-ce important ?

Les hallucinations sont importantes à comprendre car elles soulignent les limites et les challenges des modèles de langage génératifs. Bien que ces modèles soient capables de fournir une quantité impressionnante d'informations et de répondre à de nombreuses requêtes, ils ne sont pas des bases de données ou des moteurs de recherche. Ils n'ont pas de connaissance intrinsèque de ce qui est vrai ou faux. Leur capacité repose sur des statistiques et des probabilités, ce qui les conduit à générer des déclarations qui peuvent sembler convaincantes mais qui sont factuellement incorrectes ou totalement fictives. Comprendre les hallucinations permet de mieux appréhender les limites de ces modèles et d'utiliser leurs sorties avec précaution.

Comment est-ce utilisé en 2023 ?

En 2023, la compréhension des hallucinations dans les modèles de langage génératifs est devenue une préoccupation majeure. Les chercheurs et les développeurs travaillent sur l'amélioration de ces modèles afin de réduire le nombre d'hallucinations et d'augmenter leur fiabilité. Des techniques sont mises en place pour détecter et filtrer les réponses hallucinatoires, afin de fournir des résultats plus précis et fiables. Les utilisateurs sont encouragés à vérifier et à valider les informations générées par ces modèles, en particulier lorsqu'il s'agit de faits sensibles ou critiques. L'objectif est de trouver un équilibre entre la génération créative de contenu et la précision des informations fournies par ces modèles de langage génératifs, afin de maximiser leur utilité tout en minimisant les hallucinations.

Hyperparamètres

I

Inférence

Intelligence artificielle explicative

Intelligence artificielle générale (ou IA forte)

Intelligence artificielle générative

L'Intelligence Artificielle générative, ou "Generative AI" en anglais, est un type d'IA capable de produire un contenu original, comme une image ou un texte, à partir d'une entrée donnée, généralement sous forme de texte. Au lieu de simplement analyser, réorganiser ou identifier des données existantes, un modèle d'IA générative crée quelque chose de nouveau, que ce soit une histoire, une image ou un autre type de contenu. Il est important de noter que même si un contenu est généré par l'IA, cela ne signifie pas nécessairement qu'il est correct ou qu'il reflète la réalité, seulement qu'il n'existait pas avant qu'on ne le demande.

Pourquoi est-ce important ?

L'IA générative est importante car elle ouvre des portes à une toute nouvelle dimension de créativité pour les machines. En étant capable de générer de nouvelles idées, images, textes ou concepts, elle a un potentiel significatif dans divers domaines allant de l'art à la science en passant par la technologie. De plus, elle a le potentiel d'améliorer la façon dont les machines interagissent avec les humains, en générant des réponses plus naturelles et contextuelles.

Comment est-ce utilisé en 2023 ?

En 2023, l'IA générative est utilisée dans une variété de domaines. Dans le domaine de l'art et du design, elle est utilisée pour générer de nouvelles œuvres d'art ou des concepts de design. Dans le domaine de l'écriture, elle est utilisée pour générer du contenu textuel, que ce soit des articles de blog, des scripts de film ou même des histoires. Dans le domaine technologique, elle est utilisée pour améliorer l'interaction humain-machine, en générant des réponses plus naturelles et contextuelles dans les chatbots ou les assistants virtuels. Il convient de noter que même si ces systèmes sont capables de produire des contenus de qualité comparable à celle des humains, le contenu généré ne reflète pas nécessairement la réalité et doit être utilisé avec discernement.

Intelligence augmentée

L'intelligence augmentée (ou "augmented intelligence" en anglais) est une fusion entre l'homme et la machine visant à tirer le meilleur de ces deux mondes. Les ordinateurs sont excellents pour manipuler de grandes quantités de données et effectuer des calculs complexes rapidement. Les humains, en revanche, sont doués pour comprendre le contexte, établir des liens entre les choses même avec des données incomplètes, et prendre des décisions sur l'instinct. L'intelligence augmentée combine ces deux ensembles de compétences. Il ne s'agit pas que les ordinateurs remplacent les humains ou fassent tout le travail à notre place. C'est plutôt comme embaucher un assistant vraiment intelligent et bien organisé.

Pourquoi est-ce important ?

L'intelligence augmentée est importante car elle nous permet d'améliorer et d'élargir nos capacités humaines grâce à la technologie. Elle ne cherche pas à remplacer l'homme par la machine, mais à les faire travailler ensemble de manière harmonieuse. En tirant parti des points forts de l'homme et de la machine, l'intelligence augmentée peut nous aider à résoudre des problèmes plus complexes, à prendre des décisions plus éclairées et à augmenter notre productivité.

Comment est-ce utilisé en 2023 ?

En 2023, l'intelligence augmentée est largement utilisée dans de nombreux domaines. Par exemple, dans le domaine de la santé, elle aide les médecins à poser des diagnostics plus précis en analysant rapidement de grandes quantités de données médicales. Dans le monde des affaires, elle aide les décideurs à prendre des décisions plus éclairées en fournissant des analyses approfondies des données de l'entreprise. Dans le domaine de l'éducation, elle peut aider les enseignants à personnaliser l'apprentissage pour chaque étudiant. L'intelligence augmentée est également devenue une composante essentielle de nombreux outils et technologies que nous utilisons quotidiennement, comme les assistants numériques personnels et les applications de réalité augmentée.

L

Langchain

LLaMA

LLM

Loi de mise à l'échelle de Chinchilla

La loi de mise à l'échelle de Chinchilla pour l'entraînement des modèles de langage Transformer suggère que lorsque l'on dispose d'un budget accru (en FLOPs), pour obtenir un calcul optimal, le nombre de paramètres du modèle (N) et le nombre de tokens pour l'entraînement du modèle (D) devraient être mis à l'échelle dans des proportions approximativement égales. En des termes plus simples, cela signifie que si vous augmentez votre budget de calcul, vous devriez augmenter à la fois la taille de votre modèle et la quantité de données d'entraînement dans des proportions similaires. Cette conclusion diffère de la précédente loi de mise à l'échelle pour les modèles de langage neuronal, qui stipulait que N devrait être mis à l'échelle plus rapidement que D.

Pourquoi est-ce important ?

La loi de mise à l'échelle de Chinchilla est importante car elle offre une orientation sur la manière d'allouer efficacement les ressources lors de l'entraînement de modèles de langage Transformer. Elle fournit des recommandations sur la manière de mettre à l'échelle les paramètres du modèle et les données d'entraînement en fonction du budget de calcul disponible. Cela peut aider à optimiser l'efficacité de l'entraînement, en évitant de surdimensionner ou de sous-dimensionner le modèle ou les données par rapport aux ressources disponibles.

Comment est-ce utilisé en 2023 ?

En 2023, la loi de mise à l'échelle de Chinchilla est utilisée comme un guide pour l'entraînement de modèles de langage Transformer. Les chercheurs et les ingénieurs qui entraînent ces modèles utilisent cette loi pour décider comment allouer leurs ressources de calcul. Par exemple, s'ils disposent d'un budget de calcul accru, ils peuvent utiliser la loi de mise à l'échelle de Chinchilla pour déterminer comment augmenter la taille de leur modèle et la quantité de leurs données d'entraînement. Cela leur permet d'entraîner leurs modèles de manière plus efficace et d'obtenir de meilleurs résultats avec les ressources dont ils disposent.

M

Machine learning

Machine learning bias

Le biais de l'apprentissage automatique désigne les distorsions ou les préjugés qui peuvent se manifester dans les résultats des modèles d'apprentissage automatique en raison de données biaisées ou d'assomptions incorrectes faites par l'algorithme pendant le processus d'apprentissage. Lorsque les ordinateurs sont nourris d'informations biaisées, ils peuvent prendre des décisions biaisées, ce qui peut avoir des conséquences significatives sur l'exactitude, l'équité et l'efficacité des systèmes d'intelligence artificielle.

Pourquoi est-ce important ?

Le biais de l'apprentissage automatique est un enjeu crucial dans la construction de systèmes d'IA équitables et fiables. Lorsque les modèles d'apprentissage automatique sont formés sur des données historiques qui reflètent des préjugés ou des inégalités, ils risquent de reproduire ces biais dans leurs décisions et leurs prédictions. Cela peut avoir des implications négatives dans divers domaines, tels que la sélection des candidats, l'octroi de prêts, l'application de la loi, etc. Il est essentiel de détecter, de comprendre et de réduire ces biais afin de garantir l'équité, la transparence et la confiance dans les systèmes d'IA.

Comment est-ce utilisé en 2023 ?

En 2023, la prise de conscience concernant le biais de l'apprentissage automatique s'est considérablement accrue. Les organisations et les chercheurs travaillent activement pour développer des méthodes et des techniques visant à identifier, atténuer et prévenir le biais dans les modèles d'IA. Des pratiques telles que l'équilibrage des données d'entraînement, l'audit des modèles, la collecte de données diversifiées et l'évaluation régulière des résultats sont utilisées pour traiter le problème du biais. L'objectif est de créer des systèmes d'IA qui prennent des décisions justes, non discriminatoires et équitables, en tenant compte de la diversité et de l'inclusion. La gestion du biais de l'apprentissage automatique est essentielle pour établir la confiance et garantir que les systèmes d'IA bénéficient à l'ensemble de la société de manière équitable.

Mélange d'Experts

MidJourney

Modèle

Modèle d'attention (ou Attention model)

Modèle de base (ou Foundation model)

Modèle de maturité éthique de l'IA

Un modèle de maturité éthique de l'IA est un cadre qui aide les organisations à évaluer et à améliorer leurs pratiques éthiques dans l'utilisation des technologies d'IA. Il permet de cartographier les différentes façons dont les organisations peuvent évaluer leurs pratiques actuelles en matière d'IA éthique, puis progresser vers une utilisation plus responsable et fiable de l'IA. Ce modèle aborde des questions liées à la transparence, à l'équité, à la protection des données, à la responsabilité et aux biais dans les prédictions.

Pourquoi est-il important ?

L'éthique de l'IA est devenue une préoccupation majeure à mesure que les technologies d'IA se développent et sont de plus en plus utilisées dans différents domaines. Un modèle de maturité éthique de l'IA est important car il permet aux organisations de prendre conscience des enjeux éthiques liés à l'utilisation de l'IA et de mettre en place des pratiques responsables pour garantir des résultats équitables, transparents et respectueux des droits de l'homme. Il permet également d'évaluer et de suivre les progrès de l'organisation dans l'adoption de pratiques éthiques en matière d'IA, renforçant ainsi la confiance des utilisateurs, des clients et du public.

Comment est-ce utilisé en 2023 ?

En 2023, les modèles de maturité éthique de l'IA sont de plus en plus utilisés par les organisations pour évaluer et améliorer leurs pratiques éthiques en matière d'IA. Ces modèles aident les organisations à évaluer leur niveau de conformité aux principes éthiques et aux normes réglementaires en matière d'IA. Ils fournissent des cadres de référence pour identifier les lacunes éthiques, mettre en œuvre des politiques et des pratiques appropriées, et surveiller les impacts éthiques des systèmes d'IA. Les modèles de maturité éthique de l'IA sont utilisés par les entreprises, les organismes gouvernementaux et les institutions pour promouvoir une adoption responsable de l'IA et s'assurer que les avantages de l'IA sont réalisés de manière éthique et équitable.

MPT

Multi-modal

N

NLP

P

Paramètres

Prompt engineering

Prompt injection

PyTorch

Q

Quantization

R

Reinforcement learning from human feedback (RLHF)

Réseau neuronal artificiel

Un réseau neuronal artificiel (RNA), parfois simplement appelé réseau neuronal, est une méthode de développement de l'intelligence artificielle qui s'inspire du fonctionnement du cerveau humain. Il est composé de nombreux nœuds, parfois des milliards, appelés perceptrons, qui sont reliés ensemble pour former un réseau. Comme notre cerveau qui possède des milliards de neurones interconnectés, un RNA a de nombreuses petites unités de traitement qui travaillent ensemble, un peu comme une équipe travaillant à résoudre le même problème. Chaque membre de l'équipe fait sa part, puis transmet ses résultats. À la fin, on obtient la réponse recherchée. Chez les humains comme chez les ordinateurs, tout repose sur la force du travail d'équipe.

Pourquoi est-ce important ?

Les réseaux neuronaux artificiels sont essentiels parce qu'ils sont au cœur de nombreuses applications de l'intelligence artificielle. Ils permettent d'effectuer des tâches complexes qui seraient difficiles, voire impossibles, à réaliser avec des algorithmes traditionnels. Grâce à leur capacité à apprendre à partir de données d'entraînement, les RNA peuvent reconnaître des motifs, effectuer des prédictions et prendre des décisions de manière autonome, ce qui les rend particulièrement précieux pour une multitude de tâches allant de la reconnaissance d'images à la prévision météorologique.

Comment est-ce utilisé en 2023 ?

En 2023, les réseaux neuronaux artificiels sont omniprésents dans notre quotidien. Ils alimentent une grande variété de systèmes et d'applications, allant des assistants vocaux intelligents aux voitures autonomes. Dans le domaine de la santé, par exemple, les RNA sont utilisés pour analyser les images médicales et aider à détecter les maladies à un stade précoce. Dans le domaine commercial, ils sont utilisés pour analyser le comportement des consommateurs et prédire les tendances futures. Ils sont également à la base de nombreux modèles de langage, comme GPT-4, qui peuvent comprendre et répondre aux requêtes en langage naturel.

Réseaux Bayésiens

Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation (RAG) est une méthode introduite par les chercheurs de Meta AI pour traiter des tâches intensives en connaissances à l'aide de modèles de langage. RAG intègre une composante de récupération d'informations avec un modèle générateur de texte. Il fonctionne en prenant une entrée, en récupérant un ensemble de documents pertinents depuis une source (par exemple, Wikipedia), puis en combinant ces documents avec la requête initiale pour produire une réponse. Cette approche permet d'ajouter une dynamique d'accès aux informations les plus récentes, contournant le problème des modèles de langage dont la connaissance est statique.

Pourquoi est-ce important ?

Les tâches qui nécessitent un accès à des connaissances externes, comme répondre à des questions spécifiques ou vérifier des faits, peuvent poser des problèmes pour les modèles de langage traditionnels. Ces modèles peuvent "halluciner" des réponses ou fournir des informations obsolètes. RAG offre une solution en combinant la génération de texte avec la récupération d'informations, permettant d'obtenir des réponses plus factuelles, spécifiques et fiables. Cette combinaison permet d'améliorer la cohérence factuelle des réponses et d'éviter de re-former entièrement un modèle pour intégrer de nouvelles informations.

Comment est-il utilisé en 2023 ?

En 2023, RAG est largement adopté pour renforcer les capacités des modèles de langage, en particulier dans les tâches axées sur la connaissance. Les approches basées sur la récupération, comme RAG, sont combinées avec des modèles de langage populaires comme ChatGPT pour améliorer leur exactitude et leur pertinence. RAG s'est avéré performant sur plusieurs benchmarks, comme Natural Questions, WebQuestions, et CuratedTrec, et a montré sa capacité à générer des réponses factuelles lors de tests sur MS-MARCO et des questions de Jeopardy. De plus, avec l'avènement de la documentation LangChain, il est plus facile que jamais d'intégrer RAG avec des récupérateurs et des modèles de langage pour des tâches de réponse à des questions.

S

StableDiffusion

T

Tensor flow

The Pile

Token

Transformer

Un Transformer est un type d'architecture de réseau neuronal conçu pour gérer les données séquentielles. Il a été appliqué avec succès aux tâches de traitement du langage naturel. Les Transformers sont un type de modèle d'apprentissage profond et sont particulièrement utiles pour le traitement du langage. Ils sont très doués pour comprendre le contexte des mots dans une phrase parce qu'ils créent leurs sorties en fonction de données séquentielles (comme une conversation en cours), et non pas simplement de points de données individuels (comme une phrase sans contexte). Le nom "Transformer" vient de la manière dont ils peuvent transformer des données en entrée (comme une phrase) en des données en sortie (comme une traduction de la phrase).

Pourquoi est-ce important ?

Les Transformers sont importants car ils ont radicalement changé le domaine du traitement du langage naturel. Leur capacité à gérer les données séquentielles et à comprendre le contexte des mots a conduit à des améliorations significatives dans des tâches comme la traduction automatique, la génération de texte et la compréhension de texte. Ils constituent le fondement de nombreux modèles de langage modernes, comme GPT-3, et ont permis des avancées importantes dans l'intelligence artificielle.

Comment est-ce utilisé en 2023 ?

En 2023, les architectures Transformer sont utilisées dans une grande variété d'applications de traitement du langage naturel. Elles sont au cœur de nombreux modèles de langage de pointe, utilisés pour des tâches allant de la traduction automatique à la génération de texte en passant par la réponse aux questions. Les Transformers sont également utilisés dans les assistants vocaux, les chatbots et d'autres applications où la compréhension du contexte du langage est importante. Par ailleurs, bien que leur utilisation la plus notable soit dans le domaine du langage, les Transformers sont également explorés pour d'autres types de données séquentielles, comme les séries temporelles ou la musique.

Lexique

A

Adaptation à faible rang (Low rank adaption, LoRA)

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

ALIBI (élargissement de la fenêtre contextuelle)

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Alignement

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Annotation

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Apprentissage non supervisé (ou unsupervised learning)

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Apprentissage supervisé / Supervised learning

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Architecture d'un modèle

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

B

Bard

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

BERT

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Bloom

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

C

Chatbots

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

ChatGPT

Pourquoi est-ce important?

Comment est-ce utilisé en 2023 ?

Claude

Pourquoi est-ce important ?

Comment est-il utilisé en 2023 ?

Clustering

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Cognitive computing

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Common Crawl

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Compromis Biais-Variance

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Cross validation

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

D

DALL-E

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Deep learning

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Discriminator (en GAN)

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Données synthétiques

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

DoNotDelete

E

Effondrement du modèle

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

Embeddings

Pourquoi est-ce important ?

Comment est-ce utilisé en 2023 ?

F