Aller au contenu principal
Intelligence artificielle, Architecture

RAG

Le RAG (Retrieval-Augmented Generation) est une architecture qui connecte un LLM à des sources de données externes via la recherche vectorielle. Plutôt que de se fier uniquement aux connaissances apprises lors de l'entraînement, le modèle interroge une base documentaire pour enrichir ses réponses avec des informations précises, actualisées et spécifiques à votre contexte métier.

Architecture

Le pipeline RAG se décompose en quatre étapes : l'indexation des documents sous forme d'embeddings vectoriels, leur stockage dans une base vectorielle (Pinecone, Qdrant, pgvector), la recherche sémantique des passages pertinents pour une requête donnée, puis la génération d'une réponse par le LLM enrichie de ce contexte récupéré.

Cas d'usage

Le RAG excelle pour les bases de connaissances internes (documentation technique, procédures RH, référentiels métier), le support client intelligent qui puise dans l'historique des tickets et la documentation produit, et les assistants métier spécialisés capables de répondre avec précision sur des domaines pointus.

Le RAG est le pont pragmatique entre l'IA générique et la connaissance spécifique de votre entreprise : il transforme un LLM généraliste en assistant expert de votre métier, sans nécessiter de ré-entraînement coûteux.

Même catégorie

Autres termes : Architecture

API Une API (Application Programming Interface) est un contrat d'échange entre deux systèmes logiciels. Découvrez son rôle central dans les architectures web modernes.
arrow_forward
API Gateway Une API Gateway est un composant d'architecture qui centralise les appels vers vos API, gérant authentification, rate limiting et routage.
arrow_forward
API Platform API Platform est le framework de référence pour créer des API REST et GraphQL en PHP/Symfony. Découvrez ses fonctionnalités et son rôle dans les architectures modernes.
arrow_forward
Architecture web L'architecture web définit la structure technique d'une application. Découvrez les principes fondamentaux pour concevoir des systèmes robustes, performants et maintenables.
arrow_forward
Audit technique L'audit technique analyse la qualité, la sécurité et la performance de votre application web. Découvrez ce qu'il couvre, comment il se déroule et ce qu'il vous apporte.
arrow_forward
Backend Le backend est la partie invisible d'une application web : serveur, base de données, logique métier et API. C'est le moteur qui fait tourner votre produit.
arrow_forward
Base de données Une base de données est un système organisé de stockage et de récupération d'informations. Relationnelle ou NoSQL, elle est au cœur de toute application web.
arrow_forward
Data pipeline Un data pipeline est une chaîne automatisée de traitements qui collecte, transforme et achemine les données d'une source vers une destination.
arrow_forward
Design patterns Les design patterns sont des modèles de conception réutilisables qui résolvent des problèmes architecturaux fréquents en développement logiciel.
arrow_forward
ETL L'ETL (Extract, Transform, Load) est un processus de migration et d'intégration de données entre systèmes. Le socle de toute stratégie data.
arrow_forward
Headless CMS Un headless CMS sépare la gestion du contenu de sa présentation. Il expose le contenu via une API, consommable par n'importe quel front-end.
arrow_forward
Idempotence Une opération idempotente produit le même résultat quel que soit le nombre d'exécutions. Concept clé pour les API, les webhooks et les systèmes distribués.
arrow_forward
Jamstack La Jamstack (JavaScript, APIs, Markup) est une architecture web qui pré-génère les pages et s'appuie sur des API pour le contenu dynamique.
arrow_forward
Knowledge silo Un knowledge silo se forme lorsqu'une seule personne détient la compréhension critique d'une partie du système. Risques et pratiques pour les éliminer.
arrow_forward
Microservices L'architecture microservices découpe une application en services indépendants, chacun responsable d'une fonction métier. Découvrez ses avantages, ses contraintes et quand la choisir.
arrow_forward
Middleware Un middleware est un composant qui intercepte les requêtes HTTP pour ajouter des comportements transverses : authentification, logging, CORS, rate limiting.
arrow_forward
Migration technique La migration technique consiste à faire évoluer le socle technologique d'une application existante. Objectifs, stratégies et pièges à éviter pour réussir une migration.
arrow_forward
Monolithe L'architecture monolithique regroupe toute la logique d'une application dans un seul déploiement. Découvrez pourquoi elle reste le choix le plus pragmatique pour la plupart des projets web.
arrow_forward
Multi-tenant L'architecture multi-tenant permet de servir plusieurs clients (tenants) avec une seule instance d'application. Découvrez ses modèles, ses avantages et ses défis techniques.
arrow_forward
NoSQL NoSQL désigne les bases de données non relationnelles, conçues pour la flexibilité, la scalabilité horizontale et les structures de données variées.
arrow_forward
ORM L'ORM (Object-Relational Mapping) permet de manipuler la base de données comme des objets PHP. Doctrine, le standard Symfony, et ses pièges de performance.
arrow_forward
OpenAPI OpenAPI (ex-Swagger) est le standard pour décrire et documenter les API REST. Génération automatique, validation et intégration avec API Platform.
arrow_forward
Performance web La performance web mesure la rapidité et la réactivité d'une application. Découvrez pourquoi elle est critique pour l'expérience utilisateur, le SEO et votre activité.
arrow_forward
REST API Une REST API est une interface de programmation qui permet à des applications de communiquer via HTTP. Découvrez ses principes, ses bonnes pratiques et son rôle dans les architectures modernes.
arrow_forward
Rate limiting Le rate limiting limite le nombre de requêtes par client sur une API. Algorithmes (token bucket, sliding window), implémentation et bonnes pratiques.
arrow_forward
Replatforming Le replatforming consiste à migrer une application vers une nouvelle plateforme technique en conservant les fonctionnalités existantes. Quand et comment l'envisager.
arrow_forward
Reverse proxy Un reverse proxy (Nginx, Varnish, Traefik) intercepte les requêtes avant votre application pour gérer cache, SSL, compression et protection contre les attaques.
arrow_forward
SOLID SOLID est un acronyme regroupant cinq principes de conception orientée objet qui guident l'écriture de code flexible, maintenable et extensible.
arrow_forward
SSO (Single Sign-On) Le Single Sign-On (SSO) permet de se connecter une seule fois pour accéder à plusieurs applications. Fonctionnement, protocoles et bénéfices pour votre organisation.
arrow_forward
SSR / CSR Le SSR (Server-Side Rendering) et le CSR (Client-Side Rendering) sont deux approches de rendu des pages web. Découvrez leurs différences, avantages et cas d'usage respectifs.
arrow_forward
SaaS Le SaaS est un modèle de distribution logicielle où l'application est hébergée dans le cloud et accessible via un navigateur. Découvrez ses caractéristiques, avantages et enjeux techniques.
arrow_forward
Scalabilité La scalabilité est la capacité d'une application à absorber une augmentation de charge sans dégradation. Découvrez ses principes, ses stratégies et comment anticiper la montée en charge.
arrow_forward
Serverless Le serverless est un modèle d'exécution cloud où le fournisseur gère l'infrastructure. Vous ne payez que le temps d'exécution réel de vos fonctions.
arrow_forward
Symfony Symfony est le framework PHP de référence pour les applications web d'entreprise. Découvrez ses avantages, son architecture et pourquoi les équipes techniques le choisissent.
arrow_forward
WebSocket Le protocole WebSocket permet une communication bidirectionnelle en temps réel entre le navigateur et le serveur. Découvrez ses cas d'usage et son fonctionnement.
arrow_forward
Webhook Un webhook est un mécanisme de callback HTTP qui permet à une application de notifier une autre en temps réel lorsqu'un événement se produit. Fonctionnement et cas d'usage.
arrow_forward
Voir tout le glossaire arrow_forward

Un projet en lien avec rag ?

Échangeons sur vos enjeux techniques. Pas de discours commercial, pas de jargon inutile : un diagnostic clair et des solutions concrètes.