Mistral AI et Snowflake
Au-delà des requêtes de base : atteindre une précision 2 fois supérieure avec le texte-vers-sql sur Snowflake.
Snowflake utilise les LLMs de Mistral AI pour améliorer l'analyse en libre-service.
Snowflake est l'entreprise de cloud de données AI qui aide les entreprises à tirer davantage de valeur de leurs données, en traitant des milliards de requêtes chaque jour pour des milliers de clients afin de générer des insights business importants. Au cœur du succès de Cortex Analyst, leur assistant alimenté par l'IA pour les données structurées, se trouvait un partenariat avec Mistral AI et l'intégration de deux LLMs — Mistral Large et Codestral — sélectionnés pour leur excellente compréhension du langage naturel et leur capacité à générer du SQL.
En utilisant les LLMs de Mistral AI, Snowflake Cortex Analyst a atteint :
- Une précision 2 fois supérieure par rapport aux LLMs de pointe
- Une précision 14 % supérieure à celle des autres solutions concurrentes
- Une précision de 90 % ou plus de manière constante dans les évaluations clients
Cette collaboration a établi un nouveau standard pour l'expérience utilisateur dans les produits SQL génératifs d'IA, facilitant l'accès rapide des membres non techniques de l'équipe à l'analyse en libre-service.
Contexte
Le besoin de LLMs pour aider à interpréter les données augmente à mesure que les clients recherchent un accès aux insights dans les données structurées et non structurées. L'équipe de développement de Snowflake avait besoin d'une solution pour Cortex Analyst capable de générer du SQL avec expertise, tout en offrant des compétences conversationnelles pour des interactions en langage naturel de haute qualité. Étant donné l'importance de la précision pour les équipes de données et les utilisateurs professionnels utilisant les résultats des requêtes pour informer des décisions commerciales critiques, la solution devait être à la pointe de la technologie et surpasser les métriques d'évaluation existantes.
« Avec Mistral Large et Codestral, Snowflake offre des capacités texte-vers-SQL de pointe pour des données d'entreprise complexes et nuancées. »Yusuf Ozuysal, Directeur de l'Ingénierie, Snowflake
SQL : un obstacle à l'accès rapide aux insights
Pour quiconque rédige fréquemment des requêtes SQL dans un environnement d'entreprise, la courbe d'apprentissage pour trouver le bon schéma et comprendre les nuances de jeux de données complexes peut être raide. Pour compliquer davantage les choses, les requêtes SQL peuvent être subtiles et ambiguës, et la « bonne » réponse peut être écrite de plus d'une manière. La rédaction et l'optimisation des requêtes SQL peuvent être complexes et chronophages pour les utilisateurs non techniques, rendant ainsi une expérience utilisateur fluide et intuitive cruciale pour stimuler l'adoption et la satisfaction parmi une base d'utilisateurs diversifiée.
Pour fournir un accès plus rapide aux insights, Snowflake souhaitait améliorer Cortex Analyst avec des capacités texte-vers-SQL hautement précises. L'objectif était de développer des capacités texte-vers-SQL hautement précises pouvant gérer des jeux de données complexes, simplifier la courbe d'apprentissage pour l'identification des schémas, et offrir une expérience intuitive pour les utilisateurs non techniques. Plus crucialement, Snowflake devait garantir une précision à la pointe de la technologie pour soutenir des décisions commerciales critiques.
Codestral et Mistral Large : Fournir des réponses conversationnelles précises
Snowflake devait générer une requête SQL, évaluer cette requête pour sa précision et corriger tout problème potentiel, puis fournir la requête et les informations pertinentes de manière conversationnelle aux utilisateurs professionnels. Snowflake s'est tourné vers deux modèles Mistral comme réponses potentielles : Codestral, un modèle à poids ouvert spécialement conçu pour les tâches de génération de code, et Mistral Large, pour le raisonnement, la génération de langage et la génération de code.
Pour une génération de requêtes robuste, Snowflake utilise une approche en deux étapes : d'abord, demander à plusieurs agents de générer du SQL, puis demander à un autre agent de synthétiser le SQL final basé sur les réponses d'experts. Snowflake utilise Mistral Large et un Codestral affiné pour la génération initiale de SQL et utilise Codestral pour synthétiser la réponse SQL finale.
Cortex Analyst devait également présenter les requêtes et les informations contextuelles importantes de manière conversationnelle en utilisant un langage naturel que tout utilisateur, quel que soit son niveau d'expertise technique, pourrait comprendre. Un aspect important était d'identifier les questions ambiguës ou sans réponse compte tenu des données disponibles et d'alerter l'utilisateur ou de suggérer des alternatives.
« Mistral AI était le choix parfait pour la génération texte-vers-SQL. Notre objectif était de dépasser la précision par rapport aux benchmarks existants. Nous avons essayé plusieurs autres modèles, mais même avec un affinage, ils ne répondaient pas à la précision d'exécution requise. »Yusuf Ozuysal, Directeur de l'Ingénierie, Snowflake
Mistral Large a été crucial pour fournir à la fois les connaissances en SQL et la qualité conversationnelle. L'explication supplémentaire de la manière dont la requête a été générée et la documentation de référence donnent aux utilisateurs confiance dans le résultat et la capacité de faire des recherches supplémentaires si nécessaire.
Pourquoi Mistral AI
Snowflake a sélectionné les modèles Mistral Large et Codestral pour :
- Leur compréhension supérieure du langage naturel et leurs capacités de génération de SQL
- Leur performance solide à la fois dans les tâches de génération de code et de raisonnement
- Leur capacité à fournir des explications conversationnelles de haute qualité
- Leur avantage concurrentiel en matière d'expertise SQL par rapport à d'autres modèles
Résultats et impact : Établir de nouveaux standards en matière de précision et d'expérience utilisateur
Les résultats ont été impressionnants. Sur la base d'ensembles d'évaluation internes, en utilisant Mistral Large et Codestral, Cortex Analyst est systématiquement près de 2 fois plus précis que la génération de SQL en une seule fois à partir de LLMs de pointe et offre environ 14 % de précision en plus qu'une autre solution texte-vers-SQL concurrente sur le marché. De plus, Cortex Analyst a atteint environ 90 % ou plus de précision de manière fiable dans les évaluations clients ainsi que dans les tests de benchmark, ce qui est crucial pour les cas d'utilisation en entreprise.
Au-delà des améliorations numériques, la collaboration entre Snowflake et Mistral AI a établi un nouveau standard pour l'expérience utilisateur dans les produits SQL d'IA générative. Elle a amélioré les interactions en langage naturel pour les utilisateurs non techniques et a amélioré la capacité à identifier les questions ambiguës et à suggérer des alternatives. Ce partenariat a permis à Snowflake de tenir davantage sa promesse de démocratiser l'IA générative pour ses clients et de fournir de la valeur à partir de leurs données d'entreprise.
Regard vers l'avenir : Élargir les horizons de l'analyse de données
À mesure que Snowflake augmente l'accessibilité des insights de données grâce à des applications de données alimentées par l'IA, la collaboration avec Mistral AI ouvre de nouvelles possibilités. Des sorties de meilleure qualité conduisent à une satisfaction et une adoption accrues des utilisateurs, permettant aux équipes de données de construire en toute confiance des applications commerciales en utilisant des solutions de pointe sans les défis de précision, de latence et de coût qui accompagnent la construction et le maintien de modèles internes.
Ce partenariat entre Snowflake et Mistral AI n'est que le début d'un voyage visant à fournir aux clients un accès rapide et perspicace aux données, rendant l'analyse en libre-service plus accessible et efficace pour les entreprises de divers secteurs.
Pour en savoir plus sur la raison pour laquelle les entreprises du monde entier font confiance à Mistral AI pour des LLMs ouverts, efficaces et performants, consultez nos témoignages clients à l'adresse https://mistral.ai/customers/.