Transcription de l'entretien

Sami Taaissat

Software & Data Engineer chez Artefact

"L’IA Générative – Démo Babylone"

Bonjour à tous je suis Emmanuel Malherbe, directeur de la recherche chez Artefact et j’ai la chance d’animer ces Data Coffees de la plateforme média The Bridge. Le principe est simple, un expert data, aujourd’hui Sami.

Bonjour Emmanuel.

Bonjour Sami. Un sujet data, aujourd’hui l’IA générative et un bon café. Alors Sami qui es-tu chez artefact ?

Chez Artefact je suis data engineer depuis environ 1 an et et ma spécialité c’est l’IA générative.

À ce sujet, cette année tu as présenté à VivaTech un outil dénommé Babylone.

Tout à fait.

Pourquoi Babylone ?

Babylone c’est une référence à la cité du savoir. C’est un outil qui permet de compiler le savoir donc pour nous c’était un nom qui était très explicite et plutôt approprié.

Et qu’est-ce qu’il fait exactement cet outil ?

En fait Babylone, ce qu’il fait c’est qu’il prend des données déjà existantes, comme un site web ou un fichier PDF, il va ensuite compiler tout le texte qui est à l’intérieur, le résumer, le contextualiser, donner tout ça à une IA générative, en l’occurrence ChatGPT4 et à partir de de tout ce texte qui est donné à l’IA générative, ce qui va se passer c’est que quand un utilisateur va poser une question, l’IA va piocher dans ce qu’elle connaît, donc dans ce qu’elle a appris du site web par exemple et va pouvoir répondre de manière contextualisée et très précise aux questions posées par un utilisateur.

C’est très clair. Sans plus attendre je propose qu’on regarde la démo.

Très bien. Voici Babylone. Ça se présente ainsi. On commence par choisir le type d’informations qu’on veut donner à notre IA. Donc on va partir sur un site web entier. Une fois qu’on a choisi le type de de source, on entre l’adresse de notre site web on va tester sur artefact.com. Donc on collecte la donnée, là ça s’est fait en quelques secondes parce qu’on peut avoir le système de mise en cache. Comme à VivaTech on avait beaucoup de passages sur notre stand, l’un des gros objectifs de cette démonstration était que ça prenne un minimum de temps pour pouvoir récupérer, collecter la donnée, la traiter, etc donc on a mis en place beaucoup de technologies derrière qui permettait de faire tout ça. En voici une justement en action. Une fois que c’est fait, on va connecter la donnée qui a été récupérée au robot donc à notre IA. Là aussi ça prend quelques secondes. Ce qui se passe lors de cette étape, c’est que toute la donnée qui a été récupérée, on l’a convertie dans un format qui peut être compris par GPT donc c’est une transformation vectorielle comme on appelle et on stocke tout ça dans une base de données dans laquelle GPT va pouvoir piocher à chaque fois qu’on pose une question. En fait le processus est en plusieurs étapes, d’abord on pose la question à GPT, GPT va essayer de comprendre la question et pour ça il va transformer notre question en une représentation mathématique. À partir de cette représentation mathématique, on va aller comparer à notre base de données et récupérer les documents qui sont le plus susceptibles de répondre à la question. Une fois qu’on a récupéré ces documents, on les donne à notre IA avec la question qui a été posée par l’utilisateur et ça va permettre en fait de contextualiser la réponse apportée par l’IA.

Très clair, donc il y a une étape d’indexation de tous ces documents par GPT4 ?

Tout à fait. On peut le voir en action donc je vais poser comme question à mon IA pour montrer ses capacités “what is artefact ?”

C’est une question importante !

Très importante mais très standard et elle va nous permettre en fait d’assez rapidement déterminer si le processus a fonctionné ou pas. Pourquoi parce qu’un artefact en anglais c’est comme un artefact en français, c’est un objet archéologique et donc si on pose cette question à ChatGPT qui lui aussi utilise GPT, comme il n’a pas les documents qui lui permettent de comprendre ce que c’est que l’entreprise Artefact, il va juste nous donner la définition d’un artefact.

Donc ce n’est pas une question si simple que ça en fait.

Exactement. C’est une question qui permet vraiment de montrer le “avant après”. Voilà on peut voir ici qu’il nous répond que Artefact c’est une data driven marketing agency, spécialisée dans le consulting, le digital marketing et le commerce digital. Et comme je le disais c’est là en fait où on voit que la contextualisation a permis à GPT d’avoir des informations qu’il ne connaissait pas avant. Et c’est pour ça que c’est une question très intéressante à poser bien qu’elle soit très basique pour montrer le “avant après”.

Ça marche très très bien.

Ensuite après la réponse, on peut voir que Babylone nous donne aussi les sources, donc en fait ce sont toutes les pages, tous les morceaux de données qui ont été utilisés pour répondre à la question. C’est très important d’avoir les sources car ça nous permet de montrer et de les utiliser en fait pour les mettre dans un autre robot et s’assurer qu’on n’a pas des fake news qui sont générées. Car ça va être ça l’un des gros soucis avec l’IA générative et les modèles comme GPT, c’est que lorsqu’il ne connaît pas la réponse, il va avoir tendance à générer des hallucinations qui sont en fait des fake news très concrètement.

C’est très convainquant, c’est impressionnant, c’est rapide et tout simplement ça marche alors qu’il y a un vrai challenge sémantique à ce problème là. Merci à tous pour votre attention et je vous donne rendez-vous pour le prochain épisode sur le thème de l’IA générative sur la plateformme média The Bridge.

RESTEZ INFORMÉ

ABONNEZ-VOUS A LA NEWSLETTER THE BRIDGE.

Recevez nos nouveaux épisodes

TOUS NOS ÉPISODES THE BRIDGE

Aleksandra Semenenko

Director of Data Science at Artefact

Mastering Marketing ROI thanks to Incrementality Testing

Jean-Marie John-Mathews

PhD, cofondateur et directeur scientifique de Giskard AI

L’IA et l’éthique

Nathalie Beslay

CEO et co-fondatrice de Naaia, et avocate

L’AI Act et son application business.

Julien Ho-Tong

Partner and Data/AI Strategy & Governance Expert at Artefact

How to implement a Data Governance strategy.

Matthieu Rouif

Co-Founder & CEO of Photoroom

Impact of Gen AI technologies on the photo business.

Laurent Daudet

Co-CEO et Co-fondateur chez LightOn

Une IA générative privée, sécurisée et éthique.

Basile Marmoy

Senior Data Consultant chez Artefact

L’IA Gen: L’adopter en entreprise et impact sur son métier

Daniel Al Choboq

Senior Data Scientist chez Artefact

L’IA Générative – Démo Pythie

Sami Taaissat

Software & Data Engineer chez Artefact

L’IA Gen et le métier de Data Engineer

ILIASS BENRYANE

Lead Data Scientist chez Artefact

L’IA Générative

Leïla Achour

Directrice du Développement chez Artefact 3000

L’IA Gen en création et en publicité

Sami Taaissat

Software & Data Engineer chez Artefact

L’IA Générative – Démo Babylone

Bertrand Brisou

Data & Analytics Director at Artefact

How savvy Marketing Measurement can boost sales and maximize business outcomes

Siddharth Mohan

Director Data Science & Global Lead for Causal AI Research & Marketing Mix Modelling at Artefact

Innovative modeling techniques push the boundaries of experimentation and measurement

Aleksandra Semenenko

Director of Data Science & Global lead on Marketing Measurement at Artefact

Three trends paving the way for the future of Marketing Mix Modeling (MMM)

XAVIER PERRET

Directeur Cloud Azure chez Microsoft France

Le nouveau monde de l’IA Générative.

HANAN OUAZAN

Partner et Lead IA Générative chez Artefact

L’IA Générative, un écosystème technologique en pleine effervescence.

MAXIME MAREMBAUD

Group CDO chez Sodexo

La transformation Data du Groupe Sodexo.

Chloé BENHACOUN

Senior Data Consultante chez Artefact

La Modern Data Stack va faire évoluer la transformation data des entreprises.

KILLIAN GAUMONT

Senior Manager chez Artefact

Le Data Mesh : une gestion décentralisée de la data qui crée de la valeur.

JEAN-MARC LAZARD

Président et co-fondateur d'Opendatasoft

Un accès égal à la donnée grâce à l’Open Data.

MICHEL TRICOT

CEO d'Airbyte

L’open source pour résoudre la connexion des datas ETL.

Violaine Berland

Directrice Conseil chez Artefact

Le Data Mesh et les data products.

JEAN-BAPTISTE CHARRUEY

Data Engineering Director & Tech Lead Artefact

Le Data Mesh et les outils associés.

ARVAND MODARRESI

Partner chez Artefact

Le Data Mesh : une gestion décentralisée de la data qui crée de la valeur.

BRIAN LOZACH

Senior Data Scientist chez Artefact

La Modern Data Stack & la transformation du métier de Data Scientist.

OLIVIER BURGUIERE

Senior Data Analyst chez Artefact

La Modern Data Stack et son impact sur le métier de Data Analyst.

HUBERT BEROCHE

Fondateur de Urban AI

Les intelligences artificielles urbaines.

ISABELLE RYL

Directrice de PRAIRIE (PaRis Artificial Intelligence Research InstitutE) à l'Inria

Recherche fondamentale en IA : les obstacles à dépasser.

JEAN-DANIEL FEKETE

Senior Scientist Group Lead à l’Université Paris-Saclay et DR à l’Inria au sein de l’équipe “Analysis and Visualization”

La visualisation des données, une aide puissante à l’analyse et à la décision qu’il faut savoir maîtriser et interpréter.

MÉDÉRIC CHOMEL

VP Data, AI & Automation chez Orange France

Gouvernance de la donnée et diffusion d’une culture de la data : fondations d’une transformation à grand échelle.

CHRISTINE BALAGUÉ

Professeure à l'Institut Mines-Télécom & Directrice de la Chaire Good in Tech

Une IA de confiance va s’imposer encore plus fort que le RGPD.

Nicolas Vayatis

Professeur à l’Ecole Normale Supérieure Paris-Saclay et Directeur du Centre Borelli

La recherche fondamentale n’a de valeur que si elle est ancrée dans la réalité du terrain.

Anca MAROLA

Chief Data Officer du Groupe LVMH

La transformation business passe par l’acculturation à la data.

Vincent Luciani

CEO et co-fondateur d'Artefact

La valeur créée par la data révèle son plein potentiel quand son adoption est généralisée.

ARTHUR DERENNES

VP Data Engineering chez Artefact

La modern data stack : Kezako et impact sur les métiers.

Aleksandra Semenenko

Director of Data Science at Artefact

Mastering Marketing ROI thanks to Incrementality Testing

Jean-Marie John-Mathews

PhD, cofondateur et directeur scientifique de Giskard AI

L’IA et l’éthique

Nathalie Beslay

CEO et co-fondatrice de Naaia, et avocate

L’AI Act et son application business.

Julien Ho-Tong

Partner and Data/AI Strategy & Governance Expert at Artefact

How to implement a Data Governance strategy.

Matthieu Rouif

Co-Founder & CEO of Photoroom

Impact of Gen AI technologies on the photo business.

Laurent Daudet

Co-CEO et Co-fondateur chez LightOn

Une IA générative privée, sécurisée et éthique.

Basile Marmoy

Senior Data Consultant chez Artefact

L’IA Gen: L’adopter en entreprise et impact sur son métier

Daniel Al Choboq

Senior Data Scientist chez Artefact

L’IA Générative – Démo Pythie

Sami Taaissat

Software & Data Engineer chez Artefact

L’IA Gen et le métier de Data Engineer

ILIASS BENRYANE

Lead Data Scientist chez Artefact

L’IA Générative

Leïla Achour

Directrice du Développement chez Artefact 3000

L’IA Gen en création et en publicité

Sami Taaissat

Software & Data Engineer chez Artefact

L’IA Générative – Démo Babylone

Bertrand Brisou

Data & Analytics Director at Artefact

How savvy Marketing Measurement can boost sales and maximize business outcomes

Siddharth Mohan

Director Data Science & Global Lead for Causal AI Research & Marketing Mix Modelling at Artefact

Innovative modeling techniques push the boundaries of experimentation and measurement

Aleksandra Semenenko

Director of Data Science & Global lead on Marketing Measurement at Artefact

Three trends paving the way for the future of Marketing Mix Modeling (MMM)

XAVIER PERRET

Directeur Cloud Azure chez Microsoft France

Le nouveau monde de l’IA Générative.

HANAN OUAZAN

Partner et Lead IA Générative chez Artefact

L’IA Générative, un écosystème technologique en pleine effervescence.

MAXIME MAREMBAUD

Group CDO chez Sodexo

La transformation Data du Groupe Sodexo.

Chloé BENHACOUN

Senior Data Consultante chez Artefact

La Modern Data Stack va faire évoluer la transformation data des entreprises.

KILLIAN GAUMONT

Senior Manager chez Artefact

Le Data Mesh : une gestion décentralisée de la data qui crée de la valeur.

JEAN-MARC LAZARD

Président et co-fondateur d'Opendatasoft

Un accès égal à la donnée grâce à l’Open Data.

MICHEL TRICOT

CEO d'Airbyte

L’open source pour résoudre la connexion des datas ETL.

Violaine Berland

Directrice Conseil chez Artefact

Le Data Mesh et les data products.

JEAN-BAPTISTE CHARRUEY

Data Engineering Director & Tech Lead Artefact

Le Data Mesh et les outils associés.

ARVAND MODARRESI

Partner chez Artefact

Le Data Mesh : une gestion décentralisée de la data qui crée de la valeur.

BRIAN LOZACH

Senior Data Scientist chez Artefact

La Modern Data Stack & la transformation du métier de Data Scientist.

OLIVIER BURGUIERE

Senior Data Analyst chez Artefact

La Modern Data Stack et son impact sur le métier de Data Analyst.

HUBERT BEROCHE

Fondateur de Urban AI

Les intelligences artificielles urbaines.

ISABELLE RYL

Directrice de PRAIRIE (PaRis Artificial Intelligence Research InstitutE) à l'Inria

Recherche fondamentale en IA : les obstacles à dépasser.

JEAN-DANIEL FEKETE

Senior Scientist Group Lead à l’Université Paris-Saclay et DR à l’Inria au sein de l’équipe “Analysis and Visualization”

La visualisation des données, une aide puissante à l’analyse et à la décision qu’il faut savoir maîtriser et interpréter.

MÉDÉRIC CHOMEL

VP Data, AI & Automation chez Orange France

Gouvernance de la donnée et diffusion d’une culture de la data : fondations d’une transformation à grand échelle.

CHRISTINE BALAGUÉ

Professeure à l'Institut Mines-Télécom & Directrice de la Chaire Good in Tech

Une IA de confiance va s’imposer encore plus fort que le RGPD.

Nicolas Vayatis

Professeur à l’Ecole Normale Supérieure Paris-Saclay et Directeur du Centre Borelli

La recherche fondamentale n’a de valeur que si elle est ancrée dans la réalité du terrain.

Anca MAROLA

Chief Data Officer du Groupe LVMH

La transformation business passe par l’acculturation à la data.

Vincent Luciani

CEO et co-fondateur d'Artefact

La valeur créée par la data révèle son plein potentiel quand son adoption est généralisée.

ARTHUR DERENNES

VP Data Engineering chez Artefact

La modern data stack : Kezako et impact sur les métiers.

"L’IA Générative – Démo Babylone"

ABONNEZ-VOUS A LA NEWSLETTER THE BRIDGE.

TOUS NOS ÉPISODES THE BRIDGE

Aleksandra Semenenko

Jean-Marie John-Mathews

Nathalie Beslay

Julien Ho-Tong

Matthieu Rouif

Laurent Daudet

Basile Marmoy

Daniel Al Choboq

Sami Taaissat

ILIASS BENRYANE

Leïla Achour

Sami Taaissat

Bertrand Brisou

Siddharth Mohan

Aleksandra Semenenko

XAVIER PERRET

HANAN OUAZAN

MAXIME MAREMBAUD

Chloé BENHACOUN

KILLIAN GAUMONT

JEAN-MARC LAZARD

MICHEL TRICOT

Violaine Berland

JEAN-BAPTISTE CHARRUEY

ARVAND MODARRESI

BRIAN LOZACH

OLIVIER BURGUIERE

HUBERT BEROCHE

ISABELLE RYL

JEAN-DANIEL FEKETE

MÉDÉRIC CHOMEL

CHRISTINE BALAGUÉ

Nicolas Vayatis

Anca MAROLA

Vincent Luciani

ARTHUR DERENNES

Aleksandra Semenenko

Jean-Marie John-Mathews

Nathalie Beslay

Julien Ho-Tong

Matthieu Rouif

Laurent Daudet

Basile Marmoy

Daniel Al Choboq

Sami Taaissat

ILIASS BENRYANE

Leïla Achour

Sami Taaissat

Bertrand Brisou

Siddharth Mohan

Aleksandra Semenenko

XAVIER PERRET

HANAN OUAZAN

MAXIME MAREMBAUD

Chloé BENHACOUN

KILLIAN GAUMONT

JEAN-MARC LAZARD

MICHEL TRICOT

Violaine Berland

JEAN-BAPTISTE CHARRUEY

ARVAND MODARRESI

BRIAN LOZACH

OLIVIER BURGUIERE

HUBERT BEROCHE

ISABELLE RYL

JEAN-DANIEL FEKETE

MÉDÉRIC CHOMEL

CHRISTINE BALAGUÉ

Nicolas Vayatis

Anca MAROLA

Vincent Luciani

ARTHUR DERENNES

ABONNEZ-VOUS A LA NEWSLETTER THE BRIDGE ET RECEVEZ NOS NOUVEAUX ÉPISODES