Datavillage 2A

Actions
Collaborate on data
56 000 €
montant total
  • Eligible à une réduction d’impôts
Cette campagne de financement est clôturée

Contexte général du partage de la donnée


Selon Gartner, les organisations qui promeuvent le partage de données surpasseront leurs pairs dans la plupart des mesures commerciales. Par exemple: en utilisant des données agrégées pour atteindre des objectifs communs en toute sécurité, les organisations peuvent travailler avec la concurrence au sein d'un secteur de marché pour atteindre des objectifs communs tels que le développement d'informations plus approfondies sur les clients ou la détection de modèles de fraude dans l'ensemble d'un secteur. Pour les entreprises, les données cryptées rendent les projets d'intelligence artificielle (IA) et d'apprentissage automatique (ML) plus sûrs et les audits de conformité plus faciles.

De telles opportunités de monétisation des données par le partage et la mise en commun peuvent offrir un avantage concurrentiel aux premiers entrants. Les nouvelles technologies donnent naissance à des modèles d'affaires et des produits innovants en simplifiant les mécanismes de partage des données entre les organisations et/ou en impliquant les individus. Les capacités de partage de données sécurisées peuvent aider les organisations à monétiser leurs propres ressources d'information et à atteindre leurs objectifs commerciaux en utilisant les données d'autres personnes.

Définition du marché


Le marché de Datavillage est le marché du partage de données divisé en 3 catégories principales : le transfert de données (partage de données entre les parties), les marchés de données (achat et vente de données entre les parties) et la collaboration de données (collaboration de plusieurs parties dans un but particulier).

Datavillage se concentre sur le marché de la collaboration de données en s'appuyant sur des capacités de préservation de la confidentialité pour permettre une collaboration de confiance entre les différentes parties. Les deux premières catégories sont déjà bien implantées sur le marché et peu ou pas de parts de marché sont encore à aller conquérir.

La 3ème catégorie, la collaboration autour données, quant à elle s'est consolidée au cours des 6 derniers mois (Gartner, Deloitte, Forrester ou même la plateforme de données Snowflake désignent la collaboration de données comme la prochaine grande étape de la transformation des données d'entreprise). La concurrence reste limitée mais s'accélère avec l'utilisation de différentes technologies comme parfois la blockchain mais le plus souvent des technologies renforçant la vie privée (informatique confidentielle ou "Confidential Computing", chiffrement homomorphique, calcul différentiel multipartite, ...)

Taille du marché



TAM: Le marché total disponible (TAM) des technologies de préservation de la vie privée (Privacy Enhancing Technologies "PET") est estimé à 56 milliards de dollars d'ici à 2026.
SAM: Datavillage se concentre d'abord sur les marchés hautement réglementés comme l'Europe et l'Amérique du Nord estimés à 48% du TAM pour un montant de 28 milliards de dollars (Serviceable Available Market).
SOM: Enfin, Datavillage se concentre sur les organisations qui élargissent leur capacité à utiliser des données externes avec une collaboration de données (Finance, Médias, Retail) estimée à 70%, ce qui laisse pour 18 milliards de dollars.

Aussi, le marché disponible total de l'informatique confidentielle (Confidential Computing, CC) devrait croître d'au moins 6x dans le pire des cas et 26x dans le meilleur des cas au cours des cinq prochaines années. Le marché du CC devrait croître à un TCAC de 90 à 95 % dans le meilleur des cas et
40 à 45 % dans le pire des cas jusqu'en 2026.

Source: https://confidentialcomputing.io/wp-content/uploads/sites/85/2021/10/Everest_Group_-_Confidential_Computing_-_The_Next_Frontier_in_Data_Security_-_2021-10-19.pdf

Evolution du marché


L'Europe est à la pointe de la réglementation des données. Le RGPD est la réglementation sur les données la plus connue et la plus établie. Le coût et l'attention portée à la conformité dans les organisations restent très élevés.

La stratégie data de l'Europe renforcera l'utilisation des données dans les années à venir pour créer un marché des données et favoriser l'émergence de nouveaux business models, notamment vis-à-vis des GAFAM et des autres grands acteurs du web. Le principal levier de croissance pour Datavillage est la loi sur la gouvernance des données (DGA: https://digital-strategy.ec.europa.eu/en/policies/data-governance-act) qui normalisera et uniformisera la notion d'intermédiaire de données dans les 12 prochains mois, ce qui favorisera Datavillage qui se positionne déjà comme un dépositaire de données et fournissant un environnement neutre pour la collaboration de données entre les organisations et les individus.

Dans une récente enquête, Forrester Research a constaté que plus de 70 % des décideurs mondiaux en matière de données et d'analyse élargissent leur capacité à utiliser des données externes, et 17 % prévoient de le faire dans les 12 prochains mois.

Compétition et proposition de valeur unique


Le paysage concurrentiel est structuré sur deux axes : un axe relatif au modèle de partage de données et un autre axe relatif au type de données. Dans ce paysage, les acteurs peuvent être classés en différents types d'intermédiaires de données traitant de problèmes différents et peuvent ouvrir de nouvelles opportunités:

Fiducies de données: Assure la gestion fiduciaire des données au nom des personnes concernées.

Échanges de données:
Ces "data exchanges" fonctionnent comme des plateformes de données en ligne où les ensembles de données peuvent être annoncées et consultées - commercialement ou sur une base à but non lucratif. Dans ce système la donnée est vendue et copiée, donc perdue, une fois achetée.

Systèmes de gestion des informations personnelles: cherchent à donner aux personnes concernées plus de contrôle sur leurs données personnelles.

Coopératives de données:
Active les espaces de données partagées et contrôlées par les personnes concernées.

Tiers de confiance:
Fournis l'assurance à ceux qui cherchent à accéder à des ensembles de données confidentiels que les données sont adaptées à leur objectif (par exemple en termes de qualité ou de normes éthiques).

Dépositaires de données:
Activez l'analyse de protection de la vie privée ou les vérifications d'attributs des données confidentielles, par exemple, via l'application des technologies d'amélioration de la confidentialité (PET).

Le paysage concurrentiel direct identifié pour Datavillage est celui des dépositaires de données permettant l'analyse de la confidentialité ou les vérifications d'attributs de données confidentielles, Datavillage a une position de "first-to-market" à l'instar d'autres startups telles que Decentriq, Apheris, Habu, Duality ou Sarus.

L'avantage concurrentiel unique de Datavillage réside dans le fait que la plupart des concurrents parient sur des technologies encore trop immatures et non actionnables du point de vue commercial car ne bénéficiant pas encore de la confiance des clients (encryption homomorphique, Blockchain) tandis que Datavillage se repose sur des standards venant du "web 2" et évoluant pour servir le "web 3" où la donnée est décentralisée et distribuée, favorisant la collaboration multi-partite sur les données ainsi que sur des technologies de traitement confidentiel des données (Confidential Computing) bien plus mature. Datavillage ne fait pas que d'échanger la donnée, nous en assurons le contrôle au moment de la transférer mais aussi de la traiter (processing).

Aussi, l'un des avantages concurrentiels de Datavillage réside dans le fait que nous prenons aussi des cas d'usages dit "B2C", c'est à dire non seulement le traitement des données entreprises mais aussi des données personnelles pouvant être fournies par le consommateur lui-même.


Stratégie marché


A l'échelle européenne, Datavillage a mis en place une stratégie dite d'avantage du premier arrivé ("first-to-market") en prévision de ce cadre européen favorable à la collaboration sur la data. La mise en place de cette stratégie se fait via une approche progressive.

Datavillage a prévu 3 niveaux de développement:

- Le premier palier (les 2 dernières années) était de démontrer l'applicabilité de notre technologie dans une industrie avec des barrières à l'entrée réduites (l'industrie des médias, avec des données moins sensibles).

- Le deuxième palier (les 2 prochaines années) se concentrera sur l'industrie financière, la plus mature pour les cas d'usages transverses critiques nécessitant des données sensibles (sous l'obligation des régulations PSD2 et PSD3 notamment qui ont favorisé un premier esprit d'ouverture et de compréhension). Le secteur financier est considéré comme un vecteur de la stratégie d'évolution de l'entreprise et sera un focus stratégique pour la croissance de celle-ci, au même titre que l'industrie du retail où plusieurs cas d'usage ont déjà été identifiés et développés.

- Le troisième palier se concentrera sur la diversification des secteurs adressés et l'ouverture sur de nouveaux marchés (Amérique du Nord, Asie) au sein d'espaces de données définis par l'Europe tels que les RH, la mobilité et le Green Deal, mais aussi certaines industries avec des rendements plus élevés mais des barrières à l'entrée très élevées comme la santé.

D'ici là, Datavillage doit devenir une plateforme SaaS (Software-as-a-service) de référence pour la collaboration de données en abaissant les barrières pour créer ou rejoindre des espaces de collaboration de données existants qui seront devenus d'ici là devenus la norme pour les entreprises sous l'impulsion législative des états.

Enfin, Datavillage s'appuie sur des partenariats pour l'acquisition de clients, d'une part via des sociétés d'intégrations de solutions IT et d'autre part sur des éditeurs de logiciels et plateformes de gestion de données afin de proposer sa solution comme une capacité métier permettant le partage de données avec les organisations. Des partenaires capables de proposer à leurs clients entreprises une solution clé en main intégrable dans des architectures métiers orientées "produits de données".