Time Series France

La commmunauté francophone sur les séries temporelles, de la collecte de la donnée jusqu'à son exploitation !

Rejoignez la communauté
lispstreamingperformance Inscription

Bonjour à tou(te)s,

Pour cette 18ème édition, nous allons mettre nos activités entre parenthèses et donner un petit coup de glamour avec la présentation de LispTick par Cédric Joulain.

Pendat cette édition, Cédric va nous présenter LispTick, un format de stockage et un moteur de calcul sur les timeseries en pur streaming. Vous pourrez découvrir ou redécouvrir les nombreux avantages insoupçonnés d’une approche pur streaming:

  • une utilisation mémoire minimale,
  • aucune contrainte sur la taille des timeseries,
  • le début des résultats pouvant arriver quasi immédiatement,
  • traitement identique de l’historique et du temps réel (temps continu),
  • etc.

LispTick a été conçu à l’origine pour les flux de bourses, les flux les plus complexes car asynchrones, avec des fréquences très variables (quelques points par an à plusieurs à la même nanoseconde) et tout type de valeur (entiers, décimaux, réels, booléen, chaîne de caractères…). Nous avons depuis étendu les usages à l’IoT, la météo, les tenseurs multidimentionnels… Ainsi, nous avons pu appliquer des algortihmes de finance au suivi de la santé des abeilles!

A propos de Cédric Joulain : après avoir suivi un cursus Ingénieur en informatique et en parallèle un DEA en traitement du signal j’ai été doctorant en NeuroCybernetic avec plusieurs publications à la clef. J’ai ensuite travaillé pendant 20 ans, de près ou de loin, pour BNP Paribas à Paris et Londres dans les équipes recherches des salles de marché. L’expertise acquise m’a permis de développer une approche très efficace du traitement des timeseries, aussi bien pour le stockage que pour le calcul en pur streaming. Depuis 2021, je suis responsable R&D chez Kereon Intelligence, travaillant sur tout type de projet innovant relatif à la data, que ce soit de la computer vision, de l’IoT,… ou bien sûr des timeseries!

Cette édition se fait toujours en virtuel via Zoom étant sur la région parisienne et notre invité dans la région de Poitiers. Si néanmoins quelqu'un souhaite héberger le meetup pour avoir une version hybride, n'hésitez pas à me contacter.

Nous espérons vous voir nombreux !

ezakoanomalieautomatisationdétection Inscription

Bonjour à tou(te)s,

Pour cette 17ème édition, la société eZako vient nous présenter deux sujets autour de la détection d'anomalie et l'annotation de séries temporelles; le tout en une heure.

Sujet 1 : 30 minutes pour devenir expert en détection d’anomalie sur les séries temporelles en machine learning

Les techniques de détection d’anomalies sont réputées dures à mettre en place. Trouver la bonne data et la transformer, choisir le bon algorithme et le paramètrer, annoter les données et optimiser les résultats sont des étapes clés d’une bonne détection. Nous allons vous présenter des exemples concrets de ces tâches et vous fournir les éléments clés pour les mener à bien en utilisant des approches d'apprentissage non supervisées, semi-supervisées et supervisées.

Le sujet sera présenté par Yassine Elamraoui. il est un expert en Machine Learning depuis 2019. Il prépare une thèse d’automatisation des processus de Machine Learning et des activités du data scientist.

Sujet 2 : Annotez facilement vos séries temporelles !

Augmenter la performance de vos modèles sur séries temporelles est crucial. Se concentrer uniquement sur le choix de l’algorithme et son paramétrage n’est pas suffisant. D’autres facteurs entrent en jeu, tels que la qualité et la disponibilité des labels dans vos données. Dans cette présentation je vais vous montrer que des labels de qualité peuvent être ajoutés facilement pour vous permettre de basculer vers des approches supervisées ou hybrides qui amélioreront vos modèles.

Le sujet sera présenté par Julien Muller ; il est le CTO de la société Ezako, spécialisée en ML sur séries temporelles. Il dirige les travaux de son équipe sur les modèles de détection d’anomalies, de maintenance prédictive et de forecasting et sur des sujets de labellisation et de données synthétiques.

Cette édition se fait toujours en virtuel via Zoom étant sur la région parisienne et nos invités à Sophia Antipolis. Si néanmoins quelqu'un souhaite héberger le meetup pour avoir une version hybride, n'hésitez pas à me contacter.

Nous espérons vous voir nombreux !

warp10senx Inscription

Bonjour à tous,

A l'occasion de la sortie prochaine de Warp 10 3.0, la société SenX qui développe Warp 10 organise un "Ask Me Anything" (AMA) avec son CTO Mathias Herberts.

Mathias était déjà venu nous parler de Time Series et de Warp 10 en particulier dans le cadre des éditions #1 et #5 du meetup :

Si vous avez questions ou des attentes particulières concernant Warp 10 en général et le contenu de la version 3.0 en particulier, n'hésitez pas à remonter vos questions dans le formulaire ci-dessous

Pour en savoir plus sur:

En fonction des réponses, la séance AMA peut se faire en Français et/ou Anglais.

Inscriptions et questions via : https://forms.gle/Sf8vNgRyL5uwAd2P8

santédataloggerchrubrestwarp10senx Inscription

Bonjour à tou(te)s,

Pour cette 16ème édition, nous allons bénéficier d'un retour d'expérience d'utilisation de séries temporelles dans le domaine de la santé.

Le CHRU de Brest a décidé en 2020 d'acquérir la tension artérielle et la pression intracrânienne en continu de tous ses patients en réanimation, avec une résolution inégalée jusqu'ici. Découvrez cette aventure, de la conception à l'exploitation des 10 milliards de points résultant.

Pour nous raconter ce beau projet, nous aurons comme orateurs :

  • Pierre PAPIN : Électronicien passionné d'informatique, après 13 ans chez renault sport, je combine ces deux passions en un métier: développeur chez SenX. Quand un projet de collecte de données nécessite du hardware, je réalise la carte électronique, le soft embarqué, et toutes les couches nécessaires pour envoyer les données dans Warp 10. Armé de mon fer à souder et d'un stock de composants, j'ai participé au développement du respirateur open source Makair en mars 2020.
  • Arnaud MORE : Étudiant en dernière année de l'ENIB (École Nationale d'Ingénieur de Brest), école d'ingénieur généraliste, je réalise un parcours bi-diplomant en partenariat avec l'UBO afin de me spécialiser en traitement du signal. Actuellement en stage de fin d'études au CHRU de la cavale-blanche à Brest, j'aide les médecins à réaliser un outil d'aide à la décision. Ce stage me permet d'allier mes passions pour la médecine et l'ingénierie au sein d'un même projet.

Cette édition se fait toujours en virtuel via Zoom.

Nous espérons vous voir nombreux !

iotmachine-learningsatellitedata-science Inscription

Bonjour à tous,

Meilleurs voeux pour cette nouvelle année avec notamment plein de projets de séries temporelles ! Comme cela vous pourrez venir en parler aux prochaines éditions du meetup 😉

Pour cette 14ème édition, nous allons lever les yeux vers le ciel pour nous intéresser aux séries temporelles de satellites. 🛰

Bruno Pinos, Data Scientist chez Kratos Defense and Security Solutions va nous parler plus particulièrement des manoeuvres de satellites : son objectif est de détecter des manoeuvres ou des groupes de manoeuvres anormaux et de comprendre les causes des anormalités.

Au programme :

  • Extraction des manoeuvres dans la série temporelle entière
  • Etude des métriques durant les manoeuvres (Courbe de densité, corrélations…)
  • Etude de la distance entre les manoeuvres (DTW, euclidean), création de matrices de distance
  • Détection d’anomalies à l’aide des matrices de distance
  • Clustering : Agglomerative clustering basé sur les matrices de distance des manoeuvres (univarié, multivarié)

Le meetup reste sous forme virtuelle vu les conditions sanitaires actuelles mais aussi parce que Bruno est à Toulouse.

data-scienceforcecastprévisiondécompositionprophetkatsneural-prophet Inscription

Bonjour à tous,

Pour cette 13ème édition, nous recevons Paul Péton et Syrine Ben Salah pour un talk plus orienté data-science avec pour titre "Décomposition et prévision des Séries Temporelles : de la théorie à la pratique"

Les bases théoriques de l'analyse des séries temporelles (time series) ont montré leur efficacité depuis plusieurs dizaines d'années. La méthode de décomposition en particulier a le double intérêt d'être facilement interprétable et de très bien s'adapter à de nombreux phénomènes macro-économiques. Pourtant, le sujet est loin d'être à l'arrêt et de nouveaux outils voient le jour : utilisation des réseaux de neurones pour les séries temporelles, packaging des méthodes pour simplifier leur utilisation au quotidien. Après avoir résumé les bases théoriques, nous ferons un retour d'expérience sur des outils comme Prophet, kats ou encore neural prophet.

Deux mots sur nos orateurs :

Le meetup reste sous forme virtuelle vu que Paul est à Nantes et pour permettre à un maximum de personnes de participer à cette édition.

Au plaisir de vous retrouver pour cette dernière édition du meetup pour 2021 et en attendant de voir ce que nous ferons en 2022...

course au largetrimaranmulti50oceanfiftydata-scienceprévisionprédictiontimescaledbmachine-learningdata-engineering Inscription

Bonjour à tous,

Pour cette douzième édition, nous prenons le large en cette période estivale ! Loïc Veyssière, de chez Meritis, va venir nous parler de course au large et de séries temporelles avec TimescaleDB et des usages autour :

Le projet Bateau Qui Vole a pour objectif d’exploiter toutes les données de navigation du trimaran de compétition de Sébastien Rogues afin d’en optimiser les performances. Il sera pleinement opérationnel pour la Route du Rhum 2022. Je vous propose de plonger dans l’univers de la voile à travers les défis data auxquels nous faisons face. Dans un premier temps, ancrage sur l’ingénierie data : stockage des données de capteurs, récupération des prévisions météorologiques et annotations semi-automatisées. Puis cap sur l’analyse scientifique : le problème de la calibration, les indices de performances mais aussi du machine learning sur des séries temporelles pour la prédiction de hauteurs vagues et pour l’aide à la décision.

Loïc Veyssière est ingénieur diplômé de Centrale Lille et a obtenu un master en mathématiques appliquées à l’EPFL. Il commence chez Intel sur des problématiques de performance appliquées aux supercalculateurs. Il part ensuite en Australie, travaille comme data scientist / software engineer pour 2 start-ups et rejoint Meritis début 2019. En plus de ses activités de consultant, il est le responsable du projet Bateau qui Vole.

En attendant le meetup, un article sur le sujet : « Le bateau qui vole » : l’analytique en temps réel au service d’un skipper

influxdbtelegrafchronografkapacitoriox

Bonjour à tous,

Format particulier pour cette édition sous la forme d'une vidéo résumant les annonces produit d'InfluxData dans le cadre des InfluxDays EMEA 2021 des 18/19 Mai 2021.

Retrouvez l'ensemble des conférences sur la playlist YouTube InfluxDays EMEA 2021 et sur le site InfluxDays EMEA 2021.

cassandratsqlstuteofinancedevopsiot Inscription

Bonsoir à tous,

Pour cette dixième édition et suite à la demande de venir présenter leur produit au meetup, nous aurons le plaisir d'accueillir Habib Chtourou, CTO et co-fondateur de Stuteo. Il souhaite nous présenter son produit et avoir nos retours.

Stuteo est, une startup Française, éditeur d’un gestionnaire de séries temporelles basé sur Apache Cassandra. StuteoDB est une solution optimisée pour la gestion des séries temporelles, adapté à tous les cas d’usages (Finance de marché, DevOps, IOT ...), avec un nouveau modèle de données et un nouveau langage TSQL spécialement dédié à l’analyse et le traitement des séries temporelles.

Habib Chtourou présentera l’architecture et les fonctionnalités de StuteoDB avec des exemples pour la finance de marché.

Que vous soyez curieux sur leur implémentation, un utilisateur d'Apache Cassandra dans un contexte séries temporelles (ou pas) ou bien curieux de voir un nouvel acteur français se lancer dans les séries temporelles, n'hésitez pas à venir à cette édition ! Vous pourrez voir si la promesse est au rendez-vous !

Au plaisir de vous y retrouver !

influxdbmachine-learninganomalielabel Inscription

Bonjour à tous,

Meilleurs voeux à tous !

Pour cette première édition (virtuelle) de 2021, nous allons parler de séries temporelles et de machine learning au travers d'un retour d'expérience sur la base InfluxDB avec la société Ezako et son CTO : Julien Muller. Il nous dira comment il gère la labellisation des séries temporelles et fait de la détection d'anomalies.

Ezako est une startup spécialisée dans l’analyse de séries temporelles. Ezako aide ses clients à détecter des anomalies et à labelliser leur données de séries temporelles. Elle aide à accélérer le processus de labellisation et à analyser de grandes quantités de données d’une multitude de capteurs en temps réel. L’entreprise offre une compréhension poussée des anomalies et rend celle-ci plus facile pour les data scientists. Ezako est l’éditeur d’Upalgo, un outil de gestion des données de séries temporelles qui utilise l’IA pour détecter automatiquement des anomalies dans un flux de données.

awstimestreamiotmonitoringanalytics Inscription

Bonjour à tous,

Pour cette édition virtuelle du mois de Novembre, nous parlerons d'AWS TimeStream avec Sébastien Stormacq (Developer Advocate AWS)

Annoncée lors de re:Invent 2018 et finalement lancé en Septembre 2020, Amazon TimeStream est une base de données de séries chronologiques rapide, évolutive et sans serveurs. TimeStream permet aux développeurs de collecter des données issues de IoT ou des données opérationnelles. Il facilite le stockage et l'analyse de milliers de milliards d'événements par jour, jusqu'à 1 000 fois plus vite que les bases de données relationnelles et pour un dixième du coût. TimeStream possède des fonctions analytiques de séries chronologiques intégrées, vous permettant d'identifier, quasiment en temps réel, des tendances et des modèles dans les données. Dans cette présentation, je ferai le tour du propriétaire en expliquant les principes et cas d’utilisations, puis en montrant comment interagir avec TimeStream avec la ligne de commande, la console et l’API.

questdb Inscription

Bonjour à tous,

Nouvelle édition mardi 13 octobre avec la présentation de QuestDB. QuestDB est la dernière base Time Series qui a fait son apparition il y a quelques mois ou en tous cas dont on entend de plus en plus parler ; faut dire qu'avoir embauché un des DevRel InfluxData a permis de donner de la raisonnance au projet !

Sous le titre prometteur "QuestDB, Une perspective nouvelle pour les bases de données temporelles", Méril Pilon va donc venir nous parler de QuestDB et présenter le projet, ses fonctionnalités, ses cas d'usage, etc ; le tout avec quelques démos.

timescaletimescaledbpostgresql Inscription

Bonjour à tous,

La saison 2 du meetup démarre avec l'édition 6 consacrée à la solution TimescaleDB, basée sur Postgresql et édité par l'entreprise Timescale.

Le talk sera réalisé par Avthar Sewrathan, Developer Advocate chez Timescale.

influxdbtelegraffluxinfluxdatasenxwarpscriptwarp10 Inscription

Bonjour à tous,

Pour clore cette première saison du Paris Time Series Meetup, nous vous proposons deux sujets !

  • Talk 1 : Je (Nicolas Steinmetz) vais vous faire un résumé des annonces produit qui ont eu lieu aux d'InfluxDays pour ceux qui n'ont pas pu assister aux deux jours de conférences cette semaine.
  • Talk 2 : Mathias Herberts (CTO SenX, Warp10) qui avait ouvert la saison nous fait le plaisir de venir la clôturer avec un nouveau projet appelé "FloWS" :
influxdbtelegraffluxinfluxdata Inscription

Pour cette quatrième édition qui s'est tenue chez Ippon Technologies, nous avons eu le plaisir d'écouter David McKay, Developper Advocate chez InfluxData. Il est venu nous parler de :

  • Let's meet InfluxDB and Flux : retour sur la génèse et un tour du propriétaire d'InfluxDB 2.0 et du langage flux.
  • The telegraf toolbelt : Revue et bonnes pratiques autour de l'agent de collecte Telegraf.
quasardbfinancetransport Inscription

Cette seconde édition s'est tenue chez Novencia Group et fait le focus sur la solution QuasarDB.

  • Jean-Claude Tagger , COO et co-fondateur et Vianney Plotton, ingénieur R&D chez QuasarDB : "Time Series sans limites avec QuasarDB" : la technologie en mode cloud ou embarquée permet de gérer des cas d’usages « extrêmes » dans des secteurs aussi variés que la Finance de Marché, le Transport ou l’Industrie. Un aperçu des principes de base de la technologie ainsi que de quelques cas d’usage.
  • Mickaël Gervais, consultant chez Agaetis nous fait un retour sur le choix et l'utilisation de QuasarDB chez un équipement automobile autour d'un sujet de véhicules connectés.
warp10datascienceovhcloudsenx Inscription

Pour cette première édition qui s'est tenue chez ManoMano, nous avons eu le plaisir d'écouter :

  • Mathias Herberts, Co-fondateur et CTO de SenX venu nous parler des usages avancés autour des séries temporelles et de la plateforme Warp10
  • Clément Bataille et Christophe Rannou, d'OVHCloud, sont venus nous présenter leur offre préscience et un retour d'expérience sur l'usage du machine learning appliqué au séries temporelles dans le cadre du monitoring de data-centers.