Vous avez envie d’évoluer au sein du plus grand centre de recherche francophone en Amérique du Nord et de participer à des projets de recherche des plus stimulants?
Le Centre de recherche du CHU de Québec-Université Laval est une organisation qui offre un environnement de travail stimulant où les nouvelles idées, le partage des connaissances et le dépassement de soi sont valorisés.
SCIENTA, le Centre de valorisation et d’exploitation des données du CHU de Québec-Université Laval et Plateforme du Centre de recherche, est le milieu de travail pour vous.
SCIENTA est une infrastructure de pointe en science des données permettant la mise en œuvre de solutions performantes et sécurisées pour l’intégration, l’interopérabilité, le traitement et la transformation des données en format électronique provenant des systèmes d’information de l’établissement.
SCIENTA a été mandaté par le CHU pour être le guichet unique d’accès aux renseignements du réseau de la santé et de services sociaux (RSSS) dans l’établissement pour répondre aux différents besoins de recherche, d’évaluation, d’enseignement.
SCIENTA souhaite agrandir son équipe en accueillant une personne passionnée par l’architecture et l’exploitation des données massives.
La personne recherchée sera principalement appelée à concevoir et optimiser une infrastructure sous forme de lac de données et évaluer l’intégration des données à celle-ci.
Elle pourra évoluer dans un environnement de logiciel libre (open source) et contribuer à l'utilisation optimale de ses connaissances en programmation Python.
Les compétences de la personne recherchée viendront consolider l’équipe d’experts pour faire évoluer la plateforme d'extraction et de chargement de données (ETL) du lac de données.
Cette personne pourra également concevoir des processus de transformation et d'intégration de données à partir de sources hétérogènes comme des documents XML, des interfaces de programmation REST / SOAP.
Elle aura, par ailleurs, la possibilité de s’impliquer à long terme. Une combinaison de scolarité et de formation ou d’expérience jugée équivalente sera également retenue.
Description du poste, des tâches et des responsabilitésSelon les besoins, le ou la candidat·e aura à :
- Superviser la conception et l’optimisation architecturale de l'infrastructure d'intégration de données ;
- Veille à l’intégrité et la sécurité des données dans l’infrastructure ;
- Réaliser des preuves de concepts pour valider l’orientation de l’infrastructure et la mise en place de solutions technologiques ;
- Maintenir le catalogue des données et définir les règles de gestions des données de référence ;
- Documenter et communiquer l’architecture et les modèles de données à l’interne ;
- Établir de meilleures pratiques au sein de l’équipe ;
- Dépanner et corriger les disparités de données ;
- Assurer l’utilisabilité, l'entretien et l'évolution de l'infrastructure de lac de données ;
- Perfectionner les processus d’extraction et les performances de chargement (ELT / ETL) ;
- Collaborer avec les scientifiques et les ingénieurs au développement de nouveaux services au Guichet d’accès aux données de SCIENTA ;
- Effectuer une veille technologique, repérer et suggérer de nouvelles approches.
- Lieu de travail : Centre de recherche du CHU de Québec, site de l’Hôpital de l'Enfant-Jésus ;
- Horaire : 35h par semaine ;
- Entrée en fonction : dès que possible ;
- Durée : 12 mois (avec possibilité de renouvellement) ;
- Rémunération : selon la structure salariale en place ;
- Vacances : 20 jours ;
- Fériés : 13 jours ;
- Congés de maladie : 7 jours ;
- Régime d’assurances collectives avec contribution de l’employeur (jusqu’à concurrence de 2 000$ par année) ;
- Régime de retraite (RREGOP) ;
- Privilèges CHU : rabais chez différents partenaires (restaurants, boutiques, conditionnement physique, loisirs, hôtels, centres de santé, spa, etc.), si applicable.
Formation requise :
Détenir un diplôme universitaire de 1er cycle en informatique ou une discipline appropriée.
Profil recherché :
- Bonne connaissance en processus d'extraction, traitement et de chargement des données (ETL / ELT) ;
- Très bonne connaissance du langage SQL ;
- Bonne connaissance du langage Python ;
- Excellente compréhension du fonctionnement des bases de données et de leur gestion (PostgreSQL, Oracle, SQL serveur) ;
- Désir de s’impliquer dans un environnement open source ;
- Expérience avec l’environnement Linux ;
- Expérience en outil de gestion des codes sources (Git) ;
- Bonne connaissance avec langages scriptés et autres (R, Shell, Bash) ;
- Expérience en matière de technologie de conteneurs (Docker, Podman) ;
- Expérience démontrée avec du stockage de type objet S3 ;
- Connaissance de l’utilisation des interfaces de programmation (API) (Rest, Soap) ;
- Connaissance des différents systèmes d’information du réseau de la santé.
Aptitudes :
- Excellente capacité d’analyse et de prise de décision ;
- Aimer résoudre des problèmes complexes ;
- Personnalité hautement analytique et minutieuse ;
- Curiosité, capacité à innover et à résoudre des problèmes ;
- Motivé et rigoureux ;
- Autonome et volontaire à apprendre la codification de nouveaux outils avec un minimum de supervision.
Atouts :
- Connaissance de Talend Studio ;
- Expérience dans l’exploitation et la gestion de données non-structurées ;
- Connaissance liés aux files de messages (RabbitMQ, MQ, Kafka) ;
- Connaissance des formats de données standard en santé (HL7 / FHIR, DICOM) ;
- Connaissance générale du système de santé et des terminologies médicales ;
- Connaissance de la technologie Apache Airflow.