Lemieux, Sébastien, Ph.D.

Coordonnées

Unité de recherche en bio-informatique fonctionnelle et structurale
IRIC

(514) 343-6111, ext. 0635

sébastien.lemieux@umontreal.ca

Site web du labo :

https://www.iric.ca/fr/recherche/chercheuses-et-chercheurs-principaux/sebastien-lemieux


Axes de recherche

  • Bioinformatique
  • Cancérologie
  • Génomique
  • Protéomique

Description de la recherche

Le laboratoire développe de nouvelles méthodes informatiques à l’interface de l’intelligence artificielle, de la transcriptomique et de la découverte de médicaments. Nous concevons des modèles d’apprentissage profond capables de représenter et d’interpréter les profils d’expression génique à partir de données de séquençage d’ARN, en explorant notamment des représentations continues (embeddings) et ordonnées (type transformer) des gènes. Ces approches visent à extraire automatiquement les structures sous-jacentes de la régulation cellulaire et à construire des représentations universelles des états biologiques, applicables à la classification, au débruitage et à la prédiction de réponses thérapeutiques.

Nos travaux portent également sur le développement de modèles statistiques et bayésiens pour améliorer la robustesse des analyses expérimentales et la sélection de composés thérapeutiques. Nous concevons des modèles de diffusion pour reconstruire des profils RNA-seq à partir de données à faible profondeur, ainsi que des approches probabilistes et multimodales combinant transcriptomique et imagerie cellulaire afin de prédire l’activité biologique de molécules candidates.

Enfin, nous développons des méthodes informatiques pour l’identification de peptides spécifiques aux tumeurs à partir de données de spectrométrie de masse et de RNA-Seq. Ces peptides, souvent issus de régions non codantes du génome, composent l’immunopeptidome tumoral et représentent des cibles privilégiées pour la conception de vaccins anticancéreux personnalisés. Ensemble, ces projets traduisent une vision intégrative : créer des outils d’IA capables de relier directement les séquences, les profils d’expression et les effets biologiques afin d’accélérer les découvertes en biologie des systèmes et en médecine de précision.

Research axis

  • Bioinformatics
  • Cancer
  • Genomics
  • Proteomics

Research description

Our laboratory develops novel computational methods at the interface of artificial intelligence, transcriptomics, and drug discovery. We design deep learning models capable of representing and interpreting gene expression profiles from RNA sequencing data, exploring both continuous (embedding-based) and ordered (transformer-based) representations of genes. These approaches aim to automatically uncover the underlying structure of gene regulation and to build universal representations of biological states, applicable to classification, denoising, and therapeutic response prediction.

Our research also focuses on developing statistical and Bayesian models to improve the robustness of experimental analyses and the selection of therapeutic compounds. We design diffusion models to reconstruct RNA-seq profiles from low-depth data, as well as probabilistic frameworks to estimate compound efficacy from noisy experimental observations.

Finally, we are developing computational methods for identifying tumor-specific peptides from mass spectrometry and RNA-seq data. These peptides, often originating from non-coding regions of the genome, constitute the tumor immunopeptidome and represent key targets for the design of personalized cancer vaccines. Together, these projects reflect an integrative vision: building AI-driven tools that directly link sequences, expression profiles, and biological effects to accelerate discovery in systems biology and precision medicine.


Publications

  • Cuevas MVR, Hardy MP, Larouche JD, Apavaloaei A, Kina E, Vincent K, Gendron P, Laverdure JP, Durette C, Thibault P, Lemieux S, Perreault C, Ehx G. BamQuery: a proteogenomic tool to explore the immunopeptidome and prioritize actionable tumor antigens. Genome Biol. 2023 Aug 15;24(1):188.
  • Scicluna M, Grenier JC, Poujol R, Lemieux S, Hussin JG. Toward computing attributions for dimensionality reduction techniques. Bioinform Adv. 2023 Aug 3;3(1):vbad097.
  • Daouda T, Dumont-Lagacé M, Feghaly A, Benslimane Y, Panes R, Courcelles M, Benhammadi M, Harrington L, Thibault P, Major F, Bengio Y, Gagnon É, Lemieux S, Perreault C. CAMAP: Artificial neural networks unveil the role of codon arrangement in modulating MHC-I peptides presentation. PLoS Comput Biol. 2021 Oct 22;17(10):e1009482.
  • Trofimov A, Cohen JP, Bengio Y, Perreault C, Lemieux S. Factorized embeddings learns rich and biologically meaningful embedding spaces using factorized tensor decomposition. Bioinformatics. 2020 Jul 1;36(Suppl_1):i417-i426.
  • Audemard EO, Gendron P, Feghaly A, Lavallée VP, Hébert J, Sauvageau G, Lemieux S. Targeted variant detection using unaligned RNA-Seq reads. Life Sci Alliance. 2019 Aug 19;2(4):e201900336.