Search jobs > Montreal, QC > Site reliability engineer

Site Reliability Engineer

ALTEN Canada
Montreal, Quebec, Canada
Full-time

English will follow - Dans cette annonce, l'utilisation du genre masculin a été adoptée afin de faciliter la lecture, et n'a aucune intention discriminatoire.

Qui sommes-nous ?

Chef de file mondial de l’industrie de l’ingénierie et du conseil TI avec plus de 57 000 conseillers à travers le monde, le Groupe ALTEN optimise la performance technologique des entreprises depuis plus de 30 ans.

Les femmes et les hommes qui composent le groupe ALTEN constituent le moteur de notre activité. Chez ALTEN Canada, nous offrons à chaque candidat un service entièrement personnalisé.

Vous avez la possibilité d’exercer votre métier de façon indépendante ou permanente. Nous sélectionnons les meilleures opportunités répondant à vos aspirations professionnelles.

Nous positionnons votre savoir-faire sur des mandats passionnants à la hauteur de vos ambitions.

ALTEN Canada c’est aussi un centre de solutions, le Montreal Delivery Center (MDC) , qui propose des services managés dans les domaines du développement applicatif, de la pratique Données, IA & Analytiques Avancées et de la Cyber Sécurité pour les secteurs bancaires, télécoms et pour l’industrie au sens large.

Nos experts sont sélectionnés rigoureusement et assurent une proximité ainsi qu’un niveau de services et de compétences incomparable dans la région de Montréal.

Quels profils recrutons-nous et pour qui ?

Le département Application Infrastructure (AI) recherche un Site Reliability Engineer (SRE) pour contribuer à l'ingénierie de la fiabilité, aux opérations et aux services de support client pour la mise en œuvre de ServiceNow SaaS de Morgan Stanley.

Sous la responsabilité d'un responsable de l'ingénierie et des opérations de fiabilité du site, ce poste exige de mettre en œuvre un éventail de pratiques SRE au sein d'une communauté mondiale d'autres SRE.

Il s'agit de travailler en équipe avec des collègues pour fournir des systèmes fiables et résilients sans gaspillage d'efforts opérationnels.

Les pratiques SRE comprennent l'optimisation et l'automatisation des tâches, la priorisation de la dette technique, l'observabilité et les tableaux de bord de surveillance, la gestion de la capacité, la réponse aux incidents et l'élimination des problèmes.

Quelles seront mes responsabilités ?

  • Les tâches opérationnelles optimisées et automatisées permettent d'améliorer la disponibilité et les performances des systèmes pris en charge.
  • Vous êtes en charge de la mise en œuvre de la stratégie de développement de l'entreprise et de la mise en place de la politique de développement de l'entreprise, de la mise en œuvre de la stratégie de développement de l'entreprise et de la mise en œuvre de la politique de développement de l'entreprise.
  • Explorer et fournir l'observabilité, y compris les métriques, la journalisation, le traçage et l'alerte qui peuvent définir et mesurer la fiabilité cible d'un produit.
  • Être fiable et réactif pendant les heures de travail convenues, par exemple dans le cadre de la rotation des astreintes avec le reste de l'équipe mondiale.
  • Un engagement à comprendre les instances ServiceNow de l'entreprise et les dépendances connexes, en contribuant à leur documentation.
  • L'identification et la priorisation de la dette technique qui peut avoir un impact sur la satisfaction du client ou l'efficacité opérationnelle.
  • Le candidat doit être en mesure de fournir un retour d'information sur la politique et les procédures liées à la prestation de SRE et aux pratiques opérationnelles en vue de rendre l'entreprise continuellement plus sûre et plus efficace.

Je suis convaincu-e ! Quelles compétences dois-je avoir pour rejoindre vos équipes ?

  • Expérience de l'administration et du développement de ServiceNow, ou compétences en matière de développement de logiciels dans un ou plusieurs langages de programmation, par exemple Python.
  • Compétences en matière de communication orale et écrite
  • Vous êtes capable d'établir des relations chaleureuses et efficaces avec vos collègues afin de collaborer à la réussite de vos projets.
  • Un travail d'équipe fiable avec un engagement démontré envers le service à la clientèle.
  • Capacité à réagir de manière appropriée lors d'urgences techniques occasionnelles, telles que des pannes.

Pourquoi se joindre à nos équipes?

Alten Canada offre un environnement de travail dynamique et collaboratif. Nous offrons aux membres de notre équipe l’occasion de vivre des expériences stimulantes et nous investissons dans leur perfectionnement et leur développement professionnels.

Parmi nos avantages :

  • Rémunération et avantages sur mesure pour chacun de nos employés et pigistes ;
  • Aide perfectionnement professionnel (certification) ;
  • Possibilité de mobilité internationale dans l’une des filiales du Groupe ;
  • Nombreuses activités corporatives ;

Who are we?

As a global leader in engineering and IT consulting with over 57,000 consultants worldwide, ALTEN Group has been optimizing companies' technological performance for over 30 years.

The men and women who make up ALTEN Group are the driving force behind our activity. At ALTEN Canada, we offer each candidate a fully personalized service, allowing you to work independently or permanently.

We select the best opportunities that match your professional aspirations, positioning your expertise on exciting mandates that match your ambitions.

ALTEN Canada also houses a solution center, the "Montreal Delivery Center (MDC)," offering managed services in application development, Data, AI & Advanced Analytics, and Cyber Security for banking, telecom, and various industries.

Our experts are rigorously selected, providing unparalleled service and expertise in the Montreal region.

Whom are we hiring and for whom?

The Application Infrastructure (AI) department is seeking a Site Reliability Engineer (SRE) to help drive the reliability engineering, operations and customer support services for Morgan Stanley's ServiceNow SaaS implementation.

Reporting to a Site Reliability Engineering & Operations Lead, this role requires delivering a range of SRE practices within a global community of other SREs.

This means teaming up with colleagues to deliver reliable, resilient systems without wasteful

operational effort. SRE practi ces include task optimization and automation, prioritizing technical debt, observability and monitoring dashboards, capacity management, incident response, and problem elimination.

What will be my tasks and responsibilities?

  • Delivery of improvements that will maximize the availability and performance of supported systems through optimized and automated operational tasks.
  • Troubleshooting ServiceNow issues, and also some on premise capabilities in a Linux environment from time to time, collaborating with others get to the bottom of issues.
  • Exploring and delivering observability including metrics, logging, tracing and alerting that can define and measure the target reliability of a product.
  • Being dependable and responsive during agreed hours, like when part of the on call rotation with the rest of the global team.
  • A commitment to understanding the Firm’s ServiceNow instances and related dependencies, contributing to their documentation.
  • Identification and prioritization of technical debt that is can impact client satisfaction or operational efficiency.
  • Give feedback on policy and procedures related to the delivery of SRE and operational practices with a view to continually making the Firm safer and more efficient.

I'm convinced! What do I need to join them?

  • ServiceNow administration / development experience, or Software development skills in one or more programming language, e.g. Python
  • Proficient oral and written communication skills
  • Establishing warm, effective relationships with colleagues to collaborate on successful delivery
  • A dependable team worker with demonstrated commitment to client service
  • Ability to respond appropriately during occasional technical emergencies, like outages.
  • 14 hours ago
Related jobs
Promoted
National Bank
Montreal, Quebec

As a Specialist in site reliability engineering on the National Bank Data Protection team, you will ensure the operational reliability of data protection assets. ...

Bourse de Montreal Inc.
Montréal, Quebec

Previous experience as a Site Reliability Engineer (SRE). The Devops Engineering team is responsible for working closely with various business units and stakeholders to solve complex problems using innovative solutions, quickly and effectively using agile, lean and devops methodologies, while ensuri...

Behavox
Montreal, Quebec

As a Site Reliability Engineer you will be responsible for the availability, latency, performance, efficiency, change management, monitoring, emergency response, and capacity planning of all production systems and services. You will work together with other DevOps, Product and Engineering teams to d...

S.i. Systems
Montreal, Quebec

Senior Site Reliability Engineer (SRE). Local candidates with the ability to work on-site three days/week in a hybrid model will be prioritized however % remote options will be available. As the successful candidate, you will work with other application and operational experts to ensure the highest ...

SAP
Montreal, Quebec

The Site Reliability Engineering teams make the SAP Business Technology Platform run better by providing 24x7 deep technical coverage for Incident Management (Outages and other incidents with major customer impact) applying SRE principles. As a Site Reliability Engineer, you will have the opportunit...

Jobber
Canada
Remote

Senior Site Reliability Engineer. Our Software Engineering team is pivotal to Jobber's success, creating software that adds value to tens of thousands of users worldwide. As a part of our cloud infrastructure team (SRE), you'll play a critical role in empowering our product development teams, ensuri...

Lyft
Montreal, Quebec

Site Reliability Engineer (SRE), Systems Engineer, Software Engineer, DevOps Engineer, Infrastructure Engineer, Production Engineer). The Transit, Bikes, and Scooters (TBS) infrastructure team at Lyft in Montreal is growing, and we are looking for a Site Reliability Engineer to support our productio...

Behavox
Canada

As a Site Reliability Engineer, you will be responsible for the availability, latency, performance, efficiency, change management, monitoring, emergency response, and capacity planning of all production systems and services. You will work together with other DevOps, Product, and Engineering teams to...

Great Canadian Gaming Corp.
Canada, Canada

Mindwire is currently looking for a Site Reliability Engineer to work for our valued public sector client. The position is located in Ottawa, Ontario, 3 days onsite preferred, but would be open to remote for the right candidate. ...

National Bank
Montreal, Quebec

Information technology As a Specialist in site reliability engineering on the National Bank Data Protection team, you will ensure the operational reliability of data protection assets. ...