Door de fusie tussen Ciba-Geigy en Sandoz is Novartis een zwaargewicht in de farmaceutische industrie. In 2021 realiseerde de groep, die wereldwijd 110.000 medewerkers in dienst heeft, een omzet van 51 miljard dollar. Hij merkte op dat hij iets meer dan $ 9 miljard aan onderzoek en ontwikkeling heeft uitgegeven.
Farmaceutisch onderzoek, klinische proeven, productie, logistiek… al deze activiteiten bij Novartis genereren data. Veel gegevens.
In de IS van de groep nemen data voor onderzoek en ontwikkeling alleen al meer dan 20 petabyte aan opslagruimte in beslag.
Dit feit is niet nieuw. De groep blijft zijn infrastructuur ontwikkelen.
Geweldige verzamelprojecten
Sinds 2015 bouwt het bedrijf een speciaal analyseplatform voor zijn klinische proeven. In 2016 introduceerde ze Nerve Live. Het is het “commandocentrum” dat zich toelegt op de rekrutering van patiënten die elk jaar worden belast met ongeveer 500 klinische onderzoeken. Het omvat onder meer de SENSE-eenheid.
Het is een “uitkijktoren” die informatie geeft over de status van klinische proeven en waarmee problemen kunnen worden geïdentificeerd en de risico’s van overbudgettering of vertragingen kunnen worden vermeden. Andere geavanceerde analysetools maken het mogelijk om human resources te beheren, onderzoeksresultaten te simuleren of zelfs de levering van behandelingen te beheren die nodig zijn voor hun voortgang.
” [Ce sont] Primaire verdedigingen die ons in staat hebben gesteld om de risico’s voor onze klinische onderzoeken tijdens de wereldwijde pandemie uit te stellen en te beperken, met een beperkte impact op onze activiteiten en planningen’, aldus de groep op haar website.
In 2018 was dit platform toen gebaseerd op een intern gepubliceerd datameer. Dat was voordat Novartis een hybride architectuur ontwikkelde. Nerve Live vertrouwt nu op lokale datatransmissieservers in combinatie met een private cloud.
Vervolgens ontwikkelde Novartis data42, een platform dat is ontworpen om historische gegevens uit klinische onderzoeken te analyseren en te onderzoeken. Dit is gebaseerd op een architectuur die cluster-HPC’s combineert met AWS-instanties.
Vanaf februari 2022 werden 42 gegevens gebruikt door bijna 700 onderzoekers in drie Novartis-entiteiten. Meer dan petabytes aan gegevens werden opgenomen uit meer dan 3.000 bronsystemen. Het platform brengt minstens 3.000 klinische onderzoeken samen met bijna 900.000 patiënten.
In 2021 publiceerde Novartis, in samenwerking met Microsoft, een datawetenschapssuite om de formules te bestuderen die worden gebruikt tijdens de vroege stadia van de productie van experimentele behandelingen.
Dit uitgebreide gebruik van data geldt niet alleen voor onderzoek. Sinds 2015 uploaden historici en ongeveer twee dozijn ERP’s van de fabrieken van de groep hun gegevens naar het Hadoop-systeem van de site.
Na te hebben vastgesteld dat zijn HDFS schaling niet slecht ondersteunt, besloot Novartis in 2019 zijn gegevens te migreren naar Amazon S3- en EBS-instanties. Sindsdien combineert Novartis historische data van zijn fabrieken met data van IoT-sensoren die zijn uitgerust met AWS IoT Greengrass. Industriële gegevens worden opgenomen in het realtime analyseplatform van SpotOn, dat in 2021 op 18 productielocaties wordt uitgerold.
In China publiceert Novartis in samenwerking met Tencent een app genaamd AI Nurse. Het is gewijd aan de voorspelling en monitoring van hart- en vaatziekten. Het wordt gebruikt door meer dan 5.000 zorgprofessionals om 300.000 patiënten in 1.000 ziekenhuizen te ondersteunen.
Formula One, een platform voor tweeduizend datawetenschappers
Novartis wilde niet dat deze initiatieven geïsoleerd zouden blijven. In 2019 lanceerde de groep het F1 Formula One-programma.
De farmaceutische groep kwam toen op het idee om een wereldwijd platform te creëren dat alle bedrijfsgegevens zou verbinden voor analytische doeleinden. Tegenwoordig integreert het apparaat “bijna alle interne gegevens van het bedrijf”, aldus Loic Giroud, global head of digital delivery bij Novartis.
“We hebben een wereldwijd analyseplatform waarmee we meer dan 80 belangrijke databronnen verbinden.”
Loïc GeroGlobal Head of Digital Delivery, Novartis
“We hebben een wereldwijd analyseplatform waarmee we meer dan 80 belangrijke gegevensbronnen verbinden”, zegt hij. “Het wordt gebruikt voor onderzoek, klinische proeven en productie – inclusief productie, logistiek, verkoop en marketing – evenals ondersteunende functies: inkoop of human resource management.”
Aangezien de activiteiten van het bedrijf, van onderzoek tot geneesmiddelenmarketing, onderling verweven zijn, werd overeengekomen om een modulaire architectuur te creëren. De projecten moesten 2.000 datawetenschappers huisvesten voor de groep.
“Het platform is een multi-cloud, multi-product architectuur”, zegt Loïc Giraud. Het wordt ingezet in meerdere AWS- en Azure-cloudregio’s in Europa, de VS en China. Volgens een vacature van de groep die in februari 2022 werd gepubliceerd, zou Novartis zijn aanwezigheid op AWS met 200% vergroten en met 1500% op Microsoft Azure.
Dit platform is verdeeld in drie groepen: Er is een “landingsgebied” waar gegevens worden opgenomen en gemodelleerd, voordat deze worden gecoördineerd, gestandaardiseerd en geïntegreerd in de MDM. Daarom zijn de gegevens onderworpen aan de bedrijfsregels van Novartis.
De gegevens kunnen worden verplaatst naar een gebied dat is aangewezen voor “controle”, d.w.z. voor verfijning, voorspellende en didactische analyse van de gegevens. Ten slotte worden deze voorbereide of geanalyseerde gegevens naar AI- of machine learning-applicaties gepusht.
Een browser “marktplaats” stelt bedrijven, met name datawetenschappers, in staat om te zoeken naar datasets, bronnen of andere activa waartoe ze toegang hebben. De markt speelt de rol van een groepsbrede oplossing voor gegevensbeheer, waarbij gegevensratio’s, indexering, kwaliteitsbeheer en datamining-mogelijkheden worden geïntegreerd.
Het doel is om herbruikbare, referentiebare datasets te ontwerpen voor verschillende gebruiksscenario’s. Vandaag zijn er meer dan 1.500 activa beschikbaar vanaf het platform.
Evenzo is het DevSecOps-team verantwoordelijk voor het ontwikkelen en onderhouden van het platform in een operationele staat. Datatoegang en infrastructuurvoorziening zijn grotendeels geautomatiseerd.
Na de lancering van de eerste productie in het derde kwartaal van 2020, biedt het platform nu plaats aan meer dan 300 use-cases. “Interne bestellingen zijn exponentieel”, zegt Loïc Giraud.
Hoe Novartis gokt op een sneeuwvlok
Eén use case heeft meer specifiek betrekking op de Amerikaanse activiteiten van de groep die zich richten op apotheken en artsen. Nu de teruggetrokken en ouder wordende activiteit van de Islamitische Staat afneemt, hebben teams aanzienlijke inspanningen moeten leveren om nieuwe mediacampagnes te lanceren en te volgen. Analysetools waren niet langer relevant voor de situatie, terwijl de introductie van nieuwe medicijnen moeilijk te voorspellen was.
Dit was een van de eerste use cases die werden overwogen toen het Formule 1-initiatief eind 2019 werd gelanceerd. De opkomst van de COVID-19-pandemie heeft de gewoonten van verkopers die vroeger apotheekmanagers en artsen ontmoetten, verstoord. De bedrijfsvoering moet evolueren om zorgprofessionals in de Verenigde Staten te blijven informeren. Een doel was om de segmentatie van deze populatie te verbeteren om zo de mediacampagnes te verbeteren.
“De lancering van Data Exchange heeft veel voor ons veranderd.”
Loïc GeroGlobal Head of Digital Delivery, Novartis
Datzelfde jaar kondigde Snowflake de lancering aan van zijn platform voor het delen van gegevens, Data Exchange. Dit is een van de argumenten die platformbeheerders uiteindelijk hebben overtuigd om te kiezen voor een multicloud datawarehouse.
“De lancering van Data Exchange heeft veel voor ons veranderd”, benadrukt Loïc Giraud.
In combinatie met marketinginspanningen om de bekendheid van de geneesmiddelen van Novartis te vergroten, heeft deze capaciteit voor het delen van gegevens de zakelijke kansen vergroot en een reeks processen versneld, van onderzoek tot de commercialisering van moleculen.
Dus Novartis beoordeelde de manier waarop het toegang heeft tot externe gegevens, van partners zoals IQVIA en Symphony Health. “We waren een van de eerste grote farmaceutische bedrijven die echt gokten op Snowflake’s platform voor het delen van gegevens”, zei Ed Scura, hoofd solutions engineering bij Novartis, tijdens een sessie op Snowflake Summit 2022. Het duurt nu nog maar een paar dagen.”
Als het op analytics aankomt, wilde Novartis dat hun teams een geïntegreerde ervaring zouden hebben. Dat is prima: het systeem in het hart van de gegevensuitwisseling maakt het mogelijk om datasets te delen via een eenvoudige URL. Ook was het essentieel dat de kwaliteit van de data afkomstig uit honderd streams punctueel was. “We hebben honderden kwaliteitscontroles uitgevoerd voordat de gegevens in handen kwamen van datawetenschappers en analisten”, zegt Ed Scura. Hiervoor hebben platformbeheerders uit het F1-programma een in-house ontwikkeld framework, ETL Matilion en Apache Spark-functionaliteit geïntegreerd die door Databriks wordt bediend.
Analytics-werkbanken bestaan uit een mix van onder andere Amazon SageMaker, Dataiku en R Maker.
Van hun kant hebben bedrijven toegang tot bepaalde analyses via Qlik Sense-apps. “Wij zijn de grootste consument van Qlik Sense. We hebben 60.000 gebruikers en meer dan 500 Qlik-apps”, meldt Loïc Giraud.
Het is niet ongebruikelijk om analyseplatforms te zien die de integratie van interne en externe gegevensbronnen mogelijk maken. Daarnaast heeft Novartis 300 datapijplijnen ingezet – zowel ETL Matillion-streams als Spark-taken – op Datbriks om zijn Snowflake-datawarehouse te runnen. Deze stromen zijn gekoppeld aan een grafiekgestuurde database – AWS Neptune – voor opname op de interne markt.
De use-case alleen al omvat een petabyte-gegevenslaag die wordt verstrekt aan meer dan 1.000 gebruikers in de Verenigde Staten.
Een ander selectiecriterium dat de publicatie van Snowflake motiveerde, was volgens Loïc Giraud de prestaties. De farmaceutische groep kon Snowflake in 2017 uitproberen.
Nadat de gegevens van Hadoop naar AWS waren gemigreerd, realiseerde Novartis zich dat Amazon RedShift niet voldeed aan de behoeften van het verkoopteam op het gebied van compensatieverwerking. “Het heeft lang geduurd. Onze tests met Snowflake hebben ons overtuigd: we hadden dit prestatieniveau nog nooit eerder gezien”, zegt Loïc Giraud. Het clouddatawarehouse werd vervolgens uitgebreid met andere use-cases. “We zijn begonnen met analyses, maar we hebben ontdekt dat Snowflake op alle niveaus kan worden gebruikt”, voegt hij eraan toe.
Nieuwe gebruiksscenario’s in ontwikkeling
Bij Novartis is Snowflake de markt bij uitstek geworden voor gegevensuitwisseling. De repository is een van de lagen die worden gebruikt om gegevens te verzamelen die nodig zijn voor verkooppersoneel, onderzoek en ontwikkeling en om MVO-beleid te onderhouden, maar het kan ook nieuwe gebruiksscenario’s stimuleren.
Loc Giraud verwelkomt zelfs de komst van hybride tabellen, een mechanisme dat door Snowflake is geïntroduceerd om transactieverwerking vanuit het datawarehouse mogelijk te maken. Evenzo zou recente ondersteuning voor ongestructureerde gegevens, de programmeertaal Python en Apache Iceberg het gebruik van deze technologie verder kunnen vergroten.
Daarom blijft Novartis Snowflake verspreiden in de EMEA-regio en zou de leverancier graag zijn aanwezigheid in China versterken.
Ondertussen onderzoekt de farmaceutische groep andere technologieën, waaronder digitale tweelingen en blockchain.
Novartis is lid van het Europese PharmaLedger Consortium. De organisatie ontwikkelt een blockchain die is gericht op het delen, transparantie en integriteit van gegevens over de toeleveringsketen, klinische onderzoeken en gezondheidsonderzoeken.
We use cookies on our website to give you the most relevant experience by remembering your preferences and repeat visits. By clicking “Accept All”, you consent to the use of ALL the cookies. However, you may visit "Cookie Settings" to provide a controlled consent.
This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. These cookies ensure basic functionalities and security features of the website, anonymously.
Cookie
Duration
Description
cookielawinfo-checkbox-analytics
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional
11 months
The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy
11 months
The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
Functional cookies help to perform certain functionalities like sharing the content of the website on social media platforms, collect feedbacks, and other third-party features.
Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Advertisement cookies are used to provide visitors with relevant ads and marketing campaigns. These cookies track visitors across websites and collect information to provide customized ads.