Methodologie
Magistra Bijwerkingen Voorspeller™ — Versie 4.0 (dual-track)
Laatst bijgewerkt: april 2026 | Open voor peer review
Uitnodiging aan onderzoekers
Deze methodologie is bewust transparant. Wij nodigen biostatistici, epidemiologen, klinisch onderzoekers en ML-onderzoekers uit om onze aanpak te bekritiseren, verbeteringen voor te stellen, of samen te werken. Alle feedback wordt publiek erkend in toekomstige versies.
Geef feedback ↓1. Dual-track architectuur
In plaats van klinische en gemeenschapsdata te mengen in één getal (wat de bewijshiërarchie verbergt), berekenen wij twee parallelle schattingen per bijwerking:
Klinisch
Alleen gepubliceerde klinische studies + regelgevende rapporten. Conservatief. Alle modifiers uit peer-reviewed bronnen.
Echte wereld
Alle bronnen inclusief Reddit, fora, nieuws. Vangt selectiebias maar ook echte ervaringen die in studies ontbreken.
De kloof tussen beide is zelf informatief. Bijvoorbeeld: klinische studies onderrapporteren vaak emotionele afvlakking, haarverlies en vermoeidheid. Wanneer de echte-wereld schatting significant hoger is, wijst dit op een hiaat in klinische rapportage — niet op fout in de voorspelling. Naarmate meer klinische data binnenkomt, moeten beide tracks convergeren.
2. Dataverzameling
Dagelijks verzamelen 18 scrapers data uit vier broncategorieën. Claude Haiku extraheert gestructureerde datapunten met een betrouwbaarheidsniveau (high/medium/low):
- • Klinisch: PubMed, ClinicalTrials.gov, Cochrane, WHO, EMA, MHRA, preprints
- • Regelgevend: FDA FAERS, EMA, MHRA
- • Gebruikersrapporten: Reddit (13 subreddits), Trustpilot, Drugs.com, Quora
- • Nieuws & richtlijnen: Google News RSS, professionele richtlijnen
Elk datapunt behoudt zijn sourceType voor deduplicatie (sourceUrl + sideEffect) en voor filtering in de twee tracks. Extractie is conservatief: alleen expliciet vermelde frequenties, geen inferentie.
3. Statistische aanpak
Voor elke track:
- Filter datapunten op patiëntprofiel (geslacht, dosis, etniciteit, beweging)
- Gewogen gemiddelde (gewicht = steekproefgrootte × extractiebetrouwbaarheid)
- Winsorisatie bij 5e/95e percentiel indien n > 10 (grenzen expliciet gelogd)
- Dosisschaling indien data geen dosisspecificiteit heeft
- Log-odds modifier toepassing (gelimiteerd op totale shift van 2.5 log-odds)
- Random-effects betrouwbaarheidsinterval (DerSimonian-Laird τ²)
4. Zelf-evoluerend model
Dagelijks draait een statistische analyse die empirische odds ratios berekent voor elke dimensie × bijwerking. Belangrijkste waarborgen:
- • FDR-correctie (Benjamini-Hochberg) over alle hypothesetests
- • Auto-update alleen bij n ≥ 30, gecorrigeerde p < 0.01, en verandering < 0.3 OR
- • Grotere veranderingen worden gevlagd voor menselijke review
- • Nieuwe parameters (etniciteit, BMI, dieet) worden 'gepromoveerd' wanneer ze significant zijn voor 2+ bijwerkingen
- • Max 5 auto-updates per dag; alle wijzigingen worden gelogd met provenance
- • Elke vorige configuratieversie wordt bewaard voor rollback
5. Eerlijke beperkingen
Wij publiceren onze beperkingen omdat verborgen zwaktes gevaarlijker zijn dan zichtbare:
- Datavolume: Momenteel ~217 datapunten over 15 bijwerkingen. Modelhealth is 'degraded' totdat wij n ≥ 100 per bijwerking bereiken.
- Demografische gaten: Vrouwelijke bias (87% van gespecificeerde geslachten), minimale etnische diversiteit in bronnen.
- Modifierbronnen: Initiële waarden zijn handgecodeerd uit literatuur. Worden vervangen door empirische waarden naarmate data accumuleert.
- Geen interactietermen: Modifiers worden onafhankelijk toegepast. Interacties (bijv. geslacht × leeftijd) worden niet gemodelleerd — wij cappen cumulatieve log-odds shifts om stapelbias te beperken.
- Kalibratietests: Nog niet formeel gevalideerd tegen onafhankelijke uitkomstdata. Gepland zodra n ≥ 500 per bijwerking.
- LLM-extractie: Imperfect. Goud-standaard handmatige auditing is gepland op een steekproef van 50 bronnen per bijwerking.
- Journey-voorspeller: Gewichtstraject en spierbehoud modellen gebruiken STEP-trial constanten met expert-gecodeerde modifiers. Niet empirisch gevalideerd.
- Niet causaal: Dit zijn populatiegemiddelde conditionele risico's, geen individuele causale voorspellingen.
6. Publicatie-roadmap
- • Fase 1 (huidig): dual-track framework, open methodologie, community feedback
- • Fase 2: n ≥ 100 per bijwerking, formele kalibratietesting
- • Fase 3: n ≥ 500, externe validatie op onafhankelijke dataset
- • Fase 4: pre-registratie bij OSF.io, ingediend bij peer-reviewed tijdschrift (doel: Nature Medicine)
Wij zijn een kleine team en onze methodologie heeft onvermijdelijk zwaktes. Als u iets ziet dat verkeerd of verbeterbaar is, laat het ons weten.
Feedback van onderzoekers
Als u een biostatisticus, epidemioloog, klinisch onderzoeker of ML-wetenschapper bent: bekritiseer onze aanpak. Wij erkennen alle bijdragers in toekomstige versies en houden een openbaar wijzigingenlog bij.
Open source op GitHub
De volledige methodologie, broncode en preprint zijn gepubliceerd onder Apache 2.0. Bekijk, kloon of dien een pull request in.
github.com/saurabhgoyal75/magistra-predictor →Citeer onze preprint
De volledige methodologie-preprint is gepubliceerd op Zenodo met een permanente DOI onder CC BY 4.0.
Magistra Side Effects Predictor™ — Statistische indicator, geen medisch advies.