Methodologie

Magistra Bijwerkingen Voorspeller™ — Versie 4.0 (dual-track)

Laatst bijgewerkt: april 2026 | Open voor peer review

Uitnodiging aan onderzoekers

Deze methodologie is bewust transparant. Wij nodigen biostatistici, epidemiologen, klinisch onderzoekers en ML-onderzoekers uit om onze aanpak te bekritiseren, verbeteringen voor te stellen, of samen te werken. Alle feedback wordt publiek erkend in toekomstige versies.

Geef feedback ↓

1. Dual-track architectuur

In plaats van klinische en gemeenschapsdata te mengen in één getal (wat de bewijshiërarchie verbergt), berekenen wij twee parallelle schattingen per bijwerking:

Klinisch

Alleen gepubliceerde klinische studies + regelgevende rapporten. Conservatief. Alle modifiers uit peer-reviewed bronnen.

Echte wereld

Alle bronnen inclusief Reddit, fora, nieuws. Vangt selectiebias maar ook echte ervaringen die in studies ontbreken.

De kloof tussen beide is zelf informatief. Bijvoorbeeld: klinische studies onderrapporteren vaak emotionele afvlakking, haarverlies en vermoeidheid. Wanneer de echte-wereld schatting significant hoger is, wijst dit op een hiaat in klinische rapportage — niet op fout in de voorspelling. Naarmate meer klinische data binnenkomt, moeten beide tracks convergeren.

2. Dataverzameling

Dagelijks verzamelen 18 scrapers data uit vier broncategorieën. Claude Haiku extraheert gestructureerde datapunten met een betrouwbaarheidsniveau (high/medium/low):

  • • Klinisch: PubMed, ClinicalTrials.gov, Cochrane, WHO, EMA, MHRA, preprints
  • • Regelgevend: FDA FAERS, EMA, MHRA
  • • Gebruikersrapporten: Reddit (13 subreddits), Trustpilot, Drugs.com, Quora
  • • Nieuws & richtlijnen: Google News RSS, professionele richtlijnen

Elk datapunt behoudt zijn sourceType voor deduplicatie (sourceUrl + sideEffect) en voor filtering in de twee tracks. Extractie is conservatief: alleen expliciet vermelde frequenties, geen inferentie.

3. Statistische aanpak

Voor elke track:

  1. Filter datapunten op patiëntprofiel (geslacht, dosis, etniciteit, beweging)
  2. Gewogen gemiddelde (gewicht = steekproefgrootte × extractiebetrouwbaarheid)
  3. Winsorisatie bij 5e/95e percentiel indien n > 10 (grenzen expliciet gelogd)
  4. Dosisschaling indien data geen dosisspecificiteit heeft
  5. Log-odds modifier toepassing (gelimiteerd op totale shift van 2.5 log-odds)
  6. Random-effects betrouwbaarheidsinterval (DerSimonian-Laird τ²)
logit(p) = logit(base_rate) + Σ ln(OR_i)   (|Σ| ≤ 2.5)

4. Zelf-evoluerend model

Dagelijks draait een statistische analyse die empirische odds ratios berekent voor elke dimensie × bijwerking. Belangrijkste waarborgen:

  • • FDR-correctie (Benjamini-Hochberg) over alle hypothesetests
  • • Auto-update alleen bij n ≥ 30, gecorrigeerde p < 0.01, en verandering < 0.3 OR
  • • Grotere veranderingen worden gevlagd voor menselijke review
  • • Nieuwe parameters (etniciteit, BMI, dieet) worden 'gepromoveerd' wanneer ze significant zijn voor 2+ bijwerkingen
  • • Max 5 auto-updates per dag; alle wijzigingen worden gelogd met provenance
  • • Elke vorige configuratieversie wordt bewaard voor rollback

5. Eerlijke beperkingen

Wij publiceren onze beperkingen omdat verborgen zwaktes gevaarlijker zijn dan zichtbare:

  • Datavolume: Momenteel ~217 datapunten over 15 bijwerkingen. Modelhealth is 'degraded' totdat wij n ≥ 100 per bijwerking bereiken.
  • Demografische gaten: Vrouwelijke bias (87% van gespecificeerde geslachten), minimale etnische diversiteit in bronnen.
  • Modifierbronnen: Initiële waarden zijn handgecodeerd uit literatuur. Worden vervangen door empirische waarden naarmate data accumuleert.
  • Geen interactietermen: Modifiers worden onafhankelijk toegepast. Interacties (bijv. geslacht × leeftijd) worden niet gemodelleerd — wij cappen cumulatieve log-odds shifts om stapelbias te beperken.
  • Kalibratietests: Nog niet formeel gevalideerd tegen onafhankelijke uitkomstdata. Gepland zodra n ≥ 500 per bijwerking.
  • LLM-extractie: Imperfect. Goud-standaard handmatige auditing is gepland op een steekproef van 50 bronnen per bijwerking.
  • Journey-voorspeller: Gewichtstraject en spierbehoud modellen gebruiken STEP-trial constanten met expert-gecodeerde modifiers. Niet empirisch gevalideerd.
  • Niet causaal: Dit zijn populatiegemiddelde conditionele risico's, geen individuele causale voorspellingen.

6. Publicatie-roadmap

  • • Fase 1 (huidig): dual-track framework, open methodologie, community feedback
  • • Fase 2: n ≥ 100 per bijwerking, formele kalibratietesting
  • • Fase 3: n ≥ 500, externe validatie op onafhankelijke dataset
  • • Fase 4: pre-registratie bij OSF.io, ingediend bij peer-reviewed tijdschrift (doel: Nature Medicine)

Wij zijn een kleine team en onze methodologie heeft onvermijdelijk zwaktes. Als u iets ziet dat verkeerd of verbeterbaar is, laat het ons weten.

Feedback van onderzoekers

Als u een biostatisticus, epidemioloog, klinisch onderzoeker of ML-wetenschapper bent: bekritiseer onze aanpak. Wij erkennen alle bijdragers in toekomstige versies en houden een openbaar wijzigingenlog bij.

Alle feedback wordt handmatig gereviewd. Bijdragers worden erkend in de openbare methodologie-changelog (tenzij anonimiteit gevraagd).

Open source op GitHub

De volledige methodologie, broncode en preprint zijn gepubliceerd onder Apache 2.0. Bekijk, kloon of dien een pull request in.

github.com/saurabhgoyal75/magistra-predictor →

Citeer onze preprint

De volledige methodologie-preprint is gepubliceerd op Zenodo met een permanente DOI onder CC BY 4.0.

Goyal, S. (2026). A Dual-Track Framework for GLP-1 Side Effect Estimation: Separating Clinical Evidence from Real-World Patient Reports (v4.0). Zenodo. https://doi.org/10.5281/zenodo.19559749
DOI: 10.5281/zenodo.19559749 →

Magistra Side Effects Predictor™ — Statistische indicator, geen medisch advies.

Gepersonaliseerd gewichtsbeheer, arts-begeleid

Gratis Vragenlijst