Methodologie

1. Dual-track architectuur

In plaats van klinische en gemeenschapsdata te mengen in één getal (wat de bewijshiërarchie verbergt), berekenen wij twee parallelle schattingen per bijwerking:

Klinisch

Alleen gepubliceerde klinische studies + regelgevende rapporten. Conservatief. Alle modifiers uit peer-reviewed bronnen.

Echte wereld

Alle bronnen inclusief Reddit, fora, nieuws. Vangt selectiebias maar ook echte ervaringen die in studies ontbreken.

De kloof tussen beide is zelf informatief. Bijvoorbeeld: klinische studies onderrapporteren vaak emotionele afvlakking, haarverlies en vermoeidheid. Wanneer de echte-wereld schatting significant hoger is, wijst dit op een hiaat in klinische rapportage — niet op fout in de voorspelling. Naarmate meer klinische data binnenkomt, moeten beide tracks convergeren.

2. Dataverzameling

Dagelijks verzamelen 18 scrapers data uit vier broncategorieën. Claude Haiku extraheert gestructureerde datapunten met een betrouwbaarheidsniveau (high/medium/low):

• Klinisch: PubMed, ClinicalTrials.gov, Cochrane, WHO, EMA, MHRA, preprints
• Regelgevend: FDA FAERS, EMA, MHRA
• Gebruikersrapporten: Reddit (13 subreddits), Trustpilot, Drugs.com, Quora
• Nieuws & richtlijnen: Google News RSS, professionele richtlijnen

Elk datapunt behoudt zijn sourceType voor deduplicatie (sourceUrl + sideEffect) en voor filtering in de twee tracks. Extractie is conservatief: alleen expliciet vermelde frequenties, geen inferentie.

3. Statistische aanpak

Voor elke track:

Filter datapunten op patiëntprofiel (geslacht, dosis, etniciteit, beweging)
Gewogen gemiddelde (gewicht = steekproefgrootte × extractiebetrouwbaarheid; toekomstig werk: inverse-variantie meta-analytische weging per studiekwaliteit)
Winsorisatie bij 5e/95e percentiel indien n > 10 (grenzen expliciet gelogd)
Dosisschaling indien data geen dosisspecificiteit heeft
Log-odds modifier toepassing (gelimiteerd op totale shift van 2.5 log-odds)
Random-effects betrouwbaarheidsinterval (DerSimonian-Laird τ²)

logit(p) = logit(base_rate) + Σ ln(OR_i) (|Σ| ≤ 2.5)

4. Zelf-evoluerend model

Dagelijks draait een statistische analyse die empirische odds ratios berekent voor elke dimensie × bijwerking. Belangrijkste waarborgen:

• FDR-correctie (Benjamini-Hochberg) over alle hypothesetests
• Auto-update alleen bij n ≥ 30, gecorrigeerde p < 0.01, en verandering < 0.3 OR
• Grotere veranderingen worden gevlagd voor menselijke review
• Nieuwe parameters (etniciteit, BMI, dieet) worden 'gepromoveerd' wanneer ze significant zijn voor 2+ bijwerkingen
• Max 5 auto-updates per dag; alle wijzigingen worden gelogd met provenance
• Elke vorige configuratieversie wordt bewaard voor rollback

5. Eerlijke beperkingen

Wij publiceren onze beperkingen omdat verborgen zwaktes gevaarlijker zijn dan zichtbare:

Datavolume: Momenteel ~217 datapunten over 15 bijwerkingen. Modelhealth is 'degraded' totdat wij n ≥ 100 per bijwerking bereiken.
Demografische gaten: Vrouwelijke bias (87% van gespecificeerde geslachten), minimale etnische diversiteit in bronnen.
Modifierbronnen: Initiële waarden zijn handgecodeerd uit literatuur. Worden vervangen door empirische waarden naarmate data accumuleert. Doelarchitectuur: inverse-variantie meta-analytisch raamwerk met formele studiekwaliteitsbeoordeling (Cochrane Risk of Bias).
Geen interactietermen: Modifiers worden onafhankelijk toegepast. Interacties (bijv. geslacht × leeftijd) worden niet gemodelleerd — wij cappen cumulatieve log-odds shifts om stapelbias te beperken.
Kalibratietests: Nog niet formeel gevalideerd tegen onafhankelijke uitkomstdata. Gepland zodra n ≥ 500 per bijwerking.
LLM-extractie: Imperfect. Goud-standaard handmatige auditing is gepland op een steekproef van 50 bronnen per bijwerking.
Journey-voorspeller: Gewichtstraject en spierbehoud modellen gebruiken STEP-trial constanten met expert-gecodeerde modifiers. Niet empirisch gevalideerd.
Niet causaal: Dit zijn populatiegemiddelde conditionele risico's, geen individuele causale voorspellingen.

6. Publicatie-roadmap

• Fase 1 (huidig): dual-track framework, open methodologie, community feedback
• Fase 2: n ≥ 100 per bijwerking, formele kalibratietesting
• Fase 3: n ≥ 500, externe validatie op onafhankelijke dataset
• Fase 4: pre-registratie bij OSF.io, ingediend bij peer-reviewed tijdschrift (doel: Nature Medicine)

Wij zijn een kleine team en onze methodologie heeft onvermijdelijk zwaktes. Als u iets ziet dat verkeerd of verbeterbaar is, laat het ons weten.

Magistra Side Effects Predictor™ — Statistische indicator, geen medisch advies.

Uitnodiging aan onderzoekers

1. Dual-track architectuur

2. Dataverzameling

3. Statistische aanpak

4. Zelf-evoluerend model

5. Eerlijke beperkingen

6. Publicatie-roadmap

Feedback van onderzoekers

Open source op GitHub

Citeer onze preprint