Η ιατρική, παραδοσιακά, βασίζεται στην τέχνη της διάγνωσης: μέσα από ερωτήσεις και κλινική εξέταση, ο γιατρός προσπαθεί να εντοπίσει ποια ασθένεια έχει ήδη προσβάλει τον ασθενή. Πολύ δυσκολότερο –αλλά εξίσου επιθυμητό– είναι να προβλέψει ποιες ασθένειες μπορεί να εκδηλωθούν στο μέλλον. Αυτόν ακριβώς τον στόχο φιλοδοξεί να πετύχει ένα νέο μοντέλο Τεχνητής Νοημοσύνης, με την ονομασία Delphi-2M, τα αποτελέσματα του οποίου παρουσιάστηκαν πρόσφατα στο περιοδικό Nature.
Αν και δεν είναι ακόμη έτοιμο για χρήση στα νοσοκομεία, οι δημιουργοί του ελπίζουν ότι στο μέλλον θα επιτρέψει στους γιατρούς να προβλέπουν την πιθανότητα εμφάνισης περισσότερων από 1.000 παθήσεων. Ανάμεσά τους, γράφει ο Economist, συγκαταλέγονται η νόσος Αλτσχάιμερ, διάφορες μορφές καρκίνου και τα καρδιακά επεισόδια, νόσοι που κάθε χρόνο πλήττουν δεκάδες εκατομμύρια ανθρώπους. Πέρα από τον εντοπισμό ασθενών υψηλού κινδύνου, ένα τέτοιο εργαλείο θα μπορούσε να βοηθήσει και τους φορείς υγείας να κατανείμουν πιο αποτελεσματικά τους προϋπολογισμούς τους.
Το Delphi-2M δημιουργήθηκε από ερευνητές του Ευρωπαϊκού Εργαστηρίου Μοριακής Βιολογίας (EMBL) στο Κέιμπριτζ και του Γερμανικού Κέντρου Ερευνας Καρκίνου στη Χαϊδελβέργη. Η σύλληψη αντλεί έμπνευση από τα μεγάλα γλωσσικά μοντέλα (LLMs), όπως το GPT-5, που δίνουν τη δυνατότητα στο ChatGPT να συντάσσει κείμενα με συνοχή.
Τα LLMs εκπαιδεύονται σε τεράστιους όγκους κειμένων, αναγνωρίζοντας πρότυπα ώστε να μαντεύουν ποια λέξη είναι πιο πιθανό να ακολουθήσει την προηγούμενη. Οι δημιουργοί του Delphi-2M σκέφτηκαν: αν η ΤΝ μπορεί να προβλέψει λέξεις, γιατί να μην μπορεί να προβλέψει και ασθένειες, εφόσον «τραφεί» με τα κατάλληλα δεδομένα υγείας;
Η βασική πρόκληση, σύμφωνα με τον Economist, ήταν ότι οι διαγνώσεις δεν ακολουθούν η μία την άλλη με τη γραμμική αμεσότητα των λέξεων σε μια πρόταση. Για παράδειγμα, η υπέρταση που εμφανίζεται λίγο μετά από μια θετική εξέταση εγκυμοσύνης ερμηνεύεται διαφορετικά από την υπέρταση που εκδηλώνεται χρόνια αργότερα.
Γι’ αυτό, οι ερευνητές αντικατέστησαν το τμήμα του LLM που κωδικοποιεί τη «θέση» μιας λέξης με ένα άλλο που κωδικοποιεί την ηλικία του ασθενούς. Δεν έλειψαν τα προβλήματα: σε πρώιμες εκδοχές, το σύστημα έκανε νέες διαγνώσεις, ακόμη και μετά τον θάνατο κάποιου ασθενούς.
Το Delphi-2M εκπαιδεύτηκε με δεδομένα 400.000 ανθρώπων από το UK Biobank, μια από τις πληρέστερες βάσεις βιοϊατρικών δεδομένων παγκοσμίως. Χρησιμοποιήθηκαν οι κωδικοποιήσεις ICD-10, το διεθνές «συντομογραφικό λεξιλόγιο» των ιατρικών διαγνώσεων, που κάλυπταν 1.256 παθήσεις. Στη συνέχεια, το μοντέλο επαληθεύτηκε με τα δεδομένα 100.000 επιπλέον συμμετεχόντων.
Ακολούθησαν δοκιμές σε υγειονομικά αρχεία της Δανίας, τα οποία ξεκινούν από το 1978 και θεωρούνται από τα πιο πλήρη στον κόσμο. Εκεί, η ομάδα είχε πρόσβαση σε στοιχεία 1,9 εκατομμυρίων ατόμων, εξασφαλίζοντας πιο αντιπροσωπευτικό δείγμα σε σχέση με το βρετανικό.
Το Delphi-2M αναζητά «ιατρικά συμβάντα» στο ιστορικό ενός ασθενούς, όπως πότε διαγνώστηκαν ασθένειες, μαζί με παράγοντες του τρόπου ζωής του, όπως το αν είναι ή ήταν παχύσαρκος, αν κάπνιζε ή έπινε αλκοόλ, καθώς και την ηλικία και το φύλο του, όπως γράφει ο Guardian.
Παρά τα εντυπωσιακά αποτελέσματα, η κλινική εφαρμογή είναι ακόμη μακριά. Το μοντέλο πρέπει να περάσει από χρόνια δοκιμών ώστε να διαπιστωθεί αν η χρήση του όντως είναι επωφελής για την υγεία των ασθενών.
Η ομάδα εργάζεται ήδη σε μια νέα έκδοση που θα ενσωματώνει πιο σύνθετα δεδομένα· όχι μόνο χρονολογικές λίστες διαγνώσεων, αλλά και ιατρικές εικόνες και γονιδιωματικά δεδομένα, που περιλαμβάνονται επίσης στο UK Biobank. Αυτό θα μπορούσε να αυξήσει σημαντικά την ακρίβεια των προβλέψεων.
Το Delphi-2M δεν είναι η μοναδική απόπειρα του είδους. Το Foresight, που αναπτύχθηκε στο King’s College London το 2024, χρησιμοποιεί επίσης ιατρικά ιστορικά για να προβλέψει μελλοντικά περιστατικά. Ωστόσο, το πρόγραμμα ανεστάλη τον Ιούνιο, λόγω ανησυχιών ότι το NHS δεν είχε εξασφαλίσει τις κατάλληλες εγκρίσεις για τη διάθεση δεδομένων. Παράλληλα, στο Χάρβαρντ αναπτύσσεται το μοντέλο ETHOS, με παρόμοιες επιδιώξεις.
Ακόμη και αν οι ασθενείς χρειαστούν χρόνια για να δουν άμεσο όφελος, η σημερινή μορφή του Delphi-2M ήδη προσφέρει έναν ανεκτίμητο θησαυρό για τους βιολόγους. Οι προβλέψεις του αποκαλύπτουν ποιες ασθένειες εμφανίζονται συχνά μαζί, υποδεικνύοντας ενδεχομένως βαθύτερους δεσμούς που δεν έχουν ακόμη ερευνηθεί.
Ο γενετιστής Γιούαν Μπέρνεϊ από το EMBL συνοψίζει τον Economist: «Νιώθω σαν παιδί σε ζαχαροπλαστείο». Οι δυνατότητες είναι απεριόριστες∙ και το μέλλον της ιατρικής πρόβλεψης, πιο συναρπαστικό από ποτέ.
