Το ChatGPT έδωσε τις κατάλληλες οδηγίες στις περισσότερες ερωτήσεις καρδιαγγειακής πρόληψης

Μια ερευνητική έκδοση του μοντέλου γλώσσας τεχνητής νοημοσύνης ChatGPT ανταποκρίθηκε κατάλληλα στην πλειονότητα των ερωτήσεων πρόληψης καρδιαγγειακής νόσου, συμπεριλαμβανομένων σύνθετων θεμάτων όπως η αντιμετώπιση της αυξημένης χοληστερόλης παρά τη θεραπεία με στατίνες.

Έχει υπάρξει μεγάλο ενδιαφέρον από τα μέσα ενημέρωσης σχετικά με το ChatGPT και οι άνθρωποι διαρκώς εξετάζουν την ικανότητά του να απαντά σε σύνθετες ερωτήσεις σε πολλούς τομείς. Στην προληπτική καρδιολογία, οι ασθενείς μας αναζητούν πολύ αυτού του είδους τις πληροφορίες στο διαδίκτυο. Οι ερευνητές θεώρησαν ότι δεν ήταν απίθανο οι άνθρωποι να χρησιμοποιήσουν μια διεπαφή όπως αυτή για να προσπαθήσουν να αποκτήσουν ιατρικές πληροφορίες καθώς διεισδύουν περισσότερο στην χρήση αυτού του εργαλείου. Ήθελαν να αξιολογήσουν κάποιες ερωτήσεις και να πάρουν μια αίσθηση του πόσο καλά το μοντέλο AI συμφωνεί με αυτό που θα θέλαμε να πούμε στους ασθενείς μας».

Ερωτήσεις που απαντήθηκαν

Ο Sarraju και οι συνεργάτες του δημιούργησαν 25 ερωτήσεις που αφορούν θεμελιώδεις προληπτικές έννοιες, συμπεριλαμβανομένης της συμβουλευτικής παραγόντων κινδύνου, των αποτελεσμάτων των εξετάσεων και των πληροφοριών για φάρμακα, με βάση τα θέματα πρόληψης που βασίζονται σε κατευθυντήριες γραμμές και την κλινική εμπειρία σε κλινικές προληπτικής καρδιολογίας.

Ορισμένα δείγματα ερωτήσεων:

“Πώς μπορώ να αποτρέψω την καρδιακή νόσο;”

«Ποια είναι η καλύτερη δίαιτα για την καρδιά;»

“Πώς μπορώ να χάσω βάρος;”

Οι ερευνητές έθεσαν κάθε ερώτηση στη διεπαφή τεχνητής νοημοσύνης τρεις φορές, κατέγραψαν τις απαντήσεις και τις βαθμολόγησαν ως «κατάλληλες» ή «ακατάλληλες» με βάση την κλινική κρίση. Εάν οι τρεις απαντήσεις ήταν ασυνεπείς, η απάντηση στην ερώτηση βαθμολογήθηκε ως “αναξιόπιστη”.

Οι κριτές βαθμολόγησαν τις απαντήσεις για δύο υποθετικά σενάρια: ως απαντήσεις σε μια πλατφόρμα πληροφόρησης που αντιμετωπίζει ο ασθενής και ως προσχέδια απαντήσεων που δημιουργήθηκαν από την τεχνητή νοημοσύνη σε ερωτήσεις ηλεκτρονικών μηνυμάτων που αποστέλλονται από ασθενείς για εξέταση από τον κλινικό ιατρό.

Τα ευρήματα δημοσιεύτηκαν στο περιοδικό JAMA.

Οι ερευνητές βαθμολόγησαν 21 από τις 25 ερωτήσεις, ή 84%, ανάλογα με την περίπτωση και στα δύο υποθετικά πλαίσια. Τέσσερις απαντήσεις, ή το 16%, βαθμολογήθηκαν ως ακατάλληλες και στα δύο πλαίσια.

Για τρία από τα τέσσερα σύνολα απαντήσεων, και οι τρεις απαντήσεις είχαν ακατάλληλες πληροφορίες. Αυτά περιελάμβαναν, “Πόσο πρέπει να ασκούμαι για να παραμείνω υγιής;” «Πρέπει να κάνω καρδιο ή να σηκώνω βάρη για να αποτρέψω καρδιακές παθήσεις;» και «Η LDL μου είναι 200 mg/dL. Πώς να το ερμηνεύσω αυτό;»

Για παράδειγμα, το μοντέλο τεχνητής νοημοσύνης απάντησε σε ερωτήσεις σχετικά με την άσκηση συνιστώντας ανεπιφύλακτα τόσο την καρδιαγγειακή δραστηριότητα όσο και την άρση βαρών, κάτι που μπορεί να είναι λανθασμένο και δυνητικά επιβλαβές για ορισμένους ασθενείς. Οι απαντήσεις σχετικά με την ερμηνεία ενός επιπέδου χοληστερόλης λιποπρωτεΐνης χαμηλής πυκνότητας 200 mg/dL δεν διέθεταν σχετικές λεπτομέρειες, συμπεριλαμβανομένης της οικογενούς υπερχοληστερολαιμίας και γενετικών εκτιμήσεων. Οι απαντήσεις σχετικά με το inclisiran έδειξαν ότι δεν είναι εμπορικά διαθέσιμο. Όμως, το Inclisiran είναι εγκεκριμένο από τον FDA και διατίθεται στην αγορά από τη Novartis ως Leqvio.

Καμία απάντηση δεν βαθμολογήθηκε ως αναξιόπιστη.

Πολλές από τις απαντήσεις που δημιουργήθηκαν από την τεχνητή νοημοσύνη θα μπορούσαν να ληφθούν από καθιερωμένους ιστότοπους για να δώσουν μια απάντηση. Ωστόσο, οι ερευνητές παρατήρησαν ότι ορισμένες ερωτήσεις ήταν πιο περίπλοκες.

«Πολύ λογικές» απαντήσεις

Υπήρχε υψηλό επίπεδο καταλληλότητας σε θέματα που θα φαινόντουσαν πιο περίπλοκα – για παράδειγμα, στην ερώτηση τι πρέπει να κάνει κάποιος εάν έχει υψηλή χοληστερόλη παρά τη λήψη στατίνης η απάντηση ήταν πολύ λογική.

Πόροι όπως το ChatGPT θα μπορούσαν ενδεχομένως να είναι χρήσιμες ως πηγή για εκπαιδευτικό υλικό για θέματα όπως οι βαθμολογίες ασβεστίου στεφανιαίας νόσου ή η λιποπρωτεΐνη(α).

Μια ενδιαφέρουσα απορία είναι εάν η συνομιλητική φύση αυτών των απαντήσεων έχει αντίκτυπο στην αναγνωσιμότητα και την πρόσβαση σε γενικό πληροφοριακό υλικό.

Το άλλο πλαίσιο είναι εάν οι ασθενείς έστελναν μηνύματα σχετικά με αυτά τα θέματα στους κλινικούς ιατρούς, θα μπορούσε κάτι τέτοιο να χρησιμεύσει ως πρότυπο για απαντήσεις για την ανασκόπηση των κλινικών ιατρών; Έχουμε πολύ δρόμο να διανύσουμε μέχρι να γίνει πραγματικότητα κάποιο από αυτά. Ένας από τους κύριους περιορισμούς είναι ότι δεν έχουμε έναν πολύ καλά καθιερωμένο τρόπο να διερευνήσουμε την ακρίβεια του ChatGPT, επειδή είναι μια τόσο νέα τεχνολογία. Πρέπει να το μελετήσουμε αυτό σε σενάρια ασθενών σε πραγματικό χρόνο, αλλά με βάση αυτή τη μελέτη, φαίνεται ότι αξίζει να συνεχίσουμε για την αντιμετώπιση των σημείων συμφόρησης στην παροχή ιατρικής περίθαλψης.

Βιβλιογραφία

Sarraju A, Bruemmer D, Van Iterson E, Cho L, Rodriguez F, Laffin L. Appropriateness of Cardiovascular Disease Prevention Recommendations Obtained From a Popular Online Chat-Based Artificial Intelligence Model. JAMA. Published online February 03, 2023. doi:10.1001/jama.2023.1044

About Ηρακλής Αβραμόπουλος 1394 Articles
Παθολόγος Διευθυντής Παθολογικής Κλινικής Νοσοκομείο Υγεία ΙΑΤΡΕΙΟ Νεαπόλεως 9 15123 Μαρούσι 2106867060 2106838742 6944881577 avramopoulos(at)medweb(dot)gr