Το Bloomberg αποκάλυψε την πιο πρόσφατη μελέτη της ομάδας ετοιμότητας της OpenAI, η οποία συγκροτήθηκε το φθινόπωρο για να αξιολογήσει τα ρίσκα και τις πιθανές καταχρήσεις των AI μοντέλων της εταιρίας.
Η έρευνα κατέληξε στο συμπέρασμα πως η ομάδα που χρησιμοποιούσε το GPT-4, είχε μεγαλύτερο μέσο όρο στο σκορ των δύο ομάδων, αλλά τονίστηκε πως η διαφορά δεν ήταν “στατιστικά σημαντική”.
Ενώ δεν παρατηρήσαμε σημαντικές στατιστικές διαφορές στις βαθμολογίες, παρατηρήσαμε πως οι απαντήσεις της ομάδας με πρόσβαση το GPT-4 έτειναν να είναι μεγαλύτερες και περιείχαν μεγαλύτερο αριθμό λεπτομερειών.
Οι ερευνητές παρατήρησαν επίσης πως οι απαντήσεις των φοιτητών ήταν το ίδιο αποδοτικές με αυτές των ειδικών στον τομέα. Παρόλο που οι ερευνητές θεωρούν πως υπάρχει μόνο μία μικρή πιθανότητα το ChatGPT να χρησιμοποιηθεί για την ανάπτυξη βιολογικών όπλων, η έρευνα καταλήγει με μία σημείωση πως το GPT-4 έδωσε σε όλους τους συμμετέχοντες ένα “στατιστικά σημαντικό” πλεονέκτημα στη συνολική ακρίβεια.
Αν αξιολογήσουμε τη συνολική ακρίβεια και όχι μόνο τις πολλαπλές συγκρίσεις, η διαφορά είναι στατιστικά σημαντική.