Η OpenAI παρουσίασε το GPT-4o: Ένα Νέο Μοντέλο Τεχνητής Νοημοσύνης που Μπορεί να Συνομιλεί σε Πραγματικό Χρόνο
Τη Δευτέρα, η OpenAI έκανε τη μεγάλη ανακοίνωση για το GPT-4o (όπου το “o” αντιπροσωπεύει το “omni”), ένα νέο και καινοτόμο μοντέλο τεχνητής νοημοσύνης. Αυτό το μοντέλο υπόσχεται να μπορεί να συνομιλεί σε πραγματικό χρόνο, να διαβάζει συναισθηματικές ενδείξεις και να αντιδρά σε οπτικές εισροές.
Το GPT-4o λειτουργεί με μεγαλύτερη ταχύτητα από το προηγούμενο καλύτερο μοντέλο της OpenAI, το GPT-4 Turbo. Είναι δωρεάν για τους χρήστες του ChatGPT και θα είναι διαθέσιμο ως υπηρεσία μέσω του API που θα κυκλοφορήσει στις επόμενες εβδομάδες, σύμφωνα με ανακοίνωση της εταιρείας.
Στην παρουσίαση του GPT-4o σε ένα live streaming στο YouTube με τίτλο “OpenAI Spring Update”, ο CTO της OpenAI Mira Murati και οι υπάλληλοι Mark Chen και Barret Zoph παρουσίασαν τις νέες δυνατότητες του μοντέλου. Η OpenAI αναφέρει ότι το GPT-4o ανταποκρίνεται στις εισόδους ήχου σε περίπου 320 χιλιοστά του δευτερολέπτου κατά μέσο όρο, παρόμοια με τους χρόνους απόκρισης του ανθρώπου στη συνομιλία.
Το GPT-4o εκπαιδεύτηκε από άκρο σε άκρο χρησιμοποιώντας κείμενο, όραση και ήχο, με όλες τις είσοδος και έξοδος να επεξεργάζονται από το ίδιο νευρωνικό δίκτυο. Οι παρουσιαστές έδειξαν τις δυνατότητες συνομιλίας ήχου και οπτικής κατανόησης του GPT-4o, με το μοντέλο να μπορεί να αναλύει εικόνες, να αντιλαμβάνεται συναισθήματα και να παρέχει μεταφράσεις σε πραγματικό χρόνο.
Συνολικά, το GPT-4o προσφέρει βελτιωμένες ταχύτητες και ποιότητα σε περισσότερες από 50 γλώσσες και καλύπτει το 97% του παγκόσμιου πληθυσμού. Η OpenAI ανακοίνωσε ότι το GPT-4o θα είναι προσβάσιμο σε όλους τους χρήστες του ChatGPT, ενώ οι συνδρομητές επί πληρωμή θα έχουν επιπλέον πλεονεκτήματα.
Συνοψίζοντας, το GPT-4o αποτελεί ένα σημαντικό βήμα μπροστά στον χώρο της τεχνητής νοημοσύνης και υπόσχεται να επαναπροσδιορίσει τον τρόπο με τον οποίο αλληλεπιδρούμε με την τεχνολογία στο μέλλον.