Το Gemini 3.5 Live Translate υποστηρίζει ελληνικά και φέρνει την άμεση φωνητική μετάφραση σε άλλο επίπεδο

Η Google ανακοίνωσε το Gemini 3.5 Live Translate, ένα νέο μοντέλο άμεσης φωνητικής μετάφρασης που θα διατεθεί σε περισσότερα σημεία του οικοσυστήματός της, με στόχο χαμηλότερη καθυστέρηση και πιο φυσική απόδοση συνομιλιών σε πολλές γλώσσες.
Το νέο μοντέλο ανήκει στην οικογένεια Gemini 3.5, η οποία παρουσιάστηκε στο πρόσφατο I/O. Μέχρι τώρα, η Google είχε διαθέσει μόνο την έκδοση Flash, ενώ ένα μοντέλο Pro αναμένεται τις επόμενες εβδομάδες. Το Gemini 3.5 Live Translate είναι μοντέλο ομιλίας προς ομιλία και έχει ρυθμιστεί ώστε να εντοπίζει και να μεταφράζει αυτόματα περισσότερες από 70 γλώσσες μεταξύ των οποίων και τα ελληνικά, με εντυπωσιακά αποτελέσματα.
Η εταιρεία αναφέρει ότι το Gemini 3.5 Live Translate είναι αρκετά γρήγορο ώστε να ακολουθεί μια κανονική συζήτηση, μένοντας μόλις λίγα δευτερόλεπτα πίσω από τον ομιλητή. Παράλληλα, προσαρμόζει τον τόνο, τον ρυθμό και το ύψος της φωνής, ώστε το αποτέλεσμα να ακούγεται πιο κοντά στον ομιλητή και λιγότερο σαν γενική ρομποτική φωνή.
Η διάθεση ξεκινά σε αρκετά προϊόντα και υπηρεσίες της Google. Οι προγραμματιστές μπορούν να αρχίσουν να το χρησιμοποιούν μέσω δημόσιας προεπισκόπησης στο Gemini Live API ή στο AI Studio. Το μοντέλο επεξεργάζεται συνεχώς την ομιλία και χειρίζεται αυτόματα τις πολυγλωσσικές εισόδους, χωρίς να απαιτείται χειροκίνητη ρύθμιση από τους δημιουργούς εφαρμογών.
Σημαντικό στοιχείο για χρήση σε πραγματικές συνθήκες είναι και το φιλτράρισμα θορύβου. Το Gemini 3.5 Live Translate μπορεί να απομονώνει θορύβους φόντου σε πολυσύχναστα περιβάλλοντα, ώστε η μετάφραση να παραμένει λειτουργική κατά τη διάρκεια συνομιλιών εκτός ελεγχόμενων χώρων.
Το μοντέλο θα ενσωματωθεί και στο Google Meet. Επιλεγμένοι εταιρικοί πελάτες θα αποκτήσουν πρόσβαση από αυτόν τον μήνα, πριν από την ευρύτερη διάθεση. Η Google προσαρμόζει επίσης το περιβάλλον του Meet, ώστε η ζωντανή μετάφραση να βρίσκεται σε πιο εμφανές σημείο για τους χρήστες.
Η μεγαλύτερη επέκταση αφορά το Google Translate σε Android και iOS, όπου το Gemini 3.5 Live Translate θα κάνει σύντομα την εμφάνισή του. Στο τέλος της περασμένης χρονιάς, η Google είχε αρχίσει να δοκιμάζει ζωντανή μετάφραση βασισμένη στο Gemini στην εφαρμογή με οποιαδήποτε ακουστικά, καθώς και στην εφαρμογή για iOS. Παλαιότερα, η λειτουργία απαιτούσε Pixel Buds μαζί με Android smartphone.
Με τη νέα ενημέρωση, τα ακουστικά δεν θα είναι απαραίτητα. Όταν ο χρήστης δεν έχει ακουστικά, θα μπορεί να κρατά το τηλέφωνο στο αυτί σαν να βρίσκεται σε κλήση και να ακούει τη φωνητική μετάφραση. Αυτή η λειτουργία ακρόασης λειτουργεί προς το παρόν μόνο σε Android.
Σε παράδειγμα χρήσης, η λειτουργία ακρόασης επιτρέπει σε κάποιον να ακούει σχεδόν σε πραγματικό χρόνο αγγλική μετάφραση μιας ξενάγησης στα ισπανικά απευθείας από το ακουστικό του τηλεφώνου. Τα διαθέσιμα demo έχουν καταγραφεί υπό ελεγχόμενες συνθήκες.
Τέλος η Google προχωρά προσεκτικά ως προς την αυθεντικότητα του παραγόμενου ήχου. Όλες οι ροές ήχου του Gemini 3.5 Live Translate θα περιλαμβάνουν υδατογραφήματα SynthID ενσωματωμένα στα δεδομένα κυματομορφής. Με αυτόν τον τρόπο, η ομιλία θα επισημαίνεται ως παραγόμενη από τεχνητή νοημοσύνη και, προς το παρόν, δεν υπάρχει τρόπος αφαίρεσης αυτής της σήμανσης.
Πηγή: https://www.insomnia.gr/
(Κώστας Παπαζαχαρίου, αναδημοσίευση 12/6/2026)




