
أعلنت جوجل إطلاق نموذج Gemini 3.5 Live Translate الجديد للترجمة الصوتية الفورية، بهدف تقليل حواجز اللغة، وإتاحة المحادثات المباشرة بين المستخدمين بلغات مختلفة بصورة أكثر طبيعية وسلاسة.
في هذا السياق، قالت الشركة إن النموذج الجديد قادر على تعرّف أكثر من 70 لغة تلقائياً، مع تقديم ترجمة صوتية تحافظ على نبرة المتحدث وإيقاع حديثه وطبقته الصوتية، ويتميز النموذج بقدرته على توليد الترجمة بنحو مستمر في أثناء الكلام، بدلاً من الاعتماد على أسلوب الترجمة التقليدي الذي ينتظر انتهاء المتحدث من الجملة قبل بدء الترجمة.
استعرضت جوجل قدرات النموذج عبر أمثلة عملية شملت دبلجة مقاطع الفيديو في الوقت الفعلي، بالإضافة إلى ترجمة المحاضرات والعروض التقديمية المتعددة اللغات، مع الحفاظ على انسيابية الحديث بين المشاركين.
في إطار توسيع استخدام التقنية، أكدت الشركة أن Gemini 3.5 Live Translate سيصل إلى خدمة المكالمات والاجتماعات Google Meet خلال وقت لاحق من العام الجاري. وسترتفع اللغات المدعومة في الترجمة الفورية من خمس لغات فقط حالياً إلى أكثر من 70 لغة، مع إمكانية دعم أكثر من 2000 تركيبة لغوية مختلفة داخل الاجتماع الواحد.
من المقرر أن تتجاوز الخدمة الاعتماد السابق على اللغة الإنجليزية كلغة وسيطة للترجمة، في حين تعتزم جوجل تحديث واجهة Google Meet لتسهيل الوصول إلى ميزة الترجمة الصوتية بسرعة أكبر.
ستبدأ النسخة المحسّنة من الترجمة الصوتية في Google Meet الوصول أولاً إلى مجموعة محددة من الشركات المشتركة في خدمة Google Workspace ضمن معاينة خاصة خلال وقت لاحق من الشهر الجاري، على أن تتوسع إلى شريحة أوسع من المستخدمين لاحقًا هذا العام.
في الوقت نفسه، بدأت جوجل طرح Gemini 3.5 Live Translate عالمياً داخل تطبيق Google Translate عبر نظامي أندرويد و iOS. ويتضمن التحديث وضعاً جدياً باسم “وضع الاستماع” في أندرويد، يتيح للمستخدمين الاستماع إلى الترجمات المباشرة عبر سماعات الرأس أو مباشرةً عبر سماعة الهاتف.
أكدت الشركة أن كافة المقاطع الصوتية التي يولدها النموذج ستتضمن علامة مائية رقمية غير مرئية باستخدام تقنية SynthID، وهي تقنية طورتها جوجل للمساعدة في التحقق من المحتوى المُنشأ بالذكاء الاصطناعي والحد من إساءة استخدامه في نشر المعلومات المضللة.