گوگل هوش مصنوعی AudioPaLM را با توانایی شنیدن حرف زدن و ترجمه کردن معرفی کرد

گوگل هوش مصنوعی AudioPaLM را با توانایی شنیدن حرف زدن و ترجمه کردن معرفی کرد

گوگل یک Paper از مدل زبانی LLM خودش به اسم AudioPaLM منتشر کرد، این مدل در واقع میتونه بشنوه و حرف بزنه و ترجمه کنه. این مدل از ترکیب PaLM-2 و AudioLM ساخته شده و میتونه کارایی هر دو مدل رو یکجا داشته باشه.

دلیل ساخت این مدل درک بهتر و تولید گفتار هست که در یک معماری چندوجهی یکپارچه ترکیب شده و میتونه اطلاعات فرازبانی مثل هویت و لحن گوینده رو هم پردازش و تولید کنه.

از نکات جالب در مورد این Paper اینه که گوگل زبان فارسی رو هم تست کرده و میتونید گوش کنید.

مقالات بیشتری بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مجله راه‌دیجیتال