معرفی مدل هوش مصنوعی AudioPaLM گوگل با توانایی شنیدن حرف زدن و ترجمه کردن

معرفی مدل هوش مصنوعی AudioPaLM گوگل با توانایی شنیدن حرف زدن و ترجمه کردن

گوگل یک Paper از مدل زبانی LLM خودش به اسم AudioPaLM منتشر کرد، این مدل در واقع میتونه بشنوه و حرف بزنه و ترجمه کنه. این مدل از ترکیب PaLM-2 و AudioLM ساخته شده و میتونه کارایی هر دو مدل رو یکجا داشته باشه.

دلیل ساخت این مدل درک بهتر و تولید گفتار هست که در یک معماری چندوجهی یکپارچه ترکیب شده و میتونه اطلاعات فرازبانی مثل هویت و لحن گوینده رو هم پردازش و تولید کنه.

از نکات جالب در مورد این Paper اینه که گوگل زبان فارسی رو هم تست کرده و میتونید گوش کنید.

دیدگاهتان را بنویسید