متا کمپانی مادر اینستاگرام و فیسبوک از یک مدل جدید هوش مصنوعی به اسم Voicebox رونمایی کرد. این هوش مصنوعی که در اصل برای تبدیل متن به صدا ساخته شده میتواند صداهای کاملا طبیعی را با نوشتن چند خط متن تولید کنید، قبلا مدلهای دیگری مانند DALL-E ساخته شده بود اما متا میگوید Voicebox چیز دیگری است که حتی میتواند بسیار خطرناک باشد.
در حال حاضر این مدل روزی بیش از ۵۰ هزار ساعت از انواع صدا تمرین داده شده است و میتواند صداهای خود را به زبانهای زبانهای انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی تولید کند
صدای عزیزان شمارا شبیهسازی میکند
برای مثال اگر دوستی دارید که برای شما پیام ارسال میکند میتوانید از ویژگی تبدیل متن به صدا با همان صدای دوستتان استفاده کنید، و یا با تمرین دادن صدای عزیزان فوت شده خود متنهایی را تولید و گوش کنید تا یاد آنرا همیشه زنده نگه دارید.
ویژگیهای دیگر مدل هوش مصنوعی Voicebox
متا میگوید صداهای تولید شده با این مدل دارای ۱ درصد خطا بوده اند در صورتی که نرخ خطای انواع سرویسهای تبدیل متن به صدا بین ۴۵ تا ۶۰ درصد هست، همچنین در کنار تولید صدا از متن میتواند صداهارا ویرایش یا نویز گیری و حتی کلمات داخل یک فایل صوتی را تغییر دهد.
برای مثال در نظر بگیرید که یک پادکست تولید کردهاید و در اواسط آن کلمهای را اشتباه بیان کردهاید، کافی است از این مدل استفاده کنید تا برای شما فقط همان کلمه را ویرایش کند و به این شکل دیگر نیازی نیست بازگردید و دوباره ظبط کنید.
یکی از جذابیتهای دیگر آن میتواند برای صنعت دوبله مفید باشد، چرا که در اینده دوبلههایی میتوان تولید کرد که احساس و تن صدای بازیگر را داشته باشند و به زبانهای دیگر دوبله شوند.