هوش مصنوعی Voicebox متا: تبدیل متن به صدا

متا کمپانی مادر اینستاگرام و فیسبوک از یک مدل جدید هوش مصنوعی به اسم Voicebox رونمایی کرد. این هوش مصنوعی که در اصل برای تبدیل متن به صدا ساخته شده می‌تواند صداهای کاملا طبیعی را با نوشتن چند خط متن تولید کنید، قبلا مدل‌های دیگری مانند DALL-E ساخته شده بود اما متا می‌گوید Voicebox چیز دیگری است که حتی می‌تواند بسیار خطرناک باشد.

در حال حاضر این مدل روزی بیش از ۵۰ هزار ساعت از انواع صدا تمرین داده شده است و می‌تواند صداهای خود را به زبان‌های زبان‌های انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی تولید کند

صدای عزیزان شمارا شبیه‌سازی می‌کند

برای مثال اگر دوستی دارید که برای شما پیام ارسال می‌کند میتوانید از ویژگی تبدیل متن به صدا با همان صدای دوستتان استفاده کنید، و یا با تمرین دادن صدای عزیزان فوت شده خود متن‌هایی را تولید و گوش کنید تا یاد آن‌را همیشه زنده نگه دارید.

ویژگی‌های دیگر مدل هوش مصنوعی Voicebox

متا می‌گوید صداهای تولید شده با این مدل دارای ۱ درصد خطا بوده اند در صورتی که نرخ خطای انواع سرویس‌های تبدیل متن به صدا بین ۴۵ تا ۶۰ درصد هست، همچنین در کنار تولید صدا از متن می‌تواند صداهارا ویرایش یا نویز گیری و حتی کلمات داخل یک فایل صوتی را تغییر دهد.

برای مثال در نظر بگیرید که یک پادکست تولید کرده‌اید و در اواسط آن کلمه‌ای را اشتباه بیان کرده‌اید، کافی است از این مدل استفاده کنید تا برای شما فقط همان کلمه را ویرایش کند و به این شکل دیگر نیازی نیست بازگردید و دوباره ظبط کنید.

یکی از جذابیت‌های دیگر آن میتواند برای صنعت دوبله مفید باشد، چرا که در اینده دوبله‌هایی میتوان تولید کرد که احساس و تن صدای بازیگر را داشته باشند و به زبان‌های دیگر دوبله شوند.

منبع

صدای عزیزان شمارا شبیه‌سازی می‌کند

ویژگی‌های دیگر مدل هوش مصنوعی Voicebox

دیدگاهتان را بنویسید لغو پاسخ