موتور صوتی OpenAI می تواند صدای انسان را از یک نمونه 15 ثانیه ای شبیه سازی کند

زمان مطالعه: 2 دقیقه

OpenAI مدل‌های پیشرفته‌ای برای تولید متن و تصویر دارد و اخیراً Sora را نیز معرفی کرده است، مدل باورنکردنی تبدیل متن به ویدیو. اکنون، این شرکت یک مدل Voice Engine را معرفی کرده است که می تواند سخنرانی ها را با a تولید کند تک نمونه صوتی 15 ثانیه ای. این اساساً یک مدل متن به صدا است که در آن یک صدای 15 ثانیه‌ای را برای آموزش مدل تغذیه می‌کنید و متن خود را برای تولید گفتاری با صدای طبیعی وارد می‌کنید.

OpenAI می گوید که حتی اگر مدل کوچک است، Voice Engine می تواند تولید کند صداهای واقعی و احساسی، بسیار نزدیک به اسپیکر اصلی. به گفته این شرکت، این مدل در اواخر سال 2022 ساخته شد و قابلیت ChatGPT Voice Chat را تقویت کرده است.

OpenAI “خطرات جدی” مرتبط با فناوری و “خطرات جدی” را تصدیق می کند.بالقوه برای سوء استفاده از صدای مصنوعی“. بنابراین این شرکت در حال حاضر این مدل را برای عموم منتشر نمی‌کند، در عوض، در حال پیش‌نمایش مدل است تا گفتمانی را در مورد سنتز صدا و چگونگی سازگاری جامعه با این قابلیت‌های جدید آغاز کند.

در مورد مدل، می تواند صدای واقعی را به زبان های مختلف با لهجه ظریف ترجمه کند. هی جن، یک پلت فرم محبوب تولید ویدیو و صدا با هوش مصنوعی، از موتور صوتی OpenAI برای ایجاد صداهای سفارشی استفاده می کند. در این فضا، ElevenLabs مدل سنتز گفتار خود را ساخته است که می تواند صدا را شبیه سازی کند و گفتارهایی را به زبان های چند زبانه تولید کند.

مقالات پیشنهادی

وبلاگ OpenAI GPT-4.5 Turbo را افشا کرد. جرقه علاقه

آرجون شا

13 مارس 2024

GPT-5 ممکن است در تابستان 2024 منتشر شود. از نظر مادی بهتر از GPT-4

آرجون شا

21 مارس 2024

در حالی که این فناوری بسیار قدرتمند است، می تواند فریبنده باشد و ممکن است کاربران را در موقعیت های مختلف به خطر بیندازد. OpenAI این را پذیرفته است احراز هویت مبتنی بر صدا برای دسترسی به حساب های بانکی و سایر اطلاعات حساس استفاده می شود. این شرکت امیدوار است که چنین سیستم های احراز هویت به تدریج حذف شوند. جدای از آن، رسانه های اجتماعی مملو از افرادی است که صداهای محبوب را شبیه سازی می کنند تا محصولات خود را به فروش برسانند.

به ویژه در هند، کلاهبرداری های شبیه سازی صوتی با هوش مصنوعی در حال افزایش است. مجرمان سایبری هستند شبیه سازی صدای بچه ها تهدید والدین و اخاذی در چنین سناریویی، OpenAI موقعیت مناسبی برای انتشار گسترده مدل ندارد. با حرکت به سمت عصر هوش مصنوعی، احتیاط و انعطاف پذیری بیشتری از سوی جامعه در کل مورد نیاز است.

نظر شما در مورد موتور شبیه سازی صوتی OpenAI چیست؟ آیا شرکت باید این مدل را برای عموم عرضه کند؟ نظرات خود را در نظرات زیر با ما در میان بگذارید.

با کُلبه وبسایت و مجله فناوری و ابزارهای هوشمند ،بهترین تکنولوژی، بهترین آینده ، بروز بمانید

Happy

0 %

Sad

0 %

Excited

0 %

Sleepy

0 %

Angry

0 %

Surprise

0 %

شاید برای شما جالب باشد

خبر فوری

نقشه پیچ خورده Homelander در فصل 4 پسران چیست

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

همه مکان‌های کامیون باربری خیابان ششم در Zenless Zone Zero

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

The Boys Season 4 Episode 6: Webweaver کیست و قدرت های او چیست

Threads به 175 میلیون کاربر فعال ماهانه در سراسر جهان می رسد که هندی ها جزو فعال ترین کاربران هستند

15 بهترین بازی دزدان دریایی در ایکس باکس در سال 2024

موتورولا گوشی تاشو Razr 50 Ultra را با پشتیبانی گوگل جمینی در هند عرضه کرد

آیا Zenless Zone Zero Multiplayer است؟

نقشه پیچ خورده Homelander در فصل 4 پسران چیست

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

ریلمی دوربین Ultra Clear با هوش مصنوعی را در گوشی 5G سری 13 Pro با سنسورهای سونی معرفی کرد.

همه مکان‌های کامیون باربری خیابان ششم در Zenless Zone Zero

خبر فوری

اکنون عضو شوید

ما را در سانه ها دنبال کنید

Average Rating

دیدگاهتان را بنویسید لغو پاسخ

شاید برای شما جالب باشد