OpenAI مدلهای پیشرفتهای برای تولید متن و تصویر دارد و اخیراً Sora را نیز معرفی کرده است، مدل باورنکردنی تبدیل متن به ویدیو. اکنون، این شرکت یک مدل Voice Engine را معرفی کرده است که می تواند سخنرانی ها را با a تولید کند تک نمونه صوتی 15 ثانیه ای. این اساساً یک مدل متن به صدا است که در آن یک صدای 15 ثانیهای را برای آموزش مدل تغذیه میکنید و متن خود را برای تولید گفتاری با صدای طبیعی وارد میکنید.
OpenAI می گوید که حتی اگر مدل کوچک است، Voice Engine می تواند تولید کند صداهای واقعی و احساسی، بسیار نزدیک به اسپیکر اصلی. به گفته این شرکت، این مدل در اواخر سال 2022 ساخته شد و قابلیت ChatGPT Voice Chat را تقویت کرده است.
OpenAI “خطرات جدی” مرتبط با فناوری و “خطرات جدی” را تصدیق می کند.بالقوه برای سوء استفاده از صدای مصنوعی“. بنابراین این شرکت در حال حاضر این مدل را برای عموم منتشر نمیکند، در عوض، در حال پیشنمایش مدل است تا گفتمانی را در مورد سنتز صدا و چگونگی سازگاری جامعه با این قابلیتهای جدید آغاز کند.
در مورد مدل، می تواند صدای واقعی را به زبان های مختلف با لهجه ظریف ترجمه کند. هی جن، یک پلت فرم محبوب تولید ویدیو و صدا با هوش مصنوعی، از موتور صوتی OpenAI برای ایجاد صداهای سفارشی استفاده می کند. در این فضا، ElevenLabs مدل سنتز گفتار خود را ساخته است که می تواند صدا را شبیه سازی کند و گفتارهایی را به زبان های چند زبانه تولید کند.
مقالات پیشنهادی
وبلاگ OpenAI GPT-4.5 Turbo را افشا کرد. جرقه علاقه
آرجون شا
13 مارس 2024
GPT-5 ممکن است در تابستان 2024 منتشر شود. از نظر مادی بهتر از GPT-4
آرجون شا
21 مارس 2024
در حالی که این فناوری بسیار قدرتمند است، می تواند فریبنده باشد و ممکن است کاربران را در موقعیت های مختلف به خطر بیندازد. OpenAI این را پذیرفته است احراز هویت مبتنی بر صدا برای دسترسی به حساب های بانکی و سایر اطلاعات حساس استفاده می شود. این شرکت امیدوار است که چنین سیستم های احراز هویت به تدریج حذف شوند. جدای از آن، رسانه های اجتماعی مملو از افرادی است که صداهای محبوب را شبیه سازی می کنند تا محصولات خود را به فروش برسانند.
به ویژه در هند، کلاهبرداری های شبیه سازی صوتی با هوش مصنوعی در حال افزایش است. مجرمان سایبری هستند شبیه سازی صدای بچه ها تهدید والدین و اخاذی در چنین سناریویی، OpenAI موقعیت مناسبی برای انتشار گسترده مدل ندارد. با حرکت به سمت عصر هوش مصنوعی، احتیاط و انعطاف پذیری بیشتری از سوی جامعه در کل مورد نیاز است.
نظر شما در مورد موتور شبیه سازی صوتی OpenAI چیست؟ آیا شرکت باید این مدل را برای عموم عرضه کند؟ نظرات خود را در نظرات زیر با ما در میان بگذارید.
با کُلبه وبسایت و مجله فناوری و ابزارهای هوشمند ،بهترین تکنولوژی، بهترین آینده ، بروز بمانید