Үндсэн санаанууд
- DeepZen нь хиймэл оюун ухаан (хиймэл оюун ухаан) ашиглан текстээс гайхалтай бодит аудио ном бүтээдэг.
- Технологи нь барилгын материалаар хангахын тулд жинхэнэ хүний дуу хоолойны жүжигчдийг ашигладаг.
- Amazon болон Audible одоогоор компьютерийн аудио номыг хүлээн авахгүй.
DeepZen нь хүний жүжигчдийн жинхэнэ дуу хоолойд тулгуурлан аудио номонд хэрэглэгддэг компьютерийн дуу хоолойг бүтээдэг компани юм. Чанар нь аймшигтай - олон цагаар сонсоход хангалттай. Энд байгаа заль мэх бол AI (хиймэл оюун ухаан) бүрэлдэхүүн хэсэг бөгөөд текстийг уншиж, контекст дээр үндэслэн сэтгэл хөдлөлийн зөв хариу үйлдэл үзүүлэх боломжтой. Дараа нь тэр сэтгэл хөдлөлийг хоолойд оруулдаг.
Энэ нь гайхалтай бөгөөд маш тохиромжтой. Гэхдээ бид үнэхээр нэгэн төрлийн аудио номын туршлагыг хүсч байна уу? Харин тэдгээр дуу оруулагчдыг яах вэ?
"Инди хэвлэгчийн үүднээс авч үзвэл аудио ном үйлдвэрлэх зардлыг бууруулдаг аливаа зүйл маш сонирхолтой байдаг" гэж бие даасан хэвлэн нийтлэгч Carlile Media-ийн эзэн Рик Карлайл Lifewire-д цахим шуудангаар дамжуулан хэлэв.
"Гэхдээ тэрхүү сонирхол татахуйц бүтээгдэхүүн нь уламжлалт өгүүлэмжтэй ижил чанартай байх болно гэж таамаглаж байна. Би одоохондоо бид тэнд зуун хувь байгаа гэж бодохгүй байна. Намайг битгий буруугаар ойлгоорой, DeepZen бол гайхалтай сайн. Энэ бол асар их нээлт бөгөөд түүнийг бүтээгчид асар их магтаал, амжилтыг хүртэх ёстой. Гэхдээ энэ нь хараахан төгс болоогүй байна."
Аудио "Хангалттай сайн"
DeepZen-ийн чанарыг ойлгох хамгийн сайн арга бол дээжийг сонсох явдал юм. Хэрэв та эдгээрийг компьютерээр бүтээснийг мэдээгүй байсан бол та ойлгохгүй байж магадгүй юм. Ямар ч байсан хэсэг хугацаанд биш. DeepZen-ийн хиймэл оюун ухаан нь төгс бөгөөд сэтгэл хөдлөлийн тэмдэглэлээ хэзээ ч буруугаар тайлбарладаггүй гэж бодъё.
Тэгсэн ч гэсэн хүн илүү нарийн бөгөөд ихэвчлэн илүү гайхмаар тайлбаруудыг санал болгож чадна. Жүжигчин хүн компьютерийн хэзээ ч санаанд оромгүй үгсийг гэнэт эргүүлж магадгүй юм. Бодит байдал дээр хиймэл оюун ухааны тайлбар нь мэргэжлийн дуу оруулагчийнх шиг тийм ч сайн биш байгаа нь гарцаагүй.
"Кино дээр ажиллаж байгаа бөгөөд сүүлийн үед аудио өгүүллэгийн ертөнцөд ажиллаж байгаа хүний хувьд хиймэл оюун ухаанд гүн сэтгэгдэл төрүүлэхийн зэрэгцээ машин тайлбарлаж чадахгүй гүн гүнзгий утга санаа байдгийг би сайн мэднэ" гэж мэргэжлийн дуу хоолой жүжигчин Пол Крам Lifewire-д цахим шуудангаар дамжуулан мэдэгдэв.
"Үнэхээр үл мэдэгдэх зохиогчид үүнийг ашиглах уу? Энэ нь "хангалттай сайн" учраас тийм байх болно гэдгийг би баталж байна."
Хангалттай сайн байх нь ая тухтай байдал, зардал хэмнэлттэй хослуулан инди хэвлэн нийтлэгчдийг үйлчилгээ рүү татахад хангалттай байж болох юм.
"Аудио ном нь нэг цаг дуусаад 500 долларын үнэтэй байх боломжтой (одны дуу хоолойны хувьд илүү үнэтэй) бөгөөд үүнд удирдлага, админы зардал ороогүй болно" гэж Карлайл хэлэв. "DeepZen гэх мэт үйлчилгээ үзүүлэгч рүү гар бичмэлээ байршуулах замаар энэ зардлыг хоёр дахин бууруулах боломжтой байх нь маш сонирхолтой юм."
Ярихад асуудал
Дууны жүжигчдээ халж, DeepZen-д гар бичмэлээ байршуулах шиг тийм амар биш байна. Одоогоор аудио номыг хиймэл оюун ухаанаар ярихад нэг саад бэрхшээл тулгараад байгаа бөгөөд энэ нь Amazon-оос ирсэн.
"Одоогоор Аудибл болон Амазон аудио номыг түгээх өөрөө хэвлэгчийн маршрут болох ACX нь хүний бичээгүй аудио номыг хүлээн авахгүй" гэж Карлайл хэлэв.
Яагаад? Чанартай. Вэб сайтын түгээмэл асуултууд энд байна:
"Текстээс яриа болон бусад автомат бичлэг хийхийг хориглоно. Сонсох боломжтой сонсогч нь тухайн материалын гүйцэтгэл болон түүхийн хувьд аудио номыг сонгодог. Энэ хүлээлтийг хангахын тулд таны аудио номыг хүн бичсэн байх ёстой."
Энэ нь DeepZen-ээр үүсгэсэн аудио номууд одоохондоо байхгүй гэсэн үг. Энэ бол цэвэр таамаг, гэхдээ DeepZen нь Amazon-ийн хувьд маш сайн худалдан авалт мэт санагдаж, үйлчилгээгээ зарж, зөвхөн Аудит номонд зориулж хадгалах боломжийг олгодог. Хэдий тийм зүйл болохгүй байсан ч компьютерээр бүтээгдсэн аудио номны чанар ийм сайн байвал энэ дүрмээс үл хамаарах зүйл байхгүй бололтой.
Та ийм байдлаар хийгдсэн аудио номуудыг сонсохдоо баяртай байх уу? Энэ нь тохиолдоход ихэнх хүмүүс сэжиглэхгүй байх болно. Зарим нь компьютерт бий болгосон дуу хоолойг төгс төгөлдөр болгохыг илүүд үздэг, учир нь тэд заримдаа анхаарлыг сарниулдаг дууны заль мэх, дадал зуршлаас ангид байх болно. Энэ технологи нь видео тоглоом, телевиз, радио зар болон дуут жүжигчин хөлслөх бусад хувилбаруудад тохиромжтой.
DeepZen-ийн технологи нь мөн бичсэн нийтлэлээс мэдээний подкастуудыг автоматаар үүсгэх гайхалтай арга болох бөгөөд энэ нь ажилдаа явахад хялбар байх болно.
Тэгээд тэр хоолойн жүжигчид яах вэ? Ядаж нэг боломж гарах болно: Тэд DeepZen-д очиж ажиллах боломжтой.