Таны компьютертэй хийсэн яриа илүү бодитой болж магадгүй

Агуулгын хүснэгт:

Таны компьютертэй хийсэн яриа илүү бодитой болж магадгүй
Таны компьютертэй хийсэн яриа илүү бодитой болж магадгүй
Anonim

Үндсэн санаанууд

  • Meta нь яриандаа сэтгэл хөдлөлөө илэрхийлэх программ бүтээхийн тулд хиймэл оюун ухаан ашиглаж байна.
  • Компанийн хиймэл оюун ухааны баг инээх, эвшээх, уйлах, "аяндаа чатлах" зэрэг илэрхий дуу хоолойг бодит цаг хугацаанд загварчлахад ахиц дэвшил гаргасан гэж мэдэгдэв.
  • AI-г мөн яриа таних чадварыг сайжруулахад ашиглаж байна.
Image
Image

Хиймэл оюун ухааны (AI) хүчинд та удахгүй компьютертэйгээ илүү энгийн чатлах боломжтой болж магадгүй.

Meta нь хиймэл оюун ухаанаас илүү бодитой ярианы системийг бий болгох хүчин чармайлтдаа ихээхэн ахиц дэвшил гаргасан гэж мэдэгдэв. Компанийн хиймэл оюун ухааны баг бодит цаг хугацаанд "аяндаа чатлах"-аас гадна инээх, эвшээх, уйлах зэрэг илэрхий дуу хоолойг загварчлах чадварт ахиц дэвшил гаргасан гэж мэдэгдэв.

"Ямар ч харилцан ярианд хүмүүс аялгуу, сэтгэл хөдлөлийн илэрхийлэл, түр зогсолт, өргөлт, хэмнэл зэрэг аман бус дохиогоор дүүрэн харилцан солилцдог. Энэ бүхэн нь хүмүүсийн харилцан үйлчлэлд чухал ач холбогдолтой" гэж баг саяхан блогтоо бичжээ.. "Гэхдээ өнөөгийн хиймэл оюун ухааны системүүд эдгээр баялаг, илэрхий дохиог барьж чаддаггүй, учир нь тэд зөвхөн бидний хэлж байгаа зүйлийг бичдэг текстээс л сурдаг, гэхдээ бидний хэрхэн хэлдэггүй."

Илүү ухаалаг яриа

Блогын нийтлэлд Meta AI-ийн баг ярианы өнгө аяс, сэтгэл хөдлөлийн илэрхийлэл, түр зогсолт, өргөлт, хэмнэл зэрэг аман бус дохиог ойлгодоггүй уламжлалт хиймэл оюун ухааны системийн хязгаарлалтыг даван туулахаар ажиллаж байна гэжээ.. Системүүд зөвхөн бичмэл текстээс суралцах боломжтой тул саатсан.

Гэхдээ Метагийн ажил өмнөх хүчин чармайлтаас ялгаатай бөгөөд учир нь түүний хиймэл оюун ухаантай загварууд нь ярианы хэлний мөн чанарыг бүрэн дүрслэн харуулахын тулд байгалийн хэл боловсруулах загваруудыг ашиглаж чаддаг. Мета судлаачид шинэ загварууд нь AI системүүд нь уйтгар гуниг, инээдэм гэх мэт сэтгэл хөдлөлөө илэрхийлэх боломжийг олгоно гэж мэдэгджээ.

"Ойрын ирээдүйд бид асуултанд хариулах (жишээ нь: "Яаж байна вэ" гэх мэт нөөц их шаарддаг текст шошго эсвэл автомат яриа таних систем (ASR) шаардалгүйгээр, хэрэгцээтэй хэрэглээний программуудыг бүтээхэд текстгүй техникийг ашиглахад анхаарлаа хандуулах болно. цаг агаар?"), "гэж багийнхан блогтоо бичжээ. "Яриан дахь просоди нь өгүүлбэрийг илүү сайн задлан задлахад тусалж, зорилгыг ойлгоход тусалж, асуултанд хариулах чадварыг сайжруулдаг гэдэгт бид итгэдэг."

AI ойлгох чадвар

Компьютерууд утгыг дамжуулахдаа сайжираад зогсохгүй яриа таних чадварыг сайжруулахад хиймэл оюун ухааныг ашиглаж байна.

Компьютерийн эрдэмтэд дор хаяж 1952 онд Bell Labs-ийн гурван судлаач нэг тоон цифрийг таних системийг бий болгосноос хойш компьютерийн яриа таних тал дээр ажиллаж байгаа гэж AI Dynamics-ийн технологийн ахлах ажилтан Райан Монсурэйт цахим шуудангаар мэдэгджээ. Lifewire. 1990-ээд он гэхэд яриа таних системийг худалдаанд гаргах боломжтой байсан ч эрүүл мэндийн тусламж үйлчилгээ гэх мэт маш тодорхой хэрэглээний домэйноос гадуур ашиглахыг хориглоход хангалттай өндөр алдаатай байсан.

"Гүнзгий суралцах загварууд нь ансамблийн загваруудыг (Microsoft-ынх шиг) яриа таних чадварт хүрэх боломжийг олгож байгаа тул бид чанга яригчаас хамааралгүй компьютертэй амаар харилцах технологитой болсон" гэж Монсурат хэлэв. "Дараагийн үе шатанд зардлыг бууруулж, Siri эсвэл Google-ийн хиймэл оюун ухааны туслахуудыг ашигладаг хүн бүр яриа таних ийм түвшинд хандах боломжтой болно."

Image
Image

AI яриа танихад тустай, учир нь энэ нь суралцах замаар цаг хугацааны явцад сайжирч чадна гэж Verbit.ai хиймэл оюун ухааны дуу хоолой компанийн орлогын ахлах ажилтан, ерөнхий менежер Ариэль Утник Lifewire-д өгсөн цахим ярилцлагадаа хэлэв. Жишээлбэл, Вербит өөрийн дотоод хиймэл оюун ухаантай технологи нь арын дуу чимээ, цуурайг илрүүлж, шүүж, чанга яригчийг өргөлтөөс үл хамааран хуулбарлаж, шууд болон бичигдсэн видео болон аудио бичлэгээс нарийвчилсан, мэргэжлийн хуулбар, тайлбар үүсгэдэг гэж мэдэгджээ.

Гэхдээ Утник хэлэхдээ одоогийн ихэнх яриа таних платформууд ердөө 75-80% нарийвчлалтай байдаг.

"AI нь хүнийг хэзээ ч бүрэн орлохгүй. Учир нь эцсийн хуулбарыг өндөр чанартай, үнэн зөв гаргахын тулд орчуулагч, засварлагч, засварлагчдын хувийн хяналт зайлшгүй шаардлагатай" гэж тэр нэмж хэлэв.

Дуу таних чадварыг сайжруулахын тулд хакеруудаас урьдчилан сэргийлэх боломжтой гэж Mitek Systems-ийн дуу хоолой таних компанийн бүтээгдэхүүн, корпорацийн хөгжлийн дэлхийн дэд ерөнхийлөгч Санжай Гупта цахим шуудангаар мэдэгдэв. Судалгаанаас харахад хоёр жилийн дотор бүх амжилттай данс булаан авах халдлагын 20 хувь нь дуу хоолойны нийлэг сайжруулалтыг ашиглах болно гэж тэр нэмж хэлэв.

"Энэ нь гүн гүнзгий хуурамч технологи улам боловсронгуй болохын хэрээр бид зураг, видеоны гүн гүнзгий хуурамч мэдээлэлтэй зэрэгцэн эдгээр тактиктай тэмцэх боломжтой дэвшилтэт хамгаалалтыг нэгэн зэрэг бий болгох шаардлагатай байна" гэж Гупта хэлэв. "Дууны хууран мэхлэлттэй тэмцэхийн тулд амьд дуу хоолой болон дууны бичигдсэн, синтетик эсвэл компьютерээр үүсгэсэн хувилбарыг ялгах чадвартай амьд байдлыг илрүүлэх технологи шаардлагатай."

Залруулга 2022/04/05: 9-р догол мөрөнд Райан Монсуратын нэрийн үсгийг зассан.

Зөвлөмж болгож буй: