Удахгүй та компьютертэй ярьж байгаагаа мэдэхгүй байж магадгүй

Агуулгын хүснэгт:

Удахгүй та компьютертэй ярьж байгаагаа мэдэхгүй байж магадгүй
Удахгүй та компьютертэй ярьж байгаагаа мэдэхгүй байж магадгүй
Anonim

Үндсэн санаанууд

  • Компьютерийн бүтээсэн яриаг бодит байдлаас нь ялгаж салгах боломжгүй өдөр ойртож байна.
  • Google саяхан LaMDA загвараа танилцууллаа.
  • Хүнтэй төстэй яриа гаргахад асар их хэмжээний боловсруулалтын хүч шаардагдана.
Image
Image

Одоогоор та компьютертэй ярьж байгаа үед үүнийг тодорхойлоход хялбар боловч хиймэл оюун ухаанд гарсан сүүлийн үеийн дэвшлийн ачаар энэ нь удахгүй өөрчлөгдөж магадгүй юм.

Google саяхан LaMDA-г танилцуулсан бөгөөд энэ нь хиймэл оюун ухааны туслахуудын харилцан ярианы чадварыг сайжруулж, илүү байгалийн яриа өрнүүлэх боломжтой гэж тус компани мэдэгдэв. LaMDA нь ямар ч бэлтгэлгүйгээр бараг бүх зүйлийн талаар энгийн байдлаар ярилцахыг зорьдог.

Энэ нь таныг хүнтэй ярьж байна уу гэж эргэлзэхэд хүргэж болох өсөн нэмэгдэж буй хиймэл оюун ухааны төслүүдийн нэг юм.

"Миний тооцоолсноор хэрэглэгчид ирэх 12 сарын дотор эдгээр шинэ, илүү сэтгэл хөдлөм дуу хоолойд өртөж, дасаж эхэлнэ" гэж MeetKai-ийн гүйцэтгэх захирал Жеймс Каплан, ярианы хиймэл оюун ухааны виртуал дуут туслах, хайлтын систем хөдөлгүүр гэж и-мэйл ярилцлагадаа хэлсэн.

"Нэгэнт ийм зүйл тохиолдвол өнөөдрийн нэгтгэсэн яриа нь хэрэглэгчдэд 2000-аад оны эхэн үеийн яриа өнөөгийн бидэнд сонсогдож байгаа мэт сонсогдох болно."

Дүртэй дуут туслах

Google-н LaMDA нь Google Research-ийн зохион бүтээсэн мэдрэлийн сүлжээний архитектур болох Transformer дээр бүтээгдсэн. Бусад хэлний загваруудаас ялгаатай нь Google-ийн LaMDA нь бодит харилцан ярианд сургагдсан.

Байгалийн дуугаралттай хиймэл оюун ухаанаар илтгэх сорилтуудын нэг хэсэг бол харилцан ярианы нээлттэй шинж чанар юм гэж Google-ийн Эли Коллинз блогтоо бичжээ.

Image
Image

"Телевизийн шоуны талаар найзтайгаа ярилцах нь тухайн улсын хамгийн шилдэг бүс нутгийн хоолны талаар мэтгэлцэхээс өмнө тухайн шоуны зураг авалт хийгдсэн улсын тухай хэлэлцүүлэг болж хувирах болно" гэж тэр нэмж хэлэв.

Роботын яриагаар бүх зүйл хурдацтай хөгжиж байна. Харилцан ярианы хиймэл оюун ухаанд хөрөнгө оруулалт хийдэг Tsingyuan Ventures компанийн менежер Эрик Розенблюм хэлэхдээ, компьютерийн тусламжтай ярианы зарим үндсэн асуудлууд бараг шийдэгддэг.

Жишээ нь, Otter.ai программ хангамжийн хуулбар эсвэл DeepScribe-аас авсан эмнэлгийн тэмдэглэл зэрэг үйлчилгээнүүдэд яриаг ойлгох нарийвчлалын түвшин аль хэдийн маш өндөр байдаг.

"Дараагийн хил нь хамаагүй хэцүү" гэж тэр нэмж хэлэв.

"Хүмүүстэй харьцаж буй компьютер гэх мэт байгалийн хэлний боловсруулалтаас давсан асуудал болох нөхцөл байдлын талаархи ойлголтыг хадгалахын тулд бухимдал, уур хилэн, тэвчээргүй байдал гэх мэтийг ойлгох хэрэгтэй. Эдгээр хоёр асуудал дээр ажиллаж байгаа ч хоёулаа сэтгэл хангалуун бус байна."

Мэдрэлийн сүлжээ бол түлхүүр юм

Амьдрал шиг дуу хоолой үүсгэхийн тулд компаниуд гүн мэдрэлийн сүлжээ гэх мэт технологийг ашиглаж байна, өгөгдлийг давхаргаар нь ангилдаг машин сургалтын нэг хэлбэр, текстээс ярианы программ хангамж боловсруулдаг ReadSpeaker компанийн Хойд Америкийн ерөнхийлөгч Мэтт Мулдон, гэж цахим шуудангийн ярилцлагадаа хэлсэн.

"Эдгээр давхарга нь дохиог сайжруулж, илүү төвөгтэй ангилалд ангилдаг" гэж тэр нэмж хэлэв. "Үр дүнд нь хүн шиг ер бусын сонсогддог нийлэг яриа бий."

Хөгжрүүлж буй өөр нэг технологи бол Prosody Transfer бөгөөд энэ нь нэг текстээс ярианы дууг нөгөөгийн ярианы хэв маягтай хослуулах явдал юм гэж Мулдон хэлэв. Мэдрэлийн текстээс ярианы шинэ дуу хоолой үүсгэхэд шаардагдах сургалтын өгөгдлийн хэмжээг багасгадаг шилжүүлэх сургалт бас бий.

Каплан хэлэхдээ хүнийхтэй төстэй яриа гаргахад асар их хэмжээний боловсруулалтын хүч шаардагддаг. Компаниуд мэдрэлийн хурдасгуур чипийг хөгжүүлж байгаа бөгөөд эдгээр нь ердийн процессортой хамт ажилладаг захиалгат модулиуд юм.

"Үүний дараагийн үе шат нь эдгээр чипүүдийг жижиг техник хангамжид оруулах болно, учир нь хараанд зориулсан хиймэл оюун ухаан шаардлагатай үед камерт аль хэдийн хийгдсэн байдаг" гэж тэр нэмж хэлэв. "Ийм төрлийн тооцоолох чадварыг чихэвчнүүдэд ашиглах боломжтой болох хүртэл удахгүй болно."

Хиймэл оюун ухаанд суурилсан яриаг хөгжүүлэхэд тулгарч буй нэг бэрхшээл бол хүн бүр өөр өөрөөр ярьдаг тул компьютерууд биднийг ойлгоход хэцүү байдаг.

"Жоржиа, Бостон, Хойд Дакота хэлийг гол хэл нь англи хэл мөн эсэхээс үл хамааран бодоорой" гэж MDinc-д дуут хайлтын аналитик дээр ажилладаг Моника Дема цахим шуудангаар хэлэв. "Дэлхийн хэмжээнд бодоход Герман, Хятад, Энэтхэгийн бүх бүс нутагт үүнийг хийх нь өндөр өртөгтэй боловч энэ нь боломжгүй эсвэл боломжгүй гэсэн үг биш юм."

Зөвлөмж болгож буй: