Үндсэн санаанууд
- Машин сургалтын шинэ загвар нь орчуулгад туслахын тулд хэл дээрх өгүүлбэрийн дүр төрхийг харуулдаг.
- VALHALLA нэртэй хиймэл оюун ухааны систем нь хүний хэлийг хэрхэн хүлээж авдагийг дуурайхаар бүтээгдсэн.
- Шинэ систем нь хэлийг ойлгоход хиймэл оюун ухаан ашиглах өсөн нэмэгдэж буй хөдөлгөөний нэг хэсэг юм.
Үг орчуулж байхдаа зургийг дүрслэн харуулах хүний арга нь хиймэл оюун ухаан (AI) таныг илүү сайн ойлгоход тусална.
Машин сургалтын шинэ загвар нь хэл дээрх өгүүлбэр хэрхэн харагдахыг харуулдаг. Саяхны нэгэн судалгааны баримт бичгийн дагуу энэ техник нь орчуулгад туслахын тулд дүрслэл болон бусад сэжүүрүүдийг ашигладаг. Энэ нь хэлийг ойлгохын тулд хиймэл оюун ухаан ашиглах өсөн нэмэгдэж буй хөдөлгөөний нэг хэсэг юм.
"Хүмүүсийн ярьж, бичих нь өвөрмөц, учир нь бид бүгд арай өөр өнгө аяс, хэв маягтай байдаг" гэж судалгаанд оролцоогүй Мэривиллийн их сургуулийн өгөгдлийн аналитикийн профессор Бет Кудни Lifewire-д цахим шуудангаар ярилцлага өгөхдөө хэлжээ.. "Нөхцөл байдлыг ойлгоход хэцүү байдаг, учир нь энэ нь бүтэцлэгдээгүй өгөгдөлтэй харьцахтай адил юм. Энд байгалийн хэлний боловсруулалт (NLP) нь ашигтай байдаг. NLP бол AI-ийн нэг салбар бөгөөд машинаас уншиж ойлгох чадварыг ашиглан бидний харилцах харилцааны ялгааг харуулдаг. NLP-ийн гол ялгаа, AI-ийн нэг салбар болохын хувьд бидний ярьж, бичиж буй үгсийн шууд утгыг анхаарч үздэггүй, утгыг нь хардаг."
Явж Алисаас асуу
MIT, IBM болон Сан Диего дахь Калифорнийн их сургуулийн судлаачдын бүтээсэн VALHALLA хэмээх шинэ хиймэл оюун ухааны систем нь хүмүүсийн хэл яриаг хэрхэн хүлээж авдагийг дуурайх зорилготой юм. Эрдэмтдийн үзэж байгаагаар мултимедиа гэх мэт мэдрэхүйн мэдээллийг зурагтай флаш карт гэх мэт шинэ, танил бус үгстэй хослуулан ашиглах нь хэлний мэдлэг, хадгалалтыг сайжруулдаг.
Эдгээр системүүд нь одоогоор зөвхөн бэлтгэгдсэн, тодорхой харилцан яриа хийх чадвартай чатботуудын хүчийг нэмэгдүүлж байна…
Тэдний арга нь зөвхөн текст орчуулгаас илүү машин орчуулгын нарийвчлалыг сайжруулдаг гэж багийнхан мэдэгдэв. Эрдэмтэд хоёр трансформатор бүхий кодлогч-декодерын архитектурыг ашигласан бөгөөд энэ нь хэл гэх мэт дарааллаас хамааралтай өгөгдөлд тохирсон мэдрэлийн сүлжээний загвар бөгөөд өгүүлбэрийн түлхүүр үг, семантикт анхаарлаа хандуулдаг. Нэг трансформатор нь харааны хий үзэгдэл үүсгэдэг бол нөгөө нь эхний трансформаторын гаралтыг ашиглан мультимодаль орчуулгыг гүйцэтгэдэг.
"Бодит нөхцөл байдлын хувьд та эх өгүүлбэртэй холбоотой дүрсгүй байж магадгүй" гэж судалгааны багийн гишүүдийн нэг Рамесвар Панда мэдээлсэн байна. "Тиймээс бидний сэдэл нь үндсэндээ: Дүгнэлт хийх явцад гаднах дүрсийг орц болгон ашиглахын оронд бид харааны хий үзэгдэл буюу харааны үзэгдлүүдийг төсөөлөх чадварыг ашиглан машин орчуулгын системийг сайжруулж болох уу?"
AI ойлголт
Их хэмжээний судалгаа нь NLP-ийг хөгжүүлэхэд чиглэгддэг гэж Кадни онцолсон. Жишээлбэл, Элон Маск Open AI-г үүсгэн байгуулсан бөгөөд энэ нь хүнтэй харилцаж чаддаг, Python болон Java хэл дээр программ хангамжийн код үүсгэх чадвартай GPT-3 загвар дээр ажиллаж байгаа.
Google болон Meta мөн LAMDA нэртэй системээрээ харилцан ярианы хиймэл оюун ухаан хөгжүүлэхээр ажиллаж байна. "Эдгээр системүүд нь одоогоор зөвхөн бэлтгэгдсэн, тодорхой харилцан яриа хийх чадвартай чатботуудын хүчийг нэмэгдүүлж байгаа нь хэрэглэгчийн дэмжлэг, тусламжийн ширээг өөрчлөх магадлалтай" гэж Кадни хэлэв.
AI технологийн компаний үүсгэн байгуулагч CLIPr Аарон Сломан цахим шуудангаар GPT-3 гэх мэт том хэлний загварууд хүний санал хүсэлт дээр үндэслэн текстийн хураангуйг сайжруулахын тулд маш цөөн сургалтын жишээнээс суралцаж чадна гэж мэдэгджээ. Жишээлбэл, та том хэлний загварт математикийн бодлого өгч, хиймэл оюун ухаанаас алхам алхмаар бодохыг хүснэ гэж тэр хэлэв.
"Бид том хэлний загваруудын чадвар, хязгаарлалтын талаар илүү ихийг мэдэхийн хэрээр илүү их ойлголт, үндэслэлийг олж авна гэж найдаж болно" гэж Сломан нэмж хэлэв. "Загвар зохион бүтээгчид сонирхсон тодорхой ажлуудад зориулж загваруудаа нарийн тааруулах илүү сайн аргуудыг боловсруулснаар би эдгээр хэлний загварууд нь хүнтэй төстэй үйл явцыг бий болгоно гэж би бас найдаж байна."
Georgia Tech-ийн тооцооллын профессор Дийи Ян цахим шуудангаар ярилцлага өгөхдөө бид өдөр тутмын амьдралдаа NLP-д суурилсан хувь хүний туслахаас эхлээд цахим шуудан болон утасны дуудлагад туслах байгалийн хэл боловсруулах (NLP) системийг илүү ихээр ашиглах болно гэж таамаглаж байсан. аялал жуулчлал, эрүүл мэндийн тусламж үйлчилгээнд мэдээлэл хайхад зориулсан мэдлэгтэй харилцан ярианы системд."Үүнээс гадна даалгаврыг гүйцэтгэж, хүмүүст хариуцлагатай, өрөөсгөл байдлаар туслах чадвартай хиймэл оюун ухааны системүүд" гэж Ян нэмж хэлэв.
GPT-3 болон DeepText зэрэг олон триллион параметр бүхий хиймэл оюун ухааны асар том загварууд нь бүх хэлний хэрэглээний нэг загвар дээр үргэлжлүүлэн ажиллана гэж Dialexa-ийн машин сургалтын инженер Стивен Хейж цахим шуудангаар ярилцлага өгөхдөө таамаглаж байсан. Мөн дуут командтай онлайн худалдаа гэх мэт тусгай зориулалтын шинэ төрлийн загварууд бий болно гэж тэр хэллээ.
"Жишээ нь худалдан авагч 'Надад шөнө дундын цэнхэр өнгөөр энэ тенийг илүү гэрэл гэгээтэй, илүү гэрэлтсэн өнгөөр үзүүлээрэй' гэж хэлж болох бөгөөд энэ сүүдрийг хэрхэн түрхэж байгааг нь хянахын тулд нүдэн дээр нь харуулах болно" гэж Хейж нэмж хэлэв.