AI системүүд хүний бүтээлч байдлыг хэрхэн дуурайдаг

Агуулгын хүснэгт:

AI системүүд хүний бүтээлч байдлыг хэрхэн дуурайдаг
AI системүүд хүний бүтээлч байдлыг хэрхэн дуурайдаг
Anonim

Үндсэн санаанууд

  • DALL·E нь текст дээр тулгуурлан зураг зурах шинэ мэдрэлийн сүлжээ юм.
  • Сүлжээ нь хүний бүтээлч үр дүнг дуурайж чадах өсөн нэмэгдэж буй хиймэл оюун ухааны төслүүдийн нэг юм.
  • Мэргэжилтнүүд хиймэл оюунаар зурсан зургуудыг анхны бүтээл биш гэж үзэж байна.
Image
Image

Нүүж яв, Пикассо. Шинэ мэдрэлийн сүлжээ нь текст дээр үндэслэн зураг зурах боломжтой.

DALL·E, зураач Сальвадор Дали болон Пиксарын WALL·E-ийн нэрсийн портманто нь дурын текстийг авч, түүгээрээ зураг үүсгэх боломжтой. Систем нь олон тэрбум зураг, текстийн жишээн дээр сургагдсан мэдрэлийн сүлжээг ашигладаг. Энэ нь хүний бүтээлч үр дүнг дуурайж чаддаг, гэхдээ хуулбарлах боломжгүй, өсөн нэмэгдэж буй хиймэл оюун ухааны төслүүдийн нэг юм.

"Байгалийн хэл байнга хувьсан өөрчлөгдөж, контекст нюансаас ихээхэн хамаардаг тул зураг зурахад хангалттай хэлийг ойлгох машиныг зааж сургах нь маш чухал амжилт юм" гэж Пенсильванийн Йоркийн коллежийн кибер аюулгүй байдлын профессор Тамара Шварц хэлэв. гэж цахим шуудангаар ярилцлага өгөхдөө хэлсэн байна. "Гэрчийн тайлбарт үндэслэн зураг бүтээх чадвартай, ховор авьяастай цагдаагийн ноорог зураач гэж төсөөлөөд үз дээ."

Зураг бүтээхдээ том өгөгдлийг ашиглах нь

DALL-E-ийг хиймэл оюун ухааны судалгааны OpenAI компани бүтээсэн бөгөөд интернетээс асар их хэмжээний өгөгдөл цуглуулж ажилладаг. Дараа нь өгөгдлийг байгалийн хэлний загвараар боловсруулж, текстээс зураг гаргахад сургадаг. DALL-E нь саяхан гарсан GPT-3-тай төстэй ажилладаг бөгөөд OpenAI-ийн бүтээсэн хэлний загвар бөгөөд эх текстийн хэсгүүдийг үүсгэх боломжтой. GPT-3 нь хагас их наяд үгийн интернет текстийг ашиглан бэлтгэгдсэн бөгөөд гайхалтай бодит текстийг гаргаж чаддаг.

Зураг зурахад хангалттай хэлийг ойлгох машинд сургах нь маш чухал амжилт юм.

Мэдээллийн шинжлэх ухааны BroutonLab компанийн үүсгэн байгуулагч, ерөнхий захирал Майкл Юрушкин цахим шуудангаар ярилцлага өгөхдөө DALL-E бол "хүн төрөлхтний бидний бүтээлч байдал, төсөөллийг дуурайж чадсан цөөхөн хэдэн амжилтын нэг" гэж хэлсэн. Тэрээр "Холбогдох өгөгдлүүдийг судалснаар хиймэл оюун ухаан ямар нэг зүйлийг хэрхэн урьдчилан таамаглаж байгааг ойлгоход илүү хялбар байдаг ч өмнө нь хэзээ ч "сонсож байгаагүй" зүйлсээс хэрхэн зураг гаргаж чаддагийг ойлгох нь илүү хэцүү байдаг."

Шварц хиймэл оюун ухаан нь мэдээлэл бүтээдэггүй, харин хэлний өгөгдлийг авч, дүрс болгон хувиргадаг гэдгийг анхаарна уу.

"Анхны бүтээлч байдал нь даалгаврыг бүтээсэн хүнээс үүсдэг" гэж Шварц хэлэв. "Хиймэл оюун ухаанд зарим нэг "бүтээлч байдал" байдаг, учир нь энэ нь янз бүрийн өгөгдлийн хослолыг туршиж, дараа нь хэд хэдэн боломжит үр дүнгээс сонгож авдаг. Гэсэн хэдий ч хүн гаралтыг шалгаж, хиймэл оюун ухаанд олон хослолоос хэрхэн сонгохыг зааж байна."

Робот мөрдөгч ажил?

Машин энэ өгөгдөл болон объектын хослолыг хүний зураачаас хамаагүй хурдан турших боломжтой. Шварц DALL-E хэзээ нэгэн цагт гэрчийн мэдүүлэгт үндэслэн гэмт хэргийн газрын зургийг тоймоор дамжуулан сэргээн засварлахыг оролдож буй мөрдөгчтэй хамтран ажиллах боломжтой гэж тэмдэглэжээ.

"Гэрчүүдийн мэдүүлэг өгөх үед компьютер нь ярианы, байгалийн хэл дээрх мэдээллийг авч, хэргийн газрын зураг эсвэл олон зургийг бүтээх боломжтой" гэж тэр хэлэв. "Дараа нь алдагдсан нотлох баримтын илүү нарийвчлалтай дүр төрхийг бий болгохын тулд эдгээр дүрслэлийг нэгтгэж болно. Гэмт хэрэг гарахаас өмнөх байршлын өмнөх зургийг нэгтгэснээр энэхүү дүрслэлийг баяжуулж болно."

Хиймэл оюун ухаанд суурилсан өөр хэд хэдэн программууд урлагийг бүтээх боломжтой. Жишээлбэл, Ай-Да робот гар систем, нүүр царай таних технологийг хиймэл оюун ухаантай хослуулан урлагт ашигладаг. Систем нь роботын гарны хөдөлгөөнийг бий болгох алгоритмд оруулдаг машины урд тавьсан дүрсийг шинжлэх боломжтой.

Гэсэн хэдий ч хүн төрөлхтний уран бүтээлчид роботын эзэд тэднийг орлох болно гэж санаа зовох хэрэггүй гэж Ратгерсийн их сургуулийн Урлаг ба хиймэл оюун ухааны лабораторийн захирал Ахмед Элгаммал өнгөрсөн жил The New York Times сонинд ярьжээ.

"Урлагийн тодорхойлолт байнга хувьсан өөрчлөгдөж байдаг ч гол утгаараа энэ нь хүмүүсийн хоорондын харилцааны нэг хэлбэр юм" гэж тэр бичжээ. "Машины ард хүн зураач байхгүй бол хиймэл оюун ухаан нь дэлгэц дээрх пикселийг удирдах эсвэл хөгжмийн дэвтэр дээрх тэмдэглэлийг удирдах гэх мэт хэлбэр дүрсээр тоглохоос өөр зүйлийг хийж чадна. Эдгээр үйлдлүүд нь анхаарал татахуйц, мэдрэхүйн хувьд сонирхолтой байж болох ч тэдгээрийн хоорондын харилцан үйлчлэлгүйгээр утга учир дутагдалтай байдаг. уран бүтээлч ба үзэгчид."

DALL-E-ийн бүтээлийг үзээд хиймэл оюун ухаанаар бүтээсэн зургууд нь урлаг биш гэдгийг Элгаммал хэлснийг би ойлгож байна. Нөгөө талаар тэд миний хийж чадах бүх уран бүтээлээс илүү. Тэгэхээр үнэхээр ялгаа нь юу вэ?

Зөвлөмж болгож буй: