Үндсэн санаанууд
- Google хэрэглэгчдэд дуулж, дуулж, шүгэлдэж дуу хайх боломжийг олгодог шинэ хэрэгслийг гаргалаа.
- Шинэ хэрэгсэл нь тасралтгүй шинэчлэгдэж байдаг хагас сая гаруй дууны мэдээллийн сан бүхий шуугиантай дууг тааруулахын тулд машин сургалтыг ашигладаг.
- Google-н хэрэглэгчид сар бүр 100 орчим удаа ямар дуу тоглож байгааг асуудаг.
Google таны толгойд дуу гацах, түүнийг юу гэж нэрлэдгийг нь ойлгохгүй байх зэрэг бухимдалтай асуудлыг шийдэхийн тулд "Хайлт хийх" хэмээх шинэ функцийг эхлүүлсэн.
Дуу олохын тулд гоншигнох санаа нь маш энгийн мэт санагдаж байгаа тул Google яагаад энэ функцийг зөвхөн 2020 онд эхлүүлээд байгаа юм бэ? Дуунуудыг ингэж тодорхойлох нь үнэндээ нэлээд төвөгтэй байдаг нь нэг талаараа бидний дуугарсан хувилбарууд анхны дуунаасаа нэлээд ялгаатай байдагтай холбоотой юм. Google өөрийн AI блог дээрээ саяхан нийтэлсэн нийтлэлдээ энэ асуудлыг хэрхэн засахын тулд машин сурах аргыг ашигласан тухай тайлбарлаж, эцэст нь дууг нь дуулж, шүгэлдэж, дууг нь дуулах зэргээр дууг нь олоход нь тусалдаг.
"Hum to Search-ын гол зорилго бол хүмүүсийн толгойд тээглэсэн хөгжмийг таньж, олоход нь туслах явдал юм" гэж Google-ийн төлөөлөгч Lifewire-д имэйлээр мэдэгдэв.
Зүгээр л дуугарч эхлээрэй
Google-н хэрэглэгчид аль дууг сар бүр бараг 100 сая удаа тоглодог талаар асуудаг гэж Google-ийн дэд ерөнхийлөгч бөгөөд хэрэглэгчийн худалдан авалт хариуцсан ерөнхий менежер Апарна Ченнапрагада хайлтын хэд хэдэн шинэ функцийг танилцуулж буй видеог хэлжээ. Одоо олж мэдэх арга байна.
"Хайлт хийх" онцлог нь Google-н мобайл апп, Google Хайлтын виджет болон Google Assistant-д суурилагдсан. Аппликешнээр дамжуулан үүнд хандахын тулд микрофоны дүрс дээр товшоод "Энэ дуу юу вэ?" гэж хэлээрэй. "Дуу хайх" товчлуурыг сонгосноор мөн ажиллана.
Зөв ажиллахын тулд функц нь таныг дор хаяж 10-15 секундын турш дуугарахыг шаарддаг. Андройд хэрэглэгчид 20 гаруй хэлээр дуу олохын тулд гоншигнох боломжтой бол iPhone дээр зөвхөн англи дуунууд ажилладаг. Энэ хэрэгсэл нь дууг тэр дор нь таньж чаддаггүй ч нэг удаа танихад үр дүн нь маш сайн байдаг.
"Өргөн багцын хувьсагчтай дуунуудын талаас илүү хувь нь (ая, дууны өндөр, дууны түвшин гэх мэт) нь бидний алгоритмаар танигддаг боловч мэдээжийн хэрэг, үнэн зөв байх нь шуугианы чанар, дууны төрлөөс хамаарна. дуу болон бусад зүйл "гэж Google-ийн төлөөлөгч Lifewire-д имэйлээр мэдэгдэв. "Гэхдээ үүнийг хүлээн зөвшөөрвөл ойролцоогоор таван хариултын дөрөв нь зөв байна."
Хөгжим таних аппликейшнд гоншигнохыг анх удаа ашиглаж байгаа нь энэ биш юм. SoundHound нь CNN Business-ийн тэмдэглэснээр ижил төстэй функцийг санал болгодог бөгөөд Android болон iOS дээр бас боломжтой. Google-ийн төлөөлөгчийн хэлснээр, шинэ функц нь хувийн нууцад ямар нэгэн асуудал үүсгэхгүй бөгөөд "Google-ийн аудио дээр суурилсан харилцан үйлчлэлийг зохицуулах арга барилыг өөрчлөхгүй" гэж тэд Lifewire-д имэйлээр мэдэгдэв.
Machine Learning
Үзэл баримтлал нь энгийн хэдий ч студийн бичлэгийг олохын тулд ая эгшиглүүлэх нь техникийн хувьд нэлээд хэцүү байдаг. Үүнд хэд хэдэн шалтгаан бий гэж Google Research-ийн Кристиан Фрэнк 11-р сарын 12-нд бичсэн блогтоо тайлбарлав. Юуны өмнө, дууны эгшиглэсэн хувилбар нь бодит бичлэгээс ихээхэн ялгаатай байж болох тул энэ хоёрыг тааруулахад хэцүү байдаг. Тиймээс ресторан эсвэл бусад олон нийтийн газар сонссон дууг тань таних Shazam болон бусад олон програмууд аль хэдийн байгаа хэдий ч хайлт хийхдээ эгшиглэнт аялгууг ашиглах нь илүү төвөгтэй байж болох юм.
"Дууны үг, арын хоолой, хөгжмийн зэмсгүүдтэй бол хөгжим эсвэл студийн бичлэгийн дуу нь эгшиглэсэн аялгуунаас тэс өөр байж болно" гэж Фрэнк бичжээ."Алдаагаар эсвэл зохиомжоор хэн нэгэн дууг тайлбарлахдаа дууны ая, түлхүүр, хэмнэл эсвэл хэмнэл нь бага зэрэг эсвэл бүр мэдэгдэхүйц ялгаатай байж болно."
Дууны эгшиглэсэн хувилбар нь эх хувилбараас маш өөр байж болох тул Фрэнк өнгөрсөн үеийн олон аргад хүний жиргээг зөвхөн аялгуутай дууны хувилбар эсвэл жиргээг агуулсан дууны хувилбартай тааруулах шаардлагатай байсныг Фрэнк тэмдэглэжээ. Энэ нь эдгээр дуунуудын мэдээллийн сан хязгаарлагдмал бөгөөд гараар шинэчлэх шаардлагатай тул бодит хэрэглээг төвөгтэй болгосон.
Google "Hum to Search" функцийн хувьд дууг дууны аяыг илэрхийлдэг "тоонд суурилсан дараалал" болгон хувиргахад машин сургалтын загваруудыг ашигладаг гэж тайлбарлаж байна.."
Хэрэглэгчдэд илүү ээлтэй
Google-ийн Hum to Search функцэд машин сурах аргыг ашигласнаар уг хэрэгслийг бодит ертөнцөд ашиглахад илүү хялбар болгодог. Hum to Search нь хайгчийн дууг жинхэнэ дуутай нь тааруулж байгаа тул уг хэрэгсэл нь дуу бүрийн дууг эгшиглүүлсэн хувилбараар байнга шинэчлэгдэж байх шаардлагатай мэдээллийн сангийн оронд гарсан шинэ дуунуудтай ажиллах боломжтой. Дээрээс нь үүнийг ашиглахын тулд танд төгс дуу хоолой хэрэггүй.
"Одоогийн систем нь бидний байнга шинэчилж байгаа хагас сая гаруй дууг агуулсан дууны мэдээллийн сангийн нарийвчлалын өндөр түвшинд хүрсэн" гэж Google Hum to Search зарлалдаа дурджээ. "Энэ дууны цомогт дэлхийн олон аялгууг багтаах боломжтой хэвээр байна."