Оптик тэмдэгт таних (OCR) гэж юу вэ?

Агуулгын хүснэгт:

Оптик тэмдэгт таних (OCR) гэж юу вэ?
Оптик тэмдэгт таних (OCR) гэж юу вэ?
Anonim

Тэмдэгтийн оптик таних (OCR) нь текстийг гараар бичих, оруулах шаардлагагүйгээр компьютер унших боломжтой хэвлэсэн, шивсэн, гараар бичсэн баримт бичгийн дижитал хувилбарыг үүсгэдэг программ хангамжийг хэлнэ. OCR нь ихэвчлэн PDF форматын сканнердсан баримт бичигт ашиглагддаг боловч зургийн файл дотор компьютерт уншигдахуйц текст үүсгэх боломжтой.

OCR гэж юу вэ

OCR буюу текст таних гэж нэрлэдэг бөгөөд энэ нь хэвлэмэл болон бичмэл баримтаас тоо, үсэг, цэг таслал (мөн глиф гэж нэрлэдэг) зэрэг тэмдэгтүүдийг компьютерт илүү хялбар хүлээн зөвшөөрч, уншдаг цахим хэлбэрт хувиргадаг програм хангамжийн технологи юм. бусад програм хангамжийн програмууд. Зарим OCR програмууд үүнийг баримт бичгийг дижитал камераар сканнердах эсвэл зураг авах үед хийдэг бол бусад нь өмнө нь OCRгүйгээр сканнердсан эсвэл гэрэл зураг авсан баримт бичигт энэ процессыг хэрэглэж болно. OCR нь хэрэглэгчдэд PDF баримтаас хайлт хийх, текст засварлах, баримт бичгийг дахин форматлах боломжийг олгодог.

Image
Image
Түүхэн сониныг OCR программ хангамжаар сканнердаж байна.

Getty Images

OCR-г юунд ашигладаг вэ?

Хурдан, өдөр тутмын скан хийх хэрэгцээнд OCR нь тийм ч чухал биш байж магадгүй. Хэрэв та их хэмжээний сканнер хийвэл PDF дотроос хайлт хийснээр яг хэрэгтэй файлаа олох боломжтой байх нь бага зэрэг цаг хэмнэж, сканнерын программ дахь OCR функцийг илүү чухал болгодог. OCR-д туслах бусад зүйлс энд байна:

  • Өгөгдлийн автомат боловсруулалт болон өгөгдөл оруулах (Жишээ: Ажил горилогчийн анкетыг хянах систем).
  • Сканнердсан номыг хайх боломжтой болгож байна.
  • Гараар бичсэн сканнерыг компьютерт уншигдахуйц текст болгон хувиргаж байна.
  • Харааны бэрхшээлтэй хэрэглэгчдэд туслах уншигч програмууд баримт бичгийг илүү ашиглах боломжтой болгож байна.
  • Түүхэн баримт бичиг, сониныг хадгалахын зэрэгцээ хайх боломжтой болгодог.
  • Мэдээллийг гаргаж авах, нягтлан бодох бүртгэлийн программд шилжүүлэх (Жишээ нь: Баримт болон нэхэмжлэх).
  • Хайлтын системд ашиглах баримт бичгийг индексжүүлж байна.
  • Хурдны камер болон улаан гэрлийн камерын программаар жолоочийн улсын дугаарыг таних.
  • Ярьж чаддаггүй хүмүүст зориулсан ярианы синтезатор – онолын физикч Стивен Хокинг бол ярианы синтезийн программын хамгийн алдартай хэрэглэгч байж магадгүй юм.

Доод шугам

Яагаад зүгээр л зураг авч болохгүй гэж? Учир нь энэ нь зүгээр л зураг байх тул та юу ч засварлах эсвэл текст хайх боломжгүй болно. Баримт бичгийг сканнердаж, OCR программ хангамжийг ажиллуулснаар тэр файлыг засварлаж, хайх боломжтой зүйл болгон хувиргах боломжтой.

OCR-ийн түүх

Текст таних аргыг хамгийн анх 1914 онд ашиглаж байсан бол 1950-иад онд OCR-тэй холбоотой технологийг өргөнөөр хөгжүүлж, ашиглаж эхэлсэн бөгөөд ялангуяа дижитал хэлбэрт хөрвүүлэхэд хялбар маш хялбаршуулсан фонтуудыг бий болгосноор. унших боломжтой текст. Эдгээр хялбаршуулсан фонтуудын эхнийхийг Дэвид Шепард бүтээсэн бөгөөд OCR-7B гэж нэрлэдэг. OCR-7B нь зээлийн карт болон дебит картуудад хэрэглэгддэг стандарт фонтыг санхүүгийн салбарт өнөөг хүртэл ашигласаар байна. 1960-аад онд АНУ, Их Британи, Канад, Герман зэрэг хэд хэдэн орны шуудангийн үйлчилгээ OCR технологийг ашиглан шуудангийн эрэмбэлэх ажлыг ихээхэн хурдасгаж эхэлсэн. OCR нь дэлхий даяар шуудангийн үйлчилгээнд зориулж захидал ангилахад ашигладаг үндсэн технологи хэвээр байна. 2000 онд OCR технологийн хязгаарлалт, чадамжийн талаарх үндсэн мэдлэгийг бот болон спам илгээгчийг зогсооход ашигладаг CAPTCHA программыг боловсруулахад ашигласан.

Олон арван жилийн туршид хиймэл оюун ухаан, машин сургалт, компьютерийн хараа зэрэг холбогдох технологийн салбарын дэвшлийн улмаас OCR нь илүү нарийвчлалтай, боловсронгуй болсон. Өнөөдөр OCR программ хангамж нь бичиг баримтыг урьд өмнө хэзээ ч байгаагүйгээр илүү хурдан бөгөөд үнэн зөв хувиргахын тулд загвар таних, онцлог илрүүлэх, текст олборлолтыг ашигладаг.

FAQ

    Би утас, таблетаараа бичиг баримтыг хэрхэн скан хийх вэ?

    IOS дээр Notes програмыг нээж, шинэ тэмдэглэл үүсгэ. Камераа нээгээд Баримт бичгийг скан хийх товшино уу. Андройд дээр Google Драйвыг нээж, Plus (+) сонгоод, дараа нь Scan-г товшоод утсаараа баримт бичнэ үү.

    Би Adobe Acrobat дээр OCR хэрхэн ашиглах вэ?

    Сканнердсан зураг агуулсан PDF файлыг нээгээд Tools > PDF засах-г сонгоно уу. Acrobat нь OCR-г автоматаар хэрэглэх бөгөөд ингэснээр та текстийг засах боломжтой болно. Засвар хийх газраа сонгоод бичиж эхлээрэй.

    OCR болон OMR хоёрын ялгаа нь юу вэ?

    Оптик тэмдэг таних (OMR) нь цаасан дээрх тэмдэглэгээг илрүүлэх програм хангамж юм. OMR нь шалгалт, санал асуулга, санал асуулга, тэр ч байтугай сонгуулийн үр дүнг боловсруулахад ашиглагддаг. OCR-ээс ялгаатай нь OMR хуудас дээрх тэмдгийг тайлж чадахгүй, зөвхөн тэмдэг байгаа эсэхийг шалгана.

Зөвлөмж болгож буй: