Noisy data

khinmintatthuJune 22, 20101min500

Noisy data ဆိုသည်မှာ အဓိပ္ပာယ်အတိအကျမရှိသော အချက်အလက်များကို ခေါ်ဆိုခြင်းဖြစ်သည်။ ထိုစကားလုံးမှာ corrupt data ဆိုသောစကားလုံးကို ရည်ညွှန်းပြီးသုံးစွဲကြခြင်းဖြစ်သည်။ သို့သော်လည်း ပုံမှန်မဟုတ်သောစာသားများကဲ့သို့ စက်မှ မှားယွင်းစွာပြန်ဆိုဖော်ပြထားသော အချက်အလက်များနှင့် နားလည်ရန်ခက်ခဲသော မည်သည့်အချက်အလက်ကိုမဆို နောက်ပိုင်းတွင် ၎င်းစကားလုံးဖြင့် ဖော်ပြသုံးစွဲလာခဲ့ကြသည်။ မည်သည့်အချက်အလက်ကိုမဆို အသုံးပြုခြင်းနှင့် ဖတ်မှတ်ခြင်းမရှိဘဲလက်ခံရယူခြင်း၊ သိမ်းဆည်းခြင်းသို့မဟုတ် ပြောင်းလဲခြင်းတို့ကိုပြုလုပ်ခဲ့လျှင် Noisy data ဟုပင်ခေါ်ဆိုနိုင်သည်။ Noisy data များမှ သိုလှောင်သိမ်းဆည်းနိုင်သောပမာဏကို များစွာမဝါးမြိုနိုင်ရန်နှင့် အဆင်ပြေစွာအသုံးချနိုင်စေရန်အတွက် ကွယ်ဝှက်ထားသော သတင်းအချက်အလက်များနှင့် ပုံစံများကို ခွဲခြမ်းစိတ်ဖြာမှုပြုလုပ်ကြသည်။ ကိန်းဂဏန်းအားဖြင့် ခွဲခြမ်းစိတ်ဖြာမှုတွင် သမိုင်းအချက်အလက်များမှ သတင်းအချက်အလက်များကိုရယူသုံးစွဲရာတွင် noisy data ဟုဆိုသောအရာများကို ဖယ်ရှားသုတ်သင်ပြီးမှ ရယူသုံးစွဲကြသည်။ Noisy data သည် hardware ပျက်စီးမှုကြောင့်သော်လည်းကောင်း ပရိုဂရမ်၌အမှားအယွင်းဖြစ်နေလျှင်သော်လည်းကောင်း၊ အဓိပ္ပာယ်မဲ့စကားများကို ထည့်သွင်း ပေးခြင်းသို့မဟုတ် optical character recognition (OCR) ပရိုဂရမ်များနှင့် အဓိပ္ပာယ်မဲ့အရာများကို ထည့်သွင်းပေးလျှင်လည်းကောင်း ဖြစ်ပေါ်တတ်သည်။ စာလုံးပေါင်းအမှားအယွင်းများ၊ လုပ်ငန်းနယ်ပယ် ဆိုင်ရာ အတိုကောက်စကားလုံးများနှင့် ဗန်းစကားတို့ကဲ့သို့သော အသုံးအနှုန်းများကလည်း စက်၏ဖတ်ရှုခြင်းဆိုင်ရာလုပ်ငန်းစဉ်ကို ကြန့်ကြာစေသည်။

မှတ်ချက်။ အင်တာနက်ဂျာနယ်မှ ကူးယူဖော်ပြထားခြင်းဖြစ်ပါသည်။