ဟိုးအရင် ကာလတွေတုန်းက ကွန်ပြူတာမှာ မြန်မာစာလုံးကို သိမ်းဆည်းတဲ့ အခါမှာ မြန်မာစာလုံး အဖြစ်မသိမ်းဆည်းပဲ အင်္ဂလိပ် စာလုံးနဲ့ ညီမျှတဲ့ နံပါတ် အဖြစ်နဲ့ပဲ သိမ်းဆည်းပါတယ်။ အကယ်၍ ကျွန်တော်တို့ သဝေထိုး (ေ) ကို ရိုက်ပြီး ကွန်ပြူတာ ထဲမှာ သိမ်းမယ်ဆိုရင် ကွန်ပြူတာက သဝေထိုးအနေနဲ့ မသိမ်းပဲ အင်္ဂလိပ်စာလုံး "a" နဲ့ ညီမျှတဲ့ နံပါတ် 97 အနေနဲ့ သိမ်းပါတယ်။ အဲဒီလို စနစ်မျိုး သုံးထားတဲ့ ဖောင့်ကို အက်စကီးဖောင့် (ASCII Font)လို့ ခေါ်ပါတယ်။ အက်စကီး ဖောင့်တွေဟာ တရုတ်၊ ကိုရီးယား ဘယ်ဘာသာ စကားကို မဆို အင်္ဂလိပ် အက္ခရာ ဒါမှမဟုတ် !@ အစရှိတဲ့ သင်္ကေတ (Symbol) တွေနဲ့ ညီမျှတဲ့ ဂဏန်းတွေ အဖြစ် ပြောင်းပြီး သိမ်းပါတယ်။ အက္ခရာ တစ်လုံးကို သိမ်းဖို့ ဂဏန်း ၂ လုံးစာ နေရာ ပေးရပါတယ်။ ဝင်းအင်းဝ၊ ဝင်းကလော ၊ CE စတဲ့ မြန်မာဖောင့်တွေဟာ အဲဒီလို စနစ်မျိုးနဲ့ အလုပ်လုပ်ပါတယ်။ အဲဒါကြောင့်မို့ ဝင်းအင်းဝနဲ့ ရေးထားတဲ့ စာကို မြန်မာ ဖောင့်မရှိတဲ့ အချိန် ဖတ်ရင် အင်္ဂလိပ် စာလုံးတွေ မြင်ရတာပါ။
ယူနီကုတ် စံနှုန်းမှာတော့ ဘာသာစကား တစ်ခုချင်းစီ အတွက် သီးသန့် ဂဏန်း (Codepoint) တွေ သတ်မှတ်ပေးထားပါတယ်။ တကမ္ဘာလုံးမှာ ရှိသမျှ ဘာသာစကားတွေ အတွက် ဂဏန်း ၂လုံးစာ နဲ့ မလောက်တဲ့ အတွက် အခြေ ၁၆ ရှိတဲ့(Hexadecimal) ဂဏန်း ၄လုံး သုံးထားပါတယ်။ အဲဒီအတွက် အက္ခရာ ၆သောင်း ၅ထောင်ကျော် ကို ယူနီကုတ် စနစ်မှာ ကွဲကွဲပြားပြား သိမ်းလို့ရပါတယ်။ မြန်မာစာ နဲ့ တိုင်းရင်းသား ဘာသာစကားများ ဖြစ်တဲ့ ရှမ်း၊မွန်၊ စကောကရင်၊ ပိုးကရင် စတဲ့ ဘာသာစကားတွေ အတွက် ယူနီကုတ် အဖွဲ့ (Unicode Consortium) က ယူနီကုတ်နံပါတ် 4096 ကနေ 4255 (Decimal) အတွင်းမှာ သတ်မှတ်ပေးထားပါတယ်။ အဲဒီတော့ ကျွန်တော်တို့ မြန်မာစာ သဝေထိုး “ေ” ကို ရိုက်ပြီး သိမ်းမယ် ဆိုရင် ယူနီကုတ် စံနှုန်းမှာ နံပါတ် 4145 အနေနဲ့ သိမ်းပေးပါတယ်။ ကမ္ဘာပေါ်မှာ ရှိသမျှ ဘာသာစကားတွေ အားလုံးထဲမှာ 4145 နဲ့ ညီမျှတဲ့ အက္ခရာ ဟာ မြန်မာ အက္ခရာ သဝေထိုး တစ်ခုပဲ ရှိပါတယ်။ အခြား ဘယ်ဘာသာ စကားမှာမှ မရှိပါဘူး။ အဲဒါကြောင့် မြန်မာယူနီကုတ်ဖောင့် မရှိရင် အဲဒီစာလုံးကို လေးထောင့်ကွက် အဖြစ်နဲ့ပဲ မြင်ရပါတယ်။
ဇော်ဂျီနဲ့ ယူနီကုတ် ဖောင့်တွေ ရဲ့ ကွာခြားချက်က အဲဒီမှာ စမြင်နိုင်ပါတယ်။ ယူနီကုတ်ဖောင့် (Myanmar3, Padauk, Parabaik, MyMyanmar) အစရှိတဲ့ ဖောင့်တွေက ယူနီကုတ် အဖွဲ့က Unicode 5.1 Standard မှာ သတ်မှတ်ပေးထားတဲ့ စံနှုန်းအတိုင်း အတိ အကျ လိုက်နာပြီး သတ်မှတ်ထားတဲ့ ဂဏန်းတွေနဲ့ စာလုံးတွေကို သိမ်းပါတယ်။ ဇော်ဂျီကတော့ ကိုယ့်ဘာသာကိုယ် သိမ်းချင်တဲ့ ဂဏန်းနဲ့ သိမ်းထားပါတယ်။ ဇော်ဂျီက သုံးတဲ့ ဇယားနဲ့ ယူနီကုတ် အဖွဲ့က တရားဝင် သတ်မှတ်ပေးထားတဲ့ ဇယား နှစ်ခုကို အောက်မှာ ယှဉ်ပြ ထားပါတယ်။
Unicode 5.1 စံနှုန်း ဇယား
ဇော်ဂျီတွင် သုံးသော ဇယား
ဒါပေမယ့် ရိုက်သမျှ ဂဏန်းကို မြန်မာစာအတွက် သတ်မှတ်ပေးထားတဲ့ ဂဏန်းတွေနဲ့ သိမ်းတိုင်းလည်း ယူနီကုတ်လို့ ပြောလို့ မရပါဘူး။ ယူနီကုတ် ဖောင့်တွေ လိုက်နာရမယ့် အခြား အချက်တွေ ရှိပါသေးတယ်။
ပထမအချက် အနေနဲ့ အခြားစာလုံးနဲ့ တွဲလိုက်လို့ ပုံစံပြောင်းသွားတဲ့ စာလုံးတွေ အတွက် ယူနီကုတ်ဖောင့်က စာလုံးပုံစံကို အလိုအလျောက် ပြောင်းပေးရပါတယ်။ ဥပမာ အားဖြင့် “နိုင်” ဆိုတဲ့ စာလုံးကို လေ့လာကြည့်ပါ။ “နိုင်” ဆိုတဲ့ စကားလုံးကို မြန်မာလို နငယ် လုံးကြီးတင် တစ်ချောင်းငင် င အသတ် ဆိုပြီး ရိုက်ရပါတယ်။ မြန်မာစာမှာ နငယ် အကြီးနဲ့ နငယ် အသေးဆိုပြီး ၂ မျိုး မရှိပါဘူး။ နငယ်က တစ်မျိုးပဲ ရှိပါတယ်။ မြင်ရတဲ့အချိန်မှာသာ နငယ် အကြီးနဲ့ အသေး ကွာသွားတာပါ။
ယူနီကုတ်ဖောင့်တွေမှာ နငယ်ကို တစ်ချောင်းငင်နဲ့ တွဲရိုက်လိုက်တာနဲ့ နငယ်အကြီးကို အသေး (န) အဖြစ် User မြင်အောင် အလိုအလျောက် ပြောင်းပေးပါတယ်။ ဒါပေမယ့် အကြီးပဲ ပြပြ အသေးပဲပြပြ နောက်ကွယ်မှာ နငယ်ကို သိမ်းထားတဲ့ ဂဏန်းကတော့ 4116 တစ်ခုတည်းပါပဲ။ ဇော်ဂျီဖောင့်မှာတော့ အဲဒီလို နည်းပညာ မပါပါဘူး။ နငယ် အသေးကို သပ်သပ် ရိုက်ပေးရပါတယ်။ ဇော်ဂျီဖောင့်မှာ နငယ် အကြီး ရိုက်ရင် 4116 နဲ့ သိမ်းပြီး အသေးရိုက်ရင် 4239 နဲ့ သိမ်းပါတယ်။ Smart Rendering မလုပ်ဘဲ သိမ်းထားတဲ့ အတိုင်း ပြန်ပြီး ရိုက်ပြ ပါတယ်။ ယူနီကုတ် ၅.၁ စံနှုန်းအရ ဇော်ဂျီက “န” အနေနဲ့ သုံးထားတဲ့ နံပါတ် 4239 ဟာ မြန်မာဘာသာ အတွက် သတ်မှတ်ထားတဲ့ ဂဏန်းမဟုတ်ပဲ ပလောင် ဘာသာစကားအတွက် သတ်မှတ်ထားတဲ့ ဂဏန်း ဖြစ်ပါတယ်။
အားလုံး ပြောနေကြတဲ့ ရရစ် ပြသနာဟာ လည်း ဒါပါပဲ။ ဇော်ဂျီမှာ ရရစ် အတွက် ယူထားတဲ့ ဂဏန်း ၈ လုံး တိတိ ရှိပြီး User အနေနဲ့ ကိုယ်သုံးချင်တဲ့ ရရစ်ကို ကိုယ့်ဘာသာကိုယ် ရွေးရပါတယ်။ ရရစ် အတွက် ယူသုံးထားတဲ့ ဂဏန်းတွေကတော့ ရှမ်းဘာသာစကား အတွက် သတ်မှတ်ပေးထားတဲ့ ဂဏန်းတွေပါ။ ယူနီကုတ် ဖောင့်တွေမှာတော့ သူနဲ့ တွဲဆက်ထားတဲ့ အက္ခရာတွေ ပေါ်မူတည်ပြီး ရရစ်က အလိုအလျောက် ပုံစံပြောင်း ပေးပါတယ်။ ရရစ်အတွက် 4156 ဂဏန်း တစ်လုံးကိုပဲ သုံးထားပါတယ်။
ဒုတိယ အချက်အနေနဲ့ ယူနီကုတ်ဖောင့်တွေဟာ User က ရိုက်ထည့်လိုက်တဲ့ ဂဏန်းကို နောက်ကွယ်မှာ စံနှုန်းနဲ့ ညီတဲ့ အစီအစဉ် တကျ ပြန်စီပေးရပါတယ်။ အဲဒါကို Normalization လုပ်တယ်လို့ ခေါ်ပါတယ်။ User အနေနဲ့ “နိုင်” ဆိုတဲ့ စာလုံးကို “န” + “_ိ ”+ “ - ု” + “င” + “- ်” ဆိုပြီး ရိုက်ထည့်လို့ ရသလို “န” + “ - ု” + “_ိ ” + “င” + “- ်” ဆိုပြီး တော့လည်း ရိုက်လို့ ရပါတယ်။ “နိုင်” ဆိုတဲ့ စကားလုံးကို User အနေနဲ့ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) နဲ့ပဲ ရိုက်ထည့်ထည့် “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) နဲ့ပဲ ရိုက်ထည့်ထည့် ယူနီကုတ် ဖောင့်က နောက်ကွယ်မှာ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အဖြစ် ပြန် အစီအစဉ် ချပြီး သိမ်းပေးပါတယ်။ ဇော်ဂျီကတော့ အစီအစဉ် မချပဲ User ရိုက်ထည့်တဲ့ အတိုင်း သိမ်းပါတယ်။
သိမ်းချင်သလို သိမ်းကွာ ဖတ်လို့ရပြီးတာပဲ လို့ ပြောချင်တဲ့သူများလည်း ရှိပါလိမ့်မယ်။ ဖတ်လို့ ရတာ ဟုတ်ပေမယ့် ရှာတဲ့နေရာမှာ ရှော့ခ် ရှိပါတယ်။ ဇော်ဂျီဖောင့်နဲ့ ရှာချင်ရင် အစီအစဉ်တကျ ရိုက်ထည့်ထားတဲ့ စာကိုပဲ ရှာလို့ ရပါမယ်။ လုံးကြီးတင် တစ်ချောင်းငင် နဲ့ ရေးထားတဲ့ စာကို တစ်ချောင်းငင် လုံးကြီးတင် နဲ့ ပြန်ရှာရင်တွေ့မှာ မဟုတ်ပါဘူး။ အဲဒီလိုပဲ တစ်ချောင်းငင် လုံးကြီးတင် နဲ့ ရေးထားတဲ့စာကို လုံးကြီးတင် တစ်ချောင်းငင် နဲ့ ပြန်ရှာရင်လည်း တွေ့နိုင်မှာ မဟုတ်ပါဘူး။
ကွန်ပြူတာနဲ့ ဆက်စပ်ပြီး အလုပ်လုပ်နေသူများအတွက် နောက်ဥပမာ တစ်ခုကို ထပ်ပေးပါမယ်။ ကျွန်တော်တို့ အနေနဲ့ မြန်မာနိုင်ငံ လူဦးရေ စစ်တမ်း ကောက်တဲ့ ဒေတာဘေ့စ် တစ်ခု လုပ်ချင်တယ် ဆိုပါစို့။ လူနှစ်ယောက်ဟာ နာမည်တူ အဖေနာမည်တူ ရှိနိုင်ပေမယ့် မှတ်ပုံတင် နံပါတ်တော့ အတူတူ မရှိနိုင်ပါဘူး။ အဲဒီတော့ လူတစ်ယောက်ကို ဒေတာဘေ့စ်ထဲမှာ ၂ ခါ ပြန်မထည့်မိအောင် ကျွန်တော်တို့အနေနဲ့ မှတ်ပုံတင် နံပါတ် Column ကို Unique Constraint အနေနဲ့ ထည့်ထား လိုက်ပါမယ်။ အဲဒီလို လုပ်တဲ့အတွက် User က မှတ်ပုံတင် နံပါတ် တစ်ခုတည်းကို ၂ ခါပြန်ထည့်မိရင် ဒေတာဘေ့စ်က လက်မခံဘဲ Error ပြန်လာပါလိမ့်မယ်။
အဲဒီ ဒေတာဘေ့စ်ကို ယူနီကုတ် ၅.၁ နဲ့ သိမ်းရင် မှတ်ပုံတင် နံပါတ်က နှစ်ခု မထပ် နိုင်ပါဘူး။ ဥပမာ ၅/စကန(နိုင်)၀၀၀၀၀၀ ဆိုတဲ့ မှတ်ပုံတင် နံပါတ်ကို ဒေတာဘေ့စ်ထဲမှာ တစ်ကြိမ်ပဲ ရိုက်ထည့်လို့ ရပါမယ်။ (နိုင်) ကို ရိုက်ထည့်တဲ့သူက “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အစီအစဉ် နဲ့ ရိုက်ရိုက် “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) အစီအစဉ်နဲ့ ရိုက်ရိုက် ယူနီကုတ်ဖောင့်က Normalize လုပ်ပေးတဲ့အတွက် နောက်ဆုံးမှာ ဒေတာဘေ့စ်ထဲကို “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အစီအစဉ်နဲ့ပဲ ဝင်သွားပါလိမ့်မယ်။ ဇော်ဂျီနဲ့ ရိုက်ထည့်လို့ User က (နိုင်) ကို မှားယွင်းပြီး ရိုက်ထည့်ရင် “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) နဲ့ တစ်ခါ “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) နဲ့တစ်ခါ မှတ်ပုံတင် နံပါတ် တစ်ခုတည်းကို ၂ ခါဝင်သွား နိုင်ပါတယ်။ လူဦးရေ စာရင်းလို သန်းဂဏန်း နဲ့ ရှိတဲ့ ဒေတာတွေထဲမှာ အဲဒီလို အမှားမျိုး မတော်တဆ ဖြစ်ခဲ့ရင် ကျွန်တော်တို့ အမှားကို တွေ့အောင် ရှာနိုင်ပါ့မလား။
အဲဒီဒေတာဘေ့စ်ကို ယူနီကုတ် ၅.၁ နားလည်တဲ့ ဒေတာဘေ့စ် (ဥပမာ MySQL Latest Version) အဖြစ် Convert လုပ်ရင် Error တက်ပါလိမ့်မယ်။ Database ထဲမှာ အစီအစဉ်တကျ သိမ်းထားတဲ့ စာက ပြသနာ မရှိပေမယ့် Normalize မလုပ်ဘဲ သိမ်းချင်သလို သိမ်းထားတဲ့စာကိုတော့ Database က သူနားလည်သလို Unicode Normalization လုပ်ပါလိမ့်မယ်။ အဲဒီအချိန်မှာ နံပါတ် ၂ ခု အတူတူ ဖြစ်သွားတဲ့ အတွက် Unique Constraint ကို ချိုးဖောက်မိပြီး ဒုက္ခနဲ့ လှလှ တွေ့ပေးနိုင်ပါတယ်။
ကျွန်တော် အရင်ပို့စ်မှာလည်း Database ထဲက Unicode Normalization အကြောင်း ပြောခဲ့ဖူးပါတယ်။ ဒေတာဘေ့စ်က မြန်မာစာလုံးတွေကို Normalize လုပ်ပေးတယ် ဆိုပေမယ့် ကိုယ်မှန်းထားတဲ့ အစီအစဉ်အတိုင်းတော့ ဝင်သွားဖို့တော့ မလွယ်ပါဘူး။ ဒေတာဘေ့စ်က မနောမယ ဒေတာဘေ့စ် ဖြစ်နေမယ် ဒါမှမဟုတ် ဒေတာဘေ့စ် အက်ဒမင်က ဒေးဗစ်ကော့ပါးဖီး ဖြစ်နေမယ် ဆိုရင်တော့လည်း တစ်မျိုးပေါ့။ :D
နောက်တစ်ခု ကွာတာကတော့ “က္က” လိုမျိုး ပါဌ်ဆင့် တွေ ရိုက်တဲ့ နေရာမှာပါ။ ပါဌ်ဆင့်တွေ အတွက် ယူနီကုတ်မှာ ဂဏန်း သတ်သတ် ပေးမထားပါဘူး။ ယူနီကုတ် စံနှုန်း အရ ပါဌ်ဆင့်နှစ်ခု ရဲ့ ကြားမှာ 4153 ဆိုတဲ့ ဂဏန်းကို ထည့်ပြီး သိမ်းပါတယ်။ ဖောင့်က 4153 ဆိုတဲ့ ဂဏန်းကို တွေ့ရင် ရှေ့နောက် ဂဏန်း နှစ်လုံးကို ဆက်ပြီး သူ့အလိုအလျောက် ပါဌ်ဆင့် အဖြစ် ရိုက်ပြ ပါတယ်။ ဥပမာ “က္က” ဆိုတဲ့ စာလုံးကို သိမ်း ချင်ရင် ယူနီကုတ် စံနှုန်းမှာ က ရဲ့ နံပါတ်က 4096 ဖြစ်တဲ့ အတွက် “4096 + 4153 + 4096” ဆိုပြီး သိမ်းပါတယ်။ User အနေနဲ့လည်း ကီးဘုတ်ပေါ်မှာ ~ အက္ခရာတွေ “Ctrl + Alt” တွေ ရိုက်စရာ မလိုဘဲ ပါဌ်ဆင့်ရဲ့ ဒုတိယ အက္ခရာ မရိုက်ခင်မှာ “4153” နဲ့ ညီမျှတဲ့ “Shift + f ” ကို ကီးဘုတ်ပေါ်ကနေ ရိုက်ထည့် လိုက်ရုံပါပဲ။ “က” + “Shift +f ” + “က” ဆိုရင် ကကြီး နှစ်လုံးဆင့် ဖြစ်ပါတယ်။
ဇော်ဂျီမှာတော့ ပါဌ်ဆင့်တွေကို ပါဌ်ဆင့်အတိုင်း သိမ်းပါတယ်။ အဲဒီအတွက် မြန်မာစာ အတွက် မဟုတ်ဘဲ ကရင် ဘာသာစကားအတွက် သတ်မှတ်ထားတဲ့ ဂဏန်း 4192 ကနေ 4220 အတွင်းက ဂဏန်းတွေကို ယူသုံးပြီး သိမ်းပါတယ်။
ဒီလောက်ဆိုရင် ဇော်ဂျီနဲ့ ပတ်သက်တဲ့ ဒဏ္ဍာရီ အများစုကို ရှင်းရှင်းလင်းလင်း သိကြပြီလို့ ထင်ပါတယ်။
အများမေးနေကြမေးခွန်းကလေး တွေကို အဆစ်အနေနဲ့ ဖြေပေးလိုက်ပါ့မယ်။
(၁) ဇော်ဂျီက ယူနီကုတ်ထက် ဘာလို့ ပိုမြန်အောင် Render လုပ်နိုင်ရတာလဲ။
ကျွန်တော်ခုန ပြောခဲ့တဲ့ ယူနီကုတ်ရဲ့ မရှိမဖြစ် စံနှုန်း Smart Rendering တွေ၊ Normalization တွေ ကို ဇော်ဂျီက တစ်ခုမှ လုပ်မထားတဲ့ အတွက် အဲဒီ နည်းပညာ ထည့်ထားတဲ့ ဖောင့်တွေနဲ့ ယှဉ်ရင် ပိုမြန်နေရတာပါ။
(၂) ယူနီကုတ် ဖောင့်တစ်ခုနဲ့ ရိုက်ထားတဲ့စာကို တခြားဖောင့်နဲ့ ကြည့်လို့ ရလား။ မြန်မာ ယူနီကုတ် စနစ်က လုံးဝ ပြည့်စုံပြီလား။
ယေဘူယျအားဖြင့် မြန်မာ ၃ နဲ့ ရိုက်ထားတဲ့ စာကို ပိတောက်နဲ့ ကြည့်လို့ရသလို ပိတောက် နဲ့ ရိုက်ထားတဲ့ စာကို မြန်မာ ၃ နဲ့ ကြည့်လို့ရပါတယ်။ အလားတူပဲ ယူနီကုတ် စံနှုန်းကို လိုက်နာတဲ့ ပုရပိုက်၊ မိုင်မြန်မာ စတဲ့ ဖောင့်တွေကို လည်း အလဲလဲ အလှယ်လှယ် သုံးလို့ရတယ်။ ကျွန်တော် ယူနီကုတ် သုံးရင် မြန်မာ ၃ ကီးဘုတ်နဲ့ ပိတောက်ဖောင့်ကို တွဲသုံးလေ့ ရှိပါတယ်။
စံနှုန်းကို လိုက်နာထားတယ် ဆိုပေမယ့် အဲဒီဖောင့်တွေမှာ ကွဲလွဲချက်လေးတွေ အနည်းအကျဉ်းတော့ ရှိနေပါတယ်။ ကျွန်တော်သိသလောက် ပြောရမယ် ဆိုရင် တစ်ချို့ ဆော့ဖ်ဝဲလ်တွေ ဝက်ဘ်ဆိုက်ဒ်တွေက ယူနီကုတ် ၅.၁ စံနှုန်းက အပြည့်အဝ အထောက် အပံ့ မပေးသေးပါဘူး။ အဲဒီတော့ Myanmar3 ကလွဲပြီး အခြားဖောင့်တွေမှာ အဲဒီလို နေရာတွေမှာ ကြုံရတတ်တဲ့ Bug တွေကို ရှောင်နိုင်ဖို့ အတွက် Workaround လုပ်ထားတာတွေ ပါပါတယ်။ အဲဒီတော့ သိမ်းဆည်းတဲ့ စနစ် (Storage) မှာ တူကြပေမယ့် ပြသတဲ့ စနစ် (Rendering) မှာတော့ ကွဲပြားမှုတွေ ရှိပါတယ်။ တချို့ Site တွေ (ဥပမာ Myanmar Wikipedia) ကို Myanmar3 နဲ့ ကြည့်မယ်ဆိုရင် တစ်ချို့ စာလုံးတွေ မှန်မှန်ကန်ကန် မပြနိုင်တာ တွေ့ရပါလိမ့်မယ်။ တခြားဖောင့်တွေနဲ့ ဆိုရင်တော့ အဆင်ပြေပါတယ်။ ဆော့ဖ်ဝဲလ်တိုင်းကလည်း Unicode 5.1 ကို သုံးလို့ မရပါဘူး။ ဥပမာ လူသုံးများတဲ့ Adobe Photoshop ပေါ်မှာ ယူနီကုတ် ၅.၁ ကို သုံးလို့ မရပါဘူး။
ယူနီကုတ် ၅.၁ ကို ရယူနိုင်တဲ့ နေရာတွေကို အောက်ကလင့်ခ်မှာ သွားကြည့်နိုင်ပါတယ်။
http://my.wikipedia.org/wiki/Wikipedia:Font#Unicode_5.1_Myanmar.2FBurmese_fonts
ကီးဘုတ်၊ ဖောင့်နဲ့ ကွန်ဗာတာ တွေအကြောင်းကို နောက်ပို့စ်မှပဲ အသေးစိတ် ရေးပါတော့မယ်။
Reference: http://my.wikipedia.org/wiki/Wikipedia:Font
46 comments:
ကွန်ပျုတာလည်း နားမလည် ဖောင့်တွေလည်း မတတ် ခုမှမြန်မာစာရိုက်တတ်တာ မကြာသေးပါ...သိတာတွေမျှဝေပေးတဲ့အတွက် ကျေးဇူးအများကြီးတင်ပါတယ်....နောက်မှသေချာထပ်လာဖတ်ပါ့မယ်...
mie nge
ဆက်ချီတက် ...
သူတို့က Unicode မဟုတ်တာကို ဟုတ်ပါတယ်လို့ ပြောရင် သူတို့မှာ ဘာအကျိုးရှိနိုင်သလဲ ဆိုတာ တွေးနေမိပါတယ်။
ဦးနှောက်က မတွေးတတ်အောင် ဝေးနေတယ်ဆိုလဲ ခွင့်လွှတ်ပါ။ တကယ်ကို စဉ်းစားမရလို့ပါ။ technical ပိုင်းတွေတော့ သိပ်နားမလည်ပါဘူး။
ဟိုဘလော့မှာ စွပ်စွဲထားသလို တိုင်းရင်းသား ဘာသာစကား ဘာညာကွိကွ ကိစ္စလဲ စွပ်စွဲထားသလို ရည်ရွယ်ပြီး လုပ်တယ် မထင်ပါဘူး။ သူတို့ အလွယ်လိုက်တယ်ပဲ ထားပါတော့ ...
နောက်ဆက်တွဲ သူတို့ ဘာရနိုင်လို့လဲ။
ဒီရက်ပိုင်း ဒီကိစ္စတယ်လည်း ပေါ်ပြူလာ ဖြစ်နေပါလား ဟဲဟဲ။ ကျွန်တော်လည်း ပြောမယ်ဆိုရင် myanmar 1 ကတည်းက သုံးလာတာပါ နောက်တော့ myanmar 2, myanmar 3 တွေလည်း ဆက်တိုက်သုံးတာပါပဲ။ သူငယ်ချင်း တစ်ယောက်က ရှမ်းယူနီကုတ် လုပ်တာကိုတောင် ကူလုပ်ပေးဖူးပါသေးတယ်။ အခုလည်း ဂဃနဏ ရေးထားတာတွေ့လို့သာ ဝင်ပြီးကော့မင့်ရေးတာပါ။ တစ်ချို့ကျတော့ ဘာလို့မှန်းလည်း မသိပဲနဲ့ ဇော်ဂျီပဲလို့ အော်တဲ့လူကလည်း များသဗျ။ ကျွန်တော်လည်း အိမ်မှာဆိုရင် ဇော်ဂျီကို သုံးလေ့မရှိပါဘူး။ ဘလော့တစ်ခုပဲ ဖတ်တဲ့လူတွေက ဇော်ဂျီဖြစ်နေလို့ မသုံးမဖြစ် သုံးထားတာပါ။ ဒါမှ တစ်ကယ်တန်း ပြောင်းမယ်ဆိုရင် ကိုယ်ဟာတွေကို ပြောင်းဖို့လွယ်အောင်လို့ပါ။ myanmar 3 သုံးနေကျလူက ဇော်ဂျီကို သုံးချင်စိတ်ကို မရှိတာပါ ရိုက်ရတာကိုပဲ အင်မတန်လွယ်ပါတယ်။ ကျွန်တော်မြင်တာကတော့ မြန်တာတွေ ဘာတွေဘေးနည်းနည်းချိတ်ဗျာ လှတာတစ်ခုတည်းနဲ့ သုံးနေကျတာပါ။ ၅.၁ ကဖောင့်တွေလည်း ဟိုကောင့်ထက် လှအောင်ဆွဲဖို့ ကောင်းတယ်ဗျ။ နောက်ထပ် အရေးကြီးတာက Keyman အပေါ်မှာ မမှီခိုသင့်တော့ဘူး ကိုယ်ပိုင် Input လုပ်သင့်ပြီဗျ။ သူတို့နဲ့ အဆက်အစပ်မရှိတော့ လုပ်နေမလုပ်နေတော့ မသိဘူးဗျာ။
Please explain further so that layman can understand. Thanks for your post.
ကိုလူပျိုကြီးပြောတာတစ်ခုကို သဘောကျတယ် (ကျန်တာတွေတော့မကျတာမဟုတ်ပါဘူး :) ) Keyman ပေါ်မမှီခိုသင်တော့ဘူးဆိုတာ အရမ်းမှန်ပါတယ်။ ကျွန်တော်အပါအဝင် သုံးတဲ့သူအများစုက Unicode ဆိုတာကို နားလည်ကြတာမဟုတ်ပါဘူး။ အဲဒီတော့ unicode 5.1 ဆိုတာကြီးသုံးမယ်ဆိုရင်တောင် တစ်ဆင့်ထဲမပြီးနိုင်ဘူး။ ဟိုဟာဒေါင်းလုပ်လုပ်ပါ၊ ဒီဟာလုပ်ပါနဲ့ ဖြစ်နေရော။ ဇော်ဂျီနဲ့ ဘာကွာလဲဆိုတာ အဲဒါပါ။ ဇော်ဂျီဆိုရင် မင်းစာဖတ်ချင်လား ဒီ font သွင်းလိုက် စာရိုက်ချင်လား ရော့ဒီမှာ instraller ဆိုပြီး တစ်ချက် click လိုက်ရုံပါပဲ။ သုံးတဲ့သူဆိုတာ လွယ်တာ အဆင်ပြေတာကိုပဲ သုံးမှာပါ။ အဲဒီတော့ အကောင်းဆုံးအဆင်ရောက်အောင် ကြိုးစားဖို့ကလွဲပြီး ကြော်ငြာနေစရာမလိုပါဘူး။ ကောင်းတယ်ဆို လိုက်သုံးလာကြာမှာပါ။
BTW, thx for your explanation.
ကိုဇက်တီရေ
ဗဟုသုတတွေ ယူသွားတယ်ဗျ ခုလိုသေသေချာချာလေး ပြောပြလို့ thanks
ခင်မင်စွာဖြင့်
သီဟသစ်
ကိုဇက်တီရေ..
လေ့လာမှတ်သားသွားပါတယ်..
ဒီရှင်းပြထားတာက ကောင်းပါတယ်။ ဒါပေမယ့် ဒီအကြောင်းကိုပဲ ခဏခဏ ရှင်းပြနေပုံထောက်တော့ ZT မှာ စီပွားရေးနဲ့ပတ်သက်တဲ့ အကြောင်းတခုခုတော့ရှိမယ်ထင်ပါတယ်။
ဖောင့်နဲ့စီးပွားရေးလုပ်စားလို့ရတယ်ဆိုတာသိကြလို့ ယူနီကုဒ်အော်ပြီး ပိုက်ဆံအကုန်ခံ ဖောင့်တွေလုပ်လာကြတယ်။ နောက်ပြီးတော့ ကိုယ့်ဖောင့်ကိုလူသုံးများလာအောင် ကြိုးစားကြတယ်။ ဒါပေမယ့် သုံးရလွယ်တဲ့ဇော်ဂျီကို လူအများသဘောကျသုံးထားတော့ တိုးလို့မရဘူးဖြစ်နေတယ်။ အဲဒါကို ကိုယ်ဖောင့်ကို သုံးရလွယ်အောင် လှပအောင်မကြိုးစားပဲ ဇော်ဂျီကို တိုက်ခိုက်တဲ့ နည်းတွေသုံးလာကြတယ်။ သဘောကတော့ မင်းသားကြီးမလုပ်ရမယ့်အတူတူ ပတ်မကြီးပဲဖောက်တော့်မယ်ဆိုတဲ့ သဘောပါပဲ။
ဘောလုံးစကားနဲ့ ပြောရမယ်ဆိုရင််တော့ ZT က ကလပ်အသင်းတွေထောင် ပိုက်ဆံတွေသုံးပေမယ့် ဝါသနာရှင်အသင်းဖြစ်တဲ့ ဇော်ဂျီကို မနိုင်ဖြစ်နေတော့ ဇော်ဂျီအသင်းကန်တာ နည်းစနစ်မကျဘူး ငါတို့ကန်တာကျမှ နည်းစနစ်ကျတာ။ ဒါပေမယ့် ZT အသင်းက ဂိုးမသွင်းနိုင်ပဲ ဇော်ဂျီကပဲ သွင်းသွင်းသွားလို့ ခဲမနိုင်ကြိတ်မရဖြစ်နေတာနဲ့တူနေပါတယ်။
လူတွေကို မနက်ဖြန်ပဲ ဇော်ဂျီသုံးရင် ဒုက္ခတွေ့တော့မလိုလိုရေးနေပြီး ကိုယ်တိုင်ကျတော့ ဇော်ဂျီကိုပဲသုံးနေတာကတော့ သိပ်ပြီးတော့ သဘာဝမကျပါဘူး။ ဘယ်သူကမှ ဇော်ဂျီဖောင့်ကိုပဲသုံးပါလို့ ပြောမနေပါဘူး။ အဲဒါကို ဇော်ဂျီသုံးလို့ ဒုက္ခရောက်မယ် ခဏခဏပြောနေတော့ စေတနာထက် နောက်မှာအကြောင်းရှိလို့ဖြစ်မယ်လို့ ယူဆတယ်။ ကိုယ်ဘယ်လိုကောင်းအောင်လုပ်မယ်ပဲ ရေးသင့်ပါတယ်။ သူများမကောင်းတာတွေချည်း ရေးတာများတော့ စဉ်းစားစရာဖြစ်နေပါပြီ။
စဉ်းစာမနေပါနဲ ့ ဗဟုသုတ ကို ဗဟုသုတ ပဲ မှတ်ပေါ့..
တကယ်လို ့ ကို zt က စီးပွားရေးလုပ်တော့ ရော ကိုယ်သုံးချင်မှ ဖြစ်တဲ့ဟာ ကို.. anonymous လျှောက်ပြောနေတယ်..
ကျွန်တော့်ရဲ့ ပရော်ဖက်ရှင်က အင်ဂျင်နီယာပါ။ ကျွန်တော့် အသက်မွေး ဝမ်းကြောင်းနဲ့ ယူနီကုတ် ဘာမှ ပတ်သက်မှု မရှိပါဘူး။ မြန်မာစာကို စီးပွားရေးဆန်ဆန် လုပ်စားဖို့လည်း အစီအစဉ် မရှိပါဘူး။ ဒါပေမယ့် စီးပွားရေး မဆန်တဲ့ ယူနီကုတ် ပရော့ဂျက် တွေမှာ ပါဝင် နေတယ် ဆိုတာကိုတော့ ကျွန်တော် ဝန်ခံပါတယ်။
မြန်မာစာကို ကမ္ဘာ့အဆင့်အတန်းမီ ဖြစ်စေချင်တဲ့ ရည်ရွယ်ချက် တစ်ခုပဲ စိတ်ထဲမှာ ရှိပါတယ်။ အဲဒီအတွက်လည်း ကိုယ်တတ်နိုင်တဲ့ ဘက်က လုပ်ပေးဖို့ စဉ်းစားထားပါတယ်။
အခုလက်ရှိ ဇော်ဂျီနဲ့ ပတ်သက်ပြီး ကျွန်တော် မြင်နေတဲ့ ပြသနာတွေကို မြင်တဲ့ အတိုင်း ချပြတာပါ။ ကျွန်တော် ချပြခဲ့တဲ့ ပြသနာတွေ တကယ် ဖြစ်နိုင် မဖြစ်နိုင်ဆိုတာကို ကိုယ်တိုင် နားမလည်ရင် နည်းပညာ နားလည်တဲ့သူတွေနဲ့ Double-check လုပ်ကြည့်နိုင်ပါတယ်။
ဘလော့ဂါ တစ်ယောက်အနေနဲ့ ဖတ်တဲ့သူ အဆင်ပြေဖို့ လောလောဆယ် ဇော်ဂျီကို သုံးပါတယ်။ အခုလက်ရှိ ကိုယ်သုံးနေတဲ့ ဖောင့်ဖြစ်ပေမယ့် ဇော်ဂျီ မကောင်းရင်တော့ မကောင်းဘူးပဲ ပြောရမှာပါ။ မကောင်းတာကို မြင်ရဲ့သားနဲ့ မကောင်းဘူးလို့ မရေးရင် ကျွန်တော် ဘယ်လို သွားရေးရမှာလဲ။ ပုံပြင်ထဲက ယုန်လို နှာစေးချင်ယောင် ဆောင်နေတာတော့ ကြာခဲ့ပါပြီ။ ဘာမီတွန် လာတိုက်တဲ့သူ ရှိတော့လည်း နှာစေးချင်ယောင် ဆက်ပြီး ဆောင်လို့ မရတော့ပါဘူး။
ကျွန်တော့် ဘလော့ခ်ကို ယူနီကုတ် ပြောင်းဖို့ စမ်းသပ်နေပါတယ်။ အလွယ်တကူ ပြောင်းနိုင်တဲ့ နည်းလမ်းကို စမ်းသပ်လို့ရရင် ကျွန်တော်နဲ့ အတူတူ ယူနီကုတ် ပြောင်းချင်တဲ့ ဘလော့ဂါတွေကို ရသလောက် ဆွဲခေါ်သွားမှာပါ။ လောလောဆယ်တော့ ပို့စ်တွေကို ဇော်ဂျီနဲ့ ရေးပြီး ငါးကြင်းဆီနဲ့ပဲ ငါးကြင်းကြော်နေပါတယ်။ ကွန်မင့်တွေ ဖတ်ကြည့်ရင် ပြောင်းချင်တဲ့ စိတ်ရှိသူဟာ ကျွန်တော် တစ်ယောက်တည်း မဟုတ်ဘူး ဆိုတာ သိနိုင်ပါတယ်။
ကို ဇက်တီရေ...
လွိုင်လင်ကတည်းက ကိုဇက်တီရေးတာတွေသဘောကျတယ်..။ ယူနီကုဒ်နဲ့ပတ်သက်ပြီး တကူးတက ရှင်းပြပေးတာ ကျေးဇူးတင်ပါတယ်...။ ယူနီကုဒ်စစ်စစ်တွေ ဖြစ်လာကြရင်ဘယ်လောက်ကောင်းမယ်ဆိုတာ ဥပမာလေးတွေ ပေးတာသဘောကျပါတယ်..။
နည်းပညာပိုင်းဆိုင်ရာတော့ နားမလည်ဘူး..။ ကျွန်တော် အားမရတာကတော့ ကျွန်တော်တို့ မြန်မာစာကို မြင်ချင်ရင် ဆော့ဖ်ဝဲ တွေ install လုပ်နေရတာကိုပဲ...။ နောက်ပြီး ဝီကီပိဒိယ မှာ မြန်မာစာမျက်နှာ ကောင်းကောင်းမရှိတာပဲ..။ မြန်မာတိုင်းကြိုက်ကြတဲ့ ကမ္ဘာပေါ်က ဖောင့်တွေနဲ့ တန်းတူရှိတဲ့ ဖောင့်တစ်မျိုးလောက် မြင်ချင်တယ်ဗျာ...။ ့ဒီပညာရပ်နဲ့ပတ်သက်တဲ့ ပညာရှင်တွေ မြန်မာမှာ မနည်းဘူးဆိုတာ ကျွန်တော် မှန်းဆသိသိပါတယ်..။ စုစုစည်းစည်းနဲ့ အကောင်းဆုံးတစ်ခု ထွက်လာအောင် လုပ်နိုင်မယ့်နေ့ကိုမျှော်လင့်မိပါတယ်..။ ဂျာမန်စာကို ကျွန်တော်နားမလည်တိုင်း ဂူဂဲ translator သုံးပြီး အင်္ဂလိပ်လိုဖတ်နေရတယ်ဗျာ..။ဘလော့ပိုစ့်တွေကို တခြားဘာသာတွေကနေမြန်မာ၊ မြန်မာကနေ တစ်ခြားဘာသာတွေ တိုက်ရိုက်ပြန်နိုင်မယ့်နေ့ကို လည်းမျှော်လင့်ပါတယ်..။ အဟီးရှည်သွားလို့ခွင့်လွှတ်ပါ..။
Hello Ko ZT
Thank you for your post about Unicode.
At the moment I dont have Myanmar font and I dont know any knowledge of how to install unicode in my computer.
Kindly request to you,please explain how to install correctly unicode which you linked in your post.
I just installed and save my C and then what should I have to do so far.
Do I need to chang any setting in font in control panel or add other language?
I dont know any more . Please.
Thanks in advanced.
One who likes Unicode
ကျနော်တို့ user အနေနဲ့ ရေရှည်သုံးစွဲနိုင်မယ်. စံနှုနု်းလည်းရှိမယ်.. သုံးစွဲရတာလည်လွယ်ကူမယ့် ဖောင့်မျိုးကို သုံးမှာပါ။ ညင်သာတဲ့ အပြောင်းအလဲဖြစ်ဖို့တော့ လိုမယ်ထင်တယ်.. နည်းပညာရှင်တွေ ဖြေရှင်းနိုင်မယ်လို့လည်း ယုံကြည်တယ်..
ပိုစ့်အတွက်လည်း ကျေးဇူးတင်ပါတယ်..
ဗဟုသုတတွေ မျှဝေပေးလို့ ကျေးဇူးပါ..။ ဘာမှလဲ မသိခဲ့ပါဘူး..လူတိုင်း ဇော်ဂျီလိုလို ဖြစ်နေတော့ နောင့် တို့ဘာမှ မသိတဲ့ လူတွေကလဲ သုံးရလွယ်တဲ့ ဇော်ဂျီပေါ့...ဒါပေမယ့် ဒီ့ထက်..ပိုကောင်းတဲ့ အရာတွေ လာရင်လဲ ... လူတွေ ရဲ့ သဘာဝ ပိုကောင်းတာကို ..ပဲ လိုက်လုပ်ကြမှာပါ ကိုZT...ကြိုးစားပေးပေါ့... း)
ခင်တဲ့
မေဇင်
If I understand correctly the post, the whole main point is user have to use unicode 5.1 compatible font since user are the one whole generate the original corpus.. And ZawGyi has to be REAL unicode 5.1 compatible.
Here are a few question I have, I really don't know about it and interested to find some possible solutions..
1. If ZawGyi become unicode compatible font, How about exisitng corpus which are already in old ZawGyi codepoint?
2. When is the normalization done in Unicode font? After typing a word or save the whole corpus or some other situations?
Best Regards,
/awm
AWM-> Thanks for your interest. The answer for your questions are as follows:
1. All the text that currently written in Zawgyi codepoint need to be converted to Unicode 5.1 compatible codepoint. Currently, there is a standalone converter call "KaNaung" which is available in open source. We also have a plan to release another standalone converter with open source soon.
2. Unicode normalization is done after typing before saving the documents.
Feel free to raise questions if you have any doubt.
အတော်စုံစုံလင်လင် သေသေချာချာ သိရတာပဲ.. ကျေးဇူး ကိုဇက်တီ
အတူတူ ယူနီကုတ် ပြောင်းချင်တဲ့ ဘလော့ဂါတွေကို ရသလောက် ဆွဲခေါ်သွားမှာပါ။
ဆွဲခေါ်ပါ ဆွဲခေါ်ပါ... း)
Ko ZT, thanks for your fast response.
If we can convert the existing ZawGyi Code point to Unicode with "KaNaung" converter, I think we no need to blame ZawGyi for now.. BUT need to promote/distribute ideas of why we should use Unicode.
For Tenhnical,
1. Can "KaNaung" be part of crawler? just for myanmar search engine. (google won't bother it and zawgyi code point will corrupt in google, so user know that they need to change to unicode).
2, Can "KaNaung" be plug-in for Application ? (like your example, Population Database Application)
3. If typing in Unicode is slow due to normalization & smart rendering, can't the code can be fine-tune? We also need to find out why user are insisting to use Unicode.
We can use 1 & 2 approach, until one of unicode 5.1 compatible & user friendly font emerge.
I agreed ZawGyi need to modify (at least for normalization) but it is really hard to find out who is the owner of ZawGyi is, and seems no one has full responsibilities for it.
Just my 2 cents,
/awm
Could you please point me out where I can get Myanmar3 source code since it is saying opensource. My google skill is bad for this.. :-)
AWM-> I will leave Q1,2 & 3 for now. I don't want to pretend to know everything. :) I will leave it for the experts (like Ko Soe Min or Ko Ravi) to answer it.
To be frank, I also don't know where they keep Myanmar3 Source code. :D But I can point you out where you can get source code for other Unicode 5.1 compatible fonts.
1) Parabaik font with source code is available with OFL (Open Font License) from http://www.parabaik.info/
2)Padauk font with source is available at http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&id=Padauk
Parabaik is Open Type Font (same type as Myanmar3) and Padauk is Graphite font.
Now I think only weak point in Unicode font is its look. But I don't understand why people still claiming that Unicode fonts are not user-friendly. Maybe, lack of user guide or instructions. I will find out.
Btw, you sound like AWM who regularly posting in MMITP.
Yes, I am indeed.. but posted sometime. :-)
Your post have much collaborative info then following all the unicode & zawgyi problem in forums. So I post my though here, sorry for it.
I will try to forward my email to you that was suggest by Seth (Wait-Zar Developer).. Don't be surprise if you receive forward email from one of your friends since I don't have direct contact to you.. :-)
After that you will know why I post questions here..
best regards,
/awm
@ko zt :
Thx for raising this with your excellent writing ko zt.
@awm :
1,2,3 all cannot.
for 1,2 , kanaung is old project, and i stop developing, and i will not do open-sourcing anymore on my later programs normally, coz of copy cat ppl like okisan(let me know if you dont now what i am telling). there is newer one called myanmar text tools, but it is testing, so i cannot gurantee anything.
3, is written mainly by microsoft, pango,qt developers, not us, there is pango mm patch by tmhtet though, but you cannot tell them like microsoft to make it fast.
@both
all the fonts are editable by fontforge, regardless of license.
licensing is different, like you can redistribute or not, commercial or not. you can do everything in your computer, unless you tell or distribute to others.
rgds,
mark
FYI
ယူနီကုတ် ၅.၁ သည် ယူနီကုတ်၊ ဒါပေမယ့် ယူနီကုတ်သည် ယူနီကုတ် ၅.၁ တစ်ခုတည်းမဟုတ်
ကို ZT ရေ ..
ဒီပို့စ် လေးအတွက် တကယ်ကျေးဇူးပါ..
လွယ်တာသုံးကြတာကို အပြစ်မပြောလိုပေမဲ့
ခေတ်မီမီ ကမ္ဘာကြည့်ကြည့်မြင် ကြ ဘို့လိုပါတယ်..
အားလုံးတက်ညီလက်ညီ ရှိကြရင် ဘယ်လောက်ကောင်းမလဲ နော်
ခုတော့ အဆိုးမြင်ကြ တယူသန်နဲနဲ ဆန်ကြတဲ့ ကွန်မန့်တချို့ဖတ်ရတာ စိတ်မကောင်းတော့ဖြစ်မိပါတယ်..
မြန်မာ ယူနီကုဒ် အမြန်ဆုံးတွင်ကျယ်အောင်မြင်ပါစေ..
အားပေးလျှက်ပါ
ချစ်စု
ko ZT, thanks and still waiting to Change, some of my friend also waiting the right time.
Timing is really important. :D
@Mark
ဇော်ဂျီကို ယူနီကုတ်ဖောင့်အဖြစ် နာမည် မတပ်ချင်တဲ့ အကြောင်း က ဒီလိုပါ။
၂၀၀၃ ခုနှစ်က ပထမဆုံး မြန်မာယူနီကုတ် ပရော့ဂျက် မန္တလေး (http://sourceforge.net/projects/mandalay/) မှာ ကျွန်တော် ပရိသတ် တစ်ယောက်အနေနဲ့ ပါခဲ့ဖူးပါတယ်။ (မင်ဘာ ဖြစ်ပေမယ့် ဘာမှ ပံ့ပိုးမှု မပေးနိုင်ခဲ့လို့ ပရိသတ်လို့ ပြောတာ ပိုသဘာဝ ကျပါတယ်။) အဲဒီအချိန်ကတည်းက Smart Rendering နဲ့ ပတ်သက်တဲ့ ကန့်သက်ချက်တွေကို ယူနီကုတ် စံနှုန်းထဲမှာ ဖတ်ခဲ့ရဖူးပါတယ်။ အက္ခရာတစ်ခုဟာ နေရာပြောင်း ပုံစံပြောင်းတာနဲ့ Codepoint အသစ်တစ်ခု ထပ်မယူရဘူး ဆိုတဲ့ ကန့်သတ်ချက်မျိုးပါ။ အဲဒီ ကန့်သတ်ချက် ဟာ ဘာသာစကားတိုင်း လိုက်နာရမယ့် ကန့်သတ်ချက် ဖြစ်ပြီး မြန်မာ အက္ခရာတွေ ယူနီကုတ် ဇယားမှာ ပါမလာခင်ကတည်းက ရှိခဲ့ပါတယ်။ (Normalization ပါမပါတော့ သေချာ မမှတ်မိပါ။)
အဲဒါကြောင့် မြန်မာ ယူနီကုတ် ဖောင့်တိုင်းဟာ ယူနီကုတ် နာမည် တပ်ချင်ရင် အဲဒီလို ကန့်သတ်ချက်ကိုတော့ အနည်းဆုံး လိုက်နာဖို့ လိုတယ်လို့ ကျွန်တော့် အနေနဲ့ ယူဆပါတယ်။ ဒါကြောင့် ကျွန်တော့် အနေနဲ့ မြစေတီ၊ ဇော်ဂျီ၊ BIT စတဲ့ဖောင့်တွေကို ယူနီကုတ်ဖောင့် အနေနဲ့ လက်မခံနိုင်တာပါ။
ကျွန်တော်ကတော့ Annonymous ပြောသွားသလိုပဲ MM3 တွေ MM2 တွေကို သုံးကြပါလို့ ပြောမယ့်အစား ZAWGYI ကို ဘယ်လို ဖြတ်ကျော်နိုင်မလဲပဲ စဉ်းစားစေချင်ပါတယ်... User ဆိုတာကတော့ Ready ဖြစ်တာကို ပိုသဘောကျပါတယ် ... Unicode တိုင်းသာကောင်းမယ်ဆိုရင် Padauk ကိုလဲကြိုက်တာပဲ ... ဒါပေမယ့် လိုက်လျောညီထွေမရှိဘူး... အဲဒါကြောင့် လူသုံးနည်းတယ် ... LINUX မှာဆိုရင် ပိတောက်ကို UNICODE Sys အနေနဲ့ တခါတည်း ပေးထားတာပါ... ဒါပေမယ့် တကယ်တန်းသုံးနေတဲ့ ဇောိဂျီ ကိုမမှီဘူးဗျ ... အဲဒါဘာလဲဆိုတော့ ဘယ်အရာမဆို လွယ်ကူဖို့လဲ လိုသေးသဗျ... ကိုယ်တယောက်တည်းက တတ်သိနားလည်နေလို့ ကောင်းတယ်ဆိုရင် မတတ်တဲ့သူတွေအတွက်ဘက်က ဆိုရင် ဘယ်လိုလည်း ဆိုတာ စဉ်းစားဖို့ လိုသေးတယ်... MM3 ကိုသာ တကယ်တမ်း UNICODE အနေနဲ့ သတ်မှတ်စေချင်ရင် Zawgyi ထက် ပိုပြီး လွယ်ကူချောမွေ့အောင် ကြိုးစားကြပါလို့ပဲ ပြောချင်ပါတယ် ... Zawgyi စပေါ်လာတည်းကလည်း ကြေငြာပြီး ဝင်ခဲ့တာ မဟုတ်ပါဘူး... တဆင့်စကား တဆင့်နားနဲ့ လွယ်ကုူချောမွေ့တယ်... အဆင်ပြေတယ် ဆိုတာတွေနဲ့ တင် USER ကိုဆွဲဆောင်မှု့ပေးနေပါပြီ ... ကျွန်တော်ကတော့ ဒီလောက်ပဲ ပြောချင်ပါတယ် ... ထပ်ပြောရင် စာရှည်သွားမှာစိုးလို့ပါ...
>> နိုင်သူ
>> လိုက်လျောညီထွေမရှိဘူး...
>> တကယ်တန်းသုံးနေတဲ့ ဇောိဂျီ ကိုမမှီဘူးဗျ
>> လွယ်ကုူချောမွေ့တယ်... အဆင်ပြေတယ်
ဘာကို ဆိုလိုချင်တာလဲ မသိဘူး။ ကျွန်တော့် အတွေ့အကြုံအရတော့ ယူနီကုတ်က ဇော်ဂျီထက် ပိုလွယ်ပါတယ်။ အခုဆိုရင် One-click Installer မရှိတာက လွဲရင် Myanmar3 Installer တစ်ခုတည်းနဲ့ ဖောင့်၊ ကီးဘုတ်၊ Windows မှာသုံးတဲ့ Uniscribe DLL အားလုံးကို တခါတည်း တစုတစည်းတည်း Install လုပ်လို့ ရပါတယ်။
ယူနီကုတ်နဲ့ ဇော်ဂျီ နှစ်ခုစလုံးကို သုံးဖူးတယ် ဆိုရင် User Experience အရ ဘာအခက်အခဲ ရှိတယ် ဆိုတာ သိချင်ပါတယ်။
Thanks.
အင်း ကိုဇော်သက်ရဲ့ ဖြေကြားချက်တွေကို သဘောကျတယ် အာဂတ ကင်းပီးတော့ ပရော်ဖက်ရှင်နယ်ဆန်တယ် ... ဇော်ဂျီကိုလဲ အာဂတ ကင်းကင်းနဲ ရှင်းပြနေတယ်မှတ်ပါမယ် ဘာဖြစ်ဖြစ် blog.mghla.com မှာလုပ်ထားတဲ့ ဇော်ဂျီ နဲ 5.1 converter လေးကို သဘောကျတယ်။ ကို zt လည်းသွားကြည့်လိုက်ပါအုံး။ ဘလော့ဂါတွေကော အဲလိုလုပ်ရင် အဆင်မပြေနိုင်ဘူးလား? မသိလိုမေးတာပါ
ကို ဇော်သက် ဟိုဘက်ပို(စ်)က reply ကိုမဖတ်ပဲ အပေါ်မှာရေးမိပါတယ်။ ကိုဇော်သက် မှာရှိတယ်ဆိုတာလည်း ယုံပါတယ်ဗျာ.... download လုပ်ဖိုစောင့်နေမယ်
ပြသနာတိုင်းတွင် အဖြေရှိပါ၏
http://blog.nyilynnseck.com/search/label/Zawgyi
ဒီပို့စ်လေးကို ဖတ်ကြည့်ပေးပါ... ကိုညီလင်းဆက်ရဲ့ ဆန္ဒနဲ့ ကျွန်တော်ရဲ့ ဆန္ဒ တူညီတဲ့ အတွက် ဆက်ပြီးမရေးတော့ပါဘူး...
နင်ဒါရေးမယ်မှန်းသိရင် ငါ အပင်ပန်းခံပြီး မရေးပါဘူး။ ခွီး။ အခုတော့ အလကား ပင်ပန်းပြီ။
စတာပါ။ ကောင်းပါတယ်။ ရှေ့ဆက်ပါ။ ကျွန်တော်ကတော့ ဖြေရှင်းဖို့ နည်းလမ်းရှာတဲ့ဘက်ကိုပဲ ဦးစားပေးပါတယ်။
ko zt,
>> ယူနီကုတ် ဖောင့်က နောက်ကွယ်မှာ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်)
that is not done by font,
it is done by keyman or input program.
zawgyi can do that also.
@Mark
Thanks for correction.
>>http://blog.nyilynnseck.com/search/label/Zawgyi
>>>ဒီပို့စ်လေးကို ဖတ်ကြည့်ပေးပါ... ကိုညီလင်းဆက်ရဲ့ ဆန္ဒနဲ့ ကျွန်တော်ရဲ့ ဆန္ဒ တူညီတဲ့ အတွက် ဆက်ပြီးမရေးတော့ပါဘူး...
မြတ်စွာဘုရားက ကာလာမသုတ်မှာ ဟောခဲ့ဖူးတယ်။ ငါပြောလို့လည်း အမှန်မမှတ်နဲ့။ သူများပြောလို့လဲ အမှန်မမှတ်နဲ့။ ကိုယ်ပိုင်ညာဏ်နဲ့ ချင့်ချိန်ပြီးမှ မှန်သလား မှားသလား ကိုယ့်ဘာသာကိုယ် ဆုံးဖြတ်ဆိုတာမျိုးပါ။
ဘုရားတောင်မှ သူပြောတာကို မဆင်မခြင် အမှန်လို့ မမှတ်ယူဖို့ ပြောခဲ့တာ။ ညီလင်းဆက် ပြောလို့လည်း အမှန်မမှတ်ပါနဲ့။ ကျွန်တော် ပြောလို့လည်း အမှန်မမှတ်ပါနဲ့။ ကိုယ်ပိုင်ညာဏ်နဲ့ စဉ်းစားကြပါ။ စဉ်းစားဖို့ အချက်အလက်တွေလည်း ကျွန်တော် သိသလောက် ပေးပြီးပါပြီ။
၂၀၀၅ ခုနှစ်ထဲက မြန်မာဝီကီပိဒီယကို Myanmar1 နဲ့ ကျွန်တော် စရေးခဲ့ပါတယ်။ ဇော်ဂျီ အဲဒီအချိန်က မထွက်သေးပါ။ အဲဒီတော့ ဇော်ဂျီကလွဲလို့ အင်တာနက် ပေါ်မှာ ဘယ်ဖောင့်မှ အဆင် မပြေဘူးဆိုတဲ့ အဆိုကို လက်မခံပါ။ စာလုံးထွက် မလှတာပဲ ရှိပါတယ်။ ဒေတာနဲ့ ပတ်သက်လို့လည်း Normalization မလုပ်တဲ့ အတွက် ဘယ်လို ပြသနာမျိုး ရှိနိုင်တယ် ဆိုတာကို အကျိုးသင့် အကြောင်းသင့် ထောက်ပြခဲ့ပြီးပါပြီ။
နောက်ဆုံးတော့ ကျွန်တော်တို့ ယူနီကုတ် စံနှုန်းကို လိုက်ပြောင်းရမှာဘဲ။ အနှေးနဲ့ အမြန်ပဲ ရှိပါတယ်။ ယူနီကုတ် စံနှုန်းက စံနှုန်းမညီတဲ့ ဇော်ဂျီနောက်ကို ပြန်လိုက်မှာ မဟုတ်ပါဘူး။ နောက်လည်း ရှင်းရမယ့် အတူတူ ပြသနာကို အခုကတည်းက စောစောစီးစီး ရှင်းထားလိုက်တာ ပိုမကောင်းဘူးလား။ ကျွန်တော်တို့တွေ အရိုးစွဲ အကျင့်တွေကို ဖျောက်ပစ်ကြဖို့ပဲ လိုပါတယ်။
ကိုZT အဲဒီပို့စ်ကို သေချာ မဖတ်သေးပါဘူး... သေချာဖတ်ကြည့်ပါအုန်း... သူများဘက်ကြီးပဲ မမြင်ပါနဲ့အုန်း...UNICODE ဘက်ကိုထောက်ပြတာလဲ ကြည့်ပါအုန်း... ငါကတော့ UNICODE အစစ်ဆိုတာချည်းပဲ လည်း မလုပ်ပါနဲ့အုန်း ... ကျွန်တော်ကိုယ်တိုင်သာ သူများပြောတဲ့ အတိုင်းလိုက်မယ်ဆိုရင် MM3 တို့ ပုရပိုက်တို့ဆိုတာ ကျွန်တော့်စက်ထဲမှာ ထားမှာပေါ့... အခုဟာက UNICODE ကို ပြောင်းမှ ဖြစ်မယ့်ဆိုတာမျိုးမို့ လို့ပြောတာပါ... ညီလင်းဆက် ပြောတာက ပိုသဘာဝကျတယ်... ဖြစ်သင့်တဲ့ ဘက်ကိုပြောထားတာ များတယ်... ZT ပြောတာက အတိုင်းထက် အလွန်လိုမျိုးဖြစ်နေတယ်... ဒီနေ့ မပြောင်းတာနဲ့ နောက်နေ့ဆိုရင် ဒီ DB ကြီးကZG ကို မသိတော့ တဲ့ အတိုင်းဖြစ်နေတယ်... အခုဟာက User ဘက်ကနေပြောနေတာနော်... Technology ဘက်က Developer ဘက်ကပြောနေတာ မဟုတ်ပါဘူး... Renderingတွေနဲ့ ကိုင်ပေါက်လို ကိုင်ပေါက်ဖြစ်နေလို့ပါ... (မှတ်ချက်။ ။ ကျွန်တော်သည် ZG အသိုင်းအဝိုင်းနှင့် လုံး၀ပတ်သက်မှု့မရှိပါ။)
ကျန်သေးတာက Normal User တွေအသုံးပြုနေတဲ့ Zawgyi က လက်ကွက် အစုံရှိနေပါပြီ... MM3 ကကော အဲဒီလောက်စုံပြီလား... ကိုယ့်ဘက်မှာ ဘယ်လောက်ပြည့်စုံမှုရှိနေပြီလဲ ... အဲဒါပါပဲ...
ကျွန်တော်လည်း မြန်မာစာကို နည်းပညာအားဖြင့် ဖြစ်ကတတ်ဆန်း လုပ်ထားတာ၊ ဆေးမြီတို သုံးထားတာ ကို ကြည့်မရတဲ့သူပဲ ဖြစ်ပါတယ်။ မြန်မာစာ နည်းပညာကို နိုင်ငံတကာ အဆင့်အတန်းမီ ဖြစ်စေချင်ပါတယ်။ (စေတနာ ဆိုတဲ့ အလုံးကြီးက ကြီးလွန်းလို့ စေတနာလို့ မသုံးပါ။ ကိုယ့်ဘာသာကိုယ် မနေနိုင်မထိုင်နိုင် ဖြစ်နေတာလို့ပဲ မှတ်ပါ။) လိုက်ချင်တဲ့သူတွေ လိုက်ခဲ့ပါလိမ့်မယ်။ မလိုက်ချင်တဲ့သူများ နေခဲ့ကြပါ။ အဲဒါလည်း User Choice ပါပဲ။
>>>ကျန်သေးတာက Normal User တွေအသုံးပြုနေတဲ့ Zawgyi က လက်ကွက် အစုံရှိနေပါပြီ...
ဘာကိုဆိုလိုချင်တာလဲ မသိ။ ကျွန်တော်ရိုက်ချင်သမျှ မြန်မာအက္ခရာတော့ ယူနီကုတ် ကီးဘုတ်နဲ့ ရိုက်လို့မရတာ မရှိပါဘူး။
စကားမစပ် ပါဌ်ဆင့် လေးတွေ ရိုက်လို့ရမလားဟင် ... ဇော်ဂျီမှာသုံးထားတဲ့ ပါဌ်ဆင့်လေးတွေလိုပေါ့...
စာလုံး ၂ လုံးကြားမှာ Shift+f ထည့်ရိုက်ရင် ပါဌ်ဆင့် ဖြစ်သွားပါလိမ့်မယ်။
က္က ရိုက်ချင်ရင် က + (Shift + f) + က ရိုက်ရပါတယ်။
သင်္ချာ ဆိုရင် သင် + (Shift + f) + ချာ ရိုက်ရပါတယ်။
အသေးစိတ် သိချင်ရင် Myanmar3 Installer ထဲမှာပါတဲ့ "InputSequence.pdf" မှာ ကြည့်ပါ။
စိတ်ဝင်စားမှု အတွက် အထူး ကျေးဇူးတင်ပါတယ်။ Feedback တွေ များများ လိုချင်ပါတယ်။
ကိုဇော်သက်ရေ...
ဖတ်သွားပါတယ်..
ကျွန်တော်က ဒီကိစ္စတွေမှာ တော်တော်ပိန်းတယ်..
နားမလည်တာက အဲဒီ normalization တွေ.. smart rendering တွေကို ဘယ်သူက ဘယ် component က လုပ်နေတာလဲ ဆိုတာပါ..
သိတဲ့အတိုင်း font ဆိုရင် font ချည်းပဲမြင်တော့ font က အဲဒါတွေ လုပ်နေတာလား... ဘယ်သူက လုပ်နိုင်တာလဲ ဆိုတာလေး...
ကိုအောင်စည်သူ
Smart Rendering ကို Smart Font ကနေ လုပ်ပေးပါတယ်။ အဲဒီလို လုပ်ဖို့အတွက် ဖောင့်ထဲမှာ Glyph တွေကို Match လုပ်ပေးမယ့် Table အပိုတွေ ပါပါတယ်။
Normalization ကိုတော့ ကီးဘုတ်ကနေ လုပ်ပေးတယ်လို့ မာ့ခ် ဆီကနေ သိရပါတယ်။
မြန်မာစာတွေ နိုင်ငံတကာကွန်ပြူတာမှာ လေးထောင့်တုံး မမြင်ရပြီးတာပဲ။
ဘေးချင်းကပ်နိုင်ငံက ကျောင်းမှာတောင် ဇော်ဂျီထည့်မယ်ဆို ပေးမထည့်ဘူး အက်ဒမင်က ပိတ်ထားတယ်။
ဘေးမှာ ဗီယက်နမ်တွေ၊ တရုတ်၊ အင်ဒိုနီးရှားတွေကတော့ ဟုတ်လို့ပဲ။ ကိုယ်တွေများ ကျောင်းက စက်သုံးရင် ဂျီတော့ခ်မှာ "မြန်မာလို မရိုက်ပါနဲ့ ဘားဂလိပ်ရိုက်ကြပါ"ဆိုပြီးပြောရတယ်။
ဒီခံစားမှုမျိုးနဲ့ပဲ ဘာဖြစ်သင့်တယ်ကို သုံးစွဲသူသက်သက်အနေနဲ့ ကျနော် မျှော်မှန်းတာဖြစ်ပါတယ်။
တို့ကတော့ မြန်မာ ၃ ပဲ
ဇော်ဂျီကတော့ မဖြစ်မနေမို့လို့သုံးတာပါ။။။
ကိုယ်ကြိုက်တာ သုံးတာအကောင်းဆုံးပါပဲ ... အဲဒါမှ ဘယ်ဖောင့်က အမှန်ဆိုတာ မြင် လာပါမယ်
ကျွန်တော်ကတော့ ဖုန်းကrootလုပ်မရတော့ zawgyiမမြင်ရဘူး
Kitkat Zultraပါ။ အာ့ကြောင့် myanmar unicode နဲရေးထားတာရှာဖတ်နေပါတယ်
အောင်မြင်ပါစေဗျာ
Post a Comment