Search This Blog

Wednesday, July 15, 2009

ဖောင့်မသိတော့ ဇော်ဂျီ ယူနီကုတ်ထင်

မြန်မာ ယူနီကုတ်ဆိုတာ ဘာလဲ၊ ဇော်ဂျီက မြန်မာယူနီကုတ် စံနှုန်းကနေ ဘာတွေ လွဲနေသလဲ၊ ဘာကြောင့် ယူနီကုတ်စနစ်ကို ပြောင်းသုံးသင့်တာလဲလို့ ဇဝေဇဝါ ဖြစ်နေသူများကို ရှင်းပြဖို့ အတွက် ဒီပို့စ်ကို ရေးပါတယ်။

ဟိုးအရင် ကာလတွေတုန်းက ကွန်ပြူတာမှာ မြန်မာစာလုံးကို သိမ်းဆည်းတဲ့ အခါမှာ မြန်မာစာလုံး အဖြစ်မသိမ်းဆည်းပဲ အင်္ဂလိပ် စာလုံးနဲ့ ညီမျှတဲ့ နံပါတ် အဖြစ်နဲ့ပဲ သိမ်းဆည်းပါတယ်။ အကယ်၍ ကျွန်တော်တို့ သဝေထိုး (ေ) ကို ရိုက်ပြီး ကွန်ပြူတာ ထဲမှာ သိမ်းမယ်ဆိုရင် ကွန်ပြူတာက သဝေထိုးအနေနဲ့ မသိမ်းပဲ အင်္ဂလိပ်စာလုံး "a" နဲ့ ညီမျှတဲ့ နံပါတ် 97 အနေနဲ့ သိမ်းပါတယ်။ အဲဒီလို စနစ်မျိုး သုံးထားတဲ့ ဖောင့်ကို အက်စကီးဖောင့် (ASCII Font)လို့ ခေါ်ပါတယ်။ အက်စကီး ဖောင့်တွေဟာ တရုတ်၊ ကိုရီးယား ဘယ်ဘာသာ စကားကို မဆို အင်္ဂလိပ် အက္ခရာ ဒါမှမဟုတ် !@ အစရှိတဲ့ သင်္ကေတ (Symbol) တွေနဲ့ ညီမျှတဲ့ ဂဏန်းတွေ အဖြစ် ပြောင်းပြီး သိမ်းပါတယ်။ အက္ခရာ တစ်လုံးကို သိမ်းဖို့ ဂဏန်း ၂ လုံးစာ နေရာ ပေးရပါတယ်။ ဝင်းအင်းဝ၊ ဝင်းကလော ၊ CE စတဲ့ မြန်မာဖောင့်တွေဟာ အဲဒီလို စနစ်မျိုးနဲ့ အလုပ်လုပ်ပါတယ်။ အဲဒါကြောင့်မို့ ဝင်းအင်းဝနဲ့ ရေးထားတဲ့ စာကို မြန်မာ ဖောင့်မရှိတဲ့ အချိန် ဖတ်ရင် အင်္ဂလိပ် စာလုံးတွေ မြင်ရတာပါ။

ယူနီကုတ် စံနှုန်းမှာတော့ ဘာသာစကား တစ်ခုချင်းစီ အတွက် သီးသန့် ဂဏန်း (Codepoint) တွေ သတ်မှတ်ပေးထားပါတယ်။ တကမ္ဘာလုံးမှာ ရှိသမျှ ဘာသာစကားတွေ အတွက် ဂဏန်း ၂လုံးစာ နဲ့ မလောက်တဲ့ အတွက် အခြေ ၁၆ ရှိတဲ့(Hexadecimal) ဂဏန်း ၄လုံး သုံးထားပါတယ်။ အဲဒီအတွက် အက္ခရာ ၆သောင်း ၅ထောင်ကျော် ကို ယူနီကုတ် စနစ်မှာ ကွဲကွဲပြားပြား သိမ်းလို့ရပါတယ်။ မြန်မာစာ နဲ့ တိုင်းရင်းသား ဘာသာစကားများ ဖြစ်တဲ့ ရှမ်း၊မွန်၊ စကောကရင်၊ ပိုးကရင် စတဲ့ ဘာသာစကားတွေ အတွက် ယူနီကုတ် အဖွဲ့ (Unicode Consortium) က ယူနီကုတ်နံပါတ် 4096 ကနေ 4255 (Decimal) အတွင်းမှာ သတ်မှတ်ပေးထားပါတယ်။ အဲဒီတော့ ကျွန်တော်တို့ မြန်မာစာ သဝေထိုး “ေ” ကို ရိုက်ပြီး သိမ်းမယ် ဆိုရင် ယူနီကုတ် စံနှုန်းမှာ နံပါတ် 4145 အနေနဲ့ သိမ်းပေးပါတယ်။ ကမ္ဘာပေါ်မှာ ရှိသမျှ ဘာသာစကားတွေ အားလုံးထဲမှာ 4145 နဲ့ ညီမျှတဲ့ အက္ခရာ ဟာ မြန်မာ အက္ခရာ သဝေထိုး တစ်ခုပဲ ရှိပါတယ်။ အခြား ဘယ်ဘာသာ စကားမှာမှ မရှိပါဘူး။ အဲဒါကြောင့် မြန်မာယူနီကုတ်ဖောင့် မရှိရင် အဲဒီစာလုံးကို လေးထောင့်ကွက် အဖြစ်နဲ့ပဲ မြင်ရပါတယ်။

ဇော်ဂျီနဲ့ ယူနီကုတ် ဖောင့်တွေ ရဲ့ ကွာခြားချက်က အဲဒီမှာ စမြင်နိုင်ပါတယ်။ ယူနီကုတ်ဖောင့် (Myanmar3, Padauk, Parabaik, MyMyanmar) အစရှိတဲ့ ဖောင့်တွေက ယူနီကုတ် အဖွဲ့က Unicode 5.1 Standard မှာ သတ်မှတ်ပေးထားတဲ့ စံနှုန်းအတိုင်း အတိ အကျ လိုက်နာပြီး သတ်မှတ်ထားတဲ့ ဂဏန်းတွေနဲ့ စာလုံးတွေကို သိမ်းပါတယ်။ ဇော်ဂျီကတော့ ကိုယ့်ဘာသာကိုယ် သိမ်းချင်တဲ့ ဂဏန်းနဲ့ သိမ်းထားပါတယ်။ ဇော်ဂျီက သုံးတဲ့ ဇယားနဲ့ ယူနီကုတ် အဖွဲ့က တရားဝင် သတ်မှတ်ပေးထားတဲ့ ဇယား နှစ်ခုကို အောက်မှာ ယှဉ်ပြ ထားပါတယ်။


Unicode 5.1 စံနှုန်း ဇယား


ဇော်ဂျီတွင် သုံးသော ဇယား

ဒါပေမယ့် ရိုက်သမျှ ဂဏန်းကို မြန်မာစာအတွက် သတ်မှတ်ပေးထားတဲ့ ဂဏန်းတွေနဲ့ သိမ်းတိုင်းလည်း ယူနီကုတ်လို့ ပြောလို့ မရပါဘူး။ ယူနီကုတ် ဖောင့်တွေ လိုက်နာရမယ့် အခြား အချက်တွေ ရှိပါသေးတယ်။

ပထမအချက် အနေနဲ့ အခြားစာလုံးနဲ့ တွဲလိုက်လို့ ပုံစံပြောင်းသွားတဲ့ စာလုံးတွေ အတွက် ယူနီကုတ်ဖောင့်က စာလုံးပုံစံကို အလိုအလျောက် ပြောင်းပေးရပါတယ်။ ဥပမာ အားဖြင့် “နိုင်” ဆိုတဲ့ စာလုံးကို လေ့လာကြည့်ပါ။ “နိုင်” ဆိုတဲ့ စကားလုံးကို မြန်မာလို နငယ် လုံးကြီးတင် တစ်ချောင်းငင် င အသတ် ဆိုပြီး ရိုက်ရပါတယ်။ မြန်မာစာမှာ နငယ် အကြီးနဲ့ နငယ် အသေးဆိုပြီး ၂ မျိုး မရှိပါဘူး။ နငယ်က တစ်မျိုးပဲ ရှိပါတယ်။ မြင်ရတဲ့အချိန်မှာသာ နငယ် အကြီးနဲ့ အသေး ကွာသွားတာပါ။

ယူနီကုတ်ဖောင့်တွေမှာ နငယ်ကို တစ်ချောင်းငင်နဲ့ တွဲရိုက်လိုက်တာနဲ့ နငယ်အကြီးကို အသေး (န) အဖြစ် User မြင်အောင် အလိုအလျောက် ပြောင်းပေးပါတယ်။ ဒါပေမယ့် အကြီးပဲ ပြပြ အသေးပဲပြပြ နောက်ကွယ်မှာ နငယ်ကို သိမ်းထားတဲ့ ဂဏန်းကတော့ 4116 တစ်ခုတည်းပါပဲ။ ဇော်ဂျီဖောင့်မှာတော့ အဲဒီလို နည်းပညာ မပါပါဘူး။ နငယ် အသေးကို သပ်သပ် ရိုက်ပေးရပါတယ်။ ဇော်ဂျီဖောင့်မှာ နငယ် အကြီး ရိုက်ရင် 4116 နဲ့ သိမ်းပြီး အသေးရိုက်ရင် 4239 နဲ့ သိမ်းပါတယ်။ Smart Rendering မလုပ်ဘဲ သိမ်းထားတဲ့ အတိုင်း ပြန်ပြီး ရိုက်ပြ ပါတယ်။ ယူနီကုတ် ၅.၁ စံနှုန်းအရ ဇော်ဂျီက “န” အနေနဲ့ သုံးထားတဲ့ နံပါတ် 4239 ဟာ မြန်မာဘာသာ အတွက် သတ်မှတ်ထားတဲ့ ဂဏန်းမဟုတ်ပဲ ပလောင် ဘာသာစကားအတွက် သတ်မှတ်ထားတဲ့ ဂဏန်း ဖြစ်ပါတယ်။

အားလုံး ပြောနေကြတဲ့ ရရစ် ပြသနာဟာ လည်း ဒါပါပဲ။ ဇော်ဂျီမှာ ရရစ် အတွက် ယူထားတဲ့ ဂဏန်း ၈ လုံး တိတိ ရှိပြီး User အနေနဲ့ ကိုယ်သုံးချင်တဲ့ ရရစ်ကို ကိုယ့်ဘာသာကိုယ် ရွေးရပါတယ်။ ရရစ် အတွက် ယူသုံးထားတဲ့ ဂဏန်းတွေကတော့ ရှမ်းဘာသာစကား အတွက် သတ်မှတ်ပေးထားတဲ့ ဂဏန်းတွေပါ။ ယူနီကုတ် ဖောင့်တွေမှာတော့ သူနဲ့ တွဲဆက်ထားတဲ့ အက္ခရာတွေ ပေါ်မူတည်ပြီး ရရစ်က အလိုအလျောက် ပုံစံပြောင်း ပေးပါတယ်။ ရရစ်အတွက် 4156 ဂဏန်း တစ်လုံးကိုပဲ သုံးထားပါတယ်။

ဒုတိယ အချက်အနေနဲ့ ယူနီကုတ်ဖောင့်တွေဟာ User က ရိုက်ထည့်လိုက်တဲ့ ဂဏန်းကို နောက်ကွယ်မှာ စံနှုန်းနဲ့ ညီတဲ့ အစီအစဉ် တကျ ပြန်စီပေးရပါတယ်။ အဲဒါကို Normalization လုပ်တယ်လို့ ခေါ်ပါတယ်။ User အနေနဲ့ “နိုင်” ဆိုတဲ့ စာလုံးကို “န” + “_ိ ”+ “ - ု” + “င” + “- ်” ဆိုပြီး ရိုက်ထည့်လို့ ရသလို “န” + “ - ု” + “_ိ ” + “င” + “- ်” ဆိုပြီး တော့လည်း ရိုက်လို့ ရပါတယ်။ “နိုင်” ဆိုတဲ့ စကားလုံးကို User အနေနဲ့ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) နဲ့ပဲ ရိုက်ထည့်ထည့် “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) နဲ့ပဲ ရိုက်ထည့်ထည့် ယူနီကုတ် ဖောင့်က နောက်ကွယ်မှာ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အဖြစ် ပြန် အစီအစဉ် ချပြီး သိမ်းပေးပါတယ်။ ဇော်ဂျီကတော့ အစီအစဉ် မချပဲ User ရိုက်ထည့်တဲ့ အတိုင်း သိမ်းပါတယ်။

သိမ်းချင်သလို သိမ်းကွာ ဖတ်လို့ရပြီးတာပဲ လို့ ပြောချင်တဲ့သူများလည်း ရှိပါလိမ့်မယ်။ ဖတ်လို့ ရတာ ဟုတ်ပေမယ့် ရှာတဲ့နေရာမှာ ရှော့ခ် ရှိပါတယ်။ ဇော်ဂျီဖောင့်နဲ့ ရှာချင်ရင် အစီအစဉ်တကျ ရိုက်ထည့်ထားတဲ့ စာကိုပဲ ရှာလို့ ရပါမယ်။ လုံးကြီးတင် တစ်ချောင်းငင် နဲ့ ရေးထားတဲ့ စာကို တစ်ချောင်းငင် လုံးကြီးတင် နဲ့ ပြန်ရှာရင်တွေ့မှာ မဟုတ်ပါဘူး။ အဲဒီလိုပဲ တစ်ချောင်းငင် လုံးကြီးတင် နဲ့ ရေးထားတဲ့စာကို လုံးကြီးတင် တစ်ချောင်းငင် နဲ့ ပြန်ရှာရင်လည်း တွေ့နိုင်မှာ မဟုတ်ပါဘူး။

ကွန်ပြူတာနဲ့ ဆက်စပ်ပြီး အလုပ်လုပ်နေသူများအတွက် နောက်ဥပမာ တစ်ခုကို ထပ်ပေးပါမယ်။ ကျွန်တော်တို့ အနေနဲ့ မြန်မာနိုင်ငံ လူဦးရေ စစ်တမ်း ကောက်တဲ့ ဒေတာဘေ့စ် တစ်ခု လုပ်ချင်တယ် ဆိုပါစို့။ လူနှစ်ယောက်ဟာ နာမည်တူ အဖေနာမည်တူ ရှိနိုင်ပေမယ့် မှတ်ပုံတင် နံပါတ်တော့ အတူတူ မရှိနိုင်ပါဘူး။ အဲဒီတော့ လူတစ်ယောက်ကို ဒေတာဘေ့စ်ထဲမှာ ၂ ခါ ပြန်မထည့်မိအောင် ကျွန်တော်တို့အနေနဲ့ မှတ်ပုံတင် နံပါတ် Column ကို Unique Constraint အနေနဲ့ ထည့်ထား လိုက်ပါမယ်။ အဲဒီလို လုပ်တဲ့အတွက် User က မှတ်ပုံတင် နံပါတ် တစ်ခုတည်းကို ၂ ခါပြန်ထည့်မိရင် ဒေတာဘေ့စ်က လက်မခံဘဲ Error ပြန်လာပါလိမ့်မယ်။

အဲဒီ ဒေတာဘေ့စ်ကို ယူနီကုတ် ၅.၁ နဲ့ သိမ်းရင် မှတ်ပုံတင် နံပါတ်က နှစ်ခု မထပ် နိုင်ပါဘူး။ ဥပမာ ၅/စကန(နိုင်)၀၀၀၀၀၀ ဆိုတဲ့ မှတ်ပုံတင် နံပါတ်ကို ဒေတာဘေ့စ်ထဲမှာ တစ်ကြိမ်ပဲ ရိုက်ထည့်လို့ ရပါမယ်။ (နိုင်) ကို ရိုက်ထည့်တဲ့သူက “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အစီအစဉ် နဲ့ ရိုက်ရိုက် “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) အစီအစဉ်နဲ့ ရိုက်ရိုက် ယူနီကုတ်ဖောင့်က Normalize လုပ်ပေးတဲ့အတွက် နောက်ဆုံးမှာ ဒေတာဘေ့စ်ထဲကို “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အစီအစဉ်နဲ့ပဲ ဝင်သွားပါလိမ့်မယ်။ ဇော်ဂျီနဲ့ ရိုက်ထည့်လို့ User က (နိုင်) ကို မှားယွင်းပြီး ရိုက်ထည့်ရင် “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) နဲ့ တစ်ခါ “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) နဲ့တစ်ခါ မှတ်ပုံတင် နံပါတ် တစ်ခုတည်းကို ၂ ခါဝင်သွား နိုင်ပါတယ်။ လူဦးရေ စာရင်းလို သန်းဂဏန်း နဲ့ ရှိတဲ့ ဒေတာတွေထဲမှာ အဲဒီလို အမှားမျိုး မတော်တဆ ဖြစ်ခဲ့ရင် ကျွန်တော်တို့ အမှားကို တွေ့အောင် ရှာနိုင်ပါ့မလား။

အဲဒီဒေတာဘေ့စ်ကို ယူနီကုတ် ၅.၁ နားလည်တဲ့ ဒေတာဘေ့စ် (ဥပမာ MySQL Latest Version) အဖြစ် Convert လုပ်ရင် Error တက်ပါလိမ့်မယ်။ Database ထဲမှာ အစီအစဉ်တကျ သိမ်းထားတဲ့ စာက ပြသနာ မရှိပေမယ့် Normalize မလုပ်ဘဲ သိမ်းချင်သလို သိမ်းထားတဲ့စာကိုတော့ Database က သူနားလည်သလို Unicode Normalization လုပ်ပါလိမ့်မယ်။ အဲဒီအချိန်မှာ နံပါတ် ၂ ခု အတူတူ ဖြစ်သွားတဲ့ အတွက် Unique Constraint ကို ချိုးဖောက်မိပြီး ဒုက္ခနဲ့ လှလှ တွေ့ပေးနိုင်ပါတယ်။

ကျွန်တော် အရင်ပို့စ်မှာလည်း Database ထဲက Unicode Normalization အကြောင်း ပြောခဲ့ဖူးပါတယ်။ ဒေတာဘေ့စ်က မြန်မာစာလုံးတွေကို Normalize လုပ်ပေးတယ် ဆိုပေမယ့် ကိုယ်မှန်းထားတဲ့ အစီအစဉ်အတိုင်းတော့ ဝင်သွားဖို့တော့ မလွယ်ပါဘူး။ ဒေတာဘေ့စ်က မနောမယ ဒေတာဘေ့စ် ဖြစ်နေမယ် ဒါမှမဟုတ် ဒေတာဘေ့စ် အက်ဒမင်က ဒေးဗစ်ကော့ပါးဖီး ဖြစ်နေမယ် ဆိုရင်တော့လည်း တစ်မျိုးပေါ့။ :D

နောက်တစ်ခု ကွာတာကတော့ “က္က” လိုမျိုး ပါဌ်ဆင့် တွေ ရိုက်တဲ့ နေရာမှာပါ။ ပါဌ်ဆင့်တွေ အတွက် ယူနီကုတ်မှာ ဂဏန်း သတ်သတ် ပေးမထားပါဘူး။ ယူနီကုတ် စံနှုန်း အရ ပါဌ်ဆင့်နှစ်ခု ရဲ့ ကြားမှာ 4153 ဆိုတဲ့ ဂဏန်းကို ထည့်ပြီး သိမ်းပါတယ်။ ဖောင့်က 4153 ဆိုတဲ့ ဂဏန်းကို တွေ့ရင် ရှေ့နောက် ဂဏန်း နှစ်လုံးကို ဆက်ပြီး သူ့အလိုအလျောက် ပါဌ်ဆင့် အဖြစ် ရိုက်ပြ ပါတယ်။ ဥပမာ “က္က” ဆိုတဲ့ စာလုံးကို သိမ်း ချင်ရင် ယူနီကုတ် စံနှုန်းမှာ က ရဲ့ နံပါတ်က 4096 ဖြစ်တဲ့ အတွက် “4096 + 4153 + 4096” ဆိုပြီး သိမ်းပါတယ်။ User အနေနဲ့လည်း ကီးဘုတ်ပေါ်မှာ ~ အက္ခရာတွေ “Ctrl + Alt” တွေ ရိုက်စရာ မလိုဘဲ ပါဌ်ဆင့်ရဲ့ ဒုတိယ အက္ခရာ မရိုက်ခင်မှာ “4153” နဲ့ ညီမျှတဲ့ “Shift + f ” ကို ကီးဘုတ်ပေါ်ကနေ ရိုက်ထည့် လိုက်ရုံပါပဲ။ “က” + “Shift +f ” + “က” ဆိုရင် ကကြီး နှစ်လုံးဆင့် ဖြစ်ပါတယ်။

ဇော်ဂျီမှာတော့ ပါဌ်ဆင့်တွေကို ပါဌ်ဆင့်အတိုင်း သိမ်းပါတယ်။ အဲဒီအတွက် မြန်မာစာ အတွက် မဟုတ်ဘဲ ကရင် ဘာသာစကားအတွက် သတ်မှတ်ထားတဲ့ ဂဏန်း 4192 ကနေ 4220 အတွင်းက ဂဏန်းတွေကို ယူသုံးပြီး သိမ်းပါတယ်။

ဒီလောက်ဆိုရင် ဇော်ဂျီနဲ့ ပတ်သက်တဲ့ ဒဏ္ဍာရီ အများစုကို ရှင်းရှင်းလင်းလင်း သိကြပြီလို့ ထင်ပါတယ်။

အများမေးနေကြမေးခွန်းကလေး တွေကို အဆစ်အနေနဲ့ ဖြေပေးလိုက်ပါ့မယ်။

(၁) ဇော်ဂျီက ယူနီကုတ်ထက် ဘာလို့ ပိုမြန်အောင် Render လုပ်နိုင်ရတာလဲ။

ကျွန်တော်ခုန ပြောခဲ့တဲ့ ယူနီကုတ်ရဲ့ မရှိမဖြစ် စံနှုန်း Smart Rendering တွေ၊ Normalization တွေ ကို ဇော်ဂျီက တစ်ခုမှ လုပ်မထားတဲ့ အတွက် အဲဒီ နည်းပညာ ထည့်ထားတဲ့ ဖောင့်တွေနဲ့ ယှဉ်ရင် ပိုမြန်နေရတာပါ။

(၂) ယူနီကုတ် ဖောင့်တစ်ခုနဲ့ ရိုက်ထားတဲ့စာကို တခြားဖောင့်နဲ့ ကြည့်လို့ ရလား။ မြန်မာ ယူနီကုတ် စနစ်က လုံးဝ ပြည့်စုံပြီလား။

ယေဘူယျအားဖြင့် မြန်မာ ၃ နဲ့ ရိုက်ထားတဲ့ စာကို ပိတောက်နဲ့ ကြည့်လို့ရသလို ပိတောက် နဲ့ ရိုက်ထားတဲ့ စာကို မြန်မာ ၃ နဲ့ ကြည့်လို့ရပါတယ်။ အလားတူပဲ ယူနီကုတ် စံနှုန်းကို လိုက်နာတဲ့ ပုရပိုက်၊ မိုင်မြန်မာ စတဲ့ ဖောင့်တွေကို လည်း အလဲလဲ အလှယ်လှယ် သုံးလို့ရတယ်။ ကျွန်တော် ယူနီကုတ် သုံးရင် မြန်မာ ၃ ကီးဘုတ်နဲ့ ပိတောက်ဖောင့်ကို တွဲသုံးလေ့ ရှိပါတယ်။

စံနှုန်းကို လိုက်နာထားတယ် ဆိုပေမယ့် အဲဒီဖောင့်တွေမှာ ကွဲလွဲချက်လေးတွေ အနည်းအကျဉ်းတော့ ရှိနေပါတယ်။ ကျွန်တော်သိသလောက် ပြောရမယ် ဆိုရင် တစ်ချို့ ဆော့ဖ်ဝဲလ်တွေ ဝက်ဘ်ဆိုက်ဒ်တွေက ယူနီကုတ် ၅.၁ စံနှုန်းက အပြည့်အဝ အထောက် အပံ့ မပေးသေးပါဘူး။ အဲဒီတော့ Myanmar3 ကလွဲပြီး အခြားဖောင့်တွေမှာ အဲဒီလို နေရာတွေမှာ ကြုံရတတ်တဲ့ Bug တွေကို ရှောင်နိုင်ဖို့ အတွက် Workaround လုပ်ထားတာတွေ ပါပါတယ်။ အဲဒီတော့ သိမ်းဆည်းတဲ့ စနစ် (Storage) မှာ တူကြပေမယ့် ပြသတဲ့ စနစ် (Rendering) မှာတော့ ကွဲပြားမှုတွေ ရှိပါတယ်။ တချို့ Site တွေ (ဥပမာ Myanmar Wikipedia) ကို Myanmar3 နဲ့ ကြည့်မယ်ဆိုရင် တစ်ချို့ စာလုံးတွေ မှန်မှန်ကန်ကန် မပြနိုင်တာ တွေ့ရပါလိမ့်မယ်။ တခြားဖောင့်တွေနဲ့ ဆိုရင်တော့ အဆင်ပြေပါတယ်။ ဆော့ဖ်ဝဲလ်တိုင်းကလည်း Unicode 5.1 ကို သုံးလို့ မရပါဘူး။ ဥပမာ လူသုံးများတဲ့ Adobe Photoshop ပေါ်မှာ ယူနီကုတ် ၅.၁ ကို သုံးလို့ မရပါဘူး။

ယူနီကုတ် ၅.၁ ကို ရယူနိုင်တဲ့ နေရာတွေကို အောက်ကလင့်ခ်မှာ သွားကြည့်နိုင်ပါတယ်။
http://my.wikipedia.org/wiki/Wikipedia:Font#Unicode_5.1_Myanmar.2FBurmese_fonts
ကီးဘုတ်၊ ဖောင့်နဲ့ ကွန်ဗာတာ တွေအကြောင်းကို နောက်ပို့စ်မှပဲ အသေးစိတ် ရေးပါတော့မယ်။

Reference: http://my.wikipedia.org/wiki/Wikipedia:Font

46 comments:

Anonymous said...

ကွန်ပျုတာလည်း နားမလည် ဖောင့်တွေလည်း မတတ် ခုမှမြန်မာစာရိုက်တတ်တာ မကြာသေးပါ...သိတာတွေမျှဝေပေးတဲ့အတွက် ကျေးဇူးအများကြီးတင်ပါတယ်....နောက်မှသေချာထပ်လာဖတ်ပါ့မယ်...

mie nge

MrDBA said...

ဆက်ချီတက် ...

Rita said...

သူတို့က Unicode မဟုတ်တာကို ဟုတ်ပါတယ်လို့ ပြောရင် သူတို့မှာ ဘာအကျိုးရှိနိုင်သလဲ ဆိုတာ တွေးနေမိပါတယ်။

ဦးနှောက်က မတွေးတတ်အောင် ဝေးနေတယ်ဆိုလဲ ခွင့်လွှတ်ပါ။ တကယ်ကို စဉ်းစားမရလို့ပါ။ technical ပိုင်းတွေတော့ သိပ်နားမလည်ပါဘူး။

ဟိုဘလော့မှာ စွပ်စွဲထားသလို တိုင်းရင်းသား ဘာသာစကား ဘာညာကွိကွ ကိစ္စလဲ စွပ်စွဲထားသလို ရည်ရွယ်ပြီး လုပ်တယ် မထင်ပါဘူး။ သူတို့ အလွယ်လိုက်တယ်ပဲ ထားပါတော့ ...

နောက်ဆက်တွဲ သူတို့ ဘာရနိုင်လို့လဲ။

Lu Pyo Gyi said...

ဒီရက်ပိုင်း ဒီကိစ္စတယ်လည်း ပေါ်ပြူလာ ဖြစ်နေပါလား ဟဲဟဲ။ ကျွန်တော်လည်း ပြောမယ်ဆိုရင် myanmar 1 ကတည်းက သုံးလာတာပါ နောက်တော့ myanmar 2, myanmar 3 တွေလည်း ဆက်တိုက်သုံးတာပါပဲ။ သူငယ်ချင်း တစ်ယောက်က ရှမ်းယူနီကုတ် လုပ်တာကိုတောင် ကူလုပ်ပေးဖူးပါသေးတယ်။ အခုလည်း ဂဃနဏ ရေးထားတာတွေ့လို့သာ ဝင်ပြီးကော့မင့်ရေးတာပါ။ တစ်ချို့ကျတော့ ဘာလို့မှန်းလည်း မသိပဲနဲ့ ဇော်ဂျီပဲလို့ အော်တဲ့လူကလည်း များသဗျ။ ကျွန်တော်လည်း အိမ်မှာဆိုရင် ဇော်ဂျီကို သုံးလေ့မရှိပါဘူး။ ဘလော့တစ်ခုပဲ ဖတ်တဲ့လူတွေက ဇော်ဂျီဖြစ်နေလို့ မသုံးမဖြစ် သုံးထားတာပါ။ ဒါမှ တစ်ကယ်တန်း ပြောင်းမယ်ဆိုရင် ကိုယ်ဟာတွေကို ပြောင်းဖို့လွယ်အောင်လို့ပါ။ myanmar 3 သုံးနေကျလူက ဇော်ဂျီကို သုံးချင်စိတ်ကို မရှိတာပါ ရိုက်ရတာကိုပဲ အင်မတန်လွယ်ပါတယ်။ ကျွန်တော်မြင်တာကတော့ မြန်တာတွေ ဘာတွေဘေးနည်းနည်းချိတ်ဗျာ လှတာတစ်ခုတည်းနဲ့ သုံးနေကျတာပါ။ ၅.၁ ကဖောင့်တွေလည်း ဟိုကောင့်ထက် လှအောင်ဆွဲဖို့ ကောင်းတယ်ဗျ။ နောက်ထပ် အရေးကြီးတာက Keyman အပေါ်မှာ မမှီခိုသင့်တော့ဘူး ကိုယ်ပိုင် Input လုပ်သင့်ပြီဗျ။ သူတို့နဲ့ အဆက်အစပ်မရှိတော့ လုပ်နေမလုပ်နေတော့ မသိဘူးဗျာ။

Anonymous said...

Please explain further so that layman can understand. Thanks for your post.

Talkii said...

ကိုလူပျိုကြီးပြောတာတစ်ခုကို သဘောကျတယ် (ကျန်တာတွေတော့မကျတာမဟုတ်ပါဘူး :) ) Keyman ပေါ်မမှီခိုသင်တော့ဘူးဆိုတာ အရမ်းမှန်ပါတယ်။ ကျွန်တော်အပါအဝင် သုံးတဲ့သူအများစုက Unicode ဆိုတာကို နားလည်ကြတာမဟုတ်ပါဘူး။ အဲဒီတော့ unicode 5.1 ဆိုတာကြီးသုံးမယ်ဆိုရင်တောင် တစ်ဆင့်ထဲမပြီးနိုင်ဘူး။ ဟိုဟာဒေါင်းလုပ်လုပ်ပါ၊ ဒီဟာလုပ်ပါနဲ့ ဖြစ်နေရော။ ဇော်ဂျီနဲ့ ဘာကွာလဲဆိုတာ အဲဒါပါ။ ဇော်ဂျီဆိုရင် မင်းစာဖတ်ချင်လား ဒီ font သွင်းလိုက် စာရိုက်ချင်လား ရော့ဒီမှာ instraller ဆိုပြီး တစ်ချက် click လိုက်ရုံပါပဲ။ သုံးတဲ့သူဆိုတာ လွယ်တာ အဆင်ပြေတာကိုပဲ သုံးမှာပါ။ အဲဒီတော့ အကောင်းဆုံးအဆင်ရောက်အောင် ကြိုးစားဖို့ကလွဲပြီး ကြော်ငြာနေစရာမလိုပါဘူး။ ကောင်းတယ်ဆို လိုက်သုံးလာကြာမှာပါ။

BTW, thx for your explanation.

သီဟသစ် said...

ကိုဇက်တီရေ

ဗဟုသုတတွေ ယူသွားတယ်ဗျ ခုလိုသေသေချာချာလေး ပြောပြလို့ thanks

ခင်မင်စွာဖြင့်
သီဟသစ်

ကိုရင်နော် said...

ကိုဇက်တီရေ..
လေ့လာမှတ်သားသွားပါတယ်..

Anonymous said...

ဒီရှင်းပြထားတာက ကောင်းပါတယ်။ ဒါပေမယ့် ဒီအကြောင်းကိုပဲ ခဏခဏ ရှင်းပြနေပုံထောက်တော့ ZT မှာ စီပွားရေးနဲ့ပတ်သက်တဲ့ အကြောင်းတခုခုတော့ရှိမယ်ထင်ပါတယ်။

ဖောင့်နဲ့စီးပွားရေးလုပ်စားလို့ရတယ်ဆိုတာသိကြလို့ ယူနီကုဒ်အော်ပြီး ပိုက်ဆံအကုန်ခံ ဖောင့်တွေလုပ်လာကြတယ်။ နောက်ပြီးတော့ ကိုယ့်ဖောင့်ကိုလူသုံးများလာအောင် ကြိုးစားကြတယ်။ ဒါပေမယ့် သုံးရလွယ်တဲ့ဇော်ဂျီကို လူအများသဘောကျသုံးထားတော့ တိုးလို့မရဘူးဖြစ်နေတယ်။ အဲဒါကို ကိုယ်ဖောင့်ကို သုံးရလွယ်အောင် လှပအောင်မကြိုးစားပဲ ဇော်ဂျီကို တိုက်ခိုက်တဲ့ နည်းတွေသုံးလာကြတယ်။ သဘောကတော့ မင်းသားကြီးမလုပ်ရမယ့်အတူတူ ပတ်မကြီးပဲဖောက်တော့်မယ်ဆိုတဲ့ သဘောပါပဲ။
ဘောလုံးစကားနဲ့ ပြောရမယ်ဆိုရင််တော့ ZT က ကလပ်အသင်းတွေထောင် ပိုက်ဆံတွေသုံးပေမယ့် ဝါသနာရှင်အသင်းဖြစ်တဲ့ ဇော်ဂျီကို မနိုင်ဖြစ်နေတော့ ဇော်ဂျီအသင်းကန်တာ နည်းစနစ်မကျဘူး ငါတို့ကန်တာကျမှ နည်းစနစ်ကျတာ။ ဒါပေမယ့် ZT အသင်းက ဂိုးမသွင်းနိုင်ပဲ ဇော်ဂျီကပဲ သွင်းသွင်းသွားလို့ ခဲမနိုင်ကြိတ်မရဖြစ်နေတာနဲ့တူနေပါတယ်။

လူတွေကို မနက်ဖြန်ပဲ ဇော်ဂျီသုံးရင် ဒုက္ခတွေ့တော့မလိုလိုရေးနေပြီး ကိုယ်တိုင်ကျတော့ ဇော်ဂျီကိုပဲသုံးနေတာကတော့ သိပ်ပြီးတော့ သဘာဝမကျပါဘူး။ ဘယ်သူကမှ ဇော်ဂျီဖောင့်ကိုပဲသုံးပါလို့ ပြောမနေပါဘူး။ အဲဒါကို ဇော်ဂျီသုံးလို့ ဒုက္ခရောက်မယ် ခဏခဏပြောနေတော့ စေတနာထက် နောက်မှာအကြောင်းရှိလို့ဖြစ်မယ်လို့ ယူဆတယ်။ ကိုယ်ဘယ်လိုကောင်းအောင်လုပ်မယ်ပဲ ရေးသင့်ပါတယ်။ သူများမကောင်းတာတွေချည်း ရေးတာများတော့ စဉ်းစားစရာဖြစ်နေပါပြီ။

မီးမီးချစ် said...

စဉ်းစာမနေပါနဲ ့ ဗဟုသုတ ကို ဗဟုသုတ ပဲ မှတ်ပေါ့..
တကယ်လို ့ ကို zt က စီးပွားရေးလုပ်တော့ ရော ကိုယ်သုံးချင်မှ ဖြစ်တဲ့ဟာ ကို.. anonymous လျှောက်ပြောနေတယ်..

ZT said...

ကျွန်တော့်ရဲ့ ပရော်ဖက်ရှင်က အင်ဂျင်နီယာပါ။ ကျွန်တော့် အသက်မွေး ဝမ်းကြောင်းနဲ့ ယူနီကုတ် ဘာမှ ပတ်သက်မှု မရှိပါဘူး။ မြန်မာစာကို စီးပွားရေးဆန်ဆန် လုပ်စားဖို့လည်း အစီအစဉ် မရှိပါဘူး။ ဒါပေမယ့် စီးပွားရေး မဆန်တဲ့ ယူနီကုတ် ပရော့ဂျက် တွေမှာ ပါဝင် နေတယ် ဆိုတာကိုတော့ ကျွန်တော် ဝန်ခံပါတယ်။

မြန်မာစာကို ကမ္ဘာ့အဆင့်အတန်းမီ ဖြစ်စေချင်တဲ့ ရည်ရွယ်ချက် တစ်ခုပဲ စိတ်ထဲမှာ ရှိပါတယ်။ အဲဒီအတွက်လည်း ကိုယ်တတ်နိုင်တဲ့ ဘက်က လုပ်ပေးဖို့ စဉ်းစားထားပါတယ်။

အခုလက်ရှိ ဇော်ဂျီနဲ့ ပတ်သက်ပြီး ကျွန်တော် မြင်နေတဲ့ ပြသနာတွေကို မြင်တဲ့ အတိုင်း ချပြတာပါ။ ကျွန်တော် ချပြခဲ့တဲ့ ပြသနာတွေ တကယ် ဖြစ်နိုင် မဖြစ်နိုင်ဆိုတာကို ကိုယ်တိုင် နားမလည်ရင် နည်းပညာ နားလည်တဲ့သူတွေနဲ့ Double-check လုပ်ကြည့်နိုင်ပါတယ်။

ဘလော့ဂါ တစ်ယောက်အနေနဲ့ ဖတ်တဲ့သူ အဆင်ပြေဖို့ လောလောဆယ် ဇော်ဂျီကို သုံးပါတယ်။ အခုလက်ရှိ ကိုယ်သုံးနေတဲ့ ဖောင့်ဖြစ်ပေမယ့် ဇော်ဂျီ မကောင်းရင်တော့ မကောင်းဘူးပဲ ပြောရမှာပါ။ မကောင်းတာကို မြင်ရဲ့သားနဲ့ မကောင်းဘူးလို့ မရေးရင် ကျွန်တော် ဘယ်လို သွားရေးရမှာလဲ။ ပုံပြင်ထဲက ယုန်လို နှာစေးချင်ယောင် ဆောင်နေတာတော့ ကြာခဲ့ပါပြီ။ ဘာမီတွန် လာတိုက်တဲ့သူ ရှိတော့လည်း နှာစေးချင်ယောင် ဆက်ပြီး ဆောင်လို့ မရတော့ပါဘူး။

ကျွန်တော့် ဘလော့ခ်ကို ယူနီကုတ် ပြောင်းဖို့ စမ်းသပ်နေပါတယ်။ အလွယ်တကူ ပြောင်းနိုင်တဲ့ နည်းလမ်းကို စမ်းသပ်လို့ရရင် ကျွန်တော်နဲ့ အတူတူ ယူနီကုတ် ပြောင်းချင်တဲ့ ဘလော့ဂါတွေကို ရသလောက် ဆွဲခေါ်သွားမှာပါ။ လောလောဆယ်တော့ ပို့စ်တွေကို ဇော်ဂျီနဲ့ ရေးပြီး ငါးကြင်းဆီနဲ့ပဲ ငါးကြင်းကြော်နေပါတယ်။ ကွန်မင့်တွေ ဖတ်ကြည့်ရင် ပြောင်းချင်တဲ့ စိတ်ရှိသူဟာ ကျွန်တော် တစ်ယောက်တည်း မဟုတ်ဘူး ဆိုတာ သိနိုင်ပါတယ်။

မင်းညို said...

ကို ဇက်တီရေ...
လွိုင်လင်ကတည်းက ကိုဇက်တီရေးတာတွေသဘောကျတယ်..။ ယူနီကုဒ်နဲ့ပတ်သက်ပြီး တကူးတက ရှင်းပြပေးတာ ကျေးဇူးတင်ပါတယ်...။ ယူနီကုဒ်စစ်စစ်တွေ ဖြစ်လာကြရင်ဘယ်လောက်ကောင်းမယ်ဆိုတာ ဥပမာလေးတွေ ပေးတာသဘောကျပါတယ်..။
နည်းပညာပိုင်းဆိုင်ရာတော့ နားမလည်ဘူး..။ ကျွန်တော် အားမရတာကတော့ ကျွန်တော်တို့ မြန်မာစာကို မြင်ချင်ရင် ဆော့ဖ်ဝဲ တွေ install လုပ်နေရတာကိုပဲ...။ နောက်ပြီး ဝီကီပိဒိယ မှာ မြန်မာစာမျက်နှာ ကောင်းကောင်းမရှိတာပဲ..။ မြန်မာတိုင်းကြိုက်ကြတဲ့ ကမ္ဘာပေါ်က ဖောင့်တွေနဲ့ တန်းတူရှိတဲ့ ဖောင့်တစ်မျိုးလောက် မြင်ချင်တယ်ဗျာ...။ ့ဒီပညာရပ်နဲ့ပတ်သက်တဲ့ ပညာရှင်တွေ မြန်မာမှာ မနည်းဘူးဆိုတာ ကျွန်တော် မှန်းဆသိသိပါတယ်..။ စုစုစည်းစည်းနဲ့ အကောင်းဆုံးတစ်ခု ထွက်လာအောင် လုပ်နိုင်မယ့်နေ့ကိုမျှော်လင့်မိပါတယ်..။ ဂျာမန်စာကို ကျွန်တော်နားမလည်တိုင်း ဂူဂဲ translator သုံးပြီး အင်္ဂလိပ်လိုဖတ်နေရတယ်ဗျာ..။ဘလော့ပိုစ့်တွေကို တခြားဘာသာတွေကနေမြန်မာ၊ မြန်မာကနေ တစ်ခြားဘာသာတွေ တိုက်ရိုက်ပြန်နိုင်မယ့်နေ့ကို လည်းမျှော်လင့်ပါတယ်..။ အဟီးရှည်သွားလို့ခွင့်လွှတ်ပါ..။

Anonymous said...

Hello Ko ZT

Thank you for your post about Unicode.
At the moment I dont have Myanmar font and I dont know any knowledge of how to install unicode in my computer.
Kindly request to you,please explain how to install correctly unicode which you linked in your post.

I just installed and save my C and then what should I have to do so far.
Do I need to chang any setting in font in control panel or add other language?
I dont know any more . Please.
Thanks in advanced.


One who likes Unicode

ရေတမာ said...

ကျနော်တို့ user အနေနဲ့ ရေရှည်သုံးစွဲနိုင်မယ်. စံနှုနု်းလည်းရှိမယ်.. သုံးစွဲရတာလည်လွယ်ကူမယ့် ဖောင့်မျိုးကို သုံးမှာပါ။ ညင်သာတဲ့ အပြောင်းအလဲဖြစ်ဖို့တော့ လိုမယ်ထင်တယ်.. နည်းပညာရှင်တွေ ဖြေရှင်းနိုင်မယ်လို့လည်း ယုံကြည်တယ်..

ပိုစ့်အတွက်လည်း ကျေးဇူးတင်ပါတယ်..

မေဇင် said...

ဗဟုသုတတွေ မျှဝေပေးလို့ ကျေးဇူးပါ..။ ဘာမှလဲ မသိခဲ့ပါဘူး..လူတိုင်း ဇော်ဂျီလိုလို ဖြစ်နေတော့ နောင့် တို့ဘာမှ မသိတဲ့ လူတွေကလဲ သုံးရလွယ်တဲ့ ဇော်ဂျီပေါ့...ဒါပေမယ့် ဒီ့ထက်..ပိုကောင်းတဲ့ အရာတွေ လာရင်လဲ ... လူတွေ ရဲ့ သဘာဝ ပိုကောင်းတာကို ..ပဲ လိုက်လုပ်ကြမှာပါ ကိုZT...ကြိုးစားပေးပေါ့... း)

ခင်တဲ့
မေဇင်

Aung said...

If I understand correctly the post, the whole main point is user have to use unicode 5.1 compatible font since user are the one whole generate the original corpus.. And ZawGyi has to be REAL unicode 5.1 compatible.

Here are a few question I have, I really don't know about it and interested to find some possible solutions..

1. If ZawGyi become unicode compatible font, How about exisitng corpus which are already in old ZawGyi codepoint?
2. When is the normalization done in Unicode font? After typing a word or save the whole corpus or some other situations?

Best Regards,
/awm

ZT said...

AWM-> Thanks for your interest. The answer for your questions are as follows:

1. All the text that currently written in Zawgyi codepoint need to be converted to Unicode 5.1 compatible codepoint. Currently, there is a standalone converter call "KaNaung" which is available in open source. We also have a plan to release another standalone converter with open source soon.

2. Unicode normalization is done after typing before saving the documents.

Feel free to raise questions if you have any doubt.

နွေးနေခြည် said...

အတော်စုံစုံလင်လင် သေသေချာချာ သိရတာပဲ.. ကျေးဇူး ကိုဇက်တီ

အတူတူ ယူနီကုတ် ပြောင်းချင်တဲ့ ဘလော့ဂါတွေကို ရသလောက် ဆွဲခေါ်သွားမှာပါ။
ဆွဲခေါ်ပါ ဆွဲခေါ်ပါ... း)

Aung said...

Ko ZT, thanks for your fast response.

If we can convert the existing ZawGyi Code point to Unicode with "KaNaung" converter, I think we no need to blame ZawGyi for now.. BUT need to promote/distribute ideas of why we should use Unicode.

For Tenhnical,
1. Can "KaNaung" be part of crawler? just for myanmar search engine. (google won't bother it and zawgyi code point will corrupt in google, so user know that they need to change to unicode).
2, Can "KaNaung" be plug-in for Application ? (like your example, Population Database Application)
3. If typing in Unicode is slow due to normalization & smart rendering, can't the code can be fine-tune? We also need to find out why user are insisting to use Unicode.

We can use 1 & 2 approach, until one of unicode 5.1 compatible & user friendly font emerge.
I agreed ZawGyi need to modify (at least for normalization) but it is really hard to find out who is the owner of ZawGyi is, and seems no one has full responsibilities for it.

Just my 2 cents,
/awm

Could you please point me out where I can get Myanmar3 source code since it is saying opensource. My google skill is bad for this.. :-)

ZT said...

AWM-> I will leave Q1,2 & 3 for now. I don't want to pretend to know everything. :) I will leave it for the experts (like Ko Soe Min or Ko Ravi) to answer it.

To be frank, I also don't know where they keep Myanmar3 Source code. :D But I can point you out where you can get source code for other Unicode 5.1 compatible fonts.

1) Parabaik font with source code is available with OFL (Open Font License) from http://www.parabaik.info/

2)Padauk font with source is available at http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&id=Padauk

Parabaik is Open Type Font (same type as Myanmar3) and Padauk is Graphite font.

Now I think only weak point in Unicode font is its look. But I don't understand why people still claiming that Unicode fonts are not user-friendly. Maybe, lack of user guide or instructions. I will find out.

Btw, you sound like AWM who regularly posting in MMITP.

Aung said...

Yes, I am indeed.. but posted sometime. :-)

Your post have much collaborative info then following all the unicode & zawgyi problem in forums. So I post my though here, sorry for it.
I will try to forward my email to you that was suggest by Seth (Wait-Zar Developer).. Don't be surprise if you receive forward email from one of your friends since I don't have direct contact to you.. :-)
After that you will know why I post questions here..

best regards,
/awm

မာ့ခ် said...

@ko zt :

Thx for raising this with your excellent writing ko zt.

@awm :

1,2,3 all cannot.

for 1,2 , kanaung is old project, and i stop developing, and i will not do open-sourcing anymore on my later programs normally, coz of copy cat ppl like okisan(let me know if you dont now what i am telling). there is newer one called myanmar text tools, but it is testing, so i cannot gurantee anything.

3, is written mainly by microsoft, pango,qt developers, not us, there is pango mm patch by tmhtet though, but you cannot tell them like microsoft to make it fast.

@both

all the fonts are editable by fontforge, regardless of license.
licensing is different, like you can redistribute or not, commercial or not. you can do everything in your computer, unless you tell or distribute to others.

rgds,
mark

မာ့ခ် said...

FYI

ယူနီကုတ် ၅.၁ သည် ယူနီကုတ်၊ ဒါပေမယ့် ယူနီကုတ်သည် ယူနီကုတ် ၅.၁ တစ်ခုတည်းမဟုတ်

Anonymous said...

ကို ZT ရေ ..
ဒီပို့စ် လေးအတွက် တကယ်ကျေးဇူးပါ..
လွယ်တာသုံးကြတာကို အပြစ်မပြောလိုပေမဲ့
ခေတ်မီမီ ကမ္ဘာကြည့်ကြည့်မြင် ကြ ဘို့လိုပါတယ်..
အားလုံးတက်ညီလက်ညီ ရှိကြရင် ဘယ်လောက်ကောင်းမလဲ နော်
ခုတော့ အဆိုးမြင်ကြ တယူသန်နဲနဲ ဆန်ကြတဲ့ ကွန်မန့်တချို့ဖတ်ရတာ စိတ်မကောင်းတော့ဖြစ်မိပါတယ်..
မြန်မာ ယူနီကုဒ် အမြန်ဆုံးတွင်ကျယ်အောင်မြင်ပါစေ..

အားပေးလျှက်ပါ
ချစ်စု

nyimuyar said...

ko ZT, thanks and still waiting to Change, some of my friend also waiting the right time.
Timing is really important. :D

ZT said...

@Mark

ဇော်ဂျီကို ယူနီကုတ်ဖောင့်အဖြစ် နာမည် မတပ်ချင်တဲ့ အကြောင်း က ဒီလိုပါ။

၂၀၀၃ ခုနှစ်က ပထမဆုံး မြန်မာယူနီကုတ် ပရော့ဂျက် မန္တလေး (http://sourceforge.net/projects/mandalay/) မှာ ကျွန်တော် ပရိသတ် တစ်ယောက်အနေနဲ့ ပါခဲ့ဖူးပါတယ်။ (မင်ဘာ ဖြစ်ပေမယ့် ဘာမှ ပံ့ပိုးမှု မပေးနိုင်ခဲ့လို့ ပရိသတ်လို့ ပြောတာ ပိုသဘာဝ ကျပါတယ်။) အဲဒီအချိန်ကတည်းက Smart Rendering နဲ့ ပတ်သက်တဲ့ ကန့်သက်ချက်တွေကို ယူနီကုတ် စံနှုန်းထဲမှာ ဖတ်ခဲ့ရဖူးပါတယ်။ အက္ခရာတစ်ခုဟာ နေရာပြောင်း ပုံစံပြောင်းတာနဲ့ Codepoint အသစ်တစ်ခု ထပ်မယူရဘူး ဆိုတဲ့ ကန့်သတ်ချက်မျိုးပါ။ အဲဒီ ကန့်သတ်ချက် ဟာ ဘာသာစကားတိုင်း လိုက်နာရမယ့် ကန့်သတ်ချက် ဖြစ်ပြီး မြန်မာ အက္ခရာတွေ ယူနီကုတ် ဇယားမှာ ပါမလာခင်ကတည်းက ရှိခဲ့ပါတယ်။ (Normalization ပါမပါတော့ သေချာ မမှတ်မိပါ။)

အဲဒါကြောင့် မြန်မာ ယူနီကုတ် ဖောင့်တိုင်းဟာ ယူနီကုတ် နာမည် တပ်ချင်ရင် အဲဒီလို ကန့်သတ်ချက်ကိုတော့ အနည်းဆုံး လိုက်နာဖို့ လိုတယ်လို့ ကျွန်တော့် အနေနဲ့ ယူဆပါတယ်။ ဒါကြောင့် ကျွန်တော့် အနေနဲ့ မြစေတီ၊ ဇော်ဂျီ၊ BIT စတဲ့ဖောင့်တွေကို ယူနီကုတ်ဖောင့် အနေနဲ့ လက်မခံနိုင်တာပါ။

နိုင်သူ said...

ကျွန်တော်ကတော့ Annonymous ပြောသွားသလိုပဲ MM3 တွေ MM2 တွေကို သုံးကြပါလို့ ပြောမယ့်အစား ZAWGYI ကို ဘယ်လို ဖြတ်ကျော်နိုင်မလဲပဲ စဉ်းစားစေချင်ပါတယ်... User ဆိုတာကတော့ Ready ဖြစ်တာကို ပိုသဘောကျပါတယ် ... Unicode တိုင်းသာကောင်းမယ်ဆိုရင် Padauk ကိုလဲကြိုက်တာပဲ ... ဒါပေမယ့် လိုက်လျောညီထွေမရှိဘူး... အဲဒါကြောင့် လူသုံးနည်းတယ် ... LINUX မှာဆိုရင် ပိတောက်ကို UNICODE Sys အနေနဲ့ တခါတည်း ပေးထားတာပါ... ဒါပေမယ့် တကယ်တန်းသုံးနေတဲ့ ဇောိဂျီ ကိုမမှီဘူးဗျ ... အဲဒါဘာလဲဆိုတော့ ဘယ်အရာမဆို လွယ်ကူဖို့လဲ လိုသေးသဗျ... ကိုယ်တယောက်တည်းက တတ်သိနားလည်နေလို့ ကောင်းတယ်ဆိုရင် မတတ်တဲ့သူတွေအတွက်ဘက်က ဆိုရင် ဘယ်လိုလည်း ဆိုတာ စဉ်းစားဖို့ လိုသေးတယ်... MM3 ကိုသာ တကယ်တမ်း UNICODE အနေနဲ့ သတ်မှတ်စေချင်ရင် Zawgyi ထက် ပိုပြီး လွယ်ကူချောမွေ့အောင် ကြိုးစားကြပါလို့ပဲ ပြောချင်ပါတယ် ... Zawgyi စပေါ်လာတည်းကလည်း ကြေငြာပြီး ဝင်ခဲ့တာ မဟုတ်ပါဘူး... တဆင့်စကား တဆင့်နားနဲ့ လွယ်ကုူချောမွေ့တယ်... အဆင်ပြေတယ် ဆိုတာတွေနဲ့ တင် USER ကိုဆွဲဆောင်မှု့ပေးနေပါပြီ ... ကျွန်တော်ကတော့ ဒီလောက်ပဲ ပြောချင်ပါတယ် ... ထပ်ပြောရင် စာရှည်သွားမှာစိုးလို့ပါ...

ZT said...

>> နိုင်သူ
>> လိုက်လျောညီထွေမရှိဘူး...
>> တကယ်တန်းသုံးနေတဲ့ ဇောိဂျီ ကိုမမှီဘူးဗျ
>> လွယ်ကုူချောမွေ့တယ်... အဆင်ပြေတယ်

ဘာကို ဆိုလိုချင်တာလဲ မသိဘူး။ ကျွန်တော့် အတွေ့အကြုံအရတော့ ယူနီကုတ်က ဇော်ဂျီထက် ပိုလွယ်ပါတယ်။ အခုဆိုရင် One-click Installer မရှိတာက လွဲရင် Myanmar3 Installer တစ်ခုတည်းနဲ့ ဖောင့်၊ ကီးဘုတ်၊ Windows မှာသုံးတဲ့ Uniscribe DLL အားလုံးကို တခါတည်း တစုတစည်းတည်း Install လုပ်လို့ ရပါတယ်။

ယူနီကုတ်နဲ့ ဇော်ဂျီ နှစ်ခုစလုံးကို သုံးဖူးတယ် ဆိုရင် User Experience အရ ဘာအခက်အခဲ ရှိတယ် ဆိုတာ သိချင်ပါတယ်။

Thanks.

Anonymous said...

အင်း ကိုဇော်သက်ရဲ့ ဖြေကြားချက်တွေကို သဘောကျတယ် အာဂတ ကင်းပီးတော့ ပရော်ဖက်ရှင်နယ်ဆန်တယ် ... ဇော်ဂျီကိုလဲ အာဂတ ကင်းကင်းနဲ ရှင်းပြနေတယ်မှတ်ပါမယ် ဘာဖြစ်ဖြစ် blog.mghla.com မှာလုပ်ထားတဲ့ ဇော်ဂျီ နဲ 5.1 converter လေးကို သဘောကျတယ်။ ကို zt လည်းသွားကြည့်လိုက်ပါအုံး။ ဘလော့ဂါတွေကော အဲလိုလုပ်ရင် အဆင်မပြေနိုင်ဘူးလား? မသိလိုမေးတာပါ

Anonymous said...

ကို ဇော်သက် ဟိုဘက်ပို(စ်)က reply ကိုမဖတ်ပဲ အပေါ်မှာရေးမိပါတယ်။ ကိုဇော်သက် မှာရှိတယ်ဆိုတာလည်း ယုံပါတယ်ဗျာ.... download လုပ်ဖိုစောင့်နေမယ်

ပြသနာတိုင်းတွင် အဖြေရှိပါ၏

Anonymous said...

http://blog.nyilynnseck.com/search/label/Zawgyi

ဒီပို့စ်လေးကို ဖတ်ကြည့်ပေးပါ... ကိုညီလင်းဆက်ရဲ့ ဆန္ဒနဲ့ ကျွန်တော်ရဲ့ ဆန္ဒ တူညီတဲ့ အတွက် ဆက်ပြီးမရေးတော့ပါဘူး...

Law Shay said...

နင်ဒါရေးမယ်မှန်းသိရင် ငါ အပင်ပန်းခံပြီး မရေးပါဘူး။ ခွီး။ အခုတော့ အလကား ပင်ပန်းပြီ။

စတာပါ။ ကောင်းပါတယ်။ ရှေ့ဆက်ပါ။ ကျွန်တော်ကတော့ ဖြေရှင်းဖို့ နည်းလမ်းရှာတဲ့ဘက်ကိုပဲ ဦးစားပေးပါတယ်။

မာ့ခ် said...

ko zt,

>> ယူနီကုတ် ဖောင့်က နောက်ကွယ်မှာ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်)

that is not done by font,
it is done by keyman or input program.

zawgyi can do that also.

ZT said...

@Mark

Thanks for correction.

ZT said...

>>http://blog.nyilynnseck.com/search/label/Zawgyi
>>>ဒီပို့စ်လေးကို ဖတ်ကြည့်ပေးပါ... ကိုညီလင်းဆက်ရဲ့ ဆန္ဒနဲ့ ကျွန်တော်ရဲ့ ဆန္ဒ တူညီတဲ့ အတွက် ဆက်ပြီးမရေးတော့ပါဘူး...

မြတ်စွာဘုရားက ကာလာမသုတ်မှာ ဟောခဲ့ဖူးတယ်။ ငါပြောလို့လည်း အမှန်မမှတ်နဲ့။ သူများပြောလို့လဲ အမှန်မမှတ်နဲ့။ ကိုယ်ပိုင်ညာဏ်နဲ့ ချင့်ချိန်ပြီးမှ မှန်သလား မှားသလား ကိုယ့်ဘာသာကိုယ် ဆုံးဖြတ်ဆိုတာမျိုးပါ။

ဘုရားတောင်မှ သူပြောတာကို မဆင်မခြင် အမှန်လို့ မမှတ်ယူဖို့ ပြောခဲ့တာ။ ညီလင်းဆက် ပြောလို့လည်း အမှန်မမှတ်ပါနဲ့။ ကျွန်တော် ပြောလို့လည်း အမှန်မမှတ်ပါနဲ့။ ကိုယ်ပိုင်ညာဏ်နဲ့ စဉ်းစားကြပါ။ စဉ်းစားဖို့ အချက်အလက်တွေလည်း ကျွန်တော် သိသလောက် ပေးပြီးပါပြီ။

၂၀၀၅ ခုနှစ်ထဲက မြန်မာဝီကီပိဒီယကို Myanmar1 နဲ့ ကျွန်တော် စရေးခဲ့ပါတယ်။ ဇော်ဂျီ အဲဒီအချိန်က မထွက်သေးပါ။ အဲဒီတော့ ဇော်ဂျီကလွဲလို့ အင်တာနက် ပေါ်မှာ ဘယ်ဖောင့်မှ အဆင် မပြေဘူးဆိုတဲ့ အဆိုကို လက်မခံပါ။ စာလုံးထွက် မလှတာပဲ ရှိပါတယ်။ ဒေတာနဲ့ ပတ်သက်လို့လည်း Normalization မလုပ်တဲ့ အတွက် ဘယ်လို ပြသနာမျိုး ရှိနိုင်တယ် ဆိုတာကို အကျိုးသင့် အကြောင်းသင့် ထောက်ပြခဲ့ပြီးပါပြီ။

နောက်ဆုံးတော့ ကျွန်တော်တို့ ယူနီကုတ် စံနှုန်းကို လိုက်ပြောင်းရမှာဘဲ။ အနှေးနဲ့ အမြန်ပဲ ရှိပါတယ်။ ယူနီကုတ် စံနှုန်းက စံနှုန်းမညီတဲ့ ဇော်ဂျီနောက်ကို ပြန်လိုက်မှာ မဟုတ်ပါဘူး။ နောက်လည်း ရှင်းရမယ့် အတူတူ ပြသနာကို အခုကတည်းက စောစောစီးစီး ရှင်းထားလိုက်တာ ပိုမကောင်းဘူးလား။ ကျွန်တော်တို့တွေ အရိုးစွဲ အကျင့်တွေကို ဖျောက်ပစ်ကြဖို့ပဲ လိုပါတယ်။

Anonymous said...

ကိုZT အဲဒီပို့စ်ကို သေချာ မဖတ်သေးပါဘူး... သေချာဖတ်ကြည့်ပါအုန်း... သူများဘက်ကြီးပဲ မမြင်ပါနဲ့အုန်း...UNICODE ဘက်ကိုထောက်ပြတာလဲ ကြည့်ပါအုန်း... ငါကတော့ UNICODE အစစ်ဆိုတာချည်းပဲ လည်း မလုပ်ပါနဲ့အုန်း ... ကျွန်တော်ကိုယ်တိုင်သာ သူများပြောတဲ့ အတိုင်းလိုက်မယ်ဆိုရင် MM3 တို့ ပုရပိုက်တို့ဆိုတာ ကျွန်တော့်စက်ထဲမှာ ထားမှာပေါ့... အခုဟာက UNICODE ကို ပြောင်းမှ ဖြစ်မယ့်ဆိုတာမျိုးမို့ လို့ပြောတာပါ... ညီလင်းဆက် ပြောတာက ပိုသဘာဝကျတယ်... ဖြစ်သင့်တဲ့ ဘက်ကိုပြောထားတာ များတယ်... ZT ပြောတာက အတိုင်းထက် အလွန်လိုမျိုးဖြစ်နေတယ်... ဒီနေ့ မပြောင်းတာနဲ့ နောက်နေ့ဆိုရင် ဒီ DB ကြီးကZG ကို မသိတော့ တဲ့ အတိုင်းဖြစ်နေတယ်... အခုဟာက User ဘက်ကနေပြောနေတာနော်... Technology ဘက်က Developer ဘက်ကပြောနေတာ မဟုတ်ပါဘူး... Renderingတွေနဲ့ ကိုင်ပေါက်လို ကိုင်ပေါက်ဖြစ်နေလို့ပါ... (မှတ်ချက်။ ။ ကျွန်တော်သည် ZG အသိုင်းအဝိုင်းနှင့် လုံး၀ပတ်သက်မှု့မရှိပါ။)

Anonymous said...

ကျန်သေးတာက Normal User တွေအသုံးပြုနေတဲ့ Zawgyi က လက်ကွက် အစုံရှိနေပါပြီ... MM3 ကကော အဲဒီလောက်စုံပြီလား... ကိုယ့်ဘက်မှာ ဘယ်လောက်ပြည့်စုံမှုရှိနေပြီလဲ ... အဲဒါပါပဲ...

ZT said...

ကျွန်တော်လည်း မြန်မာစာကို နည်းပညာအားဖြင့် ဖြစ်ကတတ်ဆန်း လုပ်ထားတာ၊ ဆေးမြီတို သုံးထားတာ ကို ကြည့်မရတဲ့သူပဲ ဖြစ်ပါတယ်။ မြန်မာစာ နည်းပညာကို နိုင်ငံတကာ အဆင့်အတန်းမီ ဖြစ်စေချင်ပါတယ်။ (စေတနာ ဆိုတဲ့ အလုံးကြီးက ကြီးလွန်းလို့ စေတနာလို့ မသုံးပါ။ ကိုယ့်ဘာသာကိုယ် မနေနိုင်မထိုင်နိုင် ဖြစ်နေတာလို့ပဲ မှတ်ပါ။) လိုက်ချင်တဲ့သူတွေ လိုက်ခဲ့ပါလိမ့်မယ်။ မလိုက်ချင်တဲ့သူများ နေခဲ့ကြပါ။ အဲဒါလည်း User Choice ပါပဲ။


>>>ကျန်သေးတာက Normal User တွေအသုံးပြုနေတဲ့ Zawgyi က လက်ကွက် အစုံရှိနေပါပြီ...

ဘာကိုဆိုလိုချင်တာလဲ မသိ။ ကျွန်တော်ရိုက်ချင်သမျှ မြန်မာအက္ခရာတော့ ယူနီကုတ် ကီးဘုတ်နဲ့ ရိုက်လို့မရတာ မရှိပါဘူး။

Anonymous said...

စကားမစပ် ပါဌ်ဆင့် လေးတွေ ရိုက်လို့ရမလားဟင် ... ဇော်ဂျီမှာသုံးထားတဲ့ ပါဌ်ဆင့်လေးတွေလိုပေါ့...

ZT said...

စာလုံး ၂ လုံးကြားမှာ Shift+f ထည့်ရိုက်ရင် ပါဌ်ဆင့် ဖြစ်သွားပါလိမ့်မယ်။

က္က ရိုက်ချင်ရင် က + (Shift + f) + က ရိုက်ရပါတယ်။
သင်္ချာ ဆိုရင် သင် + (Shift + f) + ချာ ရိုက်ရပါတယ်။

အသေးစိတ် သိချင်ရင် Myanmar3 Installer ထဲမှာပါတဲ့ "InputSequence.pdf" မှာ ကြည့်ပါ။

စိတ်ဝင်စားမှု အတွက် အထူး ကျေးဇူးတင်ပါတယ်။ Feedback တွေ များများ လိုချင်ပါတယ်။

AUNG Sithu said...

ကိုဇော်သက်ရေ...
ဖတ်သွားပါတယ်..
ကျွန်တော်က ဒီကိစ္စတွေမှာ တော်တော်ပိန်းတယ်..
နားမလည်တာက အဲဒီ normalization တွေ.. smart rendering တွေကို ဘယ်သူက ဘယ် component က လုပ်နေတာလဲ ဆိုတာပါ..
သိတဲ့အတိုင်း font ဆိုရင် font ချည်းပဲမြင်တော့ font က အဲဒါတွေ လုပ်နေတာလား... ဘယ်သူက လုပ်နိုင်တာလဲ ဆိုတာလေး...

ZT said...

ကိုအောင်စည်သူ

Smart Rendering ကို Smart Font ကနေ လုပ်ပေးပါတယ်။ အဲဒီလို လုပ်ဖို့အတွက် ဖောင့်ထဲမှာ Glyph တွေကို Match လုပ်ပေးမယ့် Table အပိုတွေ ပါပါတယ်။

Normalization ကိုတော့ ကီးဘုတ်ကနေ လုပ်ပေးတယ်လို့ မာ့ခ် ဆီကနေ သိရပါတယ်။

mm thinker said...

မြန်မာစာတွေ နိုင်ငံတကာကွန်ပြူတာမှာ လေးထောင့်တုံး မမြင်ရပြီးတာပဲ။

ဘေးချင်းကပ်နိုင်ငံက ကျောင်းမှာတောင် ဇော်ဂျီထည့်မယ်ဆို ပေးမထည့်ဘူး အက်ဒမင်က ပိတ်ထားတယ်။

ဘေးမှာ ဗီယက်နမ်တွေ၊ တရုတ်၊ အင်ဒိုနီးရှားတွေကတော့ ဟုတ်လို့ပဲ။ ကိုယ်တွေများ ကျောင်းက စက်သုံးရင် ဂျီတော့ခ်မှာ "မြန်မာလို မရိုက်ပါနဲ့ ဘားဂလိပ်ရိုက်ကြပါ"ဆိုပြီးပြောရတယ်။

ဒီခံစားမှုမျိုးနဲ့ပဲ ဘာဖြစ်သင့်တယ်ကို သုံးစွဲသူသက်သက်အနေနဲ့ ကျနော် မျှော်မှန်းတာဖြစ်ပါတယ်။

Anonymous said...

တို့ကတော့ မြန်မာ ၃ ပဲ
ဇော်ဂျီကတော့ မဖြစ်မနေမို့လို့သုံးတာပါ။။။

Unknown said...

ကိုယ်ကြိုက်တာ သုံးတာအကောင်းဆုံးပါပဲ ... အဲဒါမှ ဘယ်ဖောင့်က အမှန်ဆိုတာ မြင် လာပါမယ်

Unknown said...

ကျွန်တော်ကတော့ ဖုန်းကrootလုပ်မရတော့ zawgyiမမြင်ရဘူး
Kitkat Zultraပါ။ အာ့ကြောင့် myanmar unicode နဲရေးထားတာရှာဖတ်နေပါတယ်
အောင်မြင်ပါစေဗျာ