ဖူးနုသစ်: ဖောင့်မသိတော့ ဇော်ဂျီ ယူနီကုတ်ထင်

Wednesday, July 15, 2009

ဖောင့်မသိတော့ ဇော်ဂျီ ယူနီကုတ်ထင်

မြန်မာ ယူနီကုတ်ဆိုတာ ဘာလဲ၊ ဇော်ဂျီက မြန်မာယူနီကုတ် စံနှုန်းကနေ ဘာတွေ လွဲနေသလဲ၊ ဘာကြောင့် ယူနီကုတ်စနစ်ကို ပြောင်းသုံးသင့်တာလဲလို့ ဇဝေဇဝါ ဖြစ်နေသူများကို ရှင်းပြဖို့ အတွက် ဒီပို့စ်ကို ရေးပါတယ်။

ဟိုးအရင် ကာလတွေတုန်းက ကွန်ပြူတာမှာ မြန်မာစာလုံးကို သိမ်းဆည်းတဲ့ အခါမှာ မြန်မာစာလုံး အဖြစ်မသိမ်းဆည်းပဲ အင်္ဂလိပ် စာလုံးနဲ့ ညီမျှတဲ့ နံပါတ် အဖြစ်နဲ့ပဲ သိမ်းဆည်းပါတယ်။ အကယ်၍ ကျွန်တော်တို့ သဝေထိုး (ေ) ကို ရိုက်ပြီး ကွန်ပြူတာ ထဲမှာ သိမ်းမယ်ဆိုရင် ကွန်ပြူတာက သဝေထိုးအနေနဲ့ မသိမ်းပဲ အင်္ဂလိပ်စာလုံး "a" နဲ့ ညီမျှတဲ့ နံပါတ် 97 အနေနဲ့ သိမ်းပါတယ်။ အဲဒီလို စနစ်မျိုး သုံးထားတဲ့ ဖောင့်ကို အက်စကီးဖောင့် (ASCII Font)လို့ ခေါ်ပါတယ်။ အက်စကီး ဖောင့်တွေဟာ တရုတ်၊ ကိုရီးယား ဘယ်ဘာသာ စကားကို မဆို အင်္ဂလိပ် အက္ခရာ ဒါမှမဟုတ် !@ အစရှိတဲ့ သင်္ကေတ (Symbol) တွေနဲ့ ညီမျှတဲ့ ဂဏန်းတွေ အဖြစ် ပြောင်းပြီး သိမ်းပါတယ်။ အက္ခရာ တစ်လုံးကို သိမ်းဖို့ ဂဏန်း ၂ လုံးစာ နေရာ ပေးရပါတယ်။ ဝင်းအင်းဝ၊ ဝင်းကလော ၊ CE စတဲ့ မြန်မာဖောင့်တွေဟာ အဲဒီလို စနစ်မျိုးနဲ့ အလုပ်လုပ်ပါတယ်။ အဲဒါကြောင့်မို့ ဝင်းအင်းဝနဲ့ ရေးထားတဲ့ စာကို မြန်မာ ဖောင့်မရှိတဲ့ အချိန် ဖတ်ရင် အင်္ဂလိပ် စာလုံးတွေ မြင်ရတာပါ။

ယူနီကုတ် စံနှုန်းမှာတော့ ဘာသာစကား တစ်ခုချင်းစီ အတွက် သီးသန့် ဂဏန်း (Codepoint) တွေ သတ်မှတ်ပေးထားပါတယ်။ တကမ္ဘာလုံးမှာ ရှိသမျှ ဘာသာစကားတွေ အတွက် ဂဏန်း ၂လုံးစာ နဲ့ မလောက်တဲ့ အတွက် အခြေ ၁၆ ရှိတဲ့(Hexadecimal) ဂဏန်း ၄လုံး သုံးထားပါတယ်။ အဲဒီအတွက် အက္ခရာ ၆သောင်း ၅ထောင်ကျော် ကို ယူနီကုတ် စနစ်မှာ ကွဲကွဲပြားပြား သိမ်းလို့ရပါတယ်။ မြန်မာစာ နဲ့ တိုင်းရင်းသား ဘာသာစကားများ ဖြစ်တဲ့ ရှမ်း၊မွန်၊ စကောကရင်၊ ပိုးကရင် စတဲ့ ဘာသာစကားတွေ အတွက် ယူနီကုတ် အဖွဲ့ (Unicode Consortium) က ယူနီကုတ်နံပါတ် 4096 ကနေ 4255 (Decimal) အတွင်းမှာ သတ်မှတ်ပေးထားပါတယ်။ အဲဒီတော့ ကျွန်တော်တို့ မြန်မာစာ သဝေထိုး “ေ” ကို ရိုက်ပြီး သိမ်းမယ် ဆိုရင် ယူနီကုတ် စံနှုန်းမှာ နံပါတ် 4145 အနေနဲ့ သိမ်းပေးပါတယ်။ ကမ္ဘာပေါ်မှာ ရှိသမျှ ဘာသာစကားတွေ အားလုံးထဲမှာ 4145 နဲ့ ညီမျှတဲ့ အက္ခရာ ဟာ မြန်မာ အက္ခရာ သဝေထိုး တစ်ခုပဲ ရှိပါတယ်။ အခြား ဘယ်ဘာသာ စကားမှာမှ မရှိပါဘူး။ အဲဒါကြောင့် မြန်မာယူနီကုတ်ဖောင့် မရှိရင် အဲဒီစာလုံးကို လေးထောင့်ကွက် အဖြစ်နဲ့ပဲ မြင်ရပါတယ်။

ဇော်ဂျီနဲ့ ယူနီကုတ် ဖောင့်တွေ ရဲ့ ကွာခြားချက်က အဲဒီမှာ စမြင်နိုင်ပါတယ်။ ယူနီကုတ်ဖောင့် (Myanmar3, Padauk, Parabaik, MyMyanmar) အစရှိတဲ့ ဖောင့်တွေက ယူနီကုတ် အဖွဲ့က Unicode 5.1 Standard မှာ သတ်မှတ်ပေးထားတဲ့ စံနှုန်းအတိုင်း အတိ အကျ လိုက်နာပြီး သတ်မှတ်ထားတဲ့ ဂဏန်းတွေနဲ့ စာလုံးတွေကို သိမ်းပါတယ်။ ဇော်ဂျီကတော့ ကိုယ့်ဘာသာကိုယ် သိမ်းချင်တဲ့ ဂဏန်းနဲ့ သိမ်းထားပါတယ်။ ဇော်ဂျီက သုံးတဲ့ ဇယားနဲ့ ယူနီကုတ် အဖွဲ့က တရားဝင် သတ်မှတ်ပေးထားတဲ့ ဇယား နှစ်ခုကို အောက်မှာ ယှဉ်ပြ ထားပါတယ်။

Unicode 5.1 စံနှုန်း ဇယား

ဇော်ဂျီတွင် သုံးသော ဇယား

ဒါပေမယ့် ရိုက်သမျှ ဂဏန်းကို မြန်မာစာအတွက် သတ်မှတ်ပေးထားတဲ့ ဂဏန်းတွေနဲ့ သိမ်းတိုင်းလည်း ယူနီကုတ်လို့ ပြောလို့ မရပါဘူး။ ယူနီကုတ် ဖောင့်တွေ လိုက်နာရမယ့် အခြား အချက်တွေ ရှိပါသေးတယ်။

ပထမအချက် အနေနဲ့ အခြားစာလုံးနဲ့ တွဲလိုက်လို့ ပုံစံပြောင်းသွားတဲ့ စာလုံးတွေ အတွက် ယူနီကုတ်ဖောင့်က စာလုံးပုံစံကို အလိုအလျောက် ပြောင်းပေးရပါတယ်။ ဥပမာ အားဖြင့် “နိုင်” ဆိုတဲ့ စာလုံးကို လေ့လာကြည့်ပါ။ “နိုင်” ဆိုတဲ့ စကားလုံးကို မြန်မာလို နငယ် လုံးကြီးတင် တစ်ချောင်းငင် င အသတ် ဆိုပြီး ရိုက်ရပါတယ်။ မြန်မာစာမှာ နငယ် အကြီးနဲ့ နငယ် အသေးဆိုပြီး ၂ မျိုး မရှိပါဘူး။ နငယ်က တစ်မျိုးပဲ ရှိပါတယ်။ မြင်ရတဲ့အချိန်မှာသာ နငယ် အကြီးနဲ့ အသေး ကွာသွားတာပါ။

ယူနီကုတ်ဖောင့်တွေမှာ နငယ်ကို တစ်ချောင်းငင်နဲ့ တွဲရိုက်လိုက်တာနဲ့ နငယ်အကြီးကို အသေး (န) အဖြစ် User မြင်အောင် အလိုအလျောက် ပြောင်းပေးပါတယ်။ ဒါပေမယ့် အကြီးပဲ ပြပြ အသေးပဲပြပြ နောက်ကွယ်မှာ နငယ်ကို သိမ်းထားတဲ့ ဂဏန်းကတော့ 4116 တစ်ခုတည်းပါပဲ။ ဇော်ဂျီဖောင့်မှာတော့ အဲဒီလို နည်းပညာ မပါပါဘူး။ နငယ် အသေးကို သပ်သပ် ရိုက်ပေးရပါတယ်။ ဇော်ဂျီဖောင့်မှာ နငယ် အကြီး ရိုက်ရင် 4116 နဲ့ သိမ်းပြီး အသေးရိုက်ရင် 4239 နဲ့ သိမ်းပါတယ်။ Smart Rendering မလုပ်ဘဲ သိမ်းထားတဲ့ အတိုင်း ပြန်ပြီး ရိုက်ပြ ပါတယ်။ ယူနီကုတ် ၅.၁ စံနှုန်းအရ ဇော်ဂျီက “န” အနေနဲ့ သုံးထားတဲ့ နံပါတ် 4239 ဟာ မြန်မာဘာသာ အတွက် သတ်မှတ်ထားတဲ့ ဂဏန်းမဟုတ်ပဲ ပလောင် ဘာသာစကားအတွက် သတ်မှတ်ထားတဲ့ ဂဏန်း ဖြစ်ပါတယ်။

အားလုံး ပြောနေကြတဲ့ ရရစ် ပြသနာဟာ လည်း ဒါပါပဲ။ ဇော်ဂျီမှာ ရရစ် အတွက် ယူထားတဲ့ ဂဏန်း ၈ လုံး တိတိ ရှိပြီး User အနေနဲ့ ကိုယ်သုံးချင်တဲ့ ရရစ်ကို ကိုယ့်ဘာသာကိုယ် ရွေးရပါတယ်။ ရရစ် အတွက် ယူသုံးထားတဲ့ ဂဏန်းတွေကတော့ ရှမ်းဘာသာစကား အတွက် သတ်မှတ်ပေးထားတဲ့ ဂဏန်းတွေပါ။ ယူနီကုတ် ဖောင့်တွေမှာတော့ သူနဲ့ တွဲဆက်ထားတဲ့ အက္ခရာတွေ ပေါ်မူတည်ပြီး ရရစ်က အလိုအလျောက် ပုံစံပြောင်း ပေးပါတယ်။ ရရစ်အတွက် 4156 ဂဏန်း တစ်လုံးကိုပဲ သုံးထားပါတယ်။

ဒုတိယ အချက်အနေနဲ့ ယူနီကုတ်ဖောင့်တွေဟာ User က ရိုက်ထည့်လိုက်တဲ့ ဂဏန်းကို နောက်ကွယ်မှာ စံနှုန်းနဲ့ ညီတဲ့ အစီအစဉ် တကျ ပြန်စီပေးရပါတယ်။ အဲဒါကို Normalization လုပ်တယ်လို့ ခေါ်ပါတယ်။ User အနေနဲ့ “နိုင်” ဆိုတဲ့ စာလုံးကို “န” + “_ိ ”+ “ - ု” + “င” + “- ်” ဆိုပြီး ရိုက်ထည့်လို့ ရသလို “န” + “ - ု” + “_ိ ” + “င” + “- ်” ဆိုပြီး တော့လည်း ရိုက်လို့ ရပါတယ်။ “နိုင်” ဆိုတဲ့ စကားလုံးကို User အနေနဲ့ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) နဲ့ပဲ ရိုက်ထည့်ထည့် “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) နဲ့ပဲ ရိုက်ထည့်ထည့် ယူနီကုတ် ဖောင့်က နောက်ကွယ်မှာ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အဖြစ် ပြန် အစီအစဉ် ချပြီး သိမ်းပေးပါတယ်။ ဇော်ဂျီကတော့ အစီအစဉ် မချပဲ User ရိုက်ထည့်တဲ့ အတိုင်း သိမ်းပါတယ်။

သိမ်းချင်သလို သိမ်းကွာ ဖတ်လို့ရပြီးတာပဲ လို့ ပြောချင်တဲ့သူများလည်း ရှိပါလိမ့်မယ်။ ဖတ်လို့ ရတာ ဟုတ်ပေမယ့် ရှာတဲ့နေရာမှာ ရှော့ခ် ရှိပါတယ်။ ဇော်ဂျီဖောင့်နဲ့ ရှာချင်ရင် အစီအစဉ်တကျ ရိုက်ထည့်ထားတဲ့ စာကိုပဲ ရှာလို့ ရပါမယ်။ လုံးကြီးတင် တစ်ချောင်းငင် နဲ့ ရေးထားတဲ့ စာကို တစ်ချောင်းငင် လုံးကြီးတင် နဲ့ ပြန်ရှာရင်တွေ့မှာ မဟုတ်ပါဘူး။ အဲဒီလိုပဲ တစ်ချောင်းငင် လုံးကြီးတင် နဲ့ ရေးထားတဲ့စာကို လုံးကြီးတင် တစ်ချောင်းငင် နဲ့ ပြန်ရှာရင်လည်း တွေ့နိုင်မှာ မဟုတ်ပါဘူး။

ကွန်ပြူတာနဲ့ ဆက်စပ်ပြီး အလုပ်လုပ်နေသူများအတွက် နောက်ဥပမာ တစ်ခုကို ထပ်ပေးပါမယ်။ ကျွန်တော်တို့ အနေနဲ့ မြန်မာနိုင်ငံ လူဦးရေ စစ်တမ်း ကောက်တဲ့ ဒေတာဘေ့စ် တစ်ခု လုပ်ချင်တယ် ဆိုပါစို့။ လူနှစ်ယောက်ဟာ နာမည်တူ အဖေနာမည်တူ ရှိနိုင်ပေမယ့် မှတ်ပုံတင် နံပါတ်တော့ အတူတူ မရှိနိုင်ပါဘူး။ အဲဒီတော့ လူတစ်ယောက်ကို ဒေတာဘေ့စ်ထဲမှာ ၂ ခါ ပြန်မထည့်မိအောင် ကျွန်တော်တို့အနေနဲ့ မှတ်ပုံတင် နံပါတ် Column ကို Unique Constraint အနေနဲ့ ထည့်ထား လိုက်ပါမယ်။ အဲဒီလို လုပ်တဲ့အတွက် User က မှတ်ပုံတင် နံပါတ် တစ်ခုတည်းကို ၂ ခါပြန်ထည့်မိရင် ဒေတာဘေ့စ်က လက်မခံဘဲ Error ပြန်လာပါလိမ့်မယ်။

အဲဒီ ဒေတာဘေ့စ်ကို ယူနီကုတ် ၅.၁ နဲ့ သိမ်းရင် မှတ်ပုံတင် နံပါတ်က နှစ်ခု မထပ် နိုင်ပါဘူး။ ဥပမာ ၅/စကန(နိုင်)၀၀၀၀၀၀ ဆိုတဲ့ မှတ်ပုံတင် နံပါတ်ကို ဒေတာဘေ့စ်ထဲမှာ တစ်ကြိမ်ပဲ ရိုက်ထည့်လို့ ရပါမယ်။ (နိုင်) ကို ရိုက်ထည့်တဲ့သူက “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အစီအစဉ် နဲ့ ရိုက်ရိုက် “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) အစီအစဉ်နဲ့ ရိုက်ရိုက် ယူနီကုတ်ဖောင့်က Normalize လုပ်ပေးတဲ့အတွက် နောက်ဆုံးမှာ ဒေတာဘေ့စ်ထဲကို “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) အစီအစဉ်နဲ့ပဲ ဝင်သွားပါလိမ့်မယ်။ ဇော်ဂျီနဲ့ ရိုက်ထည့်လို့ User က (နိုင်) ကို မှားယွင်းပြီး ရိုက်ထည့်ရင် “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်) နဲ့ တစ်ခါ “ - ု” + “_ိ ” (တစ်ချောင်းငင် လုံးကြီးတင်) နဲ့တစ်ခါ မှတ်ပုံတင် နံပါတ် တစ်ခုတည်းကို ၂ ခါဝင်သွား နိုင်ပါတယ်။ လူဦးရေ စာရင်းလို သန်းဂဏန်း နဲ့ ရှိတဲ့ ဒေတာတွေထဲမှာ အဲဒီလို အမှားမျိုး မတော်တဆ ဖြစ်ခဲ့ရင် ကျွန်တော်တို့ အမှားကို တွေ့အောင် ရှာနိုင်ပါ့မလား။

အဲဒီဒေတာဘေ့စ်ကို ယူနီကုတ် ၅.၁ နားလည်တဲ့ ဒေတာဘေ့စ် (ဥပမာ MySQL Latest Version) အဖြစ် Convert လုပ်ရင် Error တက်ပါလိမ့်မယ်။ Database ထဲမှာ အစီအစဉ်တကျ သိမ်းထားတဲ့ စာက ပြသနာ မရှိပေမယ့် Normalize မလုပ်ဘဲ သိမ်းချင်သလို သိမ်းထားတဲ့စာကိုတော့ Database က သူနားလည်သလို Unicode Normalization လုပ်ပါလိမ့်မယ်။ အဲဒီအချိန်မှာ နံပါတ် ၂ ခု အတူတူ ဖြစ်သွားတဲ့ အတွက် Unique Constraint ကို ချိုးဖောက်မိပြီး ဒုက္ခနဲ့ လှလှ တွေ့ပေးနိုင်ပါတယ်။

ကျွန်တော် အရင်ပို့စ်မှာလည်း Database ထဲက Unicode Normalization အကြောင်း ပြောခဲ့ဖူးပါတယ်။ ဒေတာဘေ့စ်က မြန်မာစာလုံးတွေကို Normalize လုပ်ပေးတယ် ဆိုပေမယ့် ကိုယ်မှန်းထားတဲ့ အစီအစဉ်အတိုင်းတော့ ဝင်သွားဖို့တော့ မလွယ်ပါဘူး။ ဒေတာဘေ့စ်က မနောမယ ဒေတာဘေ့စ် ဖြစ်နေမယ် ဒါမှမဟုတ် ဒေတာဘေ့စ် အက်ဒမင်က ဒေးဗစ်ကော့ပါးဖီး ဖြစ်နေမယ် ဆိုရင်တော့လည်း တစ်မျိုးပေါ့။ :D

နောက်တစ်ခု ကွာတာကတော့ “က္က” လိုမျိုး ပါဌ်ဆင့် တွေ ရိုက်တဲ့ နေရာမှာပါ။ ပါဌ်ဆင့်တွေ အတွက် ယူနီကုတ်မှာ ဂဏန်း သတ်သတ် ပေးမထားပါဘူး။ ယူနီကုတ် စံနှုန်း အရ ပါဌ်ဆင့်နှစ်ခု ရဲ့ ကြားမှာ 4153 ဆိုတဲ့ ဂဏန်းကို ထည့်ပြီး သိမ်းပါတယ်။ ဖောင့်က 4153 ဆိုတဲ့ ဂဏန်းကို တွေ့ရင် ရှေ့နောက် ဂဏန်း နှစ်လုံးကို ဆက်ပြီး သူ့အလိုအလျောက် ပါဌ်ဆင့် အဖြစ် ရိုက်ပြ ပါတယ်။ ဥပမာ “က္က” ဆိုတဲ့ စာလုံးကို သိမ်း ချင်ရင် ယူနီကုတ် စံနှုန်းမှာ က ရဲ့ နံပါတ်က 4096 ဖြစ်တဲ့ အတွက် “4096 + 4153 + 4096” ဆိုပြီး သိမ်းပါတယ်။ User အနေနဲ့လည်း ကီးဘုတ်ပေါ်မှာ ~ အက္ခရာတွေ “Ctrl + Alt” တွေ ရိုက်စရာ မလိုဘဲ ပါဌ်ဆင့်ရဲ့ ဒုတိယ အက္ခရာ မရိုက်ခင်မှာ “4153” နဲ့ ညီမျှတဲ့ “Shift + f ” ကို ကီးဘုတ်ပေါ်ကနေ ရိုက်ထည့် လိုက်ရုံပါပဲ။ “က” + “Shift +f ” + “က” ဆိုရင် ကကြီး နှစ်လုံးဆင့် ဖြစ်ပါတယ်။

ဇော်ဂျီမှာတော့ ပါဌ်ဆင့်တွေကို ပါဌ်ဆင့်အတိုင်း သိမ်းပါတယ်။ အဲဒီအတွက် မြန်မာစာ အတွက် မဟုတ်ဘဲ ကရင် ဘာသာစကားအတွက် သတ်မှတ်ထားတဲ့ ဂဏန်း 4192 ကနေ 4220 အတွင်းက ဂဏန်းတွေကို ယူသုံးပြီး သိမ်းပါတယ်။

ဒီလောက်ဆိုရင် ဇော်ဂျီနဲ့ ပတ်သက်တဲ့ ဒဏ္ဍာရီ အများစုကို ရှင်းရှင်းလင်းလင်း သိကြပြီလို့ ထင်ပါတယ်။

အများမေးနေကြမေးခွန်းကလေး တွေကို အဆစ်အနေနဲ့ ဖြေပေးလိုက်ပါ့မယ်။

(၁) ဇော်ဂျီက ယူနီကုတ်ထက် ဘာလို့ ပိုမြန်အောင် Render လုပ်နိုင်ရတာလဲ။

ကျွန်တော်ခုန ပြောခဲ့တဲ့ ယူနီကုတ်ရဲ့ မရှိမဖြစ် စံနှုန်း Smart Rendering တွေ၊ Normalization တွေ ကို ဇော်ဂျီက တစ်ခုမှ လုပ်မထားတဲ့ အတွက် အဲဒီ နည်းပညာ ထည့်ထားတဲ့ ဖောင့်တွေနဲ့ ယှဉ်ရင် ပိုမြန်နေရတာပါ။

(၂) ယူနီကုတ် ဖောင့်တစ်ခုနဲ့ ရိုက်ထားတဲ့စာကို တခြားဖောင့်နဲ့ ကြည့်လို့ ရလား။ မြန်မာ ယူနီကုတ် စနစ်က လုံးဝ ပြည့်စုံပြီလား။

ယေဘူယျအားဖြင့် မြန်မာ ၃ နဲ့ ရိုက်ထားတဲ့ စာကို ပိတောက်နဲ့ ကြည့်လို့ရသလို ပိတောက် နဲ့ ရိုက်ထားတဲ့ စာကို မြန်မာ ၃ နဲ့ ကြည့်လို့ရပါတယ်။ အလားတူပဲ ယူနီကုတ် စံနှုန်းကို လိုက်နာတဲ့ ပုရပိုက်၊ မိုင်မြန်မာ စတဲ့ ဖောင့်တွေကို လည်း အလဲလဲ အလှယ်လှယ် သုံးလို့ရတယ်။ ကျွန်တော် ယူနီကုတ် သုံးရင် မြန်မာ ၃ ကီးဘုတ်နဲ့ ပိတောက်ဖောင့်ကို တွဲသုံးလေ့ ရှိပါတယ်။

စံနှုန်းကို လိုက်နာထားတယ် ဆိုပေမယ့် အဲဒီဖောင့်တွေမှာ ကွဲလွဲချက်လေးတွေ အနည်းအကျဉ်းတော့ ရှိနေပါတယ်။ ကျွန်တော်သိသလောက် ပြောရမယ် ဆိုရင် တစ်ချို့ ဆော့ဖ်ဝဲလ်တွေ ဝက်ဘ်ဆိုက်ဒ်တွေက ယူနီကုတ် ၅.၁ စံနှုန်းက အပြည့်အဝ အထောက် အပံ့ မပေးသေးပါဘူး။ အဲဒီတော့ Myanmar3 ကလွဲပြီး အခြားဖောင့်တွေမှာ အဲဒီလို နေရာတွေမှာ ကြုံရတတ်တဲ့ Bug တွေကို ရှောင်နိုင်ဖို့ အတွက် Workaround လုပ်ထားတာတွေ ပါပါတယ်။ အဲဒီတော့ သိမ်းဆည်းတဲ့ စနစ် (Storage) မှာ တူကြပေမယ့် ပြသတဲ့ စနစ် (Rendering) မှာတော့ ကွဲပြားမှုတွေ ရှိပါတယ်။ တချို့ Site တွေ (ဥပမာ Myanmar Wikipedia) ကို Myanmar3 နဲ့ ကြည့်မယ်ဆိုရင် တစ်ချို့ စာလုံးတွေ မှန်မှန်ကန်ကန် မပြနိုင်တာ တွေ့ရပါလိမ့်မယ်။ တခြားဖောင့်တွေနဲ့ ဆိုရင်တော့ အဆင်ပြေပါတယ်။ ဆော့ဖ်ဝဲလ်တိုင်းကလည်း Unicode 5.1 ကို သုံးလို့ မရပါဘူး။ ဥပမာ လူသုံးများတဲ့ Adobe Photoshop ပေါ်မှာ ယူနီကုတ် ၅.၁ ကို သုံးလို့ မရပါဘူး။

ယူနီကုတ် ၅.၁ ကို ရယူနိုင်တဲ့ နေရာတွေကို အောက်ကလင့်ခ်မှာ သွားကြည့်နိုင်ပါတယ်။
http://my.wikipedia.org/wiki/Wikipedia:Font#Unicode_5.1_Myanmar.2FBurmese_fonts
ကီးဘုတ်၊ ဖောင့်နဲ့ ကွန်ဗာတာ တွေအကြောင်းကို နောက်ပို့စ်မှပဲ အသေးစိတ် ရေးပါတော့မယ်။

Reference: http://my.wikipedia.org/wiki/Wikipedia:Font

46 comments:

Anonymous said...: ကွန်ပျုတာလည်း နားမလည် ဖောင့်တွေလည်း မတတ် ခုမှမြန်မာစာရိုက်တတ်တာ မကြာသေးပါ...သိတာတွေမျှဝေပေးတဲ့အတွက် ကျေးဇူးအများကြီးတင်ပါတယ်....နောက်မှသေချာထပ်လာဖတ်ပါ့မယ်...

mie nge; July 15, 2009 at 6:23 PM
MrDBA said...: ဆက်ချီတက် ...; July 15, 2009 at 6:55 PM
Rita said...: သူတို့က Unicode မဟုတ်တာကို ဟုတ်ပါတယ်လို့ ပြောရင် သူတို့မှာ ဘာအကျိုးရှိနိုင်သလဲ ဆိုတာ တွေးနေမိပါတယ်။

ဦးနှောက်က မတွေးတတ်အောင် ဝေးနေတယ်ဆိုလဲ ခွင့်လွှတ်ပါ။ တကယ်ကို စဉ်းစားမရလို့ပါ။ technical ပိုင်းတွေတော့ သိပ်နားမလည်ပါဘူး။

ဟိုဘလော့မှာ စွပ်စွဲထားသလို တိုင်းရင်းသား ဘာသာစကား ဘာညာကွိကွ ကိစ္စလဲ စွပ်စွဲထားသလို ရည်ရွယ်ပြီး လုပ်တယ် မထင်ပါဘူး။ သူတို့ အလွယ်လိုက်တယ်ပဲ ထားပါတော့ ...

နောက်ဆက်တွဲ သူတို့ ဘာရနိုင်လို့လဲ။; July 15, 2009 at 7:12 PM
Lu Pyo Gyi said...: ဒီရက်ပိုင်း ဒီကိစ္စတယ်လည်း ပေါ်ပြူလာ ဖြစ်နေပါလား ဟဲဟဲ။ ကျွန်တော်လည်း ပြောမယ်ဆိုရင် myanmar 1 ကတည်းက သုံးလာတာပါ နောက်တော့ myanmar 2, myanmar 3 တွေလည်း ဆက်တိုက်သုံးတာပါပဲ။ သူငယ်ချင်း တစ်ယောက်က ရှမ်းယူနီကုတ် လုပ်တာကိုတောင် ကူလုပ်ပေးဖူးပါသေးတယ်။ အခုလည်း ဂဃနဏ ရေးထားတာတွေ့လို့သာ ဝင်ပြီးကော့မင့်ရေးတာပါ။ တစ်ချို့ကျတော့ ဘာလို့မှန်းလည်း မသိပဲနဲ့ ဇော်ဂျီပဲလို့ အော်တဲ့လူကလည်း များသဗျ။ ကျွန်တော်လည်း အိမ်မှာဆိုရင် ဇော်ဂျီကို သုံးလေ့မရှိပါဘူး။ ဘလော့တစ်ခုပဲ ဖတ်တဲ့လူတွေက ဇော်ဂျီဖြစ်နေလို့ မသုံးမဖြစ် သုံးထားတာပါ။ ဒါမှ တစ်ကယ်တန်း ပြောင်းမယ်ဆိုရင် ကိုယ်ဟာတွေကို ပြောင်းဖို့လွယ်အောင်လို့ပါ။ myanmar 3 သုံးနေကျလူက ဇော်ဂျီကို သုံးချင်စိတ်ကို မရှိတာပါ ရိုက်ရတာကိုပဲ အင်မတန်လွယ်ပါတယ်။ ကျွန်တော်မြင်တာကတော့ မြန်တာတွေ ဘာတွေဘေးနည်းနည်းချိတ်ဗျာ လှတာတစ်ခုတည်းနဲ့ သုံးနေကျတာပါ။ ၅.၁ ကဖောင့်တွေလည်း ဟိုကောင့်ထက် လှအောင်ဆွဲဖို့ ကောင်းတယ်ဗျ။ နောက်ထပ် အရေးကြီးတာက Keyman အပေါ်မှာ မမှီခိုသင့်တော့ဘူး ကိုယ်ပိုင် Input လုပ်သင့်ပြီဗျ။ သူတို့နဲ့ အဆက်အစပ်မရှိတော့ လုပ်နေမလုပ်နေတော့ မသိဘူးဗျာ။; July 15, 2009 at 7:16 PM
Anonymous said...: Please explain further so that layman can understand. Thanks for your post.; July 15, 2009 at 9:23 PM
Talkii said...: ကိုလူပျိုကြီးပြောတာတစ်ခုကို သဘောကျတယ် (ကျန်တာတွေတော့မကျတာမဟုတ်ပါဘူး :) ) Keyman ပေါ်မမှီခိုသင်တော့ဘူးဆိုတာ အရမ်းမှန်ပါတယ်။ ကျွန်တော်အပါအဝင် သုံးတဲ့သူအများစုက Unicode ဆိုတာကို နားလည်ကြတာမဟုတ်ပါဘူး။ အဲဒီတော့ unicode 5.1 ဆိုတာကြီးသုံးမယ်ဆိုရင်တောင် တစ်ဆင့်ထဲမပြီးနိုင်ဘူး။ ဟိုဟာဒေါင်းလုပ်လုပ်ပါ၊ ဒီဟာလုပ်ပါနဲ့ ဖြစ်နေရော။ ဇော်ဂျီနဲ့ ဘာကွာလဲဆိုတာ အဲဒါပါ။ ဇော်ဂျီဆိုရင် မင်းစာဖတ်ချင်လား ဒီ font သွင်းလိုက် စာရိုက်ချင်လား ရော့ဒီမှာ instraller ဆိုပြီး တစ်ချက် click လိုက်ရုံပါပဲ။ သုံးတဲ့သူဆိုတာ လွယ်တာ အဆင်ပြေတာကိုပဲ သုံးမှာပါ။ အဲဒီတော့ အကောင်းဆုံးအဆင်ရောက်အောင် ကြိုးစားဖို့ကလွဲပြီး ကြော်ငြာနေစရာမလိုပါဘူး။ ကောင်းတယ်ဆို လိုက်သုံးလာကြာမှာပါ။

BTW, thx for your explanation.; July 15, 2009 at 9:31 PM
သီဟသစ် said...: ကိုဇက်တီရေ

ဗဟုသုတတွေ ယူသွားတယ်ဗျ ခုလိုသေသေချာချာလေး ပြောပြလို့ thanks

ခင်မင်စွာဖြင့်
သီဟသစ်; July 15, 2009 at 10:03 PM
ကိုရင်နော် said...: ကိုဇက်တီရေ..
လေ့လာမှတ်သားသွားပါတယ်..; July 15, 2009 at 11:10 PM
Anonymous said...: ဒီရှင်းပြထားတာက ကောင်းပါတယ်။ ဒါပေမယ့် ဒီအကြောင်းကိုပဲ ခဏခဏ ရှင်းပြနေပုံထောက်တော့ ZT မှာ စီပွားရေးနဲ့ပတ်သက်တဲ့ အကြောင်းတခုခုတော့ရှိမယ်ထင်ပါတယ်။

ဖောင့်နဲ့စီးပွားရေးလုပ်စားလို့ရတယ်ဆိုတာသိကြလို့ ယူနီကုဒ်အော်ပြီး ပိုက်ဆံအကုန်ခံ ဖောင့်တွေလုပ်လာကြတယ်။ နောက်ပြီးတော့ ကိုယ့်ဖောင့်ကိုလူသုံးများလာအောင် ကြိုးစားကြတယ်။ ဒါပေမယ့် သုံးရလွယ်တဲ့ဇော်ဂျီကို လူအများသဘောကျသုံးထားတော့ တိုးလို့မရဘူးဖြစ်နေတယ်။ အဲဒါကို ကိုယ်ဖောင့်ကို သုံးရလွယ်အောင် လှပအောင်မကြိုးစားပဲ ဇော်ဂျီကို တိုက်ခိုက်တဲ့ နည်းတွေသုံးလာကြတယ်။ သဘောကတော့ မင်းသားကြီးမလုပ်ရမယ့်အတူတူ ပတ်မကြီးပဲဖောက်တော့်မယ်ဆိုတဲ့ သဘောပါပဲ။
ဘောလုံးစကားနဲ့ ပြောရမယ်ဆိုရင််တော့ ZT က ကလပ်အသင်းတွေထောင် ပိုက်ဆံတွေသုံးပေမယ့် ဝါသနာရှင်အသင်းဖြစ်တဲ့ ဇော်ဂျီကို မနိုင်ဖြစ်နေတော့ ဇော်ဂျီအသင်းကန်တာ နည်းစနစ်မကျဘူး ငါတို့ကန်တာကျမှ နည်းစနစ်ကျတာ။ ဒါပေမယ့် ZT အသင်းက ဂိုးမသွင်းနိုင်ပဲ ဇော်ဂျီကပဲ သွင်းသွင်းသွားလို့ ခဲမနိုင်ကြိတ်မရဖြစ်နေတာနဲ့တူနေပါတယ်။

လူတွေကို မနက်ဖြန်ပဲ ဇော်ဂျီသုံးရင် ဒုက္ခတွေ့တော့မလိုလိုရေးနေပြီး ကိုယ်တိုင်ကျတော့ ဇော်ဂျီကိုပဲသုံးနေတာကတော့ သိပ်ပြီးတော့ သဘာဝမကျပါဘူး။ ဘယ်သူကမှ ဇော်ဂျီဖောင့်ကိုပဲသုံးပါလို့ ပြောမနေပါဘူး။ အဲဒါကို ဇော်ဂျီသုံးလို့ ဒုက္ခရောက်မယ် ခဏခဏပြောနေတော့ စေတနာထက် နောက်မှာအကြောင်းရှိလို့ဖြစ်မယ်လို့ ယူဆတယ်။ ကိုယ်ဘယ်လိုကောင်းအောင်လုပ်မယ်ပဲ ရေးသင့်ပါတယ်။ သူများမကောင်းတာတွေချည်း ရေးတာများတော့ စဉ်းစားစရာဖြစ်နေပါပြီ။; July 15, 2009 at 11:23 PM
မီးမီးချစ် said...: စဉ်းစာမနေပါနဲ ့ ဗဟုသုတ ကို ဗဟုသုတ ပဲ မှတ်ပေါ့..
တကယ်လို ့ ကို zt က စီးပွားရေးလုပ်တော့ ရော ကိုယ်သုံးချင်မှ ဖြစ်တဲ့ဟာ ကို.. anonymous လျှောက်ပြောနေတယ်..; July 16, 2009 at 12:04 AM
ZT said...: ကျွန်တော့်ရဲ့ ပရော်ဖက်ရှင်က အင်ဂျင်နီယာပါ။ ကျွန်တော့် အသက်မွေး ဝမ်းကြောင်းနဲ့ ယူနီကုတ် ဘာမှ ပတ်သက်မှု မရှိပါဘူး။ မြန်မာစာကို စီးပွားရေးဆန်ဆန် လုပ်စားဖို့လည်း အစီအစဉ် မရှိပါဘူး။ ဒါပေမယ့် စီးပွားရေး မဆန်တဲ့ ယူနီကုတ် ပရော့ဂျက် တွေမှာ ပါဝင် နေတယ် ဆိုတာကိုတော့ ကျွန်တော် ဝန်ခံပါတယ်။

မြန်မာစာကို ကမ္ဘာ့အဆင့်အတန်းမီ ဖြစ်စေချင်တဲ့ ရည်ရွယ်ချက် တစ်ခုပဲ စိတ်ထဲမှာ ရှိပါတယ်။ အဲဒီအတွက်လည်း ကိုယ်တတ်နိုင်တဲ့ ဘက်က လုပ်ပေးဖို့ စဉ်းစားထားပါတယ်။

အခုလက်ရှိ ဇော်ဂျီနဲ့ ပတ်သက်ပြီး ကျွန်တော် မြင်နေတဲ့ ပြသနာတွေကို မြင်တဲ့ အတိုင်း ချပြတာပါ။ ကျွန်တော် ချပြခဲ့တဲ့ ပြသနာတွေ တကယ် ဖြစ်နိုင် မဖြစ်နိုင်ဆိုတာကို ကိုယ်တိုင် နားမလည်ရင် နည်းပညာ နားလည်တဲ့သူတွေနဲ့ Double-check လုပ်ကြည့်နိုင်ပါတယ်။

ဘလော့ဂါ တစ်ယောက်အနေနဲ့ ဖတ်တဲ့သူ အဆင်ပြေဖို့ လောလောဆယ် ဇော်ဂျီကို သုံးပါတယ်။ အခုလက်ရှိ ကိုယ်သုံးနေတဲ့ ဖောင့်ဖြစ်ပေမယ့် ဇော်ဂျီ မကောင်းရင်တော့ မကောင်းဘူးပဲ ပြောရမှာပါ။ မကောင်းတာကို မြင်ရဲ့သားနဲ့ မကောင်းဘူးလို့ မရေးရင် ကျွန်တော် ဘယ်လို သွားရေးရမှာလဲ။ ပုံပြင်ထဲက ယုန်လို နှာစေးချင်ယောင် ဆောင်နေတာတော့ ကြာခဲ့ပါပြီ။ ဘာမီတွန် လာတိုက်တဲ့သူ ရှိတော့လည်း နှာစေးချင်ယောင် ဆက်ပြီး ဆောင်လို့ မရတော့ပါဘူး။

ကျွန်တော့် ဘလော့ခ်ကို ယူနီကုတ် ပြောင်းဖို့ စမ်းသပ်နေပါတယ်။ အလွယ်တကူ ပြောင်းနိုင်တဲ့ နည်းလမ်းကို စမ်းသပ်လို့ရရင် ကျွန်တော်နဲ့ အတူတူ ယူနီကုတ် ပြောင်းချင်တဲ့ ဘလော့ဂါတွေကို ရသလောက် ဆွဲခေါ်သွားမှာပါ။ လောလောဆယ်တော့ ပို့စ်တွေကို ဇော်ဂျီနဲ့ ရေးပြီး ငါးကြင်းဆီနဲ့ပဲ ငါးကြင်းကြော်နေပါတယ်။ ကွန်မင့်တွေ ဖတ်ကြည့်ရင် ပြောင်းချင်တဲ့ စိတ်ရှိသူဟာ ကျွန်တော် တစ်ယောက်တည်း မဟုတ်ဘူး ဆိုတာ သိနိုင်ပါတယ်။; July 16, 2009 at 12:42 AM
မင်းညို said...: ကို ဇက်တီရေ...
လွိုင်လင်ကတည်းက ကိုဇက်တီရေးတာတွေသဘောကျတယ်..။ ယူနီကုဒ်နဲ့ပတ်သက်ပြီး တကူးတက ရှင်းပြပေးတာ ကျေးဇူးတင်ပါတယ်...။ ယူနီကုဒ်စစ်စစ်တွေ ဖြစ်လာကြရင်ဘယ်လောက်ကောင်းမယ်ဆိုတာ ဥပမာလေးတွေ ပေးတာသဘောကျပါတယ်..။
နည်းပညာပိုင်းဆိုင်ရာတော့ နားမလည်ဘူး..။ ကျွန်တော် အားမရတာကတော့ ကျွန်တော်တို့ မြန်မာစာကို မြင်ချင်ရင် ဆော့ဖ်ဝဲ တွေ install လုပ်နေရတာကိုပဲ...။ နောက်ပြီး ဝီကီပိဒိယ မှာ မြန်မာစာမျက်နှာ ကောင်းကောင်းမရှိတာပဲ..။ မြန်မာတိုင်းကြိုက်ကြတဲ့ ကမ္ဘာပေါ်က ဖောင့်တွေနဲ့ တန်းတူရှိတဲ့ ဖောင့်တစ်မျိုးလောက် မြင်ချင်တယ်ဗျာ...။ ့ဒီပညာရပ်နဲ့ပတ်သက်တဲ့ ပညာရှင်တွေ မြန်မာမှာ မနည်းဘူးဆိုတာ ကျွန်တော် မှန်းဆသိသိပါတယ်..။ စုစုစည်းစည်းနဲ့ အကောင်းဆုံးတစ်ခု ထွက်လာအောင် လုပ်နိုင်မယ့်နေ့ကိုမျှော်လင့်မိပါတယ်..။ ဂျာမန်စာကို ကျွန်တော်နားမလည်တိုင်း ဂူဂဲ translator သုံးပြီး အင်္ဂလိပ်လိုဖတ်နေရတယ်ဗျာ..။ဘလော့ပိုစ့်တွေကို တခြားဘာသာတွေကနေမြန်မာ၊ မြန်မာကနေ တစ်ခြားဘာသာတွေ တိုက်ရိုက်ပြန်နိုင်မယ့်နေ့ကို လည်းမျှော်လင့်ပါတယ်..။ အဟီးရှည်သွားလို့ခွင့်လွှတ်ပါ..။; July 16, 2009 at 12:47 AM
Anonymous said...: Hello Ko ZT

Thank you for your post about Unicode.
At the moment I dont have Myanmar font and I dont know any knowledge of how to install unicode in my computer.
Kindly request to you,please explain how to install correctly unicode which you linked in your post.

I just installed and save my C and then what should I have to do so far.
Do I need to chang any setting in font in control panel or add other language?
I dont know any more . Please.
Thanks in advanced.

One who likes Unicode; July 16, 2009 at 6:15 AM
ရေတမာ said...: ကျနော်တို့ user အနေနဲ့ ရေရှည်သုံးစွဲနိုင်မယ်. စံနှုနု်းလည်းရှိမယ်.. သုံးစွဲရတာလည်လွယ်ကူမယ့် ဖောင့်မျိုးကို သုံးမှာပါ။ ညင်သာတဲ့ အပြောင်းအလဲဖြစ်ဖို့တော့ လိုမယ်ထင်တယ်.. နည်းပညာရှင်တွေ ဖြေရှင်းနိုင်မယ်လို့လည်း ယုံကြည်တယ်..

ပိုစ့်အတွက်လည်း ကျေးဇူးတင်ပါတယ်..; July 16, 2009 at 7:36 AM
မေဇင် said...: ဗဟုသုတတွေ မျှဝေပေးလို့ ကျေးဇူးပါ..။ ဘာမှလဲ မသိခဲ့ပါဘူး..လူတိုင်း ဇော်ဂျီလိုလို ဖြစ်နေတော့ နောင့် တို့ဘာမှ မသိတဲ့ လူတွေကလဲ သုံးရလွယ်တဲ့ ဇော်ဂျီပေါ့...ဒါပေမယ့် ဒီ့ထက်..ပိုကောင်းတဲ့ အရာတွေ လာရင်လဲ ... လူတွေ ရဲ့ သဘာဝ ပိုကောင်းတာကို ..ပဲ လိုက်လုပ်ကြမှာပါ ကိုZT...ကြိုးစားပေးပေါ့... း)

ခင်တဲ့
မေဇင်; July 16, 2009 at 7:46 AM
Aung said...: If I understand correctly the post, the whole main point is user have to use unicode 5.1 compatible font since user are the one whole generate the original corpus.. And ZawGyi has to be REAL unicode 5.1 compatible.

Here are a few question I have, I really don't know about it and interested to find some possible solutions..

1. If ZawGyi become unicode compatible font, How about exisitng corpus which are already in old ZawGyi codepoint?
2. When is the normalization done in Unicode font? After typing a word or save the whole corpus or some other situations?

Best Regards,
/awm; July 16, 2009 at 9:57 AM
ZT said...: AWM-> Thanks for your interest. The answer for your questions are as follows:

1. All the text that currently written in Zawgyi codepoint need to be converted to Unicode 5.1 compatible codepoint. Currently, there is a standalone converter call "KaNaung" which is available in open source. We also have a plan to release another standalone converter with open source soon.

2. Unicode normalization is done after typing before saving the documents.

Feel free to raise questions if you have any doubt.; July 16, 2009 at 10:12 AM
နွေးနေခြည် said...: အတော်စုံစုံလင်လင် သေသေချာချာ သိရတာပဲ.. ကျေးဇူး ကိုဇက်တီ

အတူတူ ယူနီကုတ် ပြောင်းချင်တဲ့ ဘလော့ဂါတွေကို ရသလောက် ဆွဲခေါ်သွားမှာပါ။
ဆွဲခေါ်ပါ ဆွဲခေါ်ပါ... း); July 16, 2009 at 11:31 AM
Aung said...: Ko ZT, thanks for your fast response.

If we can convert the existing ZawGyi Code point to Unicode with "KaNaung" converter, I think we no need to blame ZawGyi for now.. BUT need to promote/distribute ideas of why we should use Unicode.

For Tenhnical,
1. Can "KaNaung" be part of crawler? just for myanmar search engine. (google won't bother it and zawgyi code point will corrupt in google, so user know that they need to change to unicode).
2, Can "KaNaung" be plug-in for Application ? (like your example, Population Database Application)
3. If typing in Unicode is slow due to normalization & smart rendering, can't the code can be fine-tune? We also need to find out why user are insisting to use Unicode.

We can use 1 & 2 approach, until one of unicode 5.1 compatible & user friendly font emerge.
I agreed ZawGyi need to modify (at least for normalization) but it is really hard to find out who is the owner of ZawGyi is, and seems no one has full responsibilities for it.

Just my 2 cents,
/awm

Could you please point me out where I can get Myanmar3 source code since it is saying opensource. My google skill is bad for this.. :-); July 16, 2009 at 11:54 AM
ZT said...: AWM-> I will leave Q1,2 & 3 for now. I don't want to pretend to know everything. :) I will leave it for the experts (like Ko Soe Min or Ko Ravi) to answer it.

To be frank, I also don't know where they keep Myanmar3 Source code. :D But I can point you out where you can get source code for other Unicode 5.1 compatible fonts.

1) Parabaik font with source code is available with OFL (Open Font License) from http://www.parabaik.info/

2)Padauk font with source is available at http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&id=Padauk

Parabaik is Open Type Font (same type as Myanmar3) and Padauk is Graphite font.

Now I think only weak point in Unicode font is its look. But I don't understand why people still claiming that Unicode fonts are not user-friendly. Maybe, lack of user guide or instructions. I will find out.

Btw, you sound like AWM who regularly posting in MMITP.; July 16, 2009 at 12:37 PM
Aung said...: Yes, I am indeed.. but posted sometime. :-)

Your post have much collaborative info then following all the unicode & zawgyi problem in forums. So I post my though here, sorry for it.
I will try to forward my email to you that was suggest by Seth (Wait-Zar Developer).. Don't be surprise if you receive forward email from one of your friends since I don't have direct contact to you.. :-)
After that you will know why I post questions here..

best regards,
/awm; July 16, 2009 at 1:05 PM
မာ့ခ် said...: @ko zt :

Thx for raising this with your excellent writing ko zt.

@awm :

1,2,3 all cannot.

for 1,2 , kanaung is old project, and i stop developing, and i will not do open-sourcing anymore on my later programs normally, coz of copy cat ppl like okisan(let me know if you dont now what i am telling). there is newer one called myanmar text tools, but it is testing, so i cannot gurantee anything.

3, is written mainly by microsoft, pango,qt developers, not us, there is pango mm patch by tmhtet though, but you cannot tell them like microsoft to make it fast.

@both

all the fonts are editable by fontforge, regardless of license.
licensing is different, like you can redistribute or not, commercial or not. you can do everything in your computer, unless you tell or distribute to others.

rgds,
mark; July 16, 2009 at 3:24 PM
မာ့ခ် said...: FYI

ယူနီကုတ် ၅.၁ သည် ယူနီကုတ်၊ ဒါပေမယ့် ယူနီကုတ်သည် ယူနီကုတ် ၅.၁ တစ်ခုတည်းမဟုတ်; July 16, 2009 at 7:43 PM
Anonymous said...: ကို ZT ရေ ..
ဒီပို့စ် လေးအတွက် တကယ်ကျေးဇူးပါ..
လွယ်တာသုံးကြတာကို အပြစ်မပြောလိုပေမဲ့
ခေတ်မီမီ ကမ္ဘာကြည့်ကြည့်မြင် ကြ ဘို့လိုပါတယ်..
အားလုံးတက်ညီလက်ညီ ရှိကြရင် ဘယ်လောက်ကောင်းမလဲ နော်
ခုတော့ အဆိုးမြင်ကြ တယူသန်နဲနဲ ဆန်ကြတဲ့ ကွန်မန့်တချို့ဖတ်ရတာ စိတ်မကောင်းတော့ဖြစ်မိပါတယ်..
မြန်မာ ယူနီကုဒ် အမြန်ဆုံးတွင်ကျယ်အောင်မြင်ပါစေ..

အားပေးလျှက်ပါ
ချစ်စု; July 16, 2009 at 8:21 PM
nyimuyar said...: ko ZT, thanks and still waiting to Change, some of my friend also waiting the right time.
Timing is really important. :D; July 16, 2009 at 11:03 PM
ZT said...: @Mark

ဇော်ဂျီကို ယူနီကုတ်ဖောင့်အဖြစ် နာမည် မတပ်ချင်တဲ့ အကြောင်း က ဒီလိုပါ။

၂၀၀၃ ခုနှစ်က ပထမဆုံး မြန်မာယူနီကုတ် ပရော့ဂျက် မန္တလေး (http://sourceforge.net/projects/mandalay/) မှာ ကျွန်တော် ပရိသတ် တစ်ယောက်အနေနဲ့ ပါခဲ့ဖူးပါတယ်။ (မင်ဘာ ဖြစ်ပေမယ့် ဘာမှ ပံ့ပိုးမှု မပေးနိုင်ခဲ့လို့ ပရိသတ်လို့ ပြောတာ ပိုသဘာဝ ကျပါတယ်။) အဲဒီအချိန်ကတည်းက Smart Rendering နဲ့ ပတ်သက်တဲ့ ကန့်သက်ချက်တွေကို ယူနီကုတ် စံနှုန်းထဲမှာ ဖတ်ခဲ့ရဖူးပါတယ်။ အက္ခရာတစ်ခုဟာ နေရာပြောင်း ပုံစံပြောင်းတာနဲ့ Codepoint အသစ်တစ်ခု ထပ်မယူရဘူး ဆိုတဲ့ ကန့်သတ်ချက်မျိုးပါ။ အဲဒီ ကန့်သတ်ချက် ဟာ ဘာသာစကားတိုင်း လိုက်နာရမယ့် ကန့်သတ်ချက် ဖြစ်ပြီး မြန်မာ အက္ခရာတွေ ယူနီကုတ် ဇယားမှာ ပါမလာခင်ကတည်းက ရှိခဲ့ပါတယ်။ (Normalization ပါမပါတော့ သေချာ မမှတ်မိပါ။)

အဲဒါကြောင့် မြန်မာ ယူနီကုတ် ဖောင့်တိုင်းဟာ ယူနီကုတ် နာမည် တပ်ချင်ရင် အဲဒီလို ကန့်သတ်ချက်ကိုတော့ အနည်းဆုံး လိုက်နာဖို့ လိုတယ်လို့ ကျွန်တော့် အနေနဲ့ ယူဆပါတယ်။ ဒါကြောင့် ကျွန်တော့် အနေနဲ့ မြစေတီ၊ ဇော်ဂျီ၊ BIT စတဲ့ဖောင့်တွေကို ယူနီကုတ်ဖောင့် အနေနဲ့ လက်မခံနိုင်တာပါ။; July 17, 2009 at 8:09 AM
နိုင်သူ said...: ကျွန်တော်ကတော့ Annonymous ပြောသွားသလိုပဲ MM3 တွေ MM2 တွေကို သုံးကြပါလို့ ပြောမယ့်အစား ZAWGYI ကို ဘယ်လို ဖြတ်ကျော်နိုင်မလဲပဲ စဉ်းစားစေချင်ပါတယ်... User ဆိုတာကတော့ Ready ဖြစ်တာကို ပိုသဘောကျပါတယ် ... Unicode တိုင်းသာကောင်းမယ်ဆိုရင် Padauk ကိုလဲကြိုက်တာပဲ ... ဒါပေမယ့် လိုက်လျောညီထွေမရှိဘူး... အဲဒါကြောင့် လူသုံးနည်းတယ် ... LINUX မှာဆိုရင် ပိတောက်ကို UNICODE Sys အနေနဲ့ တခါတည်း ပေးထားတာပါ... ဒါပေမယ့် တကယ်တန်းသုံးနေတဲ့ ဇောိဂျီ ကိုမမှီဘူးဗျ ... အဲဒါဘာလဲဆိုတော့ ဘယ်အရာမဆို လွယ်ကူဖို့လဲ လိုသေးသဗျ... ကိုယ်တယောက်တည်းက တတ်သိနားလည်နေလို့ ကောင်းတယ်ဆိုရင် မတတ်တဲ့သူတွေအတွက်ဘက်က ဆိုရင် ဘယ်လိုလည်း ဆိုတာ စဉ်းစားဖို့ လိုသေးတယ်... MM3 ကိုသာ တကယ်တမ်း UNICODE အနေနဲ့ သတ်မှတ်စေချင်ရင် Zawgyi ထက် ပိုပြီး လွယ်ကူချောမွေ့အောင် ကြိုးစားကြပါလို့ပဲ ပြောချင်ပါတယ် ... Zawgyi စပေါ်လာတည်းကလည်း ကြေငြာပြီး ဝင်ခဲ့တာ မဟုတ်ပါဘူး... တဆင့်စကား တဆင့်နားနဲ့ လွယ်ကုူချောမွေ့တယ်... အဆင်ပြေတယ် ဆိုတာတွေနဲ့ တင် USER ကိုဆွဲဆောင်မှု့ပေးနေပါပြီ ... ကျွန်တော်ကတော့ ဒီလောက်ပဲ ပြောချင်ပါတယ် ... ထပ်ပြောရင် စာရှည်သွားမှာစိုးလို့ပါ...; July 17, 2009 at 10:14 AM
ZT said...: >> နိုင်သူ
>> လိုက်လျောညီထွေမရှိဘူး...
>> တကယ်တန်းသုံးနေတဲ့ ဇောိဂျီ ကိုမမှီဘူးဗျ
>> လွယ်ကုူချောမွေ့တယ်... အဆင်ပြေတယ်

ဘာကို ဆိုလိုချင်တာလဲ မသိဘူး။ ကျွန်တော့် အတွေ့အကြုံအရတော့ ယူနီကုတ်က ဇော်ဂျီထက် ပိုလွယ်ပါတယ်။ အခုဆိုရင် One-click Installer မရှိတာက လွဲရင် Myanmar3 Installer တစ်ခုတည်းနဲ့ ဖောင့်၊ ကီးဘုတ်၊ Windows မှာသုံးတဲ့ Uniscribe DLL အားလုံးကို တခါတည်း တစုတစည်းတည်း Install လုပ်လို့ ရပါတယ်။

ယူနီကုတ်နဲ့ ဇော်ဂျီ နှစ်ခုစလုံးကို သုံးဖူးတယ် ဆိုရင် User Experience အရ ဘာအခက်အခဲ ရှိတယ် ဆိုတာ သိချင်ပါတယ်။

Thanks.; July 17, 2009 at 10:27 AM
Anonymous said...: အင်း ကိုဇော်သက်ရဲ့ ဖြေကြားချက်တွေကို သဘောကျတယ် အာဂတ ကင်းပီးတော့ ပရော်ဖက်ရှင်နယ်ဆန်တယ် ... ဇော်ဂျီကိုလဲ အာဂတ ကင်းကင်းနဲ ရှင်းပြနေတယ်မှတ်ပါမယ် ဘာဖြစ်ဖြစ် blog.mghla.com မှာလုပ်ထားတဲ့ ဇော်ဂျီ နဲ 5.1 converter လေးကို သဘောကျတယ်။ ကို zt လည်းသွားကြည့်လိုက်ပါအုံး။ ဘလော့ဂါတွေကော အဲလိုလုပ်ရင် အဆင်မပြေနိုင်ဘူးလား? မသိလိုမေးတာပါ; July 17, 2009 at 4:27 PM
Anonymous said...: ကို ဇော်သက် ဟိုဘက်ပို(စ်)က reply ကိုမဖတ်ပဲ အပေါ်မှာရေးမိပါတယ်။ ကိုဇော်သက် မှာရှိတယ်ဆိုတာလည်း ယုံပါတယ်ဗျာ.... download လုပ်ဖိုစောင့်နေမယ်

ပြသနာတိုင်းတွင် အဖြေရှိပါ၏; July 17, 2009 at 4:58 PM
Anonymous said...: http://blog.nyilynnseck.com/search/label/Zawgyi

ဒီပို့စ်လေးကို ဖတ်ကြည့်ပေးပါ... ကိုညီလင်းဆက်ရဲ့ ဆန္ဒနဲ့ ကျွန်တော်ရဲ့ ဆန္ဒ တူညီတဲ့ အတွက် ဆက်ပြီးမရေးတော့ပါဘူး...; July 19, 2009 at 4:48 PM
Law Shay said...: နင်ဒါရေးမယ်မှန်းသိရင် ငါ အပင်ပန်းခံပြီး မရေးပါဘူး။ ခွီး။ အခုတော့ အလကား ပင်ပန်းပြီ။

စတာပါ။ ကောင်းပါတယ်။ ရှေ့ဆက်ပါ။ ကျွန်တော်ကတော့ ဖြေရှင်းဖို့ နည်းလမ်းရှာတဲ့ဘက်ကိုပဲ ဦးစားပေးပါတယ်။; July 19, 2009 at 4:55 PM
မာ့ခ် said...: ko zt,

>> ယူနီကုတ် ဖောင့်က နောက်ကွယ်မှာ “_ိ ”+ “ - ု” (လုံးကြီးတင် တစ်ချောင်းငင်)

that is not done by font,
it is done by keyman or input program.

zawgyi can do that also.; July 19, 2009 at 5:06 PM
ZT said...: @Mark

Thanks for correction.; July 19, 2009 at 5:33 PM
ZT said...: >>http://blog.nyilynnseck.com/search/label/Zawgyi
>>>ဒီပို့စ်လေးကို ဖတ်ကြည့်ပေးပါ... ကိုညီလင်းဆက်ရဲ့ ဆန္ဒနဲ့ ကျွန်တော်ရဲ့ ဆန္ဒ တူညီတဲ့ အတွက် ဆက်ပြီးမရေးတော့ပါဘူး...

မြတ်စွာဘုရားက ကာလာမသုတ်မှာ ဟောခဲ့ဖူးတယ်။ ငါပြောလို့လည်း အမှန်မမှတ်နဲ့။ သူများပြောလို့လဲ အမှန်မမှတ်နဲ့။ ကိုယ်ပိုင်ညာဏ်နဲ့ ချင့်ချိန်ပြီးမှ မှန်သလား မှားသလား ကိုယ့်ဘာသာကိုယ် ဆုံးဖြတ်ဆိုတာမျိုးပါ။

ဘုရားတောင်မှ သူပြောတာကို မဆင်မခြင် အမှန်လို့ မမှတ်ယူဖို့ ပြောခဲ့တာ။ ညီလင်းဆက် ပြောလို့လည်း အမှန်မမှတ်ပါနဲ့။ ကျွန်တော် ပြောလို့လည်း အမှန်မမှတ်ပါနဲ့။ ကိုယ်ပိုင်ညာဏ်နဲ့ စဉ်းစားကြပါ။ စဉ်းစားဖို့ အချက်အလက်တွေလည်း ကျွန်တော် သိသလောက် ပေးပြီးပါပြီ။

၂၀၀၅ ခုနှစ်ထဲက မြန်မာဝီကီပိဒီယကို Myanmar1 နဲ့ ကျွန်တော် စရေးခဲ့ပါတယ်။ ဇော်ဂျီ အဲဒီအချိန်က မထွက်သေးပါ။ အဲဒီတော့ ဇော်ဂျီကလွဲလို့ အင်တာနက် ပေါ်မှာ ဘယ်ဖောင့်မှ အဆင် မပြေဘူးဆိုတဲ့ အဆိုကို လက်မခံပါ။ စာလုံးထွက် မလှတာပဲ ရှိပါတယ်။ ဒေတာနဲ့ ပတ်သက်လို့လည်း Normalization မလုပ်တဲ့ အတွက် ဘယ်လို ပြသနာမျိုး ရှိနိုင်တယ် ဆိုတာကို အကျိုးသင့် အကြောင်းသင့် ထောက်ပြခဲ့ပြီးပါပြီ။

နောက်ဆုံးတော့ ကျွန်တော်တို့ ယူနီကုတ် စံနှုန်းကို လိုက်ပြောင်းရမှာဘဲ။ အနှေးနဲ့ အမြန်ပဲ ရှိပါတယ်။ ယူနီကုတ် စံနှုန်းက စံနှုန်းမညီတဲ့ ဇော်ဂျီနောက်ကို ပြန်လိုက်မှာ မဟုတ်ပါဘူး။ နောက်လည်း ရှင်းရမယ့် အတူတူ ပြသနာကို အခုကတည်းက စောစောစီးစီး ရှင်းထားလိုက်တာ ပိုမကောင်းဘူးလား။ ကျွန်တော်တို့တွေ အရိုးစွဲ အကျင့်တွေကို ဖျောက်ပစ်ကြဖို့ပဲ လိုပါတယ်။; July 19, 2009 at 10:23 PM
Anonymous said...: ကိုZT အဲဒီပို့စ်ကို သေချာ မဖတ်သေးပါဘူး... သေချာဖတ်ကြည့်ပါအုန်း... သူများဘက်ကြီးပဲ မမြင်ပါနဲ့အုန်း...UNICODE ဘက်ကိုထောက်ပြတာလဲ ကြည့်ပါအုန်း... ငါကတော့ UNICODE အစစ်ဆိုတာချည်းပဲ လည်း မလုပ်ပါနဲ့အုန်း ... ကျွန်တော်ကိုယ်တိုင်သာ သူများပြောတဲ့ အတိုင်းလိုက်မယ်ဆိုရင် MM3 တို့ ပုရပိုက်တို့ဆိုတာ ကျွန်တော့်စက်ထဲမှာ ထားမှာပေါ့... အခုဟာက UNICODE ကို ပြောင်းမှ ဖြစ်မယ့်ဆိုတာမျိုးမို့ လို့ပြောတာပါ... ညီလင်းဆက် ပြောတာက ပိုသဘာဝကျတယ်... ဖြစ်သင့်တဲ့ ဘက်ကိုပြောထားတာ များတယ်... ZT ပြောတာက အတိုင်းထက် အလွန်လိုမျိုးဖြစ်နေတယ်... ဒီနေ့ မပြောင်းတာနဲ့ နောက်နေ့ဆိုရင် ဒီ DB ကြီးကZG ကို မသိတော့ တဲ့ အတိုင်းဖြစ်နေတယ်... အခုဟာက User ဘက်ကနေပြောနေတာနော်... Technology ဘက်က Developer ဘက်ကပြောနေတာ မဟုတ်ပါဘူး... Renderingတွေနဲ့ ကိုင်ပေါက်လို ကိုင်ပေါက်ဖြစ်နေလို့ပါ... (မှတ်ချက်။ ။ ကျွန်တော်သည် ZG အသိုင်းအဝိုင်းနှင့် လုံး၀ပတ်သက်မှု့မရှိပါ။); July 20, 2009 at 8:52 AM
Anonymous said...: ကျန်သေးတာက Normal User တွေအသုံးပြုနေတဲ့ Zawgyi က လက်ကွက် အစုံရှိနေပါပြီ... MM3 ကကော အဲဒီလောက်စုံပြီလား... ကိုယ့်ဘက်မှာ ဘယ်လောက်ပြည့်စုံမှုရှိနေပြီလဲ ... အဲဒါပါပဲ...; July 20, 2009 at 9:49 AM
ZT said...: ကျွန်တော်လည်း မြန်မာစာကို နည်းပညာအားဖြင့် ဖြစ်ကတတ်ဆန်း လုပ်ထားတာ၊ ဆေးမြီတို သုံးထားတာ ကို ကြည့်မရတဲ့သူပဲ ဖြစ်ပါတယ်။ မြန်မာစာ နည်းပညာကို နိုင်ငံတကာ အဆင့်အတန်းမီ ဖြစ်စေချင်ပါတယ်။ (စေတနာ ဆိုတဲ့ အလုံးကြီးက ကြီးလွန်းလို့ စေတနာလို့ မသုံးပါ။ ကိုယ့်ဘာသာကိုယ် မနေနိုင်မထိုင်နိုင် ဖြစ်နေတာလို့ပဲ မှတ်ပါ။) လိုက်ချင်တဲ့သူတွေ လိုက်ခဲ့ပါလိမ့်မယ်။ မလိုက်ချင်တဲ့သူများ နေခဲ့ကြပါ။ အဲဒါလည်း User Choice ပါပဲ။

>>>ကျန်သေးတာက Normal User တွေအသုံးပြုနေတဲ့ Zawgyi က လက်ကွက် အစုံရှိနေပါပြီ...

ဘာကိုဆိုလိုချင်တာလဲ မသိ။ ကျွန်တော်ရိုက်ချင်သမျှ မြန်မာအက္ခရာတော့ ယူနီကုတ် ကီးဘုတ်နဲ့ ရိုက်လို့မရတာ မရှိပါဘူး။; July 20, 2009 at 12:33 PM
Anonymous said...: စကားမစပ် ပါဌ်ဆင့် လေးတွေ ရိုက်လို့ရမလားဟင် ... ဇော်ဂျီမှာသုံးထားတဲ့ ပါဌ်ဆင့်လေးတွေလိုပေါ့...; July 20, 2009 at 9:31 PM
ZT said...: စာလုံး ၂ လုံးကြားမှာ Shift+f ထည့်ရိုက်ရင် ပါဌ်ဆင့် ဖြစ်သွားပါလိမ့်မယ်။

က္က ရိုက်ချင်ရင် က + (Shift + f) + က ရိုက်ရပါတယ်။
သင်္ချာ ဆိုရင် သင် + (Shift + f) + ချာ ရိုက်ရပါတယ်။

အသေးစိတ် သိချင်ရင် Myanmar3 Installer ထဲမှာပါတဲ့ "InputSequence.pdf" မှာ ကြည့်ပါ။

စိတ်ဝင်စားမှု အတွက် အထူး ကျေးဇူးတင်ပါတယ်။ Feedback တွေ များများ လိုချင်ပါတယ်။; July 20, 2009 at 10:02 PM
AUNG Sithu said...: ကိုဇော်သက်ရေ...
ဖတ်သွားပါတယ်..
ကျွန်တော်က ဒီကိစ္စတွေမှာ တော်တော်ပိန်းတယ်..
နားမလည်တာက အဲဒီ normalization တွေ.. smart rendering တွေကို ဘယ်သူက ဘယ် component က လုပ်နေတာလဲ ဆိုတာပါ..
သိတဲ့အတိုင်း font ဆိုရင် font ချည်းပဲမြင်တော့ font က အဲဒါတွေ လုပ်နေတာလား... ဘယ်သူက လုပ်နိုင်တာလဲ ဆိုတာလေး...; July 29, 2009 at 10:44 AM
ZT said...: ကိုအောင်စည်သူ

Smart Rendering ကို Smart Font ကနေ လုပ်ပေးပါတယ်။ အဲဒီလို လုပ်ဖို့အတွက် ဖောင့်ထဲမှာ Glyph တွေကို Match လုပ်ပေးမယ့် Table အပိုတွေ ပါပါတယ်။

Normalization ကိုတော့ ကီးဘုတ်ကနေ လုပ်ပေးတယ်လို့ မာ့ခ် ဆီကနေ သိရပါတယ်။; July 30, 2009 at 9:59 PM
mm thinker said...: မြန်မာစာတွေ နိုင်ငံတကာကွန်ပြူတာမှာ လေးထောင့်တုံး မမြင်ရပြီးတာပဲ။

ဘေးချင်းကပ်နိုင်ငံက ကျောင်းမှာတောင် ဇော်ဂျီထည့်မယ်ဆို ပေးမထည့်ဘူး အက်ဒမင်က ပိတ်ထားတယ်။

ဘေးမှာ ဗီယက်နမ်တွေ၊ တရုတ်၊ အင်ဒိုနီးရှားတွေကတော့ ဟုတ်လို့ပဲ။ ကိုယ်တွေများ ကျောင်းက စက်သုံးရင် ဂျီတော့ခ်မှာ "မြန်မာလို မရိုက်ပါနဲ့ ဘားဂလိပ်ရိုက်ကြပါ"ဆိုပြီးပြောရတယ်။

ဒီခံစားမှုမျိုးနဲ့ပဲ ဘာဖြစ်သင့်တယ်ကို သုံးစွဲသူသက်သက်အနေနဲ့ ကျနော် မျှော်မှန်းတာဖြစ်ပါတယ်။; August 2, 2009 at 8:32 PM
Anonymous said...: တို့ကတော့ မြန်မာ ၃ ပဲ
ဇော်ဂျီကတော့ မဖြစ်မနေမို့လို့သုံးတာပါ။။။; August 27, 2010 at 10:42 PM
Unknown said...: ကိုယ်ကြိုက်တာ သုံးတာအကောင်းဆုံးပါပဲ ... အဲဒါမှ ဘယ်ဖောင့်က အမှန်ဆိုတာ မြင် လာပါမယ်; June 9, 2012 at 11:48 AM
Unknown said...: ကျွန်တော်ကတော့ ဖုန်းကrootလုပ်မရတော့ zawgyiမမြင်ရဘူး
Kitkat Zultraပါ။ အာ့ကြောင့် myanmar unicode နဲရေးထားတာရှာဖတ်နေပါတယ်
အောင်မြင်ပါစေဗျာ; April 18, 2014 at 8:38 AM

ဖူးနုသစ်

Pages

Search This Blog

Wednesday, July 15, 2009

ဖောင့်မသိတော့ ဇော်ဂျီ ယူနီကုတ်ထင်

46 comments: