വരമൊഴിയിലും മൊഴി കീമാനിലും എന്കോഡിങ്ങ് ബഗ്ഗുകള്
Oct. 11th, 2007 | 10:14 pm
വരമൊഴിയിലും മൊഴി കീമാനിലും ( Tavultesoft keyboard) എന്കോഡിങ്ങ് പിശകുകള്. മലയാളം വിക്കിപ്പീഡിയയിലുള്ള മൊഴി കീമാപ്പിലും ഈ പിശക് ഉണ്ട്. വാക്കുകളുടെ യൂണിക്കോഡ് കോഡ് മൂല്യങ്ങളുടെ വിന്യാസത്തിലാണ് പിശക്. അനാവശ്യമായ ZWNJ ആണ് പ്രശ്നം
കുറച്ച് ഉദാഹരണങ്ങളിലൂടെ ഇത് വിശദമാക്കാം.
മൊഴി
പൊന്നിലാവ് (pon_nilaav): ഈ വാക്കിന്റെ ആന്തരിക യൂണിക്കോഡ് റെപ്രസന്റേഷന് എന്താണെന്നറിയാന് പൈത്തണ് പ്രോഗ്രാമ്മിങ്ങ് ഭാഷ ഉപയോഗിക്കാം.
\u200c(ZWNJ) എന്ന കോഡ് ഇവിടെ അനാവശ്യമാണ്. പൊന്നിലാവ് എന്ന വാക്കിന്റെ യഥാര്ത്ഥ യൂണിക്കോഡ് ശ്രേണി ഇതാണ്:
u'\u0d2a\u0d4a\u0d28\u0d4d\u200d\u0d28\u 0d3f\u0d32\u0d3e\u0d35\u0d4d'
ഇത്തരത്തിലുള്ള മറ്റു ചില വാക്കുകളിതാ:(മൊഴി കീമാന് ഉപയോഗിച്ചെഴുതിയത്)- വാക്കുകള്ക്കിടയില് ചില്ലക്ഷരം വരുന്നവ:
മുന്തൂക്കം, എന്കോഡിംഗ്, ചാരന്മാരാണ് ,നന്മ,പാന്ഗോ,പിന്താങ്ങുന്നുവെന്നു, പിന്തിരിയണമെന്നും,പിന്പക്കത്തില്,പി ന്വലിഞ്ഞു ,പൊന്വീണ,പൗരന്മാര്,മന്മോഹന്,മുന് കൂട്ടി,മുന്കൈ,
മുന്ഗണനകള്, മുന്ധാരണകളില്ലാതെ, മുന്വിധികളും, റേഷന്കാര്ഡിനും,സല്മാന്ഖാനും,സെന് ട്രല് , താല്പര്യം, ഉല്പന്നം, കല്പിച്ച്,നല്കാനും, മേല്വിവരിച്ച, വില്ക്കപ്പെടുന്ന, ശില്പശാല, ലോസ്ഏഞ്ചല്സ്, കണ്വഴി, കണ്വെട്ടം , പൊന്നാളം, കല്വിളക്ക്
താല്പര്യം = thaal_paryam
ZWNJ പക്ഷേ ZWJ (U+200D) എന്നതിന് ശേഷം ഇടേണ്ട കാര്യമില്ല . ZWJ ഉള്ളതുകൊണ്ട് തുടര്ന്നു വരുന്ന അക്ഷരങ്ങളുമായുള്ള കൂടിച്ചേരല് സംഭവിക്കില്ല. മൊഴിയുടെ അല്ഗോരിതം എന്തുകൊണ്ടോ ZWNJ യും ഇടുന്നു.
അതായത് വാക്കുകള്ക്കിടയില് മാത്രമല്ല , ചില്ലക്ഷരമെഴുതാന് n, l, L, r,R,N എന്നിവക്ക് പകരം എവിടെയൊക്കെ l_, n_,L_, r_,R_ ,N_ എന്നിവ ഉപയോഗിക്കുന്നുവോ അവിടെയെല്ലാം എന്കോഡിങ്ങ് പിശകാണ്. മൊഴി സ്കീമില് l_, n_,L_, r_,R_ ,N_ എന്നിവയാണ് ചില്ലക്ഷരങ്ങള്ക്ക് ഉപയോഗിക്കേണ്ടത് എന്ന് പറഞ്ഞിരിക്കുന്നു.
ഈ ഉദാഹരണം ശ്രദ്ധിക്കൂ
അവള്= avaL_
അവസാനമുള്ള ZWNJ (u+200C) ശ്രദ്ധിക്കുക. ഈ "അവള് " ഒരിക്കലും തിരഞ്ഞാല് കിട്ടാത്തവളാണെന്ന് വ്യക്തമാണല്ലോ.
ഈ പ്രശ്നം സിബു http://varamozhi.wikia.com/wiki/Help:Co ntents/Known_Problems
എന്ന പേജില് ചേര്ത്തിട്ടുണ്ട്.
മലയാളം സ്പെല്ലിങ്ങ് ചെക്കറിന്റെ ചില പരീക്ഷണങ്ങള്ക്കിടയിലാണ് ഈ ബഗ്ഗ് എന്റെ ശ്രദ്ധയില് പെട്ടത്. ചില വാക്കുകള് എപ്പോളും സ്പെല്ലിങ്ങ് മിസ്റ്റേക്ക് കാണിക്കുന്നതിന്റെ കാരണം അന്വേഷിച്ചപ്പോള് കണ്ടെത്തിയതാണിത്. സ്പെല്ലിങ്ങ് ചെക്കറിനായി ഞാന് ശേഖരിച്ച പദശേഖരത്തില് ഇത്തരത്തിലുള്ള ഏതാനും വാക്കുകള് കയറിക്കൂടിയിട്ടുണ്ട്. വിക്കിയിലോ ബ്ലോഗുകളിലോ, മൊഴിയോ വരമൊഴിയോ ഉപയോഗിച്ചെഴുതിയ വാക്കുകളാകണം.
വരമൊഴിയിലും ബഗ്ഗ്
http://varamozhi.wikia.com/wiki/Help:Co ntents/Mozhi എന്ന വിക്കി താളില് പറഞ്ഞിരിക്കുന്നു:
'പിന്നിലാവ്' എന്ന വാക്കു ശ്രദ്ധിക്കൂ. മംഗ്ലീഷില് pinnilaav~ എന്നാണെഴുതേണ്ടത് എന്നാവും ആദ്യം തോന്നുക. പക്ഷെ, കമ്പ്യൂട്ടറിനൊരു സംശയമുണ്ടാവും; അതിനെ 'പിന്നിലാവ്' എന്ന് വായിച്ചാലെന്തെന്ന്. സംശയം ന്യായമാണ്. ഈയൊരു ആശയക്കുഴപ്പത്തിനിടയാക്കാത്ത വിധം പ്രശ്നം തീര്ക്കുന്നതിനാണ് '_' (underscore) എന്ന Zero Width Space (ZWS) - വലിപ്പമില്ലാ ചിഹ്നം.
ഇവിടെ ZWS എന്നത് ഒരു അനാവശ്യ യുണിക്കോഡ് കോഡ് മൂല്യമല്ലേ? ZWS ഇല്ലാതെ തന്നെ പിന്നിലാവ് എന്ന് എഴുതാനും പറ്റും. ZWS ഇടേണ്ടിവരുന്നത് സോഫ്റ്റ്വെയറിലെ ബഗ്ഗ് മൂലമല്ലേ? ഇനി വേറൊന്ന് :
വരമൊഴി ഉപയോഗിച്ച് ഞാന് എന്റെ പേര് എഴുതി നോക്കി. സന്തോഷ് =santhOsh
വാക്കിന്റെ അവസാനമുള്ള ZWNJ ശ്രദ്ധിക്കുക.
ഇന്സ്ക്രിപ്റ്റ് ഉപയോഗിച്ച് സന്തോഷ് എന്നെഴുതിയപ്പോള്:
വരമൊഴി ഉപയോഗിച്ച് പൊന്നിലാവ് എഴുതുമ്പോള്:
അവന് avan~
മേല്പറഞ്ഞ ഉദാഹരണങ്ങളില് \u0d4d (ചന്ദ്രക്കല) എന്നതിന് ശേഷം \u200c വരുന്നതെങ്ങനെ?
മൊഴിയിലെഴുതിയതും , വരമൊഴിയിലെഴുതിയതും, ഇന്സ്ക്രിപ്റ്റിലെഴുതിയതുമായ പൊന്നിലാവ് എന്ന വാക്കിന് 3 എന്കോഡിങ്ങ്! അതായത് കമ്പ്യൂട്ടറിനെ സംബന്ധിച്ചിടത്തോളം മൂന്നും മൂന്ന് മലയാളം വാക്കുകള്!
ഈ ബഗ്ഗുകളെല്ലാം സിബുവിനെയും പെരിങ്ങോടനെയും അറിയിച്ചിട്ടുണ്ട്. ബഗ്ഗാണെന്നാണ് അവരും അംഗീകരിച്ചു.
അവരുമായുള്ള ഈ മെയില് സംവാദത്തില് നിന്ന് :
പെരിങ്ങോടന്:
മൊഴിയാണെങ്കില് ~ ഉപയോഗിക്കുന്നത്
1. ഒരു വാക്കിനു നടുവില് ആണെങ്കില് അടുത്തുവരുന്ന അക്ഷരത്തെ ചന്ദ്രക്കല ഉള്ള തൊട്ടുമുമ്പിലെ അക്ഷരവുമായി കൂട്ടിച്ചേര്ക്കുവാന് ആഗ്രഹിക്കുന്നില്ല എന്ന അസമ്പ്ഷന്
2. ഒരു വാക്കിനു അവസാനത്തിലാണെങ്കില് ചന്ദ്രക്കലയ്ക്കു പകരം ചില്ലുരൂപങ്ങള് വരുന്ന വാക്കുകളില് ചന്ദ്രക്കല സൂചിപ്പിക്കുവാന് (സന്തോഷ് എന്നെഴുതുവാന് santhOsh എന്നുമതി, അവസാനത്തെ ~ ആവശ്യമില്ല, അവന് എന്നെഴുതുവാന് ~ ആവശ്യമുണ്ട്)
ഇവിടെ രണ്ടാമത്തെ ഉപയോഗത്തില് ഒരു ബഗ്ഗുണ്ട്, വാക്കുകള്ക്കു നടുവില് ചന്ദ്രക്കല എഴുതുമ്പോള് ഇടുന്ന ZWNJ വാക്കുകള്ക്കു അവസാനവും വന്ന് പോകുന്നുണ്ട്, ഒരാള് എഴുതിക്കൊണ്ടിരിക്കുമ്പോള് അത് വാക്കിന്റെ അവസാനമോ എന്ന് ഊഹിക്കുവാന് കഴിയാത്തതില് ആണത്. എന്നാല് ZWNJ + Space -> Space എന്നൊരു റൂള് ഉണ്ടെങ്കില് ഈ പ്രശ്നം ഒഴിവാക്കുകയും ചെയ്യാം (or any other special character assuming user will type those special character to resume typing, cibu has already pointed out this bug, I was reluctant to fix it considering a normal user perspective)
സിബു:
"ആവശ്യമില്ലാത്ത zwnj മുഴുവന് ഒഴിവാക്കാന് പറ്റും എന്നെനിക്ക് പ്രതീക്ഷയില്ല. ath~ എന്നൊരാളെഴുതിയാല് വരമൊഴി അവസാനം കൊണ്ടുപോയി zwnj ഇടും. അതാണ് യൂസര് ആഗ്രഹിക്കുന്നത് എന്നാണ് എന്റെ അനുമാനം. കാരണം അതുകഴിഞ്ഞുവരുന്ന ക്യാരക്റ്റര് 'ത'യുമായി കൂട്ടക്ഷരമുണ്ടാക്കരുത് എന്നുദ്ദേശിച്ചിട്ടാവും അങ്ങനെ യൂസറിട്ടതെന്ന് വരമൊഴി കരുതുന്നു.
എന്നാല് zwj, zwnj കോമ്പിനേഷന്റെ ആവശ്യം ഒന്നുമില്ലെന്നാണ് എനിക്ക് തോന്നുന്നത്. അവിടെ zwnj പറ്റുമെങ്കില് ഒഴിവാക്കാവുന്നതാണ്."
സന്തോഷ് :
പക്ഷേ സന്തോഷ് എന്നെഴുതാന് ഞാന് ~ ഉപയോഗിച്ചില്ല. santhOsh എന്നാണ്
എഴുതിയത്. അപ്പോള് അതിന്റെ അറ്റത്ത് zwnj വരുന്നതെങ്ങനെ എന്ന്
വിശദീകരിക്കാമോ?
സിബു:
നോക്കി. ശരിയാണ് അവസാനം ഒരു ZWNJ വരുന്നുണ്ട്. അത് ഒരു വരമൊഴി ബഗ് തന്നെ. ശരിയാക്കാന് എന്തുമാത്രം എളുപ്പമാണ് എന്നറിഞ്ഞുകൂടാ എന്നു മാത്രം.
ഈ എന്കോഡിങ്ങ് പിശകുകളുടെ ഗൗരവം ഞാന് പറയാതെ തന്നെ നിങ്ങള്ക്ക് ബോദ്ധ്യപ്പെട്ടുവെന്നു കരുതുന്നു. മലയാളം വിക്കിപ്പീഡിയയില് തെറ്റായ എന്കോഡിങ്ങ് ഉള്ള മലയാളം പദങ്ങള് കടന്നു കൂടിയിരിക്കുന്നു. അതു പോലെ ബ്ലോഗുകളിലും, എവിടെയെല്ലാം വരമൊഴിയോ, മൊഴി കീമാനോ ഉപയോഗിച്ചുവോ അവിടെയെല്ലാം പിശകുകള് കാണാനുള്ള സാധ്യത വളരെയധികമാണ്. പ്രത്യേകിച്ചും ബ്ലോഗേഴ്സിന്റെ ഇടയില് വരമൊഴിയുടെ പ്രചാരം നോക്കുമ്പോള്.
മലയാളം എന്കോഡിങ്ങ് ഇന്സ്ക്രിപ്റ്റിനെയാണ് പ്രമാണമാക്കേണ്ടത്. നിവേശകരീതി ഏതായാലും അന്തര്ലീനമായ എന്കോഡിങ്ങ് ഒന്നായാലേ ഏതൊരു സോഫ്റ്റ്വെയറിനും അവയെ കൈകാര്യം ചെയ്യാനാകൂ. മൊഴി കീമാന് എന്കോഡിങ്ങ് എന്ന വാക്കു തന്നെ തെറ്റായേ എഴുതാനാകൂ.
ഇന്സ്ക്രിപ്റ്റ് ഉപയോഗിച്ച് ഒരു രചനയില് ഞാന് എന്റെ പേരെഴുതി എന്നിരിക്കട്ടെ. വരമൊഴി ഉപയോഗിച്ചെഴുതിയ "സന്തോഷ്" എന്ന വാക്ക് ആ രചനയില് തിരഞ്ഞാല് കിട്ടില്ല. Notepad ലോ , Gedit ലോ പരീക്ഷിച്ച് നോക്കൂ.
അതുകൊണ്ട്:
1. ഭാഷയില് ഈ പ്രശ്നങ്ങള് ഇനിയും കടന്നു കൂടാതിരിക്കാന് മേല് പറഞ്ഞ ബഗ്ഗുകള് അടിയന്തിരമായി തിരുത്തേണ്ടതുണ്ട്. തെറ്റിയ അല്ഗോരിതം ഏതാണെന്ന് വ്യക്തമാക്കിയാല് എല്ലാവര്ക്കും സഹായിക്കാന് സാധിച്ചേക്കും.
2. ഇപ്പോള് കടന്ന് കൂടിയ ബഗ്ഗുകള് എങ്ങനെ തിരുത്തണമെന്ന് നാം ആലോചിക്കേണ്ടിയിരിക്കുന്നു.(വിക്കിപ്പീഡിയ യില് ഒരു ബോട്ട് ഉപയോഗിക്കേണ്ടി വന്നേക്കും എന്നാണ് സിബു എന്നോട് പറഞ്ഞത്. അതിന്റെ പ്രായോഗികതയെപറ്റി ചിന്തിക്കേണ്ടിയിരിക്കുന്നു.)
3. പുതിതായി വരുന്നതും ഇപ്പോളുള്ളതുമായ നിവേശകരീതികള് സൂക്ഷ്മമായ എന്കോഡിങ്ങ് ടെസ്റ്റിന് വിധേയമാക്കണം. അതിന് ശേഷമേ പബ്ലിക് റിലീസ് പാടുള്ളൂ.
കുറച്ച് ഉദാഹരണങ്ങളിലൂടെ ഇത് വിശദമാക്കാം.
മൊഴി
പൊന്നിലാവ് (pon_nilaav): ഈ വാക്കിന്റെ ആന്തരിക യൂണിക്കോഡ് റെപ്രസന്റേഷന് എന്താണെന്നറിയാന് പൈത്തണ് പ്രോഗ്രാമ്മിങ്ങ് ഭാഷ ഉപയോഗിക്കാം.
>>>str=u"പൊന്നിലാവ്"
>>>print repr(str)
u'\u0d2a\u0d4a\u0d28\u0d4d\u200d\u200c\u0d28\u0d3f\u0d32\u0d3e\u0d35\u0d4d'
\u200c(ZWNJ) എന്ന കോഡ് ഇവിടെ അനാവശ്യമാണ്. പൊന്നിലാവ് എന്ന വാക്കിന്റെ യഥാര്ത്ഥ യൂണിക്കോഡ് ശ്രേണി ഇതാണ്:
u'\u0d2a\u0d4a\u0d28\u0d4d\u200d\u0d28\u
ഇത്തരത്തിലുള്ള മറ്റു ചില വാക്കുകളിതാ:(മൊഴി കീമാന് ഉപയോഗിച്ചെഴുതിയത്)- വാക്കുകള്ക്കിടയില് ചില്ലക്ഷരം വരുന്നവ:
മുന്തൂക്കം, എന്കോഡിംഗ്, ചാരന്മാരാണ് ,നന്മ,പാന്ഗോ,പിന്താങ്ങുന്നുവെന്നു,
മുന്ഗണനകള്, മുന്ധാരണകളില്ലാതെ, മുന്വിധികളും, റേഷന്കാര്ഡിനും,സല്മാന്ഖാനും,സെന്
താല്പര്യം = thaal_paryam
>>> str=u"താല്പര്യം"
>>> print repr(str)
u'\u0d24\u0d3e\u0d32\u0d4d\u200d\u200c\u0d2a\u0d30\u0d4d\u0d2f\u0d02'
ZWNJ പക്ഷേ ZWJ (U+200D) എന്നതിന് ശേഷം ഇടേണ്ട കാര്യമില്ല . ZWJ ഉള്ളതുകൊണ്ട് തുടര്ന്നു വരുന്ന അക്ഷരങ്ങളുമായുള്ള കൂടിച്ചേരല് സംഭവിക്കില്ല. മൊഴിയുടെ അല്ഗോരിതം എന്തുകൊണ്ടോ ZWNJ യും ഇടുന്നു.
അതായത് വാക്കുകള്ക്കിടയില് മാത്രമല്ല , ചില്ലക്ഷരമെഴുതാന് n, l, L, r,R,N എന്നിവക്ക് പകരം എവിടെയൊക്കെ l_, n_,L_, r_,R_ ,N_ എന്നിവ ഉപയോഗിക്കുന്നുവോ അവിടെയെല്ലാം എന്കോഡിങ്ങ് പിശകാണ്. മൊഴി സ്കീമില് l_, n_,L_, r_,R_ ,N_ എന്നിവയാണ് ചില്ലക്ഷരങ്ങള്ക്ക് ഉപയോഗിക്കേണ്ടത് എന്ന് പറഞ്ഞിരിക്കുന്നു.
ഈ ഉദാഹരണം ശ്രദ്ധിക്കൂ
അവള്= avaL_
>>> str=u"അവള്"
>>> print repr(str)
u'\u0d05\u0d35\u0d33\u0d4d\u200d\u200c'
അവസാനമുള്ള ZWNJ (u+200C) ശ്രദ്ധിക്കുക. ഈ "അവള് " ഒരിക്കലും തിരഞ്ഞാല് കിട്ടാത്തവളാണെന്ന് വ്യക്തമാണല്ലോ.
ഈ പ്രശ്നം സിബു http://varamozhi.wikia.com/wiki/Help:Co
എന്ന പേജില് ചേര്ത്തിട്ടുണ്ട്.
മലയാളം സ്പെല്ലിങ്ങ് ചെക്കറിന്റെ ചില പരീക്ഷണങ്ങള്ക്കിടയിലാണ് ഈ ബഗ്ഗ് എന്റെ ശ്രദ്ധയില് പെട്ടത്. ചില വാക്കുകള് എപ്പോളും സ്പെല്ലിങ്ങ് മിസ്റ്റേക്ക് കാണിക്കുന്നതിന്റെ കാരണം അന്വേഷിച്ചപ്പോള് കണ്ടെത്തിയതാണിത്. സ്പെല്ലിങ്ങ് ചെക്കറിനായി ഞാന് ശേഖരിച്ച പദശേഖരത്തില് ഇത്തരത്തിലുള്ള ഏതാനും വാക്കുകള് കയറിക്കൂടിയിട്ടുണ്ട്. വിക്കിയിലോ ബ്ലോഗുകളിലോ, മൊഴിയോ വരമൊഴിയോ ഉപയോഗിച്ചെഴുതിയ വാക്കുകളാകണം.
വരമൊഴിയിലും ബഗ്ഗ്
http://varamozhi.wikia.com/wiki/Help:Co
'പിന്നിലാവ്' എന്ന വാക്കു ശ്രദ്ധിക്കൂ. മംഗ്ലീഷില് pinnilaav~ എന്നാണെഴുതേണ്ടത് എന്നാവും ആദ്യം തോന്നുക. പക്ഷെ, കമ്പ്യൂട്ടറിനൊരു സംശയമുണ്ടാവും; അതിനെ 'പിന്നിലാവ്' എന്ന് വായിച്ചാലെന്തെന്ന്. സംശയം ന്യായമാണ്. ഈയൊരു ആശയക്കുഴപ്പത്തിനിടയാക്കാത്ത വിധം പ്രശ്നം തീര്ക്കുന്നതിനാണ് '_' (underscore) എന്ന Zero Width Space (ZWS) - വലിപ്പമില്ലാ ചിഹ്നം.
ഇവിടെ ZWS എന്നത് ഒരു അനാവശ്യ യുണിക്കോഡ് കോഡ് മൂല്യമല്ലേ? ZWS ഇല്ലാതെ തന്നെ പിന്നിലാവ് എന്ന് എഴുതാനും പറ്റും. ZWS ഇടേണ്ടിവരുന്നത് സോഫ്റ്റ്വെയറിലെ ബഗ്ഗ് മൂലമല്ലേ? ഇനി വേറൊന്ന് :
വരമൊഴി ഉപയോഗിച്ച് ഞാന് എന്റെ പേര് എഴുതി നോക്കി. സന്തോഷ് =santhOsh
>>> str=u"സന്തോഷ്"
>>> print repr(str)
u'\u0d38\u0d28\u0d4d\u0d24\u0d4b\u0d37\u0d4d\u200c'
വാക്കിന്റെ അവസാനമുള്ള ZWNJ ശ്രദ്ധിക്കുക.
ഇന്സ്ക്രിപ്റ്റ് ഉപയോഗിച്ച് സന്തോഷ് എന്നെഴുതിയപ്പോള്:
>>> str=u"സന്തോഷ്"
>>> print repr(str)
u'\u0d38\u0d28\u0d4d\u0d24\u0d4b\u0d37\u0d4d'
വരമൊഴി ഉപയോഗിച്ച് പൊന്നിലാവ് എഴുതുമ്പോള്:
>>>str=u"പൊന്നിലാവ്"
>>>print repr(str)
u'\u0d2a\u0d4a\u0d28\u0d4d\u200d\u0d28\u0d3f\u0d32\u0d3e\u0d35\u0d4d\u200c'
അവന് avan~
>>> str=u"അവന്"
>>> print repr(str)
u'\u0d05\u0d35\u0d28\u0d4d\u200c'
മേല്പറഞ്ഞ ഉദാഹരണങ്ങളില് \u0d4d (ചന്ദ്രക്കല) എന്നതിന് ശേഷം \u200c വരുന്നതെങ്ങനെ?
മൊഴിയിലെഴുതിയതും , വരമൊഴിയിലെഴുതിയതും, ഇന്സ്ക്രിപ്റ്റിലെഴുതിയതുമായ പൊന്നിലാവ് എന്ന വാക്കിന് 3 എന്കോഡിങ്ങ്! അതായത് കമ്പ്യൂട്ടറിനെ സംബന്ധിച്ചിടത്തോളം മൂന്നും മൂന്ന് മലയാളം വാക്കുകള്!
ഈ ബഗ്ഗുകളെല്ലാം സിബുവിനെയും പെരിങ്ങോടനെയും അറിയിച്ചിട്ടുണ്ട്. ബഗ്ഗാണെന്നാണ് അവരും അംഗീകരിച്ചു.
അവരുമായുള്ള ഈ മെയില് സംവാദത്തില് നിന്ന് :
പെരിങ്ങോടന്:
മൊഴിയാണെങ്കില് ~ ഉപയോഗിക്കുന്നത്
1. ഒരു വാക്കിനു നടുവില് ആണെങ്കില് അടുത്തുവരുന്ന അക്ഷരത്തെ ചന്ദ്രക്കല ഉള്ള തൊട്ടുമുമ്പിലെ അക്ഷരവുമായി കൂട്ടിച്ചേര്ക്കുവാന് ആഗ്രഹിക്കുന്നില്ല എന്ന അസമ്പ്ഷന്
2. ഒരു വാക്കിനു അവസാനത്തിലാണെങ്കില് ചന്ദ്രക്കലയ്ക്കു പകരം ചില്ലുരൂപങ്ങള് വരുന്ന വാക്കുകളില് ചന്ദ്രക്കല സൂചിപ്പിക്കുവാന് (സന്തോഷ് എന്നെഴുതുവാന് santhOsh എന്നുമതി, അവസാനത്തെ ~ ആവശ്യമില്ല, അവന് എന്നെഴുതുവാന് ~ ആവശ്യമുണ്ട്)
ഇവിടെ രണ്ടാമത്തെ ഉപയോഗത്തില് ഒരു ബഗ്ഗുണ്ട്, വാക്കുകള്ക്കു നടുവില് ചന്ദ്രക്കല എഴുതുമ്പോള് ഇടുന്ന ZWNJ വാക്കുകള്ക്കു അവസാനവും വന്ന് പോകുന്നുണ്ട്, ഒരാള് എഴുതിക്കൊണ്ടിരിക്കുമ്പോള് അത് വാക്കിന്റെ അവസാനമോ എന്ന് ഊഹിക്കുവാന് കഴിയാത്തതില് ആണത്. എന്നാല് ZWNJ + Space -> Space എന്നൊരു റൂള് ഉണ്ടെങ്കില് ഈ പ്രശ്നം ഒഴിവാക്കുകയും ചെയ്യാം (or any other special character assuming user will type those special character to resume typing, cibu has already pointed out this bug, I was reluctant to fix it considering a normal user perspective)
സിബു:
"ആവശ്യമില്ലാത്ത zwnj മുഴുവന് ഒഴിവാക്കാന് പറ്റും എന്നെനിക്ക് പ്രതീക്ഷയില്ല. ath~ എന്നൊരാളെഴുതിയാല് വരമൊഴി അവസാനം കൊണ്ടുപോയി zwnj ഇടും. അതാണ് യൂസര് ആഗ്രഹിക്കുന്നത് എന്നാണ് എന്റെ അനുമാനം. കാരണം അതുകഴിഞ്ഞുവരുന്ന ക്യാരക്റ്റര് 'ത'യുമായി കൂട്ടക്ഷരമുണ്ടാക്കരുത് എന്നുദ്ദേശിച്ചിട്ടാവും അങ്ങനെ യൂസറിട്ടതെന്ന് വരമൊഴി കരുതുന്നു.
എന്നാല് zwj, zwnj കോമ്പിനേഷന്റെ ആവശ്യം ഒന്നുമില്ലെന്നാണ് എനിക്ക് തോന്നുന്നത്. അവിടെ zwnj പറ്റുമെങ്കില് ഒഴിവാക്കാവുന്നതാണ്."
സന്തോഷ് :
പക്ഷേ സന്തോഷ് എന്നെഴുതാന് ഞാന് ~ ഉപയോഗിച്ചില്ല. santhOsh എന്നാണ്
എഴുതിയത്. അപ്പോള് അതിന്റെ അറ്റത്ത് zwnj വരുന്നതെങ്ങനെ എന്ന്
വിശദീകരിക്കാമോ?
സിബു:
നോക്കി. ശരിയാണ് അവസാനം ഒരു ZWNJ വരുന്നുണ്ട്. അത് ഒരു വരമൊഴി ബഗ് തന്നെ. ശരിയാക്കാന് എന്തുമാത്രം എളുപ്പമാണ് എന്നറിഞ്ഞുകൂടാ എന്നു മാത്രം.
ഈ എന്കോഡിങ്ങ് പിശകുകളുടെ ഗൗരവം ഞാന് പറയാതെ തന്നെ നിങ്ങള്ക്ക് ബോദ്ധ്യപ്പെട്ടുവെന്നു കരുതുന്നു. മലയാളം വിക്കിപ്പീഡിയയില് തെറ്റായ എന്കോഡിങ്ങ് ഉള്ള മലയാളം പദങ്ങള് കടന്നു കൂടിയിരിക്കുന്നു. അതു പോലെ ബ്ലോഗുകളിലും, എവിടെയെല്ലാം വരമൊഴിയോ, മൊഴി കീമാനോ ഉപയോഗിച്ചുവോ അവിടെയെല്ലാം പിശകുകള് കാണാനുള്ള സാധ്യത വളരെയധികമാണ്. പ്രത്യേകിച്ചും ബ്ലോഗേഴ്സിന്റെ ഇടയില് വരമൊഴിയുടെ പ്രചാരം നോക്കുമ്പോള്.
മലയാളം എന്കോഡിങ്ങ് ഇന്സ്ക്രിപ്റ്റിനെയാണ് പ്രമാണമാക്കേണ്ടത്. നിവേശകരീതി ഏതായാലും അന്തര്ലീനമായ എന്കോഡിങ്ങ് ഒന്നായാലേ ഏതൊരു സോഫ്റ്റ്വെയറിനും അവയെ കൈകാര്യം ചെയ്യാനാകൂ. മൊഴി കീമാന് എന്കോഡിങ്ങ് എന്ന വാക്കു തന്നെ തെറ്റായേ എഴുതാനാകൂ.
ഇന്സ്ക്രിപ്റ്റ് ഉപയോഗിച്ച് ഒരു രചനയില് ഞാന് എന്റെ പേരെഴുതി എന്നിരിക്കട്ടെ. വരമൊഴി ഉപയോഗിച്ചെഴുതിയ "സന്തോഷ്" എന്ന വാക്ക് ആ രചനയില് തിരഞ്ഞാല് കിട്ടില്ല. Notepad ലോ , Gedit ലോ പരീക്ഷിച്ച് നോക്കൂ.
അതുകൊണ്ട്:
1. ഭാഷയില് ഈ പ്രശ്നങ്ങള് ഇനിയും കടന്നു കൂടാതിരിക്കാന് മേല് പറഞ്ഞ ബഗ്ഗുകള് അടിയന്തിരമായി തിരുത്തേണ്ടതുണ്ട്. തെറ്റിയ അല്ഗോരിതം ഏതാണെന്ന് വ്യക്തമാക്കിയാല് എല്ലാവര്ക്കും സഹായിക്കാന് സാധിച്ചേക്കും.
2. ഇപ്പോള് കടന്ന് കൂടിയ ബഗ്ഗുകള് എങ്ങനെ തിരുത്തണമെന്ന് നാം ആലോചിക്കേണ്ടിയിരിക്കുന്നു.(വിക്കിപ്പീഡിയ
3. പുതിതായി വരുന്നതും ഇപ്പോളുള്ളതുമായ നിവേശകരീതികള് സൂക്ഷ്മമായ എന്കോഡിങ്ങ് ടെസ്റ്റിന് വിധേയമാക്കണം. അതിന് ശേഷമേ പബ്ലിക് റിലീസ് പാടുള്ളൂ.
Link | Leave a comment {23} Comments | Add to Memories | Tell a Friend
Aspell Malayalam Spelling checker Version 0.01-1 Released
Aug. 27th, 2007 | 11:32 am
മലയാളത്തിന് സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ തിരുവോണ സമ്മാനം: ആസ്പെല് മലയാളം സ്പെല്ലിങ്ങ് ചെക്കര്(version 0.01-1)
1,37,348 മലയാളം വാക്കുകളടങ്ങിയ മലയാളം സ്പെല്ലിങ്ങ് ചെക്കറിന്റെ ആദ്യ ലക്കം മലയാളത്തിന് സമര്പ്പിക്കുന്നു. സ്വതന്ത്ര ഡെസ്ക്ടോപ്പുകളായ ഗ്നോം, കെഡിഇ എന്നിവയില് ഉപയോഗിക്കാവുന്ന ഈ സ്പെല്ലിങ്ങ് ചെക്കര് ഗ്നു ആസ്പെല് എന്ന പ്രശസ്ത സോഫ്റ്റ്വെയര് അടിസ്ഥാനമാക്കിയാണ് വികസിപ്പിച്ചിരിക്കുന്നത്.
1,37,348 മലയാളം വാക്കുകളും സ്വയം അക്ഷരത്തെറ്റു പരിശോധിച്ചതാണ്. സമയക്കുറവ്, ശ്രദ്ധക്കുറവ്, വിവരക്കുറവ് എന്നീ കാരണങ്ങളാല് ചില പിഴവുകള് ഇതിലുണ്ടാവാം. ഈ സോഫ്റ്റ്വെയര് ഉപയോഗിക്കുമ്പോള് അത്തരം തെറ്റുകള് കാണുകയാണെങ്കില് ദയവായി എന്നെ അറിയിക്കുക.
ഇത് ഇന്സ്റ്റാള് ചെയ്യാന് https://savannah.nongnu.org/task/downlo ad.php?file_id=13811 എന്നിടത്തു നിന്ന് ഡൗണ്ലോഡ് ചെയ്ത് extract ചെയ്യുക. അതിനു ശേഷം README ഫയലില് വിവരിച്ചിരിക്കുന്ന പോലെ ചെയ്യുക.
മലയാളത്തിന്റെ പ്രത്യേകതയായ,ഒന്നിലധികം വാക്കുകള് കൂടിച്ചേര്ന്ന് പുതിയ വാക്കുകളുണ്ടാകുന്ന സവിശേഷത കൂടി കൈകാര്യം ചെയ്താല് മാത്രമേ സ്പെല്ലിങ്ങ് ചെക്കര് പൂര്ണ്ണമാവുകയുള്ളൂ. അല്ലെങ്കില് പദസഞ്ചയത്തിന്റെ വലിപ്പം വളരെയധികമായിരിക്കും(ഇപ്പോള് തന്നെ ഇന്ത്യയിലെ ഏറ്റവും വലിയ സ്പെല്ലിങ്ങ് ചെക്കര് പദസഞ്ചയമാണിത്.). സന്ധി സമാസം നിയമങ്ങള് ഈ ലക്കത്തില് ഉള്ക്കൊള്ളിച്ചില്ലാത്തതിനാല് മേല്പ്പറഞ്ഞ തരത്തിലുള്ള വാക്കുകള്പരിശോധിക്കാന് ഈ സോഫ്റ്റ്വെയറിന് കഴിയില്ല. അതായത് മഴക്കാലം, മേഘങ്ങള്, എല്ലാം, ഇരുണ്ട്, കൂടി എന്നിവയെല്ലാം പരിശോധിക്കാമെങ്കിലും "മഴക്കാലമേഘങ്ങളെല്ലാമിരുണ്ടുകൂടി" എന്ന വാക്ക് പരിശോധിക്കാന് ഇതിന് കഴിഞ്ഞെന്നു വരില്ല. ഇത് അടുത്ത ലക്കത്തില് ഉള്പ്പെടുത്താന് ശ്രമിക്കുന്നുണ്ട്.
ഇത്രയും വലിയ പദസഞ്ചയം ശേഖരിക്കാന് എന്നെ സഹായിച്ച ഹുസ്സൈന് സാറിനോട് കടപ്പാട് അറിയിച്ചുകൊള്ളുന്നു. മലയാളം വിക്കിപീഡിയ, വിവിധ ബ്ലോഗുകള് എന്നിവയില് നിന്നും വാക്കുകള് ശേഖരിച്ചിട്ടുണ്ട്. സാങ്കേതിക സഹായങ്ങള്ക്ക് കെവിന് അറ്റ്കിന്സണ്(ആസ്പെല് രചയിതാവ്), ഗോര മൊഹന്തി(ആസ്പെല് ഹിന്ദി,ഒറിയ സ്പെല് ചെക്കര്) എന്നിവരോട് നന്ദി രേഖപ്പെടുത്തുന്നു.
ഈ പദസഞ്ചയത്തിലില്ലാത്ത വാക്കുകള് പരിശോധിക്കുമ്പോള്, നിങ്ങള്ക്കത് പദസഞ്ചയത്തിലേയ്ക്ക് കൂട്ടിച്ചേര്ക്കാം. ഇങ്ങനെ നിങ്ങള് ചേര്ക്കുന്ന വാക്കുകള് നിങ്ങളുടെ ഹോം ഡയറക്ടറിയില് .aspell.ml.pws എന്ന hidden ഫയലില് ശേഖരിക്കപ്പെടും. നിങ്ങള് ചേര്ത്ത പുതിയ വാക്കുകള് മറ്റുള്ളവര്ക്കും ഉപകാരപ്പെടണമെന്നാഗ്രഹമുണ്ടെങ്കില് ആ ഫയല് എനിക്കയച്ചു തരിക. പുതിയ ലക്കങ്ങളില് ആ വാക്കുകള് പ്രധാന പദസഞ്ചയത്തില് ചേര്ക്കാം.
സഹായങ്ങള്ക്കോ സംശയങ്ങള്ക്കോ ഈ മെയിലിങ്ങ് ലിസ്റ്റിലേക്കെഴുതുക.
ഈ സോഫ്റ്റ്വെയറിനു വേണ്ടി ഉപയോഗിച്ച പദസഞ്ചയം മറ്റു ഭാഷാഗവേഷണങ്ങള്ക്കുമുപയോഗിക്കാവുന്നതാണ്. ആവശ്യമുള്ളവര് ബന്ധപ്പെടുക.
1,37,348 മലയാളം വാക്കുകളടങ്ങിയ മലയാളം സ്പെല്ലിങ്ങ് ചെക്കറിന്റെ ആദ്യ ലക്കം മലയാളത്തിന് സമര്പ്പിക്കുന്നു. സ്വതന്ത്ര ഡെസ്ക്ടോപ്പുകളായ ഗ്നോം, കെഡിഇ എന്നിവയില് ഉപയോഗിക്കാവുന്ന ഈ സ്പെല്ലിങ്ങ് ചെക്കര് ഗ്നു ആസ്പെല് എന്ന പ്രശസ്ത സോഫ്റ്റ്വെയര് അടിസ്ഥാനമാക്കിയാണ് വികസിപ്പിച്ചിരിക്കുന്നത്.
1,37,348 മലയാളം വാക്കുകളും സ്വയം അക്ഷരത്തെറ്റു പരിശോധിച്ചതാണ്. സമയക്കുറവ്, ശ്രദ്ധക്കുറവ്, വിവരക്കുറവ് എന്നീ കാരണങ്ങളാല് ചില പിഴവുകള് ഇതിലുണ്ടാവാം. ഈ സോഫ്റ്റ്വെയര് ഉപയോഗിക്കുമ്പോള് അത്തരം തെറ്റുകള് കാണുകയാണെങ്കില് ദയവായി എന്നെ അറിയിക്കുക.
ഇത് ഇന്സ്റ്റാള് ചെയ്യാന് https://savannah.nongnu.org/task/downlo
മലയാളത്തിന്റെ പ്രത്യേകതയായ,ഒന്നിലധികം വാക്കുകള് കൂടിച്ചേര്ന്ന് പുതിയ വാക്കുകളുണ്ടാകുന്ന സവിശേഷത കൂടി കൈകാര്യം ചെയ്താല് മാത്രമേ സ്പെല്ലിങ്ങ് ചെക്കര് പൂര്ണ്ണമാവുകയുള്ളൂ. അല്ലെങ്കില് പദസഞ്ചയത്തിന്റെ വലിപ്പം വളരെയധികമായിരിക്കും(ഇപ്പോള് തന്നെ ഇന്ത്യയിലെ ഏറ്റവും വലിയ സ്പെല്ലിങ്ങ് ചെക്കര് പദസഞ്ചയമാണിത്.). സന്ധി സമാസം നിയമങ്ങള് ഈ ലക്കത്തില് ഉള്ക്കൊള്ളിച്ചില്ലാത്തതിനാല് മേല്പ്പറഞ്ഞ തരത്തിലുള്ള വാക്കുകള്പരിശോധിക്കാന് ഈ സോഫ്റ്റ്വെയറിന് കഴിയില്ല. അതായത് മഴക്കാലം, മേഘങ്ങള്, എല്ലാം, ഇരുണ്ട്, കൂടി എന്നിവയെല്ലാം പരിശോധിക്കാമെങ്കിലും "മഴക്കാലമേഘങ്ങളെല്ലാമിരുണ്ടുകൂടി" എന്ന വാക്ക് പരിശോധിക്കാന് ഇതിന് കഴിഞ്ഞെന്നു വരില്ല. ഇത് അടുത്ത ലക്കത്തില് ഉള്പ്പെടുത്താന് ശ്രമിക്കുന്നുണ്ട്.
ഇത്രയും വലിയ പദസഞ്ചയം ശേഖരിക്കാന് എന്നെ സഹായിച്ച ഹുസ്സൈന് സാറിനോട് കടപ്പാട് അറിയിച്ചുകൊള്ളുന്നു. മലയാളം വിക്കിപീഡിയ, വിവിധ ബ്ലോഗുകള് എന്നിവയില് നിന്നും വാക്കുകള് ശേഖരിച്ചിട്ടുണ്ട്. സാങ്കേതിക സഹായങ്ങള്ക്ക് കെവിന് അറ്റ്കിന്സണ്(ആസ്പെല് രചയിതാവ്), ഗോര മൊഹന്തി(ആസ്പെല് ഹിന്ദി,ഒറിയ സ്പെല് ചെക്കര്) എന്നിവരോട് നന്ദി രേഖപ്പെടുത്തുന്നു.
ഈ പദസഞ്ചയത്തിലില്ലാത്ത വാക്കുകള് പരിശോധിക്കുമ്പോള്, നിങ്ങള്ക്കത് പദസഞ്ചയത്തിലേയ്ക്ക് കൂട്ടിച്ചേര്ക്കാം. ഇങ്ങനെ നിങ്ങള് ചേര്ക്കുന്ന വാക്കുകള് നിങ്ങളുടെ ഹോം ഡയറക്ടറിയില് .aspell.ml.pws എന്ന hidden ഫയലില് ശേഖരിക്കപ്പെടും. നിങ്ങള് ചേര്ത്ത പുതിയ വാക്കുകള് മറ്റുള്ളവര്ക്കും ഉപകാരപ്പെടണമെന്നാഗ്രഹമുണ്ടെങ്കില് ആ ഫയല് എനിക്കയച്ചു തരിക. പുതിയ ലക്കങ്ങളില് ആ വാക്കുകള് പ്രധാന പദസഞ്ചയത്തില് ചേര്ക്കാം.
സഹായങ്ങള്ക്കോ സംശയങ്ങള്ക്കോ ഈ മെയിലിങ്ങ് ലിസ്റ്റിലേക്കെഴുതുക.
ഈ സോഫ്റ്റ്വെയറിനു വേണ്ടി ഉപയോഗിച്ച പദസഞ്ചയം മറ്റു ഭാഷാഗവേഷണങ്ങള്ക്കുമുപയോഗിക്കാവുന്നതാണ്.
Link | Leave a comment {4} Comments | Add to Memories | Tell a Friend
Scim malayalam phonetic input method With Lookup table!!!
Jun. 18th, 2007 | 08:54 am
location: Chennai
mood: creative
Added a new feature to SCIM malayalam phonetic input method. It can give spelling suggestions while typing!!!. Cool right?
See the below screenshot from my system. I am editing some text in GEDIT. For typing വിള, I have to type viLa according to the IM Scheme. But as every body does, I typed vila. Now hint menu comes with two suggestions. ള and ല. I press arrow keys and it becomes വിള.

An extract from the documentation:
മലയാളം ശബ്ദാത്മക നിവേശകരീതിക്ക് ഉപയോക്താവ് എഴുതിക്കൊണ്ടിരിക്കുമ്പോള് സൂചനകള് കൊടുക്കാന് കഴിയും. ഇത് മലയാളം വളരെപ്പെട്ടെന്ന് തെറ്റ് കൂടാതെ എഴുതാന് സഹായിക്കുന്നു. ചില്ലക്ഷരങ്ങള്, കൂട്ടക്ഷരങ്ങള് എന്നിവ എഴുതുമ്പോള് ഇത് വളരെ ഫലപ്രദമാണ്. മലയാളികളുടെ സവിശേഷമായ മംഗ്ളീഷ് ഉപയോഗത്തിന്റെ അടിസ്ഥാനത്തിലാണ് ഇതു രൂപകല്പനചെയ്തിരിക്കുന്നത്.
ഉദാഹരണത്തിന് അടിപൊളി എന്നെഴുതാന് പലപ്പോഴും നാം ഉപയോഗിക്കുന്നത് adipoli എന്നാണ്. പക്ഷെ മലയാളം ശബ്ദാത്മക നിവേശകരീതിയിലതെഴുതുന്നത് atipoLi എന്നാണല്ലൊ?. ചിലര്ക്കെങ്കിലുമുണ്ടാകുന്ന ഈ തടസ്സം ഒഴിവാക്കുന്നതിന് സൂചനാപ്പട്ടിക ഉപകരിക്കും. adipoli എന്നെഴുതിക്കൊണ്ടിരിക്കുമ്പോള് di എന്നെഴുതുമ്പോള് സൂചനാപ്പട്ടിക ദി എന്നും ടി എന്നും 2 സൂചനകള് നല്കുന്നു. അതുപോലെ ളി എന്നതിനുവേണ്ടി Li ക്കുപകരം li എന്നെഴുതുമ്പോള് പട്ടിക ലി എന്നും ളി എന്നും 2 സൂചനകള് നല്കുന്നു.
ഇതിന്റെ വേറൊരു ഉപയോഗം പേരുകളുടെ കൂടെയുള്ള initials എഴുതുമ്പോള് ആണ്. ഉദാഹരണത്തിന് ലീല പി കെ എന്നെഴുതാന് ശരിക്കും ഉപയോഗിക്കേണ്ടത് leela pi ke എന്നാണ്. പക്ഷെ നാം leela p k എന്നു തന്നെ എഴുതാന് ഇഷ്ടപ്പെടുന്നു. നാം P അല്ലെങ്കില് p എന്നെഴുതുമ്പോള് സൂചനാപ്പട്ടിക പി എന്നൊരു സൂചനകൂടി തരും!.
കെ എസ് ആര് ടി സി എന്നെഴുതാന് K S R T C തന്നെ ഉപയോഗിക്കണമെന്നുണ്ടോ? സൂചനാപ്പട്ടികയുടെ സഹായത്തോടെ നിങ്ങള്ക്ക് K S R T C എന്നു തന്നെ എഴുതാം.
"അടിപൊളി അല്ലേ?!!!"
Now look at this

Note: I decided not to use mozhi scheme as such for the better usability.But I tried to give some compatibility to that scheme by giving alternative patterns in some places.
See the below screenshot from my system. I am editing some text in GEDIT. For typing വിള, I have to type viLa according to the IM Scheme. But as every body does, I typed vila. Now hint menu comes with two suggestions. ള and ല. I press arrow keys and it becomes വിള.
An extract from the documentation:
മലയാളം ശബ്ദാത്മക നിവേശകരീതിക്ക് ഉപയോക്താവ് എഴുതിക്കൊണ്ടിരിക്കുമ്പോള് സൂചനകള് കൊടുക്കാന് കഴിയും. ഇത് മലയാളം വളരെപ്പെട്ടെന്ന് തെറ്റ് കൂടാതെ എഴുതാന് സഹായിക്കുന്നു. ചില്ലക്ഷരങ്ങള്, കൂട്ടക്ഷരങ്ങള് എന്നിവ എഴുതുമ്പോള് ഇത് വളരെ ഫലപ്രദമാണ്. മലയാളികളുടെ സവിശേഷമായ മംഗ്ളീഷ് ഉപയോഗത്തിന്റെ അടിസ്ഥാനത്തിലാണ് ഇതു രൂപകല്പനചെയ്തിരിക്കുന്നത്.
ഉദാഹരണത്തിന് അടിപൊളി എന്നെഴുതാന് പലപ്പോഴും നാം ഉപയോഗിക്കുന്നത് adipoli എന്നാണ്. പക്ഷെ മലയാളം ശബ്ദാത്മക നിവേശകരീതിയിലതെഴുതുന്നത് atipoLi എന്നാണല്ലൊ?. ചിലര്ക്കെങ്കിലുമുണ്ടാകുന്ന ഈ തടസ്സം ഒഴിവാക്കുന്നതിന് സൂചനാപ്പട്ടിക ഉപകരിക്കും. adipoli എന്നെഴുതിക്കൊണ്ടിരിക്കുമ്പോള് di എന്നെഴുതുമ്പോള് സൂചനാപ്പട്ടിക ദി എന്നും ടി എന്നും 2 സൂചനകള് നല്കുന്നു. അതുപോലെ ളി എന്നതിനുവേണ്ടി Li ക്കുപകരം li എന്നെഴുതുമ്പോള് പട്ടിക ലി എന്നും ളി എന്നും 2 സൂചനകള് നല്കുന്നു.
ഇതിന്റെ വേറൊരു ഉപയോഗം പേരുകളുടെ കൂടെയുള്ള initials എഴുതുമ്പോള് ആണ്. ഉദാഹരണത്തിന് ലീല പി കെ എന്നെഴുതാന് ശരിക്കും ഉപയോഗിക്കേണ്ടത് leela pi ke എന്നാണ്. പക്ഷെ നാം leela p k എന്നു തന്നെ എഴുതാന് ഇഷ്ടപ്പെടുന്നു. നാം P അല്ലെങ്കില് p എന്നെഴുതുമ്പോള് സൂചനാപ്പട്ടിക പി എന്നൊരു സൂചനകൂടി തരും!.
കെ എസ് ആര് ടി സി എന്നെഴുതാന് K S R T C തന്നെ ഉപയോഗിക്കണമെന്നുണ്ടോ? സൂചനാപ്പട്ടികയുടെ സഹായത്തോടെ നിങ്ങള്ക്ക് K S R T C എന്നു തന്നെ എഴുതാം.
"അടിപൊളി അല്ലേ?!!!"
Now look at this
Note: I decided not to use mozhi scheme as such for the better usability.But I tried to give some compatibility to that scheme by giving alternative patterns in some places.
Link | Leave a comment {5} Comments | Add to Memories | Tell a Friend
Scim malayalam phonetic input method : Key mapping
Jun. 4th, 2007 | 10:50 am
This is the key mapping for scim malayalam phonetic keyboard
Please post your comments in smc-discuss@googlegroups.com
| സ്വരങ്ങള് | |||||||||
| അ | ആ | ഇ | ഈ | ഉ | ഊ | ഋ | |||
| a | aa A | i | ii I ee | u | uu U oo | RR | |||
| ാ | ി | ീ | ു | ൂ | ൃ | ||||
| എ | ഏ | ഐ | ഒ | ഓ | ഔ | അം | അഃ | ||
| e | E | ai ei | o | O | au ou | a~ aM ~ | aH | ||
| െ | േ | ൈ | ൊ | ോ | ൌ | ം | ഃ | ||
| വ്യഞ്ജനങ്ങള് | |||||||||
| ക | ഖ | ഗ | ഘ | ങ | ങ്ക | ന്റെ | |||
| k | kh K | g | gh G | ng | nk | nte | |||
| ച | ഛ | ജ | ഝ | ഞ | റ്റ | ക്ഷ | |||
| ch | Ch | j | jh J | nj | TT | x | |||
| ട | ഠ | ഡ | ഢ | ണ | ക്യു | വൈ | |||
| t | T | D | Dh | N | q | Y | |||
| ത | ഥ | ദ | ധ | ന | ക്യൂ | ഞ്ച | |||
| th | thh | d | dh | n | Q | nch | |||
| പ | ഫ | ബ | ഭ | മ | |||||
| p | f ph | b | bh B | m | |||||
| യ | ര | ല | വ | ശ | ഷ | സ | ഹ | ||
| y | r | l | v w | S z | sh | s | h | ||
| ള | ഴ | റ | |||||||
| L | zh | R | |||||||
| ചില്ലുകള് | |||||||||
| ന് | ല് | ള് | ര് | ||||||
| n~ | l~ | L~ | r~ R~ | ||||||
| ഉദാഹരണങ്ങള് | |||||||||
| മലയാളം | malayaaLaM | malayAla~ | |||||||
| സരിഗമപധനി | sarigamapadhani | ||||||||
| പൊന്പീലി | ponpiili | ||||||||
| മങ്ക | manka | ||||||||
| കുടുംബം | kutu~ba~ | kutu~baM | |||||||
| അവന് | avan~ | ||||||||
| ചക്ഷുശ്രവണഗളസ്ഥമാം | chaxuSravanagalasThamaa~ | chaxuSravanagalasThamaa~ | chakshuSravanagalasThamaa~ | ||||||
| പ്രകൃതി | prakRthi | ||||||||
| കൃഷ്ണന് | kRshNan~ | ||||||||
| പാലക്കാട് | paalakkaat | pAlakkAt | |||||||
| അക്ഷരം | axaraM |
Link | Leave a comment {7} Comments | Add to Memories | Tell a Friend
Spell checker and Late night coding..
May. 21st, 2007 | 10:03 am
mood: geeky
It was a wonderful week end. Myself and Benzi were working on the spell checker for Malayalam. In April we had done lot of research on this. We did the coding for the dictionary representation in the Binary Retrieval tree (TRIE). Saturday night we did the candidate list generation coding. It is a wonderful experience to code in the late night - one laptop and two persons to code!!!. Every thing worked fine. When we finished the coding, we realized that the application can be tuned to a universal(?) spell checker. So sunday we tested it using a 3 lakh english words.. Worked fine!!. We compared the spelling options generated with aspell. Ours was giving more options since our dictionary is bigger than aspell's.
We want it to be called as bspell :-). But qns....
Why bspell? what is the extra/less features that bspell has compared to aspell
how to make it language independent?
How to rank the spelling suggestions?
How to make it work with Office suits/Editors?
...
Answer is "study Aspell"
We want it to be called as bspell :-). But qns....
Why bspell? what is the extra/less features that bspell has compared to aspell
how to make it language independent?
How to rank the spelling suggestions?
How to make it work with Office suits/Editors?
...
Answer is "study Aspell"
Link | Leave a comment | Add to Memories | Tell a Friend
Swathanthra Malayalam Computing is participating in Google Summer of Code.
Mar. 13th, 2007 | 03:25 pm
Swathanthra Malayalam Computing is participating in Google Summer of Code.
More details at http://fci.wikia.com/wiki/SMC/SoC/2007
Excellent opportunity for Students in kerala....
Googel summer of Code:http://code.google.com/soc/
More details at http://fci.wikia.com/wiki/SMC/SoC/2007
Excellent opportunity for Students in kerala....
Googel summer of Code:http://code.google.com/soc/
