ചില്ല് എന്‍കോഡിങ്ങ് പരാജയം : ഗൂഗിള്‍ റിപ്പോര്‍ട്ട്

Home/Uncategorized/ചില്ല് എന്‍കോഡിങ്ങ് പരാജയം : ഗൂഗിള്‍ റിപ്പോര്‍ട്ട്

ചില്ല് എന്‍കോഡിങ്ങ് പരാജയം : ഗൂഗിള്‍ റിപ്പോര്‍ട്ട്

മലയാളം
കമ്പ്യൂട്ടിങ്ങ് രംഗത്ത് നിരവധി വര്‍ഷം തര്‍ക്കങ്ങള്‍ക്ക് വഴി തെളിച്ച
ചില്ലക്ഷരങ്ങളുടെ അറ്റോമിക് എന്‍കോഡിങ്ങ് പരാജയമാണെന്ന് ഗൂഗിളിന്റെ 
റിപ്പോര്‍ട്ട്. ഈ എന്‍കോഡിങ്ങ്  മുന്നോട്ടുവെച്ച മലയാളിയായ സിബു
തന്നെയാണു് ഗൂഗിളിനായി യൂണിക്കോഡിനു  സമര്‍പ്പിച്ച  ഈ പഠന റിപ്പോര്‍ട്ടും
തയ്യാറാക്കിയിരിക്കുന്നതു്. സിംഹള  ഭാഷയിലെ അറ്റോമിക്
എന്‍കോഡിങ്ങിനെ എതിര്‍ത്തുകൊണ്ടു സമര്‍പ്പിച്ച രേഖയിലാണ് മലയാളത്തിലെ
ചില്ല് എന്‍കോഡിങ്ങ് പരാജയമാണെന്നും അതില്‍ നിന്നു പാഠം  പഠിക്കണമെന്നും
അതേ തെറ്റ് ആവര്‍ത്തിക്കരുതെന്നും പറയുന്നതു്. 
ഈ രേഖ ഇവിടെ ലഭ്യമാണ് . 
യൂണിക്കോഡ്
കണ്‍സോര്‍ഷ്യത്തിലെ അംഗങ്ങള്‍ക്കു മാത്രം ലഭ്യമായിരുന്ന ഡോക്യുമെന്റ് രജിസ്ട്രി  അവര്‍ പൊതുജനങ്ങള്‍ക്കു തുറന്നിട്ടതോടെയാണു് 2013 ജനുവരിയില്‍ സമര്‍പ്പിച്ച ഈ രേഖ പുറത്തുവന്നതു്. 

വ്യഞ്ജനം+ചന്ദ്രക്കല+സീറോ 
വിഡ്ത് ജോയിനര്‍ എന്ന രീതിയില്‍ വര്‍ഷങ്ങളായി എഴുതിവരുന്ന മലയാളം 
ചില്ലക്ഷരങ്ങളെ യൂണീക്കോഡ് 5.1 പതിപ്പില്‍ വ്യഞ്ജനവുമായി ബന്ധമില്ലാത്ത 
വേറിട്ട ഒരു കോഡ് പോയിന്റ് നല്‍കി എന്‍കോഡ് ചെയ്യുകയായിരുന്നു. അതിന്റെ 
ഫലമായി രണ്ടു രീതിയില്‍ ഓരോ ചില്ലക്ഷരവും എഴുതാമെന്ന സ്ഥിതി 
സംജാതമാവുകയായിരുന്നു.

ഗൂഗിളിന്റെ വെബ് കോര്‍പ്പസ്സില്‍ നിന്നും ആണവചില്ലിന്റെ ഉപയോഗമില്ലായ്മ കാണിക്കുന്ന ഒരു 
ചാര്‍ട്ട് നല്‍കിയ ശേഷം രേഖ ഇങ്ങനെ പറയുന്നു . 
 

Chart from L2/13036
മലയാളം കമ്പ്യൂട്ടിങ്ങ് 
സമൂഹം അറ്റോമിക് ചില്ലുകളെ ഇങ്ങനെ തള്ളുമെന്നു അറിഞ്ഞിരുന്നെങ്കില്‍ ചില്ല് 
എന്‍കോഡിങ്ങിന് തങ്ങള്‍ മുതിരുമായിരുന്നോ എന്ന് സംശയമാണെന്നും മലയാളം 
വിക്കിപീഡിയയും CLDRഉം മാറ്റിനിര്‍ത്തിയാല്‍ അറ്റോമിക് ചില്ലുകളുടെ ഉപയോഗം 
ശുഷ്കമാണെന്നും ഈ രേഖ വ്യക്തമാക്കുന്നു. 
ഭാവിയില്‍ അറ്റോമിക് ചില്ലുകള്‍ കൂടുതല്‍ ഉപയോഗത്തിലെത്തുമെന്നു ഇവര്‍ പ്രതീക്ഷിക്കുമ്പോള്‍ തന്നെ
ഫോണ്ടുകളും  റെന്‍ഡറിങ്ങ് എഞ്ചിനുകളും ടെക്സ്റ്റ്എഡിറ്ററുകളും ഒക്കെ
അടക്കം എല്ലാ സോഫ്റ്റ്‌വെയര്‍ ഇമ്പ്ലിമെന്റേഷനുകളും സെര്‍ച്ചിങ്ങ് കൊളേഷന്‍
അല്‍ഗോരിതങ്ങളും  രണ്ടുതരം എന്‍കോഡിങ്ങുകളേയും അനന്തകാലം
പിന്തുണക്കേണ്ടിവരുമെന്നും അതേസമയം രണ്ടു ചില്ലുകളും തമ്മില്‍ കനോനിക
തുല്യത യൂണിക്കോഡ് ഡിഫൈന്‍ ചെയ്യാത്തതുകൊണ്ട് കാര്യങ്ങള്‍ കൂടുതല്‍
ബുദ്ധിമുട്ടാവുമെന്നും പറയുന്നു . ഇതോടൊപ്പം സീറോ വിഡ്ത്ത് കാരക്റ്ററുകളെ
കൈകാര്യം ചെയ്യുന്നതില്‍ നിരവധി സോഫ്റ്റ്‌വെയറുകളിലുള്ള ബഗ്ഗുകള്‍
ഉപയോക്താക്കള്‍ക്ക് കൂടുതല്‍ തലവേദന സൃഷ്ടിക്കുമെന്നും  ഗൂഗിളിലെ സിബു
ജോണിയും Roozbeh Pournader ഉം ചേര്‍ന്ന് തയാറാക്കിയ ഈ രേഖ പറയുന്നു. 2012
നവംബറില്‍ നടന്ന യൂണികോഡ് കണ്‍സോര്‍ഷ്യത്തിന്റെ UTC #133 എന്ന
മീറ്റിങ്ങില്‍ ഇവരോട് മലയാളത്തിലെ ചില്ലുകളുടെ സ്ഥിതിയെപ്പറ്റി റിസര്‍ച്ച്
ചെയ്യാന്‍ ആവശ്യപ്പെട്ടതിനെത്തുടര്‍ന്നാണ് ഇവര്‍ ഈ രേഖ തയ്യാറക്കിയതു്. 2011
നവംബറില്‍ സന്തോഷ് തോട്ടിങ്ങല്‍ തയ്യാറാക്കിയ മലയാളം കമ്പ്യൂട്ടിങ്ങ് സ്റ്റാറ്റസ്സിനെപ്പറ്റിയുള്ള ഈ രേഖയും  ശ്രീരമണ
ശര്‍മ്മ ഇന്‍ഡിക് സ്ക്രിപ്റ്റുകളിലെ എഡിറ്റോറിയല്‍
അപ്ഡേറ്റുകള്‍ വേണമെന്നാവശ്യപ്പെട്ട് 2012 മെയില്‍  സമര്‍പ്പിച്ച  ഈ രേഖയും മലയാളത്തിലെ ഇത്തരം പ്രശ്നങ്ങള്‍ മുമ്പ്
ചൂണ്ടിക്കാട്ടിയിരുന്നു. 
ഗൂഗിളടക്കമുള്ള
സൈറ്റൂകളിലും ഗൂഗിളിന്റെ തന്നെ മറ്റു ഉത്പന്നങ്ങളിലും അറ്റോമിക് അല്ലാത്ത
ചില്ലിന്റെ ബഗ്ഗുകള്‍ ഉന്നയിച്ചായിരുന്നു അറ്റോമിക് എന്‍കോഡിങ്ങ് നടന്നതു്.
ഇപ്പോള്‍ പുറത്തുവന്നിരിക്കുന്ന റിപ്പോര്‍ട്ടില്‍, ഈ പ്രൊഡക്ടുകളില്‍
ജോയിനര്‍ ഉപയോഗിച്ചുള്ള ചില്ലുകള്‍ക്കു് ഗൂഗീള്‍ ഉത്പന്നങ്ങള്‍
മെച്ചപ്പെട്ട പിന്തുണ ഉറപ്പാക്കാന്‍ ശ്രമിക്കണമെന്നു പറയുന്നു.
ചില്ല് എന്‍കോഡിങ്ങ് ചര്‍ച്ച ചെയ്യപ്പെട്ട 2005-2008 കാലത്ത് ചില്ല്
എന്‍കോഡിങ്ങിനെ എതിര്‍ത്ത് രചന അക്ഷരവേദി നിരവധി സബ്മിഷനുകള്‍ നടത്തിയിരുന്നു. സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് ആവശ്യപ്പെട്ടത് ചില്ല്
എന്‍കോഡിങ്ങ് ഒഴിവാക്കണമെന്നും ഇനി എന്‍കോഡ് ചെയ്യുന്നുണ്ടെങ്കില്‍
രണ്ടുതരം ചില്ലുരൂപങ്ങളും തമ്മില്‍ കനോനിക തുല്യത നടപ്പാക്കണമെന്നും
ആയിരുന്നു. ഇപ്പോള്‍ ഗൂഗിളും സിബു ജോണിയും തിരിച്ചറിഞ്ഞ എല്ലാ പ്രശ്നങ്ങളും
അന്ന് അക്കമിട്ട് ഈ രണ്ട് സംഘടനകളും ചൂണ്ടിക്കാട്ടിയിട്ടുമുണ്ടായിരുന്നു. 
ഈ ഗൂഗിളിന്റെ രേഖയില്‍ തന്നെ ഫോണ്ടുകളും സോഫ്റ്റ്‌വെയറുകളുകളും
നിര്‍മ്മിക്കുയും മലയാളം കണ്ടന്റ് ഉത്പാദിപ്പിക്കുകയും ചെയ്യുന്ന
സ്വാധീനശക്തിയുള്ള വലിയൊരു സമൂഹം അറ്റോമിക് ചില്ലുകളെ ഭാഷാപരമായ
കാരണങ്ങളാല്‍ എതിര്‍ത്തിരുന്നുവെന്ന് പറയുന്നുണ്ട് . മലയാളം വിക്കിമീഡിയ  
പ്രൊജക്റ്റുകളെക്കൊണ്ട് അറ്റോമിക് ചില്ലിലേക്ക് നിര്‍ബന്ധിത കണ്‍വര്‍ഷന്‍ 
നടത്തിയാണ് ഇപ്പോള്‍ ഈ രേഖയില്‍ കാണിക്കുന്നത്ര അറ്റോമിക് ചില്ല് ഉപയോഗമെങ്കിലും 
ഉണ്ടായതും.
2005ല്‍ രചനയുടെ രേഖകളുടെ അടിസ്ഥാനത്തില്‍ ചില്ല് എന്‍കോഡിങ്ങ് മാറ്റിവെച്ചിരുന്നു. പിന്നീട് ഭാഷാപരവും
സാങ്കേതികവുമായ വാദങ്ങള്‍ക്കപ്പുറം സര്‍ക്കാര്‍ സ്ഥാപനങ്ങളെയും കേരള ഐടി
മിഷന്‍ , മുഖ്യമന്ത്രിയായിരുന്ന വി.എസ്. അച്യുതാനന്ദന്റെ ഓഫീസ് , കേന്ദ്ര
സര്‍ക്കാര്‍ , കേന്ദ്ര ഐടി വകുപ്, സിഡാക്ക് തുടങ്ങിയ സ്ഥാപനങ്ങളെയെല്ലാം
ഉപയോഗപ്പെടുത്തിയാണ് അറ്റോമിക് ചില്ല് വാദികള്‍ ചില്ല് എന്‍കോഡിങ്ങ്
നേടിയെടുത്തത് .ആ രേഖകള്‍ യൂണിക്കോഡ് ഇപ്പോള്‍ തുറന്നുകൊടുത്ത രേഖകളില്‍
കാണാവുന്നതാണു്. ചില്ല് എന്‍കോഡിങ്ങുമായി ബന്ധപ്പെട്ട ഈ ചരിത്ര രേഖകള്‍
താഴെ കാണുക .

ചില്ലുചരിതം രേഖകള്‍ 

L2/05-081

Chilling effects of the Chillu: Encoding Problems in Malayalam
(background doc) – relates to PRI #66

Mahesh T Pai

2005-03-17

L2/05-085

Encoding of Chillu forms in Malayalam (PRI #66 feedback)

Cibu C. Johny

2005-03-31

L2/05-112

Public Review Issue #66, Encoding of chillu forms in Malayalam
(background doc)

Rick McGowan

2005-05-03

L2/05-210

Chandrakkala. Samvruthokaram. Chillaksharam, from the
perspective of Malayalam Collation

R. Chitrajakumar , N. Gangadharan

2005-08-05

L2/05-213

Samvruthokaram and Chandrakkala (accompanies L2/05-210)

R. Chitrajakumar , N. Gangadharan

2005-08-07

L2/05-214

Chillaksharam of Malayalam Language (accompanies L2/05-210)

R. Chitrajakumar , N. Gangadharan

2005-08-07

L2/05-236

Malayalam Language — Inclusion of Chillu characters

Kerala State IT Mission

2005-08-25

L2/05-246

Letter to Mark Davis from Om Vikas re Malayalam Chillus

Om Vikas

2005-09-06

L2/05-307

ZWJ/ZWNJ behavior under Indic scripts with special reference to
chillu, conjuncts, etc in Malayalam

Rajeev J Sebastian

2005-10-21

L2/05-308

Problems of Malayalam Encoding in the Indic context (Rachana’s
response to Malayalam encoding debate)

R. Chitrajakumar , N. Gangadharan

2005-10-21

L2/05-310

Rachana Documents (cover letter for L2/05-307, 308, 309)

R. Chitrajakumar

2005-10-21

L2/05-334

Critical review of Rachana (L2/05-210) and other arguments to
encode Malayalam Chillus

Cibu C Johny

2005-10-25

L2/05-354

Chillu and Semivowel examples (this is an addendum to
L2/05-308)

R. Chitrajakumar , N. Gangadharan

2005-10-28

L2/05-372

Chillus, Samvrithokaram and Chandrakkala – A Problem Which is
Not

Mahesh T. Pai

2005-11-22

L2/05-373

Malayalam keyboard layout and character encoding. Report of the
Government of Kerala Committee, May 2001

Gov’t of Kerala

2005-11-30

L2/06-189

The Chillu Issue

Govt of India, MIT

2006-05-12

L2/06-190

Annexure 1 – Chillu Evidence, 2 pages

Govt of India, MIT

2006-05-12

L2/06-191

Report on the study of IDN with respect to south Indian
Languages

Govt of India, MIT

2006-05-12

L2/06-207

Malayalam Chillaksharam

Eric Muller

2006-05-16

L2/06-218

Malayalam Chillu Encoding (e-mail to McGowan, Muller,
Umamaheswaran, et al)

R. Chitrajakumar

2006-05-19

L2/06-247

Proposal to revise names for Malayalam chillus

V.S. Umamaheswaran

2006-07-27

L2/06-270

Cillaksharam R and a comment on Cillu letter names (L2/06-247)

N. Ganesan

2006-08-01

L2/06-296

Letter to Mark Davis re Malayalam encoding

V.S. Achuthanandan

2006-08-10

L2/06-396

Chillu encoding is wrong

R. Chitrajakumar, et al.

2006-11-20

L2/07-012

Recommendations of the Committee on Malayalam Character
Encoding and Key Board Lay out Standardization Accepted

Gov’t of Kerala

2007-01-15

L2/07-034

Workshop – The Problems in Unicode Encoding of Malayalam

N. Sam

2007-01-19

L2/07-031

Letter from Chief Minister Achuthanandan (Kerala) to Mark Davis
re Malayalam Chillu encoding

V. S. Achuthanandan

2007-01-30

L2/07-035

Atomic chillus causes spoofing

Rajeev J Sebastian

2007-01-30

L2/07-036

Malayalam – Comparison of Chillu Encoding Proposals

Cibu C Johny

2007-01-31

L2/07-037

Malayalam – Dot Reph

Cibu C Johny

2007-01-31

L2/07-041

Malayalam – PR 96 feedback

Cibu C Johny

2007-02-01

L2/07-043

Public Review Issue #96 (update)

Mark Davis

2007-02-01

L2/07-057

Report of the Workshop on Problems of Unicode encoding of
Malayalam conducted at University of Kerala on January 24-25, 2007

N. Sam

2007-02-02

L2/07-061

Notes on PRI #96 Feedback

Rajeev J Sebastian

2007-02-06

L2/07-062

Letter from Rajeev J Sebasian to Mark Davis re Malayalam
Encoding

Rajeev J Sebastian

2007-02-06

L2/07-064

Theoretical and Practical Aspects of Chillus in Malayalam

K P Mohanan

2007-02-06

L2/07-065

Atomic Chillu Encoding Issue

Mahesh Mangalat

2007-02-07

L2/07-066

Letter from Swaran Lata supporting Chillu Encoding

Swaran Lata

2007-02-07

L2/07-090

Visuals and corresponding storage representations of the edge
cases in Malayalam

Cibu C. Johny

2007-03-07

L2/07-129

Changes related to Malayalam in Unicode 5.1.0 from 5.0

Cibu Johny

2007-04-24

L2/07-173

PR 96: Backgound information for Malayalam

Cibu Johny

2007-05-14

L2/07-242

Proposal to encode Malayalam Chillu YA in the UCS

Cibu Johny

2007-07-31

L2/07-283

Proposal to add three characters for Malayalam to the BMP

Michael Everson

2007-08-16

L2/07-393

Correction to L2/07-090, L2/07-129 on how Malayalam Chillus
used in boundary cases

Cibu Johny

2007-10-18

L2/07-402

Malayalam Chillus in grapheme clusters

Cibu Johny

2007-10-19

L2/08-020

Malayalam: Comparison of Dot-Reph Proposals in 5.1

Cibu Johny, Umesh Nair

2008-01-30

L2/08-038

Atomic chillu’s are Unacceptable

Santhosh Thottingal

2008-01-28

L2/08-039

Malayalam Script – Adoption of New Script for Use – Orders
Issued (1971)

Gov’t of Kerala

2008-01-28

L2/08-040

Comments on L2/07-402: Malayalam Chillus in Grapheme clusters

N. Ganesan

2008-01-28

L2/08-041

Malayalam Reph with ZWJ joiner

N. Ganesan

2008-01-28

L2/08-069

Comments on the Malayalam related text in Unicode 5.1.0

K. G. Sulochana

2008-01-28

L2/08-076

Malayalam Feedback from the Online Reporting Form (UTF-8 text
version HERE)

Rick McGowan

2008-01-29

Not
Numbered

Report on the Issues of Malayalam Language in Unicode

Santhosh Thottingal

2011-11-01

L2/12-164

Further editorial updates for Indic

Shriramana Sharma

2012-05-02

L2/13-036

Old and New Chillus in Malayalam and implications for Sinhala

Roozbeh Pournader, Cibu Johny

2013-01-29

2017-01-02T20:06:41+00:00 April 16th, 2013|Uncategorized|3 Comments

About the Author:

3 Comments

  1. suruma 16th April 2013 at 1:16 PM - Reply

    Cibu contradicts himself with the case of ള്‍മ, LL Chillu + ZWJ + MA for conjuncts, while it was alright for him N CIllu + Virama + RRA for 'nta'(ന്റ), arguing Virama is used to form subjoined form

  2. admin 16th April 2013 at 3:58 PM - Reply

    suruma , ഇത് PR 250 അല്ലേ . നല്ല പോയന്റ്

Leave a Reply