Divaina - යුනිකේත අක්ෂර භාවිත කරමින් සිංහල යතුරු ලියනය කර ගබඩා කරන්නේ කෙසේද?

e5

 

The Island The Island Nawaliya Vidusara e-Paper Classifiedsරාහු කාලය

mobitel

ugc15september

n7 3 1. හැඳින්වීම
 
 යුනිකේත තාක්ෂණය පරිගණකවල ඉදිරිපත් කිරීම සඳහා නිර්මාණය කරන ලද කාලය වන විට, සිංහල සහ දෙමළ සංකීර්ණ පිටපත් යටතේ වර්ගීකරණය කර තිබුණි. සිංහල, දිගු හා දුෂ්කර පරිගණකකරණ මාවතක් ගෙන තිබුණි. එහි ප‍්‍රතිඵලයක් ලෙස පරිගණකවල සිංහල අක්ෂර ක‍්‍රියාත්මක කිරීමේදී සිංහල ඉංග‍්‍රීසි මෙන්ම ඉදිරියෙන් සිටියි.
 
 සිංහල, වෙනත් අක්ෂර සමඟ සමාන්තරව ඕනෑම ලේඛනයක් තුළ ගබඩා කළ හැකි අතර, වෙනත් ඕනෑම ලතින් පිටපතක් මෙන් සිංහල වචන ලැයිස්තුවක් වර්ග කර පිළිවෙළට සකස් කළ හැකියි. සිංහල දත්ත, ඉංග‍්‍රීසි දත්ත මෙන්ම දත්ත සමුදා කළමනාකරණ පද්ධතිවල (ඞීබීඑම්එස්) ගබඩා කර තිබීම සාමාන්‍ය එදිනෙදා සිදුවීමක් බවට පත්ව ඇත.
 
 අක්ෂර වින්‍යාස පරීක්ෂා කිරීම සඳහා දැනටමත් මෘදුකාංග සංවර්ධනය කර ඇති අතර, ව්‍යාකරණ පරීක්ෂා කිරීම සඳහාද මෘදුකාංග නිර්මාණය වෙමින් පවතී. කොළඹ විශ්වවිද්‍යාලයේ පරිගණක ආයතනයේ (යූසීඑස්සී) භාෂා තාක්ෂණ පර්යේෂණ විද්‍යාගාරය (යූටීඑස්සී) තීක්ෂණ ආර් ඇන්ඞ් ඞී සමඟ වසර දහයකට වැඩි කාලයක් තිස්සේ දෘශ්‍ය අකුරු හඳුනාගැනීම ( ඕසීආර්) සඳහාත් ටෙක්ස්ට් ටූ ස්පීච් සඳහාත් කටයුතු කරමින් සිටින අතර මෙම පර්යේෂණ නිකුත් කිරීමට ආසන්නව පවතියි.
 
 මේ සියල්ල විශිෂ්ට ජයග‍්‍රහණ වන අතර යුනිකේත නොමැතිව මෙය කළ නොහැකිය. මෙම ලිපියේ පරමාර්ථය වන්නේ විජේසේකර යතුරුපුවරුව භාවිතයෙන් සිංහල ආදානය සඳහා ප‍්‍රමිතිය සපයන එස්එල්එස් 11341134( SLS 1134) 3 වන සංශෝධනය කෙරෙහි අවධානය යොමු කරමින් යුනිකේත පිළිබඳ හැඳින්වීමක් ලබා දීමයි.
 
 2. යුනිකේත ප‍්‍රමිතිය හෙවත් විශ්ව කේතීකරණ ප‍්‍රමිතිය
 
 යුනිකේත ප‍්‍රමිතිය හඳුන්වාදීමට පෙර, එක් එක් භාෂාවට හෝ භාෂා කාණ්ඩයට අනන්‍ය වූ කේතීකරණ ප‍්‍රමිතීන් ලොව පුරා හඳුන්වා දී තිබුණි. තොරතුරු හුවමාරු සඳහා ඇමරිකානු සම්මත කේතක‍්‍රමය (ASCII) ISO 646 ප‍්‍රමිති සමූහය ලෙසද හැඳින්වේ. එය බිට් 7 අක්ෂර කේතන ක‍්‍රමයක් වන අතර එය 1964 දී සංවර්ධනය කරන ලද අතර එහි පළමු අනුවාදය 1967 දී ලතින් අක්ෂර කට්ටලය ගබඩා කිරීමට නිකුත් කරන ලදී.
ASCII  මත පදනම්ව තවත් රටවල් කිහිපයක්ම තම රටවල් සඳහාද එම හා සමාන ප‍්‍රමිතීන් නිකුත් කළහ.
 
 ඉන්දියාව තොරතුරු හුවමාරුව සඳහා ඉන්දියානු සම්මත කේතය (ISCII) නිකුත් කරන ලද අතර එය බිට් 8 කේතයක් වන අතර එය අසාමාස්, බෙංගාලි, දේවානාග‍්‍රි, ගුජරාටි, මරාති, මලයාලම්, දෙමළ, තෙළිඟු වැනි ඉන්දියානු භාෂා කට්ටල කිහිපයකට සහාය වේ. ඒ අනුව 1990 දී ශ‍්‍රී ලංකාව තොරතුරු හුවමාරුව සඳහා ශ‍්‍රී ලංකාවේ සම්මත කේතය (SLASCII) නිකුත් කර තිබුණි.
 
 විවිධ ලක්ෂණ සහිත ලිඛිත අක්ෂර වර්ග පනහකට වැඩි ප‍්‍රමාණයක් ලෝකයේ ඇත. යුරෝපීය භාෂා බොහොමයක් ලතින් අක්ෂරයෙන් ලියා ඇත. ස්ලාවික් (Slavic) භාෂා පවුලට අයත් රුසියානු භාෂාව සිරිලික් (Cyrillic) අක්ෂර ලෙස හැඳින්වෙන අක්ෂර විශේෂයකින් ලියා ඇති අතර මෙම පිටපත් දෙකම ඇල්ෆබටික් පවුලට අයත් අක්ෂර මාලාවට අයත් වේ. හීබෘ සහ අරාබි භාෂා අයත් සෙමාටික් භාෂා පවුල දකුණේ සිට වමට ලියනු ලබයි. මෙම අක්ෂර ද්විපාර්ශ්වික අක්ෂර ලෙසත් හඳුන්වන්නේ අක්ෂර දකුණේ සිට වමට ලියන අතර අංක වමේ සිට දකුණට ලිවීම හේතුවෙනි. අරාබි සහ හීබෘ, අබ්ජාඞ් (Abjad) අක්ෂර ලෙස හැඳින්වෙන අතර, ඇල්ෆබටික් අක්ෂර මෙන් නොව අරාබි පරිගණකගත කිරීම අභියෝගයක් විය. සිංහල, දෙමළ සහ හින්දි භාෂා පැවත එන්නේ බ‍්‍රාහ්මී අක්ෂර වලින් වන අතර ඒවා ස්වභාවයෙන්ම ශබ්දය ආශ‍්‍රිතව හෝ ස්වර ආශ‍්‍රිතව හැඩතල වෙනස් වීමට ලක්වේ. මෙම අක්ෂර, සංකීර්ණ අක්ෂර හෙවත් අබිගුඩා අක්ෂර ලෙසද හැඳින්වෙන අතර මේවායෙහි අක්ෂර වින්‍යාසයේ, ව්‍යාංජන අක්ෂර ස්වර අනුව වෙනස් වීමට භාජන වෙයි. මෙම පවුලට අයත් අක්ෂර වල හැඩතල ඉතා සංකීර්ණ වන අතර මෙයට උදාහරණයක් ලෙස භූතානයේ නිල පිටපත වන ඩොංකා (Dzongkha) දැක්විය හැක. ඩොංකා 
(Dzongkha) ලෝකයේ වඩාත්ම සංකීර්ණ අක්ෂර වන අතර, මට්ටම් හයක් දක්වා පහළින් සහ උසින් විවිධ හැඩතල ව්‍යාංඡුන අක්ෂරයට එක් වේ.
 
 සිංහල, දෙමළ වැනි විවිධ භාෂා එකම පිටපතක් තුළ තිබීම යුනිකේත හෙවත් විශ්ව අක්ෂර කේතීකරණ ප‍්‍රමිතිය හඳුන්වා දීමට පෙර අභියෝගයක් විය. යුනිකේත හඳුන්වා දීමට පෙර අක්ෂර පරිගණක වල ගබඩා කර ඇත්තේ ෆොන්ට් නිර්මාණකරුවන්ට ආවේණික වන ප‍්‍රමිතීන් ආශ‍්‍රය කරගෙනය.
 
 එම නිසා යුනිකේත හඳුන්වා දීමට පෙර ප‍්‍රමිතීන් රාශියක් ලංකාවේ භාවිත වුණි. ඒ පිළිබඳව මෙම ලිපියේ ආරම්භයේද සඳහන් කර ඇත.
 
 සියලූම අක්ෂර වර්ගයන් කේතනය කිරීමේදී ඇති වූ මෙම ගැටලූව 1990 දී විසඳනු ලැබුවේ සෙරොක්ස් (Xerox) හි ජෝ ඩෙකර්, ඇපල් සමාගමේ මාක් ඬේවිස් සහ කෙන් විස්ලර් යනාදීන්ගෙන් සමන්විත ආරම්භක යුනිකේත සමූහයේ දීර්ඝ සාකච්ඡාවකින් පසුව ය. මුලින්ම විසඳුම 16 බිට් අක්ෂර ආකෘතියකින් සරල විය. මෙම ආකෘතියේ දී, පළමු බයිටය භාෂාව හඳුනා ගන්නා අතර දෙවන බයිටය අක්ෂරය ගබඩා කරයි. උදාහරණයක් ලෙස, මෙහිදී ''0D˜ සිංහල භාෂාව ලෙසත් 85 මඟින් ”අයන්න” අක්ෂරයත් දක්වයි. මෙම විසඳුම තුළ, යුනිකේත යනු අක්ෂර පදනම් කරගත් විසඳුමක් පමණක් නොව එය යුනිකේත තාක්ෂණය ලෙස විදැහුම්කරණය අවශ්‍ය වන True Type Fonts (TTF) සහ Open Type Fonts (OTF) යන දෙවර්ගයටම සහාය සපයයි. වර්තමානය වන විට විවිධ මෙහෙයුම් පද්ධති විසින් විදැහුම් එන්ජින් කිහිපයක් නිකුත් කර ඇති අතර, මයික්‍රොසොෆ්ට් වින්ඩෝස් හි විදැහුම්කරණ එන්ජිම යුනිස්ක‍්‍රයිබ් (Uniscribe) ලෙස හඳුන්වන අතර ලිනක්ස්හි පැන්ගෝ සහ QT ලෙස ඇත.
 
 අද වන විට යුනිකේත වඩාත් විවිධාකාර වී ඇති අතර වර්තමානය වන විට භාවිතයේ නොමැති භාෂාවන්ගේ අක්ෂර මාලාවන්ද ඇතුළත් කිරීම සඳහා ප‍්‍රමිතිය පුළුල් කර ඇත. චීන, ජපන් සහ කොරියානු සෑම භාෂාවක් සඳහාම අවම වශයෙන් අක්ෂර 50,000 කට වඩා වැඩි සංඛ්‍යාවක් කේතනය කර ඇත. උදාහරණයක් ලෙස, සිංහල භාෂාව කේතකරණයේදී අප විසින් තල දෙකක් භාවිතා කෙරුණු අතර මෙයට හේතුව වූයේ ඉපැරණි අංකයන් වන සිංහල ඉලක්කම් පරිපූරක තලයේ කේත කිරීමයි.
 
 වර්තමානයේ, යූටීඑෆ් 8 (UTF 8), යූටීඑෆ් 16 (UTF‍ 16) සහ යූටීඑෆ් 32(UTF‍ 32) අන්තර්ජාලයේ භාවිතා වෙයි. පළමුවෙන්ම සිංහල කේතනය කිරීම ඉතා සෙමෙන් සිදුවූ අතර ශ‍්‍රී ලංකා රජයට ඒ සඳහා විශාල පරිශ‍්‍රමයක් දැරීමට සිදුවිය. නිසි අකාරාදී අනුපිළිවෙළක් ඇති කිරීම සඳහා ISO / IEC ක‍්‍රියාකාරී කණ්ඩායම් 2 (Working Group 2)) රැස්වීම් කිහිපයකදී සිංහල යුනිකෝඩයේ කේතනය කර ඇත. සිංහල භාෂාව කේතනය කිරීමේ පළමු වැනි යෝජනාවේදී, සිංහල භාෂාවේ අකාරාදි අනුපිළිවෙළට නොව ඉන්දියානු භාෂාවේ අකාරාදි අනුපිළිවෙළට සමගාමීව අක්ෂර පිහිටුවීමට යෝජනා කරනු ලැබූයේ බටහිර පරිගණක සමාගම් දෙකකි. එහිදී සිංහල භාෂාව අනෙකුත් ඉන්දියානු භාෂා වලින් වෙනස් වන සුවිශේෂි ලක්ෂණය වන සහ ඉන්දියානු භාෂා වලට නොමැති ස්වර දෙකක් වන ”ඇ” සහ ”ඈ” සිංහල අක්ෂර මාලාවේ අකාරාදී පිළිවෙළින් වෙනස් කර සිංහල අක්ෂර වගුවේ පහල පිහිටුවා තිබෙනු දක්නට ලැබුණි. ශ‍්‍රී ලංකා රජයට මෙය දැන්වීමෙන් පසුව යුනිකේත කොන්සෝටියමට දන්වා සිටියේ ”ඇ” සහ ”ඈ”අකාරාදී පිළිවෙළටම පිහිටුවිය යුතු බවයි. ඒ අනුව 1999 දී සිංහල භාෂාව යුනිකේතකරණයට ලක් වූ අතර රජය විසින් දන්වනු ලැබුවා සේම සිංහල අකාරාදිය පවත්වා ගැනීමට හැකිවිය. පසුවද නැවත රජයට මැදිහත් වීමට සිදුවූ අතර ඒ මෙතෙක් අමතකව තිබූ අංක කට්ටල යුනිකේතනය කිරීමටයි.
 
 හර්ෂ විජයවර්ධන
 B.Sc. FBCS
 ප‍්‍රධාන මෙහෙයුම් නිලධාරී
  

විශේෂාංග

sikuru

සිනමා කලා

maalani250

නවලිය

yohanis250

දියග

wejadas250new

මීවිත

fala250new

More Articles