தமிழ் கணனியியலில் புதிய யுனிக்கோட் முறை ஒன்று தற்போது பரீட்சாத்தமாகப் உருவாக்கப்பட்டு இருக்கின்றது. இதுவே TUNE (Tamil Unicode New Encoding) அல்லது TANE (TAmil New Encoding) என்று அறியப்படுகின்றது.அண்மையின் தமிழ் கணனியியல் ஆர்வலர் மாலன் மூலம் இதைப்பற்றி அறிந்து கொண்டேன். ஏன் அது ஆரம்பிக்கப்பட்டது இதனால் என்ன நன்மைகள் உண்டு என்று பார்ப்போம். இங்கே இது பற்றிய ஒரு சிறு குறிப்பைத்தருகின்றேன்.
யுனிக்கோடு (Unicode) முறைமை யுனிக்கோடு கான்சட்டேரியம் (Unicode Consortium) எனும் நிலையத்தால் அமைக்கப்பட்டது. இந்த முறையில் உலகின் பிரதான மொழிகள் யாவும் அடக்கப்பட்டுள்ளன. தமிழ் இந்தி தொடக்கம் ஆங்கிலம் வரை முக்கிய மொழிகள் இதில் பயன்படுகின்றன. ஏன் இந்த வலைப்பதிவு கூட யுனிக்கோடு முறமையில்தான் உருவாக்கப்பட்டுள்ளது. இந்த கான்சட்டேரியத்தில் இந்திய அரசு மற்றும் தமிழக அரசு அத்துடன் உத்தமம் ஆகிய நிறுவனங்களும் பங்கு வகிக்கின்றன.
IISCI முறைமையில் இருந்து யுனிக்கோடு முறைக்கு மாறும் போது மற்றய மொழிகளைப்போல இஸ்க்கி அமைப்பையே யுனிக்கோட் என்கோடிங்கில் தமிழ் பயன்படுத்தியது. இதன் காரணமாக Complex Script ஆக வரத்தேவையில்லாத தமிழ் மற்றய இந்திய மொழிகளைப்போல Complex Script ஆக வகைப்படுத்தப்பட்டுள்ளது.
Complex Script பொதுவாக லெவல் இரண்டு மொழிகள் ஆகும். எ-கா ஹிந்தி, சீனம், ஜப்பானீஸ். தமிழும் லெவல் இரண்டு மொழிகளுள் இதனால் பட்டியலிடப்பட்டுள்ளது. ஆங்கிலம், ஜேர்மன், பிரஞ்சு போன்ற மொழிகள் லெவல் ஒன்று மொழிகள் ஆகும்.
லெவல் ஒன்று மொழியாக இருப்பதனால் பல நன்மைகள் உள்ளன. அதாவது செயலி தயாரிப்பவரோ இயங்குதளமோ இதற்கான Core Level ஆதரவை வழங்க தேவையில்லை. இதன்காரணமாக சில குறைந்தளவு மென்பொருள்களிலேயே நாம் தமிழ் யுனிக்கோடைப் பயன்படுத்தக் கூடியதாக உள்ளது (MS Office, Open Office..etc). இது வருந்தத்தக்க விடயமாகும். Level one மொழியாக தமிழ் இருக்குமானால் ஆங்கிலம் பயன்படும் அனைத்து செயலியிலும் தமிழையும் பயன்படுத்த முடியும். இதன்காரணமாக தமிழ் கணனியியல் மிக வேகமாகப் பரவும் என்பதை மறுக்க முடியாது. மக் மற்றும் சில லினக்ஸ் (சில லினக்ஸ் இயங்கு தளங்கள் ஆதரவு வழங்குகின்றன) இயங்கு தளங்களில் (Operating System) இன்றும் தமிழ் யுனிக்கோடு ஆதரவு இல்லாமையைக் குறிப்பிட வேண்டும்.
போ என்ற எழுத்து உண்மையில் ஒரு தமிழ் எழுத்தாக இருந்தாலும் இது யுனிக்கோடு முறையில் 3 எழுத்துகளாக கணக்கெடுக்கப்படும்
1. இரட்டைக்கொம்பு
2. ப னா
3. அரவு
ஆகவே ஆங்கிலத்தில் 3 எழுத்து சேமிக்கப்படும் இடத்தில் தமிழில் ஒரு எழுத்து சேமிக்கப்படுகின்றது. இதனால் தமிழில் கோப்புக்கள் சேமிக்கத்தேவையான சேமிப்பகம் அதிகமாகும்.
இவ் விடயத்தை தமிழ் இணையப் பல்கலைக்கழகம், கணித் தமிழ் சங்கம், INFITT ஆகியன இணைந்து புதிய என்கோடிங் முறமையைத் தீர்மாணித்தனர். இதைப் பல்வேறு இடங்களில் பரீட்சித்தும் பார்த்து இது வினைத்திறனானது என்ற முடிவு எடுக்கப்பட்டது. பின்பு இத்தகவல் தமிழக அரசூடாக மத்திய தகவல் தொழில் நுட்ப அமைச்சிற்கு அறிவிக்கப்பட்டது. அமைச்சு இத்தகவலை யுனிக்கோட் கொன்சட்டேரியத்திற்கு அறிவித்தது. ஆயினும் யுனிக்கோட் கான்சட்டோரியம் வினைத்திறனை கணக்கில் எடுப்பதில்லை அவர்கள் இதன் உறுதித் தன்மையை நன்கு ஆராயுமாறு கூறிவிட்டதுடன் ஒரு மாற்று வழியையும் பரிந்துரைத்தனர்.
மாற்று வழியானது யுனிக்கோடில் தனிப்பட்ட பயனர் பிரதேசத்தில இட்டு பரீட்சித்துப் பார்ப்பதே (However the Unicode consortium suggested an alternate measure to put the proposed All Character scheme in Private Use Area (PUA) of the Unicode space to startwith). அவ்வாறே தற்போது 16 பிட் முறைமையில் தமிழ் புதிய என்கோடிங் அமைக்கப்பட்டுள்ளது. இது தற்போது பரீட்சாத்த முயற்சியில் உள்ளது.
இதை பயன்படுத்திப் பார்க்க தமிழ் கணனி ஆர்வலர்கள், தமிழ் கணனி செயலி வடிவமைப்பாளர்கள் போன்றவர்கள் வரவேற்கப்பட்டுள்ளனர். இதன் மூலமாக இதில் உள்ள பிழைகள் தீர்க்கப்பட்டு புதிய யுனிக்கோடு முறமை தமிழிற்கு உருவாகும். இதன் மூலம் நாமும் ஆங்கிலம் மற்றும் ஐரோப்பிய மொழிகளைப்போல தமிழையும் பயன்படுத்தலாம். தமிழ் மொழியின் பயன்பாடு தமிழில் தற்போது இருப்பதை விட மேலும் இலகுவாகும். மென்பொருள் வடிவமைப்பாளர்களுக்கும் பயனர்களுக்கும் புதிய கதவுகள் திறந்து விடப்படும் ஆகவே நீங்கள் இந்த விடயத்தை மற்றவர்களுக்குப் பரப்புவதுடன் உங்களால் ஆன உதவியையும் வழங்குங்கள்.
இதற்கு தற்போது எதிர்ப்புக் குரல்கள் கிளம்பியுள்ளதையும் மறுப்பதற்கில்லை. பல நிரலாளர்கள் இது குட்டையைக் குளப்பும் முயற்சி என்றும் மற்றய இந்திய மொழிகளில் இருந்து தமிழை இது தனியாக்கிவிடும் என்பதே அவர்கள் கருத்து. அதைவிட புதிய TUNE/TANE முறமைக்கு தமிழக அரசு தவிர இலங்கை, சிங்கப்பூர், மலேசியா போன்ற அரசுகளின் ஆதரவு பெறப்படவில்லை என்பது இவர்களின் வாதம்.
எது என்னவானாலும் அடுத்து என்ன நடக்கப் போகின்றது என்று பொறுத்துத்தான் பார்ப்போமே!
மூலங்களைத் தரவிறக்க...
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment