مرکز دانش IT |
Unicode
یونیکد
یونیکُد (به انگلیسی: Unicode) استانداردی برای کُد کردن نویسههای رایانهای و نمایش و پردازش متن به اکثر زبانهای دنیا است. هر زبان یک قالب یونیکد دارد.
این استاندارد هماهنگ با مجموعه جهانی نویسهها تألیف شدهاست و به صورت کتابی به نام 'The Unicode Standard' منتشر شدهاست. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰۰۰۰ نویسه و ۱۰۰ نماد، مجموعهای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعهای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعهای از مرجع فایلهای دادههای کامپیوتر و تعدادی موارد مربوط مانند جزئیات نویسه، برابری یونی کد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی، فارسی و عبری، و اسکریپتهای سمت چپ به راست) میباشد. تا تاریخ مارس ۲۰۱۹، آخرین ویرایش، یونیکد ۱۲٫۰ است.
موفقیت یونیکد در یکی کردن کد بندی نویسهها سبب استفاده گسترده اش در جهانیسازی و بومیسازی نرمافزارها شدهاست. این استاندارد در بسیاری از فناوریهای اخیر پیاده شدهاست از جمله: اکس ام ال، زبان برنامهنویسی جاوا، چارچوب دات نت مایکروسافت و سیستم عاملهای مدرن.
یونیکد میتواند توسط کدبندیهای مختلفی پیادهسازی شود. پرکاربردترین رمز نگاریها عبارت اند از: UTF-8، و UCS-2 که دیگر اعتبار ندارد، و UTF-16.
کدبندی UTF-8 برای کدبندیهای موجود در استاندارد اسکی تنها ۱ بایت استفاده میکند. کد نویسههای موجود در رمز نگاری اسکی، در هر دو کدبندی یکی است. این رمز نگاری حداکثر ۴ بایت برای هر نویسه استفاده میکند. UCS-2 برای تمام نویسهها از ۲ بایت استفاده میکند بنابراین نمیتواند تمام نویسههای موجود در استاندارد فعلی یونیکد را کدبندی کند. UTF-16 کدبندی UCS-2 را گسترش میدهد و برای نویسههای باقیمانده از ۴ بایت استفاده میکند.