بسم الله الرحمن الرحیم
نویسه[۱] یا کاراکتر (به انگلیسی: character) در حوزهی رایانه و مخابرات واحدی از اطلاعات است که متناظر با یک نویسهواره مثل نشانهها در حروف الفبا در زبان نوشتاری منطبق است.[۲]
مثالهایی از نویسهها (کاراکترها) عبارتند از حرف، رقم، نشانههای سجاوندی و نویسه فاصله خالی (Whitespace). نویسههای کنترلی مثل کلید جهش هم نویسه محسوب میشوند.
از قرار گرفتن نویسهها در کنار هم، رشته به وجود میآید.
رایانهها و وسایل ارتباطی از طریق کدبندی نویسه نویسهها را به چیزهای دیگری اختصاص میدهند (به عنوان مثال هر کمیت عدد صحیح میتواند دنبالهای از رقمها باشد) که میتواند ذخیره شود و در شبکه رایانهای منتقل شود.
کدبندی نویسه (به انگلیسی: Character encoding) سیستمی است که هر نویسه را به چیز دیگری مانند الگویی از بیتها، دنبالهای از اعداد طبیعی، هشت بیت متوالی (بایت) یا پالسهای الکتریکی مربوط میکند تا بتوان دادهها را که متشکل از متن و اعداد هستند، ذخیره کرد یا توسط شبکههای ارتباطی منتقل کرد.
مثالهای معروف برای کدبندی نویسهها شامل کد مورس، کد اسکی و یونیکد میشود.
کد مورس در سال ۱۸۴۰ میلادی ابداع شد. این کد هر حرف الفبای انگلیسی و رقمهای صفر تا نه را به دنبالهای از فشرده شدن کوتاه و بلند کلید تلگراف کدبندی میکرد.
اسکی که در سال ۱۹۶۰ تا ۱۹۶۳ تالیف شد، یک جدول کدبندی ۷بیتی است که اعداد، حروف، نمادها و نویسههای کنترلی را به وسیله اعداد صحیح به کدهای با طول ثابت کدبندی میکند.
کدبندی EBCDIC که توسط شرکت آی بی ام در سال 1963 معرفی شد، یک جدول کدبندی ۸بیتی است.
محدودیتهای جدولهای اینچنینی به سرعت مشخص شد و چندین روش تک منظوره به کار گرفته شدند تا آنها را گسترش دهند. پشتیبانی از دستگاههای نوشتاری بیشتر برای زبانهای مختلف از جمله زبانهای شرق آسیا مانند چینی و کرهای، نیازمند پشتیبانی از نویسههای بسیار بیشتری بود و استفاده از روش منظم تری برای کدبندی ضروری بود.