จะขออธิบายพื้นฐานการวาง charset ให้กับ html ไว้ตรงนี้
หากเราต้องการให้ เว็บไซต์ของเราเป็นภาษาญี่ปุ่น เราควรเลือกให้เว็บของเรามี Encoding เป็น EUC-JP หรือไม่ก็ UTF-8
・ การ encoding ของหน้า (X)HTMLให้เป็น EUC-JP
・ การสร้างไฟล์โปรแกรม , ดีไซน์ให้มี format เป็น EUC-JP
(หากใช้ Dream Weaver、Eclipse ให้เซ็ท encoding ไว้เลย)
・ Database ก็ให้ encoding ก็ให้เป็น EUC-JP(UJIS)
・ ทุกๆหน้า ตรงด้านบน ให้ใส่ตัวอักษรสองไบต์「\xFD\xFE」ที่มีแต่เฉพาะใน CODE EUC-JPเท่านั้น
(การใส่อักษรที่มีเฉพาะ EUC-JP ไปบนหัวของหน้าจอ จะป้องกันไม่ให้ browser มอง Encoding เป็นตัวอื่นที่ไม่ใช่ EUC-JP)
ที่ Yahooจะมีตัวอักษรตัวนี้อยู่ที่ส่วนหัวของเพจทุกเพจ <!--京-->
・ เมื่อส่งเมลให้แปลงเป็นJISแล้วส่ง
・ ตอนสร้างไฟล์ Windows Application เช่น CSVเป็นต้น ให้ทำ DATA เป็น SJIS
(ใช้ jcode.php) เพื่อที่จะให้สามารถอ่านบน Window ได้ แต่กรณีที่ไม่ระบุ เราสามารถให้ output เป็น EUC ได้ แล้วค่อยเอามาแปลงด้วยโปรแกรม Maruo(หรืออีกชื่อว่า Hidemaru)เืพื่ออ่านได้
ตัวอย่างการเซ็ท Php.ini ส่วนที่เกี่ยวข้องกับภาษา(ตรงนี้เราสามารถเซ็ทในไฟล์ .htaccess ได้)
output_buffering Off
default_charset EUC-JP
mbstring.internal_encoding EUC-JP
mbstring.http_input ASCII,JIS,EUC-JP,SJIS
mbstring.http_output EUC-JP
mbstring.encoding_translation On
mbstring.detect_order ASCII,JIS,EUC-JP,SJIS
mbstring.encoding_translation On
mbstring.substitute_character NONE
ข้อควรระวัง)
・CASE STUDY กรณี อักษรของ SUBJECT ของ mailto เพี้ยน เป็นต้น
เนื่องจาก Windows Application มีดีฟอลต์ ENCODING ป็นSJIS
ให้ทำการ URL ENCODEก่อนแล้วค่อยกำหนด SUBJECT
การเซ็ทภาษาในโปรแกรม Dream Weaver