วันพฤหัสบดีที่ 21 เมษายน พ.ศ. 2554

การ encoding กับ HTML ภาษาญี่ปุ่น

จะขออธิบายพื้นฐานการวาง charset ให้กับ html ไว้ตรงนี้
หากเราต้องการให้ เว็บไซต์ของเราเป็นภาษาญี่ปุ่น เราควรเลือกให้เว็บของเรามี Encoding เป็น EUC-JP หรือไม่ก็ UTF-8
  การ encoding ของหน้า (X)HTMLให้เป็น EUC-JP
  การสร้างไฟล์โปรแกรม , ดีไซน์ให้มี format เป็น EUC-JP
(หากใช้ Dream WeaverEclipse ให้เซ็ท encoding ไว้เลย)
  Database ก็ให้  encoding ก็ให้เป็น EUC-JP(UJIS)
  ทุกๆหน้า ตรงด้านบน ให้ใส่ตัวอักษรสองไบต์\xFD\xFEที่มีแต่เฉพาะใน CODE EUC-JPเท่านั้น
การใส่อักษรที่มีเฉพาะ EUC-JP  ไปบนหัวของหน้าจอ จะป้องกันไม่ให้  browser มอง Encoding เป็นตัวอื่นที่ไม่ใช่ EUC-JP
ที่ Yahooจะมีตัวอักษรตัวนี้อยู่ที่ส่วนหัวของเพจทุกเพจ <!---->
  เมื่อส่งเมลให้แปลงเป็นJISแล้วส่ง
  ตอนสร้างไฟล์ Windows Application เช่น CSVเป็นต้น ให้ทำ DATA เป็น SJIS
(ใช้ jcode.php) เพื่อที่จะให้สามารถอ่านบน Window ได้ แต่กรณีที่ไม่ระบุ เราสามารถให้ output เป็น EUC ได้ แล้วค่อยเอามาแปลงด้วยโปรแกรม Maruoหรืออีกชื่อว่า Hidemaruเืพื่ออ่านได้
ตัวอย่างการเซ็ท Php.ini ส่วนที่เกี่ยวข้องกับภาษา(ตรงนี้เราสามารถเซ็ทในไฟล์ .htaccess ได้)
output_buffering          Off
default_charset EUC-JP    
mbstring.internal_encoding      EUC-JP
mbstring.http_input     ASCII,JIS,EUC-JP,SJIS
mbstring.http_output  EUC-JP   
mbstring.encoding_translation On
mbstring.detect_order  ASCII,JIS,EUC-JP,SJIS
mbstring.encoding_translation On
mbstring.substitute_character  NONE

ข้อควรระวัง
CASE STUDY กรณี อักษรของ SUBJECT ของ mailto เพี้ยน เป็นต้น
 เนื่องจาก Windows Application มีดีฟอลต์ ENCODING ป็นSJIS
 ให้ทำการ URL ENCODEก่อนแล้วค่อยกำหนด SUBJECT
 การเซ็ทภาษาในโปรแกรม Dream Weaver

ไม่มีความคิดเห็น:

แสดงความคิดเห็น