Solaris 9 新注音

February 25, 2005

Solaris 9 新注音

Sun Microsystems 一直對 X Window System 的 i18n (internationalization) 處理有很卓越的貢獻,而 Sun Solaris 裡頭則有相當豐富的技術展現。在 [新酷音] 尚未整合到 JDS (Java Desktop System) 之前,IIIMF svn repository (im-sdk) 有一份 Sun Microsystems 釋出的 sun_le_asia,不過後來 Ervin Yan 用 GTK+ 重新改寫 aux 與對 LE 重新組織後,今年一月份徹底切割 tch_le_sun 與 sch_le_sun,基本上已經相當成熟。

不過,過去的 sun_le_asia 則提供了一個有趣的設計,也就是「繁體新注音輸入法」,詳情可參考 [新注音輸入法]。Solaris 9 上面的「新注音」基本上是用新拼改過來的,所以很不符合台灣使用者既有的習慣,看快照大概就知道是怎麼一回事。

儘管 im-sdk 現在已經移除「新注音」並改用「新酷音」,但是我從過去的 repository 翻出來,做了 [一份複製] (參考 zh_TW/input_methods/newzy 目錄),裡頭有一些有趣的斷詞規則可以參考,比方說:

  • /* 以下單字為: 前後均不可聯的字, 在分詞時作用類同標點符號 */ uchar NonLinkHZ[2 * NUM_NONLINKHZ + 2] =

    • "是的了不也而你我他與它她其就和或";

    /* 以下單字為: 只可與前聯, 不可與後聯. */ uchar PreLinkHZ[2 * NUM_PRELINKHZ + 2] =

    • "們性員子上下中內外化者家兒年月日時分秒街路村";

    /* 以下單字為: 只可與後聯, 不可與前聯. */ uchar SufLinkHZ[2 * NUM_SUFLINKHZ + 2] =

    • "不在這從到那哪第各每某本總當由如以為被使更且指於但" "將可應會該此全很都近約";

新酷音在 libchewing-0.2.6 都還只是建構在統計學的基礎上,希望能夠在 0.3 branch 做出 heuristic 的整合。

由 jserv 發表於 10:57 PM