LifeType 中文開發論壇

開發 => 中文相關 => 主題作者是: markwu 於 四月 21, 2005, 11:47:20 下午



主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu四月 21, 2005, 11:47:20 下午
pLog 在目前開發團隊的共識中,我們會漸漸的把所有的語系編碼都以 UTF-8 來支援!所以在未來的正式版中,不管簡體或是繁體(正體)中文,都將只支援 UTF-8。

但是,說句實話。在台灣與中國使用 UTF-8 編碼的還是少數,所以我不得不跟 Oscar 討論讓架構上能夠接受一個語系能有不同的編碼支援,在經過來回的討論中, Oscar 終於還是答應了。所以現在的中文語系檔變為(1.0.1 之後):

locale_zh_TW.php  (繁體中文, utf-8)
locale_zh_TW_big5.php  (繁體中文, gb2312)
locale_zh_CN.php   (簡體中文, utf-8)
locale_zh_CN_gb2312.php   (簡體中文, gb2312)

所以 pLog 已經接受同時存在不同的編碼組合了!唯一我們中文使用者需要做的就是是來發展與測試 gb2312 與 big5 的部分程式。(UTF-8 的部分,官方開發團隊會負責他的發展與測試)

例如在文章預覽,在 GB2312 與 Big5 都會發生問題,這我們必須自己來解決。或是 Big5 的許功蓋問題,我們要自己解決。

我想這是最好的方式,畢竟希望 pLog 能支援 big5 與 gb2312 中文的朋友門,大家得幫忙來出一份力。我們開發團對不是神仙,真的不是樣樣都會(像 http://bugs.lifetype.net/view.php?id=365 ,我根本解不出來),需要大家的幫忙。  :-D

所以在這裡我們想徵求兩位的開發人員來負責簡體 Gb2312與繁體Big5 的開發與測試。有興趣的人請在這裡寫下你的聯絡方式。

另外,最後還是想跟各位 pLogger 分享一下,網路本來就是非同步的溝通方式,在還沒搞清楚事情始末時,最好講話客氣那麼一點點 。 sigh  :-(  ... 像是有人在英文論壇討論一定要用 GB2312 來當作簡體中文的預設編碼時 http://forums.lifetype.net/viewtopic.php?t=2082 ,跟 Oscar 槓了起來,我也遭受池魚之殃。

這idea 沒錯,但講話就是不客氣,大家脾氣火爆了,事情就作不下去了!。讓我原本跟 Oscar 在談支援多語系的事,差點就泡湯了。這是意外的小插曲啦!

Mark

相關連結:
http://bugs.lifetype.net/view.php?id=435


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu四月 22, 2005, 11:13:29 上午
有人自告奮勇的嗎?嘻嘻!  :-D

Mark


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: nba23四月 22, 2005, 11:44:54 上午
mark老大,在 GB2312  发展与测试方面,看我能否帮得上忙?至于big5编码我用得比较少,则可能帮不忙了,详细我在论坛上pm你了

现在plog用utf-8是走势,但关键是一般网站上还有其它的系统,很可能用的数据库编码就不同,若大家都安装在同一个数据库中,资料档的导出导入多多少少会有不便,台湾个边情况我不太了解,但大陆现在gb2312还是主流..

对于使用中文的用户,可以征求 oscar 的意见,若确实没有太完美的解决办法,则看是否能考虑下作一个比较友好支持中文的版本,官方若不同意,则组织下plog的一些爱好者将完中文化完善就行


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: lss四月 22, 2005, 12:55:12 下午
hi all:

我個人從 0.31 開始接觸 oscar (次數不多就是啦…)提出關於資料夾/檔案中心的中文檔名問題時, oscar 的回應是:

1.很歡迎有人願意幫忙處理不同語言所造成的問題。
2.他沒有使用多位元組語言(主要是亞洲的 CJK)的經驗,對於我當時提出的中文檔名問題完全沒有概念,只能憑猜測解決。

而我的中文檔名問題至少還在 utf-8 的層次。對 big-5 的功蓋許問題或 gb 碼的其它問題,一般的中文使用者只知道會衝碼,如何造成還不一定清楚,更何況是不懂中文,沒用過 big5 或 bg碼的 Oscar。

要完美使用 big5 或 gb 碼最終的解決方法,我個人的想法是:

要有人以新的專案的方式做專門支援 big5/gb 的全新版本。

這才是終極的解決之道。

我個人是utf-8的擁護者啦!目前 pLog 1.0 我已經嫌胖了,為了支援各種內碼而讓它變的更胖,不如另開專案。


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: deserts四月 22, 2005, 08:20:19 下午
我的就是使用了gb2312的
反正我的访问群体是简体中文的,定位不一样,呵呵


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: tyyx四月 22, 2005, 09:48:38 下午
用utf-8 能使多种文字正常显示,单纯的GB2312和BIG5做不到这一点.最终还是要回到utf-8上面来,只不过是一个迟早的问题...


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: TomexOu四月 23, 2005, 06:58:15 上午
為了相容性,兼容big5/gb2312的想法很好
常常體查微軟貼心的作法,就是從客戶的角度去看事情
雖然最後一定會使用utf-8
但多提供一個語系,相對就差很多...


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu四月 23, 2005, 03:45:00 下午
引用自: nba23
mark老大,在 GB2312  发展与测试方面,看我能否帮得上忙?至于big5编码我用得比较少,则可能帮不忙了,详细我在论坛上pm你了

现在plog用utf-8是走势,但关键是一般网站上还有其它的系统,很可能用的数据库编码就不同,若大家都安装在同一个数据库中,资料档的导出导入多多少少会有不便,台湾个边情况我不太了解,但大陆现在gb2312还是主流..

对于使用中文的用户,可以征求 oscar 的意见,若确实没有太完美的解决办法,则看是否能考虑下作一个比较友好支持中文的版本,官方若不同意,则组织下plog的一些爱好者将完中文化完善就行


沒問題,我看到你的 PM 了!在 1.0.1 (SVN) 中,我已經把 GB2312 加上了,現在需要的就是測試以及解決 Bug。你能夠透過 SVN 把 1.01 Check Out 下來測試嗎?

請依照 http://blog.lifetype.org.tw/index.php?op=ViewArticle&articleId=7&blogId=1 來安裝 SVN,並且到這一個 SVN Repository  http://devel.lifetype.net/svn/plog/plog/branches/plog-1.0.1  來下載 pLog 1.0.1。

基本上目前應該沒有大問題,為一的大問題就是在預覽時會有亂碼!如果你們有人熟 javascript 來解決這部分的問題,我會非常感激的!

另外 patch 可以 submit 到 bugs.lifetype.net 或是中文的郵件論壇  http://groups-beta.google.com/group/plog-development  我會把它 commit 到 SVN 上的。

有問題我們可以透過中文郵件論壇  http://groups-beta.google.com/group/plog-development  來討論。

Mark


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu四月 23, 2005, 03:53:01 下午
引用自: lss
hi all:

我個人從 0.31 開始接觸 oscar (次數不多就是啦…)提出關於資料夾/檔案中心的中文檔名問題時, oscar 的回應是:

1.很歡迎有人願意幫忙處理不同語言所造成的問題。
2.他沒有使用多位元組語言(主要是亞洲的 CJK)的經驗,對於我當時提出的中文檔名問題完全沒有概念,只能憑猜測解決。

而我的中文檔名問題至少還在 utf-8 的層次。對 big-5 的功蓋許問題或 gb 碼的其它問題,一般的中文使用者只知道會衝碼,如何造成還不一定清楚,更何況是不懂中文,沒用過 big5 或 bg碼的 Oscar。

要完美使用 big5 或 gb 碼最終的解決方法,我個人的想法是:

要有人以新的專案的方式做專門支援 big5/gb 的全新版本。

這才是終極的解決之道。

我個人是utf-8的擁護者啦!目前 pLog 1.0 我已經嫌胖了,為了支援各種內碼而讓它變的更胖,不如另開專案。


其實目前 pLog 早就支援多語系,只是在 big5 跟 gb2312 都沒著墨。但是當越來越多人用 pLog時,尤其是其他大站台想以 pLog 來架設 Blog Community,這就會是問題。

所以我才會建議 Oscar 我們修改架構,增加單一語系多個編碼的支援。可是還需要各 Local 支援才行,因為語系有了,不代表就會運作正常。例如文章預覽就是問題。 Big5 則有 addslashes 的問題。

這些問題,我們開發團對並不負責解決,因為需要各 local community 的幫忙才行。否則真的解決不了。至於程式碼越來越胖,我覺得倒是還好。因為增加最多的不是在這裡。而且 "1.1"是 1.1 喔,也已經在進行了,目的就是幫 pLog 減肥,再加快 pLog 速度。 有興趣可以訂閱 plog-svn 論壇,這部分是由 ben 在負責。他真的很行。

至於另開發一個全新的 blog 平台來支援 Big5/GB2312 ,呵呵!那則不在我的考慮範圍內了!因為我不想 fork 一個專案,來分散目前好不容易成行的開發團隊。  :-P

Mark


主題: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu四月 23, 2005, 03:55:51 下午
引用自: tyyx
用utf-8 能使多种文字正常显示,单纯的GB2312和BIG5做不到这一点.最终还是要回到utf-8上面来,只不过是一个迟早的问题...


贊成!但這需要我們大加的努力推廣了!  :-D

引用自: tomex_ou
為了相容性,兼容big5/gb2312的想法很好
常常體查微軟貼心的作法,就是從客戶的角度去看事情
雖然最後一定會使用utf-8
但多提供一個語系,相對就差很多...


貼心!呵呵。這是我們在設計發展實的核心想法。唯有使用者認同,才有辦法推廣。謝謝啦! :-D

Mark


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: FIEND十月 03, 2005, 05:23:07 下午
小弟對語系的東西小有研究 ^^ 



過去有參加過 gb2312 big5 utf-8 共存的專案 呼呼

如站長有需要 小弟找時間弄一個 big5 版的出來

ps : utf8 轉 big5 會有問題 , 有 方土土的衝碼問題 所以轉換會有事

       而 utf-8 的 容量會比  big5 大3倍 相對效能也會比較差

        或許您可以很依懶 cache 的功能去調整整站的效能

       但是在做 db searche 時還是一個負擔

        而且多套系統的某合上也會有點小問題
   
        小弟還是建議大家用 big5 版本比較適合



3 倍 <-- 打錯字


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu十月 03, 2005, 08:00:14 下午
小弟對語系的東西小有研究 ^^ 

過去有參加過 gb2312 big5 utf-8 共存的專案 呼呼

如站長有需要 小弟找時間弄一個 big5 版的出來

ps : utf8 轉 big5 會有問題 , 有 方土土的衝碼問題 所以轉換會有事

       而 utf-8 的 容量會比  big5 大五倍 相對效能也會比較差

        或許您可以很依懶 cache 的功能去調整整站的效能

       但是在做 db searche 時還是一個負擔

        而且多套系統的某合上也會有點小問題
   
        小弟還是建議大家用 big5 版本比較適合

好啊!歡迎!但是這裡有兩個問題要解決:

1. Big5 的『許功蓋』問題,以目前pLog 的架構來看,主要是修改 httprequest 這個 class 就可以了
2. Javascript 對 big5 的相容性,這是比較傷腦筋的。因為 javascript 對 encode 在 IE/FF 很不一樣。在 IE 運作在 FF 卻不一定。

不過,我個人真的不喜歡 Big5,原因是因為他在跟其他的 Blogger 的交流中真是問題很多。Trackback 是第一個問題,只要編碼不同互相 trackback 一定是亂碼。除非修改目前 trackback  的規格。但是這很難 ... :-(

所以為什麼我們建議採用 UTF-8 的原因在這裡。 :-)

Mark


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: FIEND十月 03, 2005, 08:01:50 下午
交換那一層 你可以視為 內容 邏輯層

反吐回 utf-8 即可

而 展示層用 big5 不衝突


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu十月 03, 2005, 08:11:16 下午
交換那一層 你可以視為 內容 邏輯層

反吐回 utf-8 即可

而 展示層用 big5 不衝突

呵呵,那要改的就多的  :-P

那有幾個情況要解決:
1. 那就變成假設對方的 Blog 是 UTF-8,然後他送 trackback 給你,你必須透過 iconv 轉為 Big5,然後再加入 DB
2. 當你在網頁操作時是 UTF-8 的頁面,但是當你把文章存入 DB 時,要轉成 Big5 再存進去。
3. 另一個是,當讀取文章時,從 DB 讀出來是 Big5 但是當顯示時要先轉成是 UTF-8。

編碼的轉換可能要寫在 pLog 的 view 這個 class 裡面,有一些複雜,但是可以改改看。你也可以做在 model 內。不過這跟 pLog 目前的 MVC 架構就違背了!

我跟 Minstrel 之前有談過這樣的想法,但是實在不想去動他,因為不知這樣改下去有哪些要改。呵呵!

Mark


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: FIEND十月 03, 2005, 08:21:38 下午
了解 .. 我可能要徹底分析一下他整個程式的架構

不過我想不難 只要了解它的架構 big5 <==> utf-8 並不是難事 我對xml和語系的處理己有數年的經驗

沒有錯確實要用 big5 當底層   如果程式 reference 做的好 相信問題很快可以解決



^^


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu十月 03, 2005, 08:26:49 下午
不過我想不難 只要了解它的架構 big5 <==> utf-8 並不是難事 我對xml和語系的處理己有數年的經驗

沒有錯確實要用 big5 當底層   如果程式 reference 做的好 相信問題很快可以解決

如果你確定要改,建議你到 pLog-SVN 發一個 discussion 的 thread 問問 Oscar 的看法。呵呵!因為如果你改好了,最後卻無法 commit 回 SVN 是很可惜的。

Oscar 是 pLog 的 Project Founder, Core 的部分目前是由他來維護的。

Mark


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: FIEND十月 03, 2005, 08:36:33 下午
真麻煩 反正我有空弄看看 -

不過說真的 轉換 那一段還真不想分享 太精華了怕沒飯吃 哈哈哈~~

有寫過 簡訊系統 的都知道 utf-8 要轉回 big5 存回 databases 的系統 都死在這段

給小弟一點時間 我放到我的網站上實驗看看

有新消息會回來跟大家報告 ^^


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: markwu十月 03, 2005, 08:47:33 下午
真麻煩 反正我有空弄看看 -

不好意思啊!希望你別誤會我的回答。因為我跟 Oscar 已經 Work 那麼久,所以我才這樣建議!因為很多的東西我已經都 Commit 到 core 當中,卻因為他不喜歡而必須 roll-back ... 呵呵(好幾次了)!所以才希望你能提個 thread 來討論。

如果讓你誤會,真的很抱歉!

不過說真的 轉換 那一段還真不想分享 太精華了怕沒飯吃 哈哈哈~~

有寫過 簡訊系統 的都知道 utf-8 要轉回 big5 存回 databases 的系統 都死在這段

給小弟一點時間 我放到我的網站上實驗看看

謝謝!太棒了!等你的消息。

Mark


主題: Re: [徵求支援] pLog 對Big5 與 GB2312 的支援
作者: Snowz十一月 03, 2005, 02:22:01 下午
最近在考虑用PLOG..

但对...是用UTF-8
还是用GB2312

有点犹豫..

到时候看数据库的情况了..