mdict

mdict

多語言電子詞典
MDict 是一款用于WinCE PDA的支持多語言的電子辭典,由中國的Rayman Zhang(張文偉)開發,其軟件本身不提供辭典數據,而是直接使用現有的辭典數據。[1]
    中文名:詞庫 外文名:mdict 别名: 開發人:Rayman Zhang 國家:中國

介紹

MDict軟件是一款由中國的Rayman Zhang(張文偉)開發的、用于查看各種mdx格式詞典文件的閱讀器(mdx格式詞典文件又被稱為“詞庫”;mdx為此類文件的擴展名)。電腦、手機需要運行相應的MDict軟件。

目前,MDict軟件最新正式版為:MDict for PC 1.3beta 【2012年6月8日更新,适用于電腦,Windows XP或Vista系統】;MDict 3.2【2010年7月7日更新,适用于手機,有自動、手動兩種安裝包;又細分為多種适用于不同手機操作系統的MDict軟件】。PPC、HPC、Smartphone、魅族M8、iPhone、三星Bada操作系統的智能手機可以運行該軟件,Symbian系統操作系統的智能手機則暫無法運行它,Android(安卓)操作系統可以使用。

MDict軟件本身并不提供“詞庫”,但軟件作者提供了“詞庫”制作工具。目前由第三方為MDict制作的“詞庫”包括:維基百科、百度百科、現代漢語詞典、成語詞典、唐詩鑒賞詞典、牛津英漢雙解詞典等等,現已達兩千種。

特色

優點

對個人非商業用途免費!

多語言支持

支持使用多個辭典文件,可以自己制作詞庫

支持詞典聯合和全文檢索

支持在線取詞

内置簡/繁體轉換

支持PPC/HPC/Smartphone操作系統

詞庫格式采用壓縮算法,體積較小

運行速度較理想

支持在線取詞

缺點

詞庫數目遠超過10個時,不易在各詞庫之間迅速切換

查看MDict版維基百科的時候,常因簡/繁體轉換而産生無法跳轉鍊接的情況(但一般可通過更改簡/繁體轉換設置加以解決)

安裝

Smartphone版本

⒈ 自動安裝版

a) 安裝程序

b) 将數據文件放到内存或者存儲卡上的任意目錄裡

c) 運行MDict,選Library->Search all. 程序會自動查找所有".mdx"結尾的文件,并在Library菜單下顯示。

d) 在Library菜單裡選擇你需要使用的數據文件

e) 可以開始使用,用Back鍵可以切換到輸入狀态,Enter鍵進行查找.

⒉ 手動安裝版

a) 選擇對應你的機器的安裝包,在存儲卡上建一個MDict的目錄,然後将安裝包解壓到那個目錄下

b) 剩下的和自動安裝包的步驟一樣。

PPC/HPC版本

⒈ 自動安裝版

a) 安裝程序

b) 将數據文件放到内存或者存儲卡上的"My Documents"目錄裡

c) 運行MDict,選Library->Open Library來打開文件.或者"Library->Search all" 程序會自動查找所有".mdx"結尾的文件,并在Library菜單下顯示。

d) 在Library菜單裡選擇你需要使用的數據文件

e) 開始使用

⒉ 手動安裝版

a) 選擇對應你的機器的安裝包,在存儲卡上建一個MDict的目錄,然後将安裝包解壓到那個目錄下

b) 剩下的和自動安裝包的步驟一樣。

更新記錄

MDict v1.0RC3

增加了多辭典模式下的标簽模式顯示及折疊展開。

MDict v1.0RC4

增加字體選擇,文本顔色背景色設置;Ctrl+鼠标滾輪放大縮小;選項對話框中增加展開折疊相關選項;一些bugfix。

MDict v1.0正式版

⒈恢複舊版原有的關鍵字模糊查詢和全文搜索。2.單詞列表窗支持Ctrl+鼠标滾輪進行字體大小調整。3.将字體選擇改為在菜單中選擇。4.支持将選中的條目顯示在單詞列表中間。5.bugfix。

MDict v1.1

⒈支持頁内查找; 2. 在安裝了IE7及以上版本的電腦上可以多級放大正文窗; 3.一些bugfix。

MDict v1.2

主要是bugfix

MDict v1.3beta

主要是改進了多詞典模式的兼容性以及一些bugfix.

制作方法

制作常用文本格式

轉換軟件MdxBuilder

首先制作MdxBuilder轉換所需的原始格式txt文本文件

最常用的是MDict的html格式

每個項目兩行

第一行是關鍵字

第二行開始是正文,這裡的正文應該包括關鍵字。可以使用html的标記(不要包含;,這個程序會自動加上,另注意在轉換時要指明源數據為html).

如果需要顯示音标的話,可以利用html指定字體就可以顯示了。(參見下面的例子)

正文結束後必須用一行;表示結束

例子: 1.txt

詞條1标題Whole

詞條1内容whole

(hol,hJl; houl)

詞條2标題

詞條2内容

詞條3标題

詞條3内容

(注意""和下一個記錄間不要有任何其他空行,請參考example.txt中的例子)

在html中連接到其它關鍵字的方法:

key

其中key是關鍵字,

詞條内部跳轉方法目錄一(一定要有;相對應)

在html中嵌入圖片的方法)

其中src指向的文件名大小寫不敏感

并将所有圖片文件放在一個單獨的目錄中(不要與詞典源文件放在同一目錄中). 數據目錄中可以帶有子目錄。在使用MdxBuilder制作詞庫時,将Data路徑指向上面存放數據的目錄,該目錄中的所有文件都會被壓縮到後綴名為.mdd文件中,使用時該.mdd文件應當與.mdx文件在同一目錄下。

制作常用工具

UltraEdit-32

編輯工具

UEDIT查找替換高級教程(制作電子書與MDIT辭典必看)

其實UEDIT32的搜索替換至少有兩個最明顯的優點:

一、執行速度非常快,是WORD的數千倍,不信你打開一個20M的TXT文檔,用UEDIT替換隻要3秒鐘,用WORD看要不要幾個鐘頭?

二、UEDIT的替換内容可以包括查找到的内容,這是在WORD以及更高級更專業的“微軟正則表達式”所都無法支持的,不過這個應用可能大部分的朋友都不知道。

雖然許多極其複雜的文檔查找與替換必須使用較專業的正則表達式來處理,但對于一般甚至比較高級的操作來說,UEDIT還是我們的不二選擇。現在我來簡要介紹一下UEDIT的查找與替換的高級應用。

以下的示例使用中文版UEDIT10進行講解

⒈ UEDIT查找的快捷鍵是Ctrl+F(find)或ALT-F3,替換的快捷鍵是Ctrl+R(replace),再次查找的快捷鍵是F3。

⒉ 一般查找與替換功能:

※在查找/替換框内将“正規表達式”的√給去除,并分别在查找與替換的框格内輸入所需的字符,執行查找與替換即可。

※如果需要匹配回車鍵,在查找框中可輸入^p(注意p是小寫)來代替回車鍵

說明:在unix格式中^n表示換行,而在mac的文本格式中^r 表示換行,dos格式中^p 表示換行,不過一般情況下^p 可以同時兼容^r 或^p

舉例:

dfdf

ss

fssdf給替換為dfdf,ss,fssdf格式:可在查找中輸入^p,替換中輸入,(半角逗号)即可。

反之将dfdf,ss,fssdf給替換成以上三行隻要在查找中輸入,(半角逗号),替換中輸入^p即可。

高級查找部分:

⒈要記住将查找/替換框中的正規表達式給√上

⒉常用的查找/替換命令:

% 匹配行頭(0字符,僅是匹配一個位置)

$ 匹配行尾(0字符,僅是匹配一個位置)

? 在一行中匹配一個單字符

* 匹配一個或多個字符(不允許跨行匹配)

+ 匹配+左邊的那個字符一或多次(不允許跨行匹配).

++ 匹配+左邊的那個字符零或多次(不允許跨行匹配).

^b 匹配分頁

^p 匹配DOS文本的換行符(通用)

^r 匹配MAC文本的換行符

^n 匹配UNⅨ格式文本的換行符(在wondows操作系統中一般情況下可與^p互換)

^t 匹配tab符

[ ] 匹配單字符或字符範圍

^{A^}^{B^} 匹配A或匹配B

^(...^) 用于替換框中代替查找的内容

EditPlus v3.1漢化版

适合少量文本文件批處理,支持不超過50M的單個文件,擁有強大的正則表達式處理功能。

支持文件批量、改名以網頁标題更名、以文本文件的第一行更名,各種内碼轉換等等;

TextForever

編碼轉換,批量htm網頁轉txt文本

包括HTML到文本文件的轉換、文件合并、文件切分、段落合并、段落切分、内碼轉換(隻能在Win 2k/XP下用)、文本替換、HTML整理、文本抽取、正則表達式(需要IE 5.5以上版本的支持)、批量OCR、tcr文件壓縮/解壓等功能。

teleport pro

Teleport Pro可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時間自動登錄到你指定的網站下載你指定的内容,你還可以用它來創建某個網站的完整的鏡象,作為創建你自己的網站的參考。

wget綠色版下載工具

是一個從網絡上自動下載文件的自由工具。

wget可以跟蹤HTML頁面上的鍊接依次下載來創建遠程服務器的本地版本,完全重建原始站點的目錄結構。這又常被稱作"遞歸下載"。在遞歸下載的時候,wget遵循Robot Exclusion标準(/robots.txt). wget可以在下載的同時,将鍊接轉換成指向本地文件,以方便離線浏覽。

wget非常穩定,它在帶寬很窄的情況下和不穩定網絡中有很強的适應性.如果是由于網絡的原因下載失敗,wget會不斷的嘗試,直到整個文件下載完畢。如果是服務器打斷下載過程,它會再次聯到服務器上從停止的地方繼續下載。這對從那些限定了鍊接時間的服務器上下載大文件非常有用。

數據處理方法

一、MDICT文本處理軟件

感謝 nbdx-mmrs 網友制作此軟件以下摘自原作者說明:将自己電腦上很多的文本文件集合到一個MDICT字典去,經過軟件處理,制作完全正常,比較方便,所以放上來讓朋友們共享 希望能方便制作MDICT字典的朋友(電腦端軟件) 通過程序,我隻用幾分鐘,就将我電腦上的幾千個文本文件整合到MDX文件了,分類明确,而且無錯,感覺比較方便

注意事項:每個txt文本文件的名稱作為詞條标題,類别處請留空(删除“AA”)。

二、處理好txt文本或者htm文件後,可以利用中的方法導入數據庫然後再導出為所需格式,支持無限多文本

或者比較少的數據可以使用這個工具

簡單的編輯工具,MDict(Mdx Source File Maker) V0.3

三、html2mdx

将html文件轉換為MDict格式文件的程序 重點推薦!Wncable(Bowang)大俠的巨好工具軟件,可以将Html格式一次性轉換成符合Mdx格式要求的Txt文件,随後便可以用MdxBuilder軟件直接生成Mdx文件了!

四、其他方法:

a.逐條輸入→MdxBuilder支持txt→MdxBuilder生成(适用于制作自己平時日積月累的東西,可以生成漂亮的表格)

b.利用MdxBuilder支持的格式的詞庫轉(适用于轉現成的SugarDict,KDict詞典)

c.其他→(excel)→文字編輯軟件(用UltraEdit-32好于EmEditor好于word)→MdxBuilder支持的txt文檔格式→MdxBuilder生成(适用于高效制作一切能方便轉為excel文檔的詞典)

六、txt文件詞條合并工具Combine

Wncable(Bowang)大俠的巨作,可将多個詞典的相同詞條合并成1個!

4、以上方法處理後得到的文件再用mdxbuilder轉換

MdxBuilder關于選項的說明:

a) Key case sensitive

關鍵字(标題)是否大小寫敏感。多數情況下詞典是大小寫不敏感的,所以不要選。

b) Allow export to text

是否允許導出為文本。如果選了,就可以用MdxExport這個工具吧詞典導出為文本格式。

c) Right to left text

文字的閱讀順序。中文是從左到右,阿拉伯文之類的是從右到左。

d) Strip key

是否去掉關鍵字中的特殊符号。例如21世紀詞典裡的關鍵字是顯示成"lis.ten" 這個樣子的,如果不去掉".",則用戶需要輸入"lis.ten"而不是”listen"來查詢單詞。

e) Title

這個是用來标示詞典的名字,計劃将來在需要顯示詞典名稱的地方進行顯示用的。但目前暫時沒有用處。

f) Description

詞典的詳細介紹。第一次打開詞典時看到的歡迎頁面。

g) Build Data archive

僅進行數據文件制作。主要是用來制作圖庫,聲音庫時用。勾選後就不用填寫Source路徑。

h) Index block size,Record block size. 這兩個是調整性能用的,用缺省值就好了。

i) Encryption Key

詞典加密的密匙,用于詞典授權用的。可以參見MdxBuilder.zip裡的LibKeygen.txt的說明

注意事項:

1、圖片鍊接最好使用這樣的格式

2、轉換出錯一般是标題位置有多餘的空行

如:

詞條1标題

詞條1内容

詞條2内容

3、mdxbuilder處理轉換後的mdx文檔大小應在4G以下

上一篇:Ryback

下一篇:三洋公司

相關詞條

相關搜索

其它詞條