名字來曆
MySQL最初的開發者的意圖是用mSQL和他們自己的快速低級例程(ISAM)去連接表格。不管怎樣,在經過一些測試後,開發者得出結論:mSQL并沒有他們需要的那麼快和靈活。這導緻了一個使用幾乎和mSQL一樣的API接口的用于他們的數據庫的新的SQL接口的産生,這樣,這個API被設計成允許為用于mSQL而寫的第三方代碼更容易移植到MySQL。
MySQL這個名字是怎麼來的已經不清楚了。基本指南和大量的庫和工具帶有前綴“my”已經有10年以上,而且不管怎樣,MySQLAB創始人之一的MontyWidenius的女兒也叫My。這兩個到底是哪一個給出了MySQL這個名字至今依然是個謎,包括開發者在内也不知道。
MySQL的海豚标志的名字叫“sakila”,它是由MySQLAB的創始人從用戶在“海豚命名”的競賽中建議的大量的名字表中選出的。獲勝的名字是由來自非洲斯威士蘭的開源軟件開發者AmbroseTwebaze提供。根據Ambrose所說,Sakila來自一種叫SiSwati的斯威士蘭方言,也是在Ambrose的家鄉烏幹達附近的坦桑尼亞的Arusha的一個小鎮的名字。
基本特性
1、使用C和C++編寫,并使用了多種編譯器進行測試,保證源代碼的可移植性。
2、支持AIX、FreeBSD、HP-UX、Linux、MacOS、NovellNetware、OpenBSD、OS/2Wrap、Solaris、Windows等多種操作系統。
3、為多種編程語言提供了API。這些編程語言包括C、C++、Eiffel、Java、Perl、PHP、Python、Ruby和Tcl等。
4、支持多線程,充分利用CPU資源。
5、優化的SQL查詢算法,有效地提高查詢速度。
6、既能夠作為一個單獨的應用程序應用在客戶端服務器網絡環境中,也能夠作為一個庫而嵌入到其他的軟件中提供多語言支持,常見的編碼如中文的GB2312、BIG5,日文的Shift_JIS等都可以用作數據表名和數據列名。
7、提供TCP/IP、ODBC和JDBC等多種數據庫連接途徑。
8、提供用于管理、檢查、優化數據庫操作的管理工具。
9、可以處理擁有上千萬條記錄的大型數據庫。
應用管理
與其他的大型數據庫例如Oracle、DB2、SQLServer等相比,MySQL自有它的不足之處,如規模小、功能有限(MySQLCluster的功能和效率都相對比較差)等,但是這絲毫也沒有減少它受歡迎的程度。對于一般的個人使用者和中小型企業來說,MySQL提供的功能已經綽綽有餘,而且由于MySQL是開放源碼軟件,因此可以大大降低總體擁有成本。
Internet上流行的網站構架方式是LAMP(Linux+Apache+MySQL+PHP),即使用Linux作為操作系統,Apache作為Web服務器,MySQL作為數據庫,PHP作為服務器端腳本解釋器。由于這四個軟件都是遵循GPL的開放源碼軟件,因此使用這種方式不用花一分錢就可以建立起一個穩定、免費的網站系統。
可以使用命令行工具管理MySQL數據庫(命令mysql和mysqladmin),也可以從MySQL的網站下載圖形管理工具MySQLAdministrator和MySQLQueryBrowser。
phpMyAdmin是由php寫成的MySQL資料庫系統管理程式,讓管理者可用Web介面管理MySQL資料庫。
phpMyBackupPro也是由PHP寫成的,可以透過Web介面創建和管理數據庫。它可以創建僞cronjobs,可以用來自動在某個時間或周期備份MySQL數據庫。
另外,還有其他的GUI管理工具,例如早先的mysql-front以及emsmysqlmanager,navicat。
存儲引擎
MySQL有多種存儲引擎:MyISAM、InnoDB、MERGE、MEMORY(HEAP)、BDB(BerkeleyDB)、EXAMPLE、FEDERATED、ARCHIVE、CSV、BLACKHOLE。
MyISAM
MySQL 5.0之前的默認數據庫引擎。MyISAM設計簡單,數據以緊密格式存儲,在某些場景下性能很好,但它最典型的問題還是表鎖。MyISAM管理非事務表。它提供高速存儲和檢索,以及全文搜索能力。MyISAM在所有MySQL配置裡被支持。它的特點是:
1)不支持行級鎖,也就是說任何操作都對整張表加鎖。
2)不支持事務,無法回滾,崩潰後無法安全恢複。
3)支持全文索引、壓縮、空間函數等。
InnoDB
InnoDB是MySQL使用率最高的存儲引擎,目前市面上至少95%的MySQL采用該存儲引擎,因此從MySQL5.5開始,它替代MyISAM成為默認的存儲引擎。它有如下幾個特點:
1)支持事務:采用MVCC(多版本并發控制)來支持高并發,實現了四個ANSI标準的隔離級别,默認為Repeatable Read,并且通過間隙鎖(next-key lock)防止幻讀。
2)InnoDB的表是基于聚簇索引,對主鍵查詢有很高的性能,但它的二級索引必須包含主鍵列。
3)支持熱備份:Oracle提供的MySQL Enterprise Backup和Percona提供的開源的XtraBackup都可以實現熱備。
4)支持行級鎖。
BDB
BDB源自BerkeleyDB,事務型數據庫的另一種選擇,支持COMMIT和ROLLBACK等其他事務特性。
Memory
Memory所有數據置于内存的存儲引擎,擁有極高的插入,更新和查詢效率,支持Hash索引。但是會占用和數據量成正比的内存空間。Memory表是表級鎖,因此寫性能較低。并且其内容會在Mysql重新啟動時丢失。
Merge
Merge将一定數量的InnoDB表聯合而成一個整體,在超大規模數據存儲時很有用。
Archive
Archive非常适合存儲大量的獨立的,作為曆史記錄的數據。因為它們不經常被讀取。Archive擁有高效的插入速度,但其對查詢的支持相對較差。隻支持insert和select操作,每次select都是全表掃描,适合日志和數據采集應用。
Federated
Federated将不同的Mysql服務器聯合起來,邏輯上組成一個完整的數據庫。非常适合分布式應用。
Cluster/ND
Cluster/NDB高冗餘的存儲引擎,用多台數據機器聯合提供服務以提高整體性能和安全性。适合數據量大,安全和性能要求高的應用。
CSV
CSV邏輯上由逗号分割數據的存儲引擎。可以将普通的csv文件作為MySQL的表處理,可以将Excel的數據存儲為csv格式文件,然後複制到MySQL的數據目錄下,就能在MySQL中以表的方式打開,因此CSV引擎作為一種數據交換機制,非常有用。
BlackHole
BlackHole黑洞引擎,寫入的任何數據都會消失,一般用于記錄binlog做複制的中繼。
EXAMPLE
EXAMPLE存儲引擎是一個不做任何事情的存根引擎。它的目的是作為MySQL源代碼中的一個例子,用來演示如何開始編寫一個新存儲引擎。同樣,它的主要興趣是對開發者。EXAMPLE存儲引擎不支持編索引。
另外,MySQL的存儲引擎接口定義良好。有興趣的開發者可以通過閱讀文檔編寫自己的存儲引擎。
版本構架
單點(Single),适合小規模應用
複制(Replication),适合中小規模應用
集群(Cluster),适合大規模應用
MySQL公司在同時開發兩個版本的軟件,4.1版以及5.0版。4.1版本的代碼已經發布并有望在8個月後公布最終代碼。而5.0版本的最後産品将在6個月後發布。
MySQL4.1版本中增加了不少新的性能,包括對主鍵的更高速度的緩存,對子查詢的更好的支持,以及應網絡約會網站所要求的,基于地理信息的查詢。
其同步開發的5.0版本則把目标對準了企業用戶,對于4.1版本中的所有新特性,5.0版本悉數收入囊中,并且獨具以下特點:對外鍵的良好支持;系統自動報錯機制以及對存儲過程的充分支持。
索引文件
索引是一種特殊的文件(InnoDB數據表上的索引是表空間的一個組成部分),它們包含着對數據表裡所有記錄的引用指針。索引不是萬能的,索引可以加快數據檢索操作,但會使數據修改操作變慢。每修改數據記錄,索引就必須刷新一次。為了在某種程序上彌補這一缺陷,許多SQL命令都有一個DELAY_KEY_WRITE項。這個選項的作用是暫時制止MySQL在該命令每插入一條新記錄和每修改一條現有之後立刻對索引進行刷新,對索引的刷新将等到全部記錄插入/修改完畢之後再進行。在需要把許多新記錄插入某個數據表的場合,DELAY_KEY_WRITE選項的作用将非常明顯。另外,索引還會在硬盤上占用相當大的空間。因此應該隻為最經常查詢和最經常排序的數據列建立索引。注意,如果某個數據列包含許多重複的内容,為它建立索引就沒有太大的實際效果。
從理論上講,完全可以為數據表裡的每個字段分别建一個索引,但MySQL把同一個數據表裡的索引總數限制為16個。
1、InnoDB數據表的索引
與InnoDB數據表相比,在InnoDB數據表上,索引對InnoDB數據表的重要性要在得多。在InnoDB數據表上,索引不僅會在搜索數據記錄時發揮作用,還是數據行級鎖定機制的苊、基礎。"數據行級鎖定"的意思是指在事務操作的執行過程中鎖定正在被處理的個别記錄,不讓其他用戶進行訪問。這種鎖定将影響到(但不限于)SELECT、LOCKINSHAREMODE、SELECT、FORUPDATE命令以及INSERT、UPDATE和DELETE命令。出于效率方面的考慮,InnoDB數據表的數據行級鎖定實際發生在它們的索引上,而不是數據表自身上。顯然,數據行級鎖定機制隻有在有關的數據表有一個合适的索引可供鎖定的時候才能發揮效力。
2、限制
如果WEHERE子句的查詢條件裡有不等号(WHEREcoloum!=),MySQL将無法使用索引。類似地,如果WHERE子句的查詢條件裡使用了函數(WHEREDAY(column)=),MySQL也将無法使用索引。在JOIN操作中(需要從多個數據表提取數據時),MySQL隻有在主鍵和外鍵的數據類型相同時才能使用索引。
如果WHERE子句的查詢條件裡使用比較操作符LIKE和REGEXP,MySQL隻有在搜索模闆的第一個字符不是通配符的情況下才能使用索引。比如說,如果查詢條件是LIKE'abc%',MySQL将使用索引;如果查詢條件是LIKE'%abc',MySQL将不使用索引。
在ORDERBY操作中,MySQL隻有在排序條件不是一個查詢條件表達式的情況下才使用索引。(雖然如此,在涉及多個數據表查詢裡,即使有索引可用,那些索引在加快ORDERBY方面也沒什麼作用)。如果某個數據列裡包含許多重複的值,就算為它建立了索引也不會有很好的效果。比如說,如果某個數據列裡包含的淨是些諸如"0/1"或"Y/N"等值,就沒有必要為它創建一個索引。
普通索引、唯一索引和主索引
1、普通索引
普通索引(由關鍵字KEY或INDEX定義的索引)的唯一任務是加快對數據的訪問速度。因此,應該隻為那些最經常出現在查詢條件(WHEREcolumn=)或排序條件(ORDERBYcolumn)中的數據列創建索引。隻要有可能,就應該選擇一個數據最整齊、最緊湊的數據列(如一個整數類型的數據列)來創建索引。
2、唯一索引
普通索引允許被索引的數據列包含重複的值。比如說,因為人有可能同名,所以同一個姓名在同一個“員工個人資料”數據表裡可能出現兩次或更多次。
如果能确定某個數據列将隻包含彼此各不相同的值,在為這個數據列創建索引的時候就應該用關鍵字UNIQUE把它定義為一個唯一索引。這麼做的好處:一是簡化了MySQL對這個索引的管理工作,這個索引也因此而變得更有效率;二是MySQL會在有新記錄插入數據表時,自動檢查新記錄的這個字段的值是否已經在某個記錄的這個字段裡出現過了;如果是,MySQL将拒絕插入那條新記錄。也就是說,唯一索引可以保證數據記錄的唯一性。事實上,在許多場合,人們創建唯一索引的目的往往不是為了提高訪問速度,而隻是為了避免數據出現重複。
3、主索引
在前面已經反複多次強調過:必須為主鍵字段創建一個索引,這個索引就是所謂的“主索引”。主索引與唯一索引的唯一區别是:前者在定義時使用的關鍵字是PRIMARY而不是UNIQUE。
4、外鍵索引
如果為某個外鍵字段定義了一個外鍵約束條件,MySQL就會定義一個内部索引來幫助自己以最有效率的方式去管理和使用外鍵約束條件。
5、複合索引
索引可以覆蓋多個數據列,如像INDEX(columnA,columnB)索引。這種索引的特點是MySQL可以有選擇地使用一個這樣的索引。如果查詢操作隻需要用到columnA數據列上的一個索引,就可以使用複合索引INDEX(columnA,columnB)。不過,這種用法僅适用于在複合索引中排列在前的數據列組合。比如說,INDEX(A,B,C)可以當做A或(A,B)的索引來使用,但不能當做B、C或(B,C)的索引來使用。
6、索引的長度
在為CHAR和VARCHAR類型的數據列定義索引時,可以把索引的長度限制為一個給定的字符個數(這個數字必須小于這個字段所允許的最大字符個數)。這麼做的好處是可以生成一個尺寸比較小、檢索速度卻比較快的索引文件。在絕大多數應用裡,數據庫中的字符串數據大都以各種各樣的名字為主,把索引的長度設置為10~15個字符已經足以把搜索範圍縮小到很少的幾條數據記錄了。在為BLOB和TEXT類型的數據列創建索引時,必須對索引的長度做出限制;MySQL所允許的最大索引全文索引文本字段上的普通索引隻能加快對出現在字段内容最前面的字符串(也就是字段内容開頭的字符)進行檢索操作。如果字段裡存放的是由幾個、甚至是多個單詞構成的較大段文字,普通索引就沒什麼作用了。這種檢索往往以的形式出現,這對MySQL來說很複雜,如果需要處理的數據量很大,響應時間就會很長。
這類場合正是全文索引(full-textindex)可以大顯身手的地方。在生成這種類型的索引時,MySQL将把在文本中出現的所有單詞創建為一份清單,查詢操作将根據這份清單去檢索有關的數據記錄。全文索引即可以随數據表一同創建,也可以等日後有必要時再使用下面這條命令添加:ALTERTABLEtablenameADDFULLTEXT(column1,column2)有了全文索引,就可以用SELECT查詢命令去檢索那些包含着一個或多個給定單詞的數據記錄了。
下面是這類查詢命令的基本語法:
SELECT * FROM tablename
WHEREMATCH(column1,column2)AGAINST('word1','word2','word3')
上面這條命令将把column1和column2字段裡有word1、word2和word3的數據記錄全部查詢出來。
注解:InnoDB數據表不支持全文索引。
查詢和索引的優化
隻有當數據庫裡已經有了足夠多的測試數據時,它的性能測試結果才有實際參考價值。如果在測試數據庫裡隻有幾百條數據記錄,它們往往在執行完第一條查詢命令之後就被全部加載到内存裡,這将使後續的查詢命令都執行得非常快--不管有沒有使用索引。隻有當數據庫裡的記錄超過了1000條、數據總量也超過了MySQL服務器上的内存總量時,數據庫的性能測試結果才有意義。
在不确定應該在哪些數據列上創建索引的時候,人們從EXPLAINSELECT命令那裡往往可以獲得一些幫助。這其實隻是簡單地給一條普通的SELECT命令加一個EXPLAIN關鍵字作為前綴而已。有了這個關鍵字,MySQL将不是去執行那條SELECT命令,而是去對它進行分析。MySQL将以表格的形式把查詢的執行過程和用到的索引等信息列出。
在EXPLAIN命令的輸出結果裡,第1列是從數據庫讀取的數據表的名字,它們按被讀取的先後順序排列。type列指定了本數據表與其它數據表之間的關聯關系(JOIN)。在各種類型的關聯關系當中,效率最高的是system,然後依次是const、eq_ref、ref、range、index和All(All的意思是:對應于上一級數據表裡的每一條記錄,這個數據表裡的所有記錄都必須被讀取一遍——這種情況往往可以用一索引來避免)。
possible_keys數據列給出了MySQL在搜索數據記錄時可選用的各個索引。key數據列是MySQL實際選用的索引,這個索引按字節計算的長度在key_len數據列裡給出。比如說,對于一個INTEGER數據列的索引,這個字節長度将是4。如果用到了複合索引,在key_len數據列裡還可以看到MySQL具體使用了它的哪些部分。作為一般規律,key_len數據列裡的值越小越好。
ref數據列給出了關聯關系中另一個數據表裡的數據列的名字。row數據列是MySQL在執行這個查詢時預計會從這個數據表裡讀出的數據行的個數。row數據列裡的所有數字的乘積可以大緻了解這個查詢需要處理多少組合。
最後,extra數據列提供了與JOIN操作有關的更多信息,比如說,如果MySQL在執行這個查詢時必須創建一個臨時數據表,就會在extra列看到usingtemporary字樣
安裝注意
1、如果是用MySQL+Apache,使用的又是FreeBSD網路操作系統的話,安裝時候你應按注意到FreeBSD的版本問題,在FreeBSD的3.0以下版本來說,MySQLSource内含的MIT-Pthread運行是正常的,但在這版本以上,你必須使用nativethreads,也就是加入一個with-named-thread-libs=-lc_r的選項。
2、如果在COMPILE過程中出了問題,請先檢查你的gcc版本是否在2.81版本以上,gmake版本是否在3.75以上。
3、如果不是版本的問題,那可能是你的内存不足,請使用./configure--with-low-memory來加入。
4、如果要重新做你的configure,那麼你可以鍵入rmconfig.cache和makeclean來清除記錄。
5、把MySQL安裝在/usr/local目錄下,這是缺省值,您也可以按照你的需要設定你所安裝的目錄。
安全設置
一、内部安全性-保證數據目錄訪問的安全
1.1 數據庫文件。
1.2 日志文件。
二、外部安全性-保證網絡訪問的安全
2.1 MySQL授權表的結構和内容
2.2 服務器控制客戶訪問
2.3 避免授權表風險
2.4 不用GRANT設置用戶
管理工具
可以使用命令行工具管理MySQL數據庫(命令mysql和mysqladmin),也可以從MySQL的網站下載圖形管理工具MySQL Administrator,MySQL Query Browser和MySQL Workbench。
phpMyAdmin是由php寫成的MySQL資料庫系統管理程程序,讓管理者可用Web界面管理MySQL資料庫。
phpMyBackupPro也是由PHP寫成的,可以透過Web界面創建和管理數據庫。它可以創建僞cronjobs,可以用來自動在某個時間或周期備份MySQL數據庫。
另外,還有其他的GUI管理工具,例如mysql-front以及 ems mysql manager,navicat等等。
MySQL中文排序錯誤的解決方法
一.方法1
在MySQL數據庫中,進行中文排序和查找的時候,對漢字的排序和查找結果是錯誤的。這種情況在MySQL的很多版本中都存在。如果這個問題不解決,那麼MySQL将無法實際處理中文。
出現這個問題的原因是:MySQL在查詢字符串時是大小寫不敏感的,在編繹MySQL時一般以ISO-8859字符集作為默認的字符集,因此在比較過程中中文編碼字符大小寫轉換造成了這種現象,一種解決方法是對于包含中文的字段加上"binary"屬性,使之作為二進制比較,例如将"name char(10)"改成"name char(10)binary"。
二.方法2
如果你使用源碼編譯MySQL,可以編譯MySQL時使用--with--charset=gbk參數,這樣MySQL就會直接支持中文查找和排序了。



















