簡介
IMDB是美國一個權威的電影網站,除了詳盡的資料外,一個特色是上面給影片做了評分。這些分數根據複雜的規則得出,不光有專業工作人員對影片打分,也允許普通影迷給電影評分,當投票人數較多的時候,我們可以認為,影片的得分可以比較客觀地反映影片的質量。
當然由于他是一個英文網站,這也使得非英語影片受到的關注較少。
IMDB概要
IMDb上有豐富的電影作品信息,包括影片演員、導演,劇情,影評這類的基本信息,也有更深層的内容,比如影片相關的瑣事花絮,片中出現的漏洞,影片音軌,屏幕的高寬比,影片的不同版本等等。
演員,導演,作者和其他工作人員都在數據庫中有自己的條目,其中列出他們參加過的影片,通常還有他們的傳記。用戶還可以在akas.imdb.com找到那些在不同語言不同國家發行時使用了不同片名的電影。
IMDb不隻是電影和電子遊戲等的數據庫,還提供每日更新的電影電視新聞,以及為不同電影活動比如奧斯卡獎推出特别報道。IMDb的論壇也十分活躍,除每個數據庫條目都有留言闆之外,還有關于多種多樣的主題的各種綜合讨論版。
IMDb擴展出來的姐妹站IMDbPro為專業人士提供額外的信息,如電影業界人士的聯系方式,電影活動日期表等等。IMDbPro不是專門為普通大衆設計服務的,内容也不是免費的。
任何人隻要有電子信箱并使用接受Cookie的Web浏覽器就可以在IMDb上建立帳戶,提交信息和對參加各種主題的投票。針對自動化查詢的需求,數據庫的大部分都能以壓縮的文本文件格式下載,并用提供的工具解壓(通常在命令行進行)。
IMDB曆史
1989年時,Col Needham和其他人在Usenet新聞組rec.arts.movies電影和交換信息。他們編寫了一個常見問題解答(FAQ)列表,包含演員,導演和已經去世的電影制作者的傳記。在1990年末,他們的FAQ已經收錄了将近10,000部電影和電視劇。
在1990年10月17日,Needham發布了一套UNIX的Shell腳本,該腳本可以搜索這4個FAQ,IMDb也由此誕生,不過那時的名字是rec.arts.movies電影數據庫。
到了1993年,數據庫已經擴展到包括瑣事花絮,傳記,影片情節等内容,還帶有一個集中的電子郵件界面,用于搜索該數據庫。當年晚些時候,IMDb被移到了萬維網上(當時還處在嬰兒期的網絡)。
數據庫被放置在威爾士卡地夫大學的計算機科學系的服務器上。最初的網頁界面作者是Rob Hartill。
在1994年,擴展了的電子郵件界面開始接受自動數據提交,人們不必再給指定的維護人員發信而間接提供新内容了。這些年裡,數據庫在連接着世界各地鏡像的網絡上靠捐贈的帶寬運行。
在1995年,這一項目發展得很大,對Col Needham和其他的志願者來說,依靠捐款和他們的空閑時間來維護它的運行已經明顯不太可能。
1996年,成立商業公司的決定被作出,IMDb在英國注冊成為互聯網電影數據庫公司。維護數據庫的人們成為其股東,依靠廣告,許可證和合作獲得利潤。
這種狀态持續到1998年。數據庫每時每刻都在成長,再一次到達了關鍵的時刻;利潤被用在設備上,股東們很難接受辛苦勞動卻隻能得到很少收入的事實。
一些大公司出價試圖收購數據庫,然而IMDb的股東們不肯輕易将其出售給無法保證繼續免費提供其信息的其他企業。
就在這時,亞馬遜的傑夫·貝索斯出現了。達成的交易是,IMDb得到了為股東們提供應有收入的資金,而Amazon.com可以在出售其DVD和錄像帶時使用IMDb的信息資源。
IMDb的功能繼續不斷擴展,2002年新增了針對娛樂界專業人士的IMDbPro,提供多樣的服務,包括電影制作和票房詳細資料,以及電影公司目錄
。訂閱的價格是每月$12.95,或每年$99.95(2005年4月5日價格)。
250部最佳影片
“佳片250”旨在列出數據庫内評級最高的250部電影,評級以數據庫注冊用戶評分為基礎,再套用下列所述公式。
入選規範必須是曾公開上映的非紀錄片,片長至少45分鐘,評分達兩萬五千人次以上,并且隻有定期投票習慣的用戶才會采用計票,至于有效票數量多少、如何才是符合“有定期投票習慣”則還不為人知。
IMDb宣稱為了保持“佳片250”名單的公信力,他們“故意不公開有效計票的标準”。
除此之外,“佳片250”還套用精算學的“可信度公式”,對評分作加權評級,獨立資料的數量越大(在此就是指合格用戶的評分),統計處理後的可信度越高,IMDb以下列公式計算加權評級:
以上:
W=加權評級
R=電影從0到10的平均分數(Rating)
u=評分人次(Votes)
M=進入名單的最少評分人次(目前為25000票)
C=全名單平均分數(目前維持在7.1)
公式所得的即為“貝式後驗平均值”(詳見貝氏定理)。
該榜因其綜合廣泛性以及不時的令人吃驚的結果而受到囑目。上榜的電影中既有老電影(如《吸血僵屍》,1922年),也有新電影(如《黑暗騎士》,2008年);
既有流行影片(如得到超過420,000次投票的《指環王首部曲:指環王現身》),也有少有人問津的影片(如隻有12,700張投票的《日出》)。
榜上有各種不同類型的電影(如黑色影片《雙重保險》、科幻片《銀翼殺手》、音樂片《雨中曲》、西部片《黃金三镖客》、動畫片《機器人總動員》等等);
以及票房一般、很少獲獎但卻在影迷群體中有廣泛的追随者的電影(比如《肖申克的救贖》、《死亡幻覺》等等)。
截至2012年7月16日《肖申克的救贖》、《教父》、《教父II》為排名前三的電影。
這些條件是否能提供一個公正沒有偏見的排行榜是有争議的。比如,新近上映的影片總是容易從一見鐘情的影迷那裡得到較高的評分,而這與成功影片應該經得起反複觀賞的觀念是不相符的。
因此,有時新上映的影片沖進250最佳影片榜,甚至前100名,但随着更多觀衆的評分和重複觀看後的評分而退出榜外的情景就十分常見了。
另外一種對該榜的主要批評則是它反映的隻是影片的受歡迎程度,并不體現對影片曆史和藝術的客觀知識。但實際上,在評論家年度評選和曆史影片評選中,名列前茅的影片在最佳250部影片中通常排名很高。
目前在最佳250部電影名單中,主演最多影片的演員以詹姆斯·斯圖爾特的10部作品最多,羅伯特·德尼羅及哈裡森·福特各以9部作品居次。
在IMDb上還有最差的100部影片榜,用基本相同的方法投票産生。經常位列榜首的影片是《Manos: The Hands of Fate》和《Plan 9 from Outer Space》。
版權問題
所有為數據庫提供内容的自願者都對其作品擁有版權,但同時準許對其的複制,修改,并将其内容許可給IMDb。相應的,IMDb不允許其他人在未經許可情況下使用其電影概述或生平簡介。
使用軟件方法屏蔽該網站顯示的廣告也被明令禁止。影片名錄中一小部分可以被引用,而且隻能用于非商業性的網站。
留言闆
IMDb另一受歡迎的特色是其對應每個數據庫條目,并且有47個主要闆塊的留言闆系統。
注冊用戶可以在這些留言闆上分享和讨論關于電影,演員,導演的消息。至今已有超過6百萬注冊用戶使用過留言闆。
IMDb其他
可信度
由于數據庫的人物傳記、瑣事等部分是采取用戶自由貢獻,但又并未要求用戶對其貢獻内容附上參考來源,因此缺少有效而立即的機制,以阻止蓄意破壞者添加未經查證、或對該人物诋毀性的資料。部分人物訊息準确度因此有争議。
中國大陸訪問狀況
2010年1月7日,IMDb.com被中國大陸防火長城封鎖,與其他被封的海外網站一樣,官方沒有提供任何解釋。
2010年2月3日,在中國大陸被解封,可以正常訪問。
2010年10月,IMDb.com再次被封鎖。坊間盛傳的一個原因是,當時IMDb首頁上出現了一部和西藏有關的記錄片《雲後的太陽》(《When the dragon swallowed the sun》)的預告視頻。此後在中國大陸訪問該網站一直處于不穩定狀态。
2013年3月初,IMDb.com被解除封鎖,各項功能均可在中國大陸正常使用,頁面顯示完整。
API
IMDb的數據在官網上可以免費下載,可惜的是免費提供下載的數據是文本格式,不能檢索。為了IMDb的數據能夠被更多人使用,許多開發人員用各自的方法實現了不同的API,目前主要有以下幾種:
IMDbAPIORG
此接口由中國人開發,
是一個輕量級的Web服務(RESTful接口),它提供一種IMDB數據的有效訪問方式。就像前面說的一樣,雖然IMDB的數據可以在官網上免費下載,但是卻沒有提供一個很好的API來檢索這些信息。此Web服務旨在一定範圍内解決這一問題。
此接口相較于其它接口具備以下特點:
支持中文譯名檢索
支持中文數據返回
支持JavaScript調用接口(可以使用AJAX技術直接獲取結果,非JSONP方式)
返回的數據字段更豐富
支持多條結果返回
請求限制寬松
此接口是唯一支持中文檢索的IMDb API。
OMDbAPI
此接口的作者為Brian Fritz,
是之前The IMDB API接口的作者,因為受到IMDb官方的要求而更換了域名,是較早一批提供IMDb數據檢索的服務(RESTful接口)。
在英文世界,該服務有較高的知名度。
該接口支持JAVASCRIPT調用。
TMDbAPI
此接口是由themoviedb數據庫開放的API,嚴格來說它并不是檢索的IMDb數據,它是一個獨立的數據庫,隻是返回數據中提供了IMDb的一些相關數據,如:IMDb ID,IMDb Rating等。
該接口提供的方法更多,但是需要授權使用,限制較多。



















